超几何分布和二项分布的联系和区别_第1页
超几何分布和二项分布的联系和区别_第2页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、超几何分布和二项分布的联系和区别开滦一中张智民在最近的几次考试中,总有半数的的学生搞不清二项分布和超几何分布,二者到底该如何区分呢?什么时候利用二项分布的公式解决这道概率问题?什么时候用超几何分布的公式去解决呢?好多学生查阅各种资料甚至于上网寻找答案,其实这个问题的回答就出现在教材上,人教版新课标选修2-3从两个方面给出了很好的解释.诚可谓:众里寻他千百度,蓦然回首,那人却在灯火阑珊处!一、两者的定义是不同的教材中的定义:(一)超几何分布的定义在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k)CkCn-kM_N-MCnN,k=0,1,2,m,其中m二minM,n,且nWN,

2、MWN,n,M,NN,称随机变量X服从超几何分布(二)独立重复试验和二项分布的定义1)独立重复试验:在相同条件下重复做的n次试验,且各次试验试验的结果相互独立,称为n次独立重复试验,其中A(i=1,2,n)是第i次试验结果,则P(A1A2A3An)二P(A1)P(A2)P(A3)P(An)2)二项分布在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为P,则P(X=k)=Ckpk(1-p)n-k(k=0,1,2,n),此时称随机变量X服从二项分布,记作XB(n,p),并称nP为成功概率1.本质区别(1)超几何分布描述的是不放回抽样问题,二项分布描述的是放回抽样问题;(

3、2)超几何分布中的概率计算实质上是古典概型问题;二项分布中的概率计算实质上是相互独立事件的概率问题2.计算公式超几何分布:在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k),k=0,1,2,m,CkCn-kM_N-MCnN二项分布:在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为P,则P(X=k)=Ckpk(1-p)n-k(k=0,1,2,n),n温馨提示:当题目中出现“用样本数据估计XXX的总体数据”时,均为二项分布问题。比如2017-2018高三上学期期末考试19题。二、二者之间是有联系的人教版新课标选修2-3第59页习题2.2B组第3题:

4、例某批n件产品的次品率为2%,现从中任意地依次抽出3件进行检验,问:当n=500,5000,500000时,分别以放回和不放回的方式抽取,恰好抽到1件次品的概率各是多少?(2)根据(1)你对超几何分布与二项分布的关系有何认识?人教版配套的教学参考上给出了如下的答案与解释说明【解】(1)在不放回的方式抽取中,每次抽取时都是从这n件产品中抽取,从而抽到次品的概率都为0.02次品数XB(3,0.02),恰好抽到1件次品的概率为P(X=1)=C1X0.02X(1-0.02)2=3X0.02X0.9820.057624在不放回的方式抽取中,抽到的次品数X是随机变量,x服从超几何分布,X的分布与产品的总数

5、n有关,所以需要分3种情况分别计算 n=500时,产品的总数为500件,其中次品的件数为500X2%°=10,合格品的件数为490从500件产品中抽出3件,其中恰好抽到1件次品的概率为 n=5000时,产品的总数为5000件,其中次品的件数为5000X2%=100,合格品的件数为4900从5000件产品中抽出3件,其中恰好抽到1件次品的概率为 n=50000时,产品的总数为50000件,其中次品的件数为50000X2%=1000,合格品的件数为49000从50000件产品中抽出3件,其中恰好抽到1件次品的概根据的计算结果可以看出,当产品的总数很大时,超几何分布近似为二项分布这也是可以

6、理解的,当产品总数很大而抽出的产品较少时,每次抽出产品后,次品率近似不变,这样就可以近似看成每次抽样的结果是互相独立的,抽出产品中的次品件数近似服从二项分布【说明】由于数字比较大,可以利用计算机或计算器进行数值计算另外本题目也可以帮助学生了解超几何分布和二项分布之间的关系:第一,n次试验中,某一事件A出现的次数X可能服从超几何分布或二项分布当这n次试验是独立重复试验时,X服从二项分布;当这n次试验是不放回摸球问题,事件A为摸到某种特性(如某种颜色)的球时,X服从超几何分布。第二,在不放回n次摸球试验中,摸到某种颜色的次数X服从超几何分布,但是当袋子中的球的数目N很大时,X的分布列近似于二项分布

7、,并且随着N的增加,这种近似的精度也增加。从以上分析可以看出两者之间的联系:当调查研究的样本容量非常大时,在有放回地抽取与无放回地抽取条件下,计算得到的概率非常接近,可以近似把超几何分布认为是二项分布下面看相关例题例1.(2016漯河模拟)寒假期间,我市某校学生会组织部分同学,用“10分制”随机调查“阳光花园”社区人们的幸福度现从调查人群中随机抽取16名,如图所示的茎叶图记录了他们的幸福度分数(以小数点前的一位数字为茎,小数点后的一位数字为叶),若幸福度分数不低于8.5分,则称该人的幸福度为“幸福”(1)求从这16人中随机选取3人,至少有2人为“幸福”的概率;(2)以这16人的样本数据来估计整

8、个社区的总体数据|,若从该社区(人数很多)任选3人,记£表示抽到“幸福”的人数,求紬勺分布列及数学期望先不要急于看答案,大家先自己解一下这道题再往下看,会有意想不到的收获哦错解(1)由茎叶图可知,抽取的16人中“幸福”的人数有12人,其他的有4人;记“从这16人中随机选取3人,至少有2人是“幸福”,”为事件A由题意得(2)£的可能取值为0,1,2,3则P(g二0)二C3C0412C31645601140;P(E=1)=C2C1412C31672_9560_70P(g二2)二C1C2412C3162645603370,C0C3412C316220_11560_28所以

9、3;的分布列为错解分析第二问的选人问题是不放回抽样问题,按照定义先考虑超几何分布,但是题目中又明确给出:“以这16人的样本数据来估计整个社区的总体数据,从该社区(人数很多)任选3人”,说明不是从16人中任选3人,而是从该社区(人数很多)任选3人,所以可以近似看作是3次独立重复试验,应该按照二项分布去求解,而不能按照超几何分布去处理正解】(1)(1)由茎叶图可知,抽取的16人中“幸福”的人数有12人,其他的有4人;记“从这16人中随机选取3人,至少有2人是“幸福”,”为事件A.由题意得2)由茎叶图知任选一人,该人幸福度为“幸福”的概率为-,匕的可能取值为0,1,2,3,显然43EB(3,-)4.

10、(13则P(E=0)=-14丿一(3、2(1、273)C2=-;P忆=3)=3<4J<4J64<4丿P(g=2)=327.64;从以上解题过程中我们还发现,错解中的期望值与正解中的期望值相等,好多学生都觉得不可思议,怎么会出现相同的结果呢?其实这还是由于前面解释过的原因,超几何分布与二项分布是有联系的,看它们的期望公式:在含有M件次品的N件产品中,任取n件,其中恰有X件次品,随机变量X服从超几何分布,超几何分布的期望计算公式为EX=nM(可以根据组合数公式以及期望的定义推导);N随机变量X服从二项分布,记作XB(n,p),EX=np;当超几何分布中的Nfg时,Mtp,此时可以

11、把超几何分布中的不放回抽样问题,近似N看作是有放回抽样问题,再次说明NTg时,可以把超几何分布看作是二项分布。总结:综上可知,当提问中涉及“用样本数据来估计总体数据”字样的为二项分布。高考解题中,我们还是要分清超几何分布与二项分布的区别,以便能正确的解题,拿到满分。相信各位同学们手中都应该有历年真题卷和2018的模拟试卷吧,快去找几道二项分布和超几何分布的概率大题试试吧,争取概率满分,加油!再比如:18.(本小题满分12分)(百所名校高考模拟金典卷五)为了调查观众对某电视娱乐节目的喜爱程度,某人在甲、乙两地各随机抽取了8名观众做问卷调查(满分100分),现将结果统计如下图所示(1)计算甲、乙两

12、地被抽取的观众的问卷得分的平均分以及方差,并根据统计知识简单说明丽甲、乙两地观众对该电视娱乐节目的喜爱程度;|以频率估计概率|,若从甲地观众中|再随机抽取3人进行问卷调查,记问卷分数超过80分的人数为E,求的分布列与数学期望75一85”+(8U85尸+(8085)24-(8385)2+(8585)2+(90-85)乂宓众日口j俺q于兀口/|°)八兑阴甲、乙两地观众对该堪视娱乐84St3人进行问$的分布列与数学期里1(70X2j80X4卜9QX2T82(70X1十80X4+90X3+5+010I3t:>因为.“=云,常走,故甲、乙两地对该电视娱乐节目的喜爱程度基本相同,但是甲地居

13、民的评分比乙地分因为甲地8名观众的问卷分数中,有2名低于80分,6名超过80分,所以随机抽取3人,超过80分的人数F可能为1,2,3.9分所以&翕陀切=罟所以变量W的分布列为28ei23p3155282814请看原题答案,居然是错解:正解:(1)同上(2)因为题中说:以频率估计概率,即以该频率来估计甲地区的整体情况,“若从甲地观众中再随机抽取3人”即时强有力的证据,所以此题应为二项分布,而非超几何分布超过80分的频率为3,即概率p=4,巴的可能取值为o123,(3A3P(x=0)=1-I4丿64P(x=1)=C1364P(x=2)=C23(-W1、27(3)3,P(x=3)=<4

14、丿<4丿64<4丿27所以X的分布列为X0123PE(X)=np=9。4而下面这道题,就应该是超几何分布啦!18.(本小题满分12分)(2018石家庄质检一)某学校为了解高三复习效果,从高三第一学期期中考试成绩中随机抽取50名考生的数学成绩,分成6组制成频率分布直方图如图所示:(1)求m的值;并且计算这50名同学数学成绩的样本平均数(U)该学校为制定下阶段的复习计划,从成绩在130,150的同学中选出3位作为代表进行座谈,记成绩在140,150的同学人数为$写出倘分布列,并求出期望。18.解(I)由题(0.004+0.012+0.024+0.04+0.012+m)x10=1解得m=

15、0.0083分=121.86分(U)成绩在130,140)的同学人数为6,在1140,150的同学人数为4,从而g的可能取10值为0,1,2,3,0123PG=0)=C0C346C3所以g的分布列为101610分1Q1Eg二0x-+1x-+2x2+3x二12分621030518.(本小题满分12分)(2018百所名校示范卷五)g城市A城市“共享单车”是城市慢行系统的一种模一A城845913665621344312334 288643286515 52市B城市式创新,对于解决民众出行“最后一公1公里”的问题特别见效,由于停取方便、租用价格低廉,各种共享单车受到人们的热捧.某机构为了调查人们对此种

16、交通方式的满意度,从交通拥堵的A城市和交通严重拥堵的B城市分别随机调查了20个用户,得到了一个用户满意度评分的样本,若评分不低于80分,则认为该用户对此种交通方式“认可”,否则认为该用户对此种交通方式“不认可”,并绘制出茎叶图如图。请根据此样本完成下面的2X2列联表,并据此样本分析是否能在犯错的概率不超过10%的情况下认为交通拥堵与认可共享单车有关;若以A城抽取的这20个用户的样本数据来估计整个A城的总体数据,现从A城任选3名用户,记X表示抽到用户为对此种交通方式“认可”的人数,求X的分布列及数学期望参考公式:其中n=a+b+c+d.参考数据:解:(1)K2的观测值k二4°(5x10-10x-5)2=8<2.706,所以不能在犯20x20x15x253错误的概率不超过10%的情况下认

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论