高中数学讲义-超几何分布_第1页
高中数学讲义-超几何分布_第2页
高中数学讲义-超几何分布_第3页
高中数学讲义-超几何分布_第4页
高中数学讲义-超几何分布_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高中数学讲义一超几何分布

目录

1.教学要点.........................................................................................1

1.1.亮点1:深挖核心知识,回归数学本质...........................................................1

1.2.亮点2:广用类比思想,关注教学整体...........................................................1

1.3.亮点3:创新模型思维,助力学生理解...........................................................1

1.4.亮点4:巧借信息技术,突破运算瓶颈...........................................................2

2.超几何分布公式是什么............................................................................2

3.几何与超几何分布................................................................................3

4.R统计学(03):超几何分布..........................................................................4

1.教学要点

这节课以课标为纲,教材为本,依托整体教学设计理念,回溯利用样本空间求概率的数学本质,

类比二项分布的研究过程,“创新”超几何分布的几何图示,帮助学生扎实“四基”,提升“四能”,

激发数学创新意识,发展数学核心素养.具体点评如下:

1.1.亮点1:深挖核心知识,回归数学本质

结合有放回抽样问题复习二项分布,引导学生回顾基于样本空间应用古典概型求解概率的一般

步骤,将应用古典概型求解得到的分布列改写为二项分布概率模型,引导学生发现二项分布是在此

基础上抽象出来的一个更为简洁的模型,引导学生认识古典概型求概率的数学本质.

1.2.亮点2:广用类比思想,关注教学整体

有放回抽样过程的复习与回顾,既是帮助学生复习知识,更是帮助学生巩固利用古典概型求概

率,感悟模型筛选的全过程,以及重温先猜后证概率模型均值的基本活动经验等,为不放回抽样问

题的探究与超几何分布模型的抽象提供类比基础和研究思路,与二项分布形成一个整体,进一步巩

固落实了概率模型的一般研究方法.

1.3.亮点3:创新模型思维,助力学生理解

基于对条件概率的概念、全概率公式学习过程中图形辅助教学的教材理解,创造性地构建Venn

图帮助学生理解超几何分布的直观意义,并借助Venn图推导随机变量的取值范围,进而引导学生进

一步借助Venn图猜想超几何分布的均值,突破推导证明的难点等,整节课扎实落实直观想象素养,

以直观助力抽象,帮助学生加深对超几何分布及其均值的理解.

第1页共8页

1.4.亮点4:巧借信息技术,突破运算瓶颈

在教材例6的讲解过程中,借助信息技术突破常规运算手段较难完成的瓶颈,计算二项分布和

超几何分布的概率值、生成概率统计图表,帮助学生直接地感受数据的生成,更直观地发现二项分

布和超几何分布的区别与联系,感悟应用信息技术研究概率统计问题的内在需求.

2.超几何分布公式是什么

超几何分布公式是:;来历:几何分布来源于几何数列。

超几何分布是统计学上离散的概率分布,它描述了从有限N个物件(其中包含M个指定种类的

物件)中抽出n个物件,成功抽出该指定种类的物件的次数(不放回),之所以被称为超几何分布,

是因为其形状与“超几何函数”的级数展式的系数有关。

下面的概率分布称为超几何分布:

•随机变量X的可能值:0,1,2,…,n.

•概率函数:

P(x)二哈产,x=0J2,・・・,外

CN

其中〃,都是正整数,且〃<N.上式中,

当或x>N-M时,显然有p(x)=0.

超几何分布中的参数为:N,n,M,上述超几何分布记作,几何学是研究空间结构和性质的学科,

它是数学中最基本的研究内容之一,几何学的发展历史悠久,内容丰富,与分析、代数等有着极为

密切的关系。

第2页共8页

012345678910

几何分布来源于几何数列:

数列也被称为等比数列,意味着一个数列从第二项开始,各个项与前一项的比是恒定的。

,就是一个等比数列,就是把随机变量所遵循的这种分布称为几何分布。

超几何数列是第2项至各项与前项的比是关于项数n的有理函数的数列。

例如,、数列{an}是超几何数列。

超几何分布的概率公式是超几何数列的形式,所以这种分布称为超几何分布。

3.几何与超几何分布

这两分布名字相近,所以放在一篇里解读。但请注意,名字随相近但实质的涵义差别很大。实

际来看,这两个高端的名字似乎和其实际内涵的毫无贴切度可言。

一、儿何分布

1.1几何分布定义

通俗的说就是:己知事件A发生的概率p,在一次又一次试验中,查看第几次试验时A才首次

发生,所以我更愿意把几何分布称为:第X次试验中,A才首次发生,简称首发分布。

在伯努利试验序列中,记每次试验中事件A的发生概率为p,如果X为事件首次出现时的试验

次数,则X的可能取值为1,2,...,称X服从几何分布,记为X〜Ge(p)。

例如:抛一颗骰子,首次出现6点的抛投次数X〜Ge(l/6);同时抛两颗骰子,首次出现点数之

和为7点的抛投次数X〜Ge(l/6);某产品的次品率为0.05%,则首次查到次品的检查次数服从

第3页共8页

X-Ge(0.05)o

因为直到第k次才首次发生,所k-1次为未发生:(X=k)=A-k-l-A,设A发生的概率设为p,

则A未发生为1-p,所以式子变成:P(X=k)=(l^))k-l-p

几何分布的期望E(X)=lp,方差D(X)=l-pp2

1.2几何分布的无记忆性

无记忆记性通俗的解释是:在前面进行了100次试验中A事件仍未发生的情况下,在接下去的

50次试验中,事件A仍未发生的概率只和接下来的50次有关,和已经结束的100次试验无关。也

就是说似乎忘记了前100次试验结果,所以叫无记忆性。

二、超几何分布

2.1超几何分布定义

超几何分布是一种重要的离散分布,它在抽样理论中占有重要的地位。超几何分布一般用来表

示不放回抽抽样的试验。

设有N个元素分为两类,M个元素属于第一类,Nil个元素属于第二类,从中任取n个,令

随机变量X表示这n个元素中第一类或第二类元素的个数,则X』(n,N,M),如下图所示。

P(X=k)=CMk-CN-Mn-k/CNn,k=0,l,2..,min(n,M)

期望E(X)=n・MN

方差D(X)=n•M(N-M)(N-n)/N2(N=l)

2.2超几何分布的二项近似

当n〈N时,假设抽取个数n远小于产品总数N时,每次抽样后,总体中的不合格品率P=M/N

改变甚微,所以不放回抽样可近似地看成放回抽样,此时超几何分布可用二项分布近似:

CMk,CNHVIn«/CNn=Cnk,pk,(1.9)n-k,其中p=M/N。

4.R统计学(03):超几何分布

第4页共8页

超几何分布(Hypergeometricdistribution),其自变量X定义为从N个有限物品中抽出n个物品,

成功抽出指定种类的物品的个数。

对于二项分布和几何分布,它们均基于伯努利试验,每次试验结果的发生概率是不变的,而超

几何分布试验结果的概率会随着每一次试验的发生而改变。以随机抽样为例,二项分布试验和几何

分布试验是有放回抽样(总体数量保持不变),因此每次试验结果的发生概率是保持不变的;而超几何

分布试验则是在有限总体中进行无放回抽样(总体数量不断减少),所以每次试验结果发生的概率将发

生变化。

1.概率分布

超几何分布是一种重要的离散型概率分布,其概率质量函数可以这样定义:假设有限总体包含N

个样本,其中质量合格的为m个,则剩余的N-m个为不合格样本,如果从该有限总体中抽取出n个

样本,其中有k个是质量合格的概率为:

P(X=k)=c*个*

其中C*表示从N个总体样本中抽取n个样本的方法数目;瑞表示从m个质量合格样本

中抽取k个样本的方法数目;。已、表示从N-m个质量不合格样本中抽取n-k个样本的方

法数目。

由上式可知,超几何分布由样本总量N、质量合格的样本数m和抽取数目n决定,记为X〜H(N,

m,n)o

2.性质

k的取值范围为{max(0,n+m-N),…,min(n,m)},其期望值和方差分别为:

m

E(k)=n

N

mNmNn

Var(k)—

nNNN1

具体可参考/wiki/Hypergeometric_distribution。

2.如果抽取数目n=l(即从有限总体中只抽取一个样本),那么超几何分布将还原成伯努利分布。

3.如果样本总体N为无穷大(也即将有限总体换成无限总体),此时是否放回抽中的样本对于质

量合格样本所占比例没有影响,超几何分布也可视为二项分布。在实际应用中,只要样本总体的数

目是抽取数目的10倍以上(即N>10n),就可用二项分布来近似描述超几何分布,通过两种概率质量

函数计算得到的概率几乎相同。对于这个性质,我们将在后面用一个例子来说明。

第5页共8页

3.R中的相关函数

R中也有四个函数可用于超几何分布,分别是:

dhyperfx,m,n,k):返回抽中x个质量合格样本的概率

phyperfq,m,n,k):返回累积概率

qhyperfp,m,n,k):返回相应分位点x,详情见下面的例子

rhyperfnn,m,n,k):返回每组抽中质量合格样本的个数

这四个函数都有m、n和k参数,分别对应于超几何分布中的质量合格数目m、不合格数目N-m

和抽取数目no下面通过一个例子来了解如何使用它们:

假设某服装店举行十一促销抽奖活动,抽奖箱中总共有30个乒乓球,其中只有3个乒乓球上写

有“中奖”两字。结账时,每个顾客抽出2个乒乓球。如果抽中一个中奖字样,商品总价打7折;

如果抽中两个,商品总价打5折;如果没抽中就不打折。

第一个问题:抽到0个,1个和2个带有“中奖”字样乒乓球的概率分别是多少?此时要用到

dhyper(x,m,n,k)函数,其中x参数指定抽中的数目,函数返回相应概率,比如:

>m<-3##带有“中奖”字样乒乓球的数目

>n<-30-m##没有带有“中奖"字样乒乓球的数目

>k<-2##抽取的数目

>dhyper(0:2,m,n,k)

[1]0,8068965520.1862068970.00689655

从计算结果可知,无法中奖的概率竟然高达80.69%,而中奖的概率仅有19.31%,可见该服装

店是不希望顾客中奖的。

我们上面提到,如果总体数目是抽取数目的十倍以上,可以用二项分布的概率质量函数近似超

几何分布的概率质量函数。在本案例中,总体数目为30,是抽取数目2的15倍,尝试用二项分布

的概率质量函数来计算顾客中奖的概率,中奖乒乓球的比例是10%(即p=0.1),随机抽取2个乒乓球,

二项分布概率质量函数的计算结果如下:

>p<-0.1

>dbinom(0:2,2,p)

[1]0,810.180.01

结果表明,两套概率结果的数值非常接近,验证了上述的第三个性质。

第二个问题:至多抽到1个带有“中奖”字样乒乓球的概率是多少?此时要用到phyper(q,m,n,

k)函数,其中q参数指定至多抽中的数目(这里为1),函数返回相应累积概率,比如:

第6页共8页

>m<-3##带有“中奖"字样乒乓球的数目

>n<-30-m##没有带有“中奖"字样乒乓球的数目

>k<-2##抽取的数目

>phyperfl,m,n,k)

[1]0.9931034

结果表明,至多抽到1个带有“中奖”字样乒乓球的概率高达99.3%

第三个问题:90%概率下我们至多能抽到几个带有“中奖”字样乒乓球的概率是多少?此时要

用至I」qhyper(p,m,n,k)函数,其中p参数指定概率(这里是0.9),函数返回相应分位点x(即F(x)20.9

对应的最小

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论