几种常见的概率分布_第1页
几种常见的概率分布_第2页
几种常见的概率分布_第3页
几种常见的概率分布_第4页
几种常见的概率分布_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于几种常见的概率分布第1页,共81页,2023年,2月20日,星期三确定性现象:不需要概率论和统计学非确定性现象:统计学研究—随机现象,无简单的因果关系,如动物出生的体重.某个样本推断总体时推断错误的可能性有多大?置信度有多高?非确定性现象是有规律的。研究偶然现象本身规律的科学称为概率论.概率论和统计学,是以随机试验为研究对象的。第2页,共81页,2023年,2月20日,星期三2.1概率的的基本概念2.1.1概率的古典定义(略)

例:掷一颗均匀的色子,求“掷出偶数的概率”例:在10尾鱼中,有6尾健康鱼,4尾病鱼。求“从中抽2尾均为病鱼”的概率。以等可能为前提(1)随机试验中,基本事件的总数n为有限个(2)各基本事件的发生是等可能的(各基本事件等概率)这类随机现象的概率类型称为古典概型。则事件A的概率:P(A)=A中包含的基本事件数/基本事件总数=m/n第3页,共81页,2023年,2月20日,星期三表2.1在相同条件下水稻种子发芽试验结果试验粒数(n)510501002005001000发芽粒数(a)584491179452901发芽频率(a/n)1.00.80.880.910.8950.9040.9012.1.2概率的统计定义课本P27表第4页,共81页,2023年,2月20日,星期三2.1.3概率的基本性质:3、不可能事件(V)的概率等于0,即:P(V)=01、任何事件(A)的概率都在0与1之间

0≤P(A)≤12、必然事件(W)的概率等于1,即:P(W)=1概率是事件在试验结果中出现可能性大小的定量计量,是事件的固有属性。概率有以下明显性质:第5页,共81页,2023年,2月20日,星期三

假定在相似条件下重复进行同一类试验,调查事件A发生的次数m与试验总次数n的比数称为频率(m/n),则在试验总次数n逐渐增大时,事件A的频率愈来愈稳定的接近一个定值p,则定义为事件A发生的概率.记为P(A)=p=m/n在实际问题中,由于试验次数n不可能无限增大,因此,常将n充分大时,事件A发生的频率作为其概率的近似值。第6页,共81页,2023年,2月20日,星期三1.加法法则任意事件A、B,有:

P(A+B)=P(A)+P(B)

–P(AB)若事件A和B互斥,则:

P(A+B)=P(A)+P(B)

例如在一鱼池中,放养草鱼鲢鱼和鲤鱼各100尾。草鱼主要吃植物性食料,鲢鱼吃浮游生物,而鲤鱼则为杂食性,求这一鱼池中单食性鱼的概率。2.1.4概率的运算第7页,共81页,2023年,2月20日,星期三2.条件概率在同一个样本空间Ω中的事件或者子集A与B,如果随机从Ω中选出的一个元素属于B,那么下一个随机选择的元素属于A的概率就定义为在B的前提下A的条件概率,记为P(A/B)。

P(A/B)=P(AB)/P(B)

课本P29例2.2,缩小了样本空间第8页,共81页,2023年,2月20日,星期三3.概率乘法法则:P(AB)=P(A)×P(B/A)P(AB)=P(B)×P(A/B)A和B是两个独立事件(事件A的发生并不影响事件B发生的概率),则:P(AB)=P(A)×P(B)

若一批玉米种子发芽率为0.9,发芽后能出土的概率为0.8,求这批种子的出苗率?P(A×B)=P(A)×P(B)=0.9×0.8=0.72第9页,共81页,2023年,2月20日,星期三例:

在10尾鱼中有3尾雌鱼,7尾雄鱼。按不放回抽样从中抽取2尾,每次抽取1尾,求“第一次抽得雄鱼,第二次抽得雌鱼”的概率。设A表示“第一次抽得雄鱼“,B表示”第二次抽得雌鱼”,则P(A)=7/10,P(B/A)=3/9P(AB)=7/10*3/9若按放回抽样从中抽取2尾,每次抽取1尾,求“第一次抽得雄鱼,第二次抽得雌鱼”的概率。第10页,共81页,2023年,2月20日,星期三4.独立事件的概率若事件A的发生,并不影响事件B的发生的概率,则称A与B是独立事件。事件A的概率为P(A),那么对立事件B的概率为:P(B)=1-P(A)若一批种子发芽率为0.9,则不发芽率的概率为1-0.9=0.1第11页,共81页,2023年,2月20日,星期三例:在一鱼池中,草鱼、鲢鱼和鲤鱼所占比例分别为50%、30%、20%,其病鱼率分别为1%,2%,4%。求从此鱼池中任意取出1尾是病鱼的概率。计算复杂事件的概率时,常需将它们分解为一些较简单的事件,再应用概率的法则设A1、A2、A3分别表示“取出鱼是草鱼”、“取出鱼是鲢鱼”和“取出鱼是鲤鱼”,B表示”任意取出一条是病鱼”,A之间互斥,和为全样本.第12页,共81页,2023年,2月20日,星期三P(B/A1)=0.01,P(B/A2)=0.02,P(B/A3)=0.04据全概率公式得:P(B)=P(A1B)+P(A2B)+P(A3B)P(A1)P(B/A1)+P(A2)P(B/A2)+P(A3)P(B/A3)=0.05*0.01+0.3*0.02+0.2*0.04=0.019第13页,共81页,2023年,2月20日,星期三&2.2随机变量的概率分布2.2.1离散型随机变量的概率分布

若随机变量X只取数轴上有限个或无限个子孤立x1,x2,x3…xn,并且这些值对应的概P1,P2,P3…Pn,则称X是离散型随机变量.其概率函数为:

p(x)=P(X=x)或表示为P{X=xi}=pi,i=1,2,…..

其中:p(x)≥0,∑p(x)

=1。大写字母表示随机变量,小写字母表示第i次观测值随机变量(randomvariable)就是在随机试验中被测定的量。第14页,共81页,2023年,2月20日,星期三将随机变量X的一切可能值x1,x2,x3….以及取得这些值的概率p1,p2,p3…..排列起来,就构成了离散型随机变量的概率分布图。(P31)P(x)x1x2xn第15页,共81页,2023年,2月20日,星期三常用离散型随机变量的分布:0-1分布;二项分布;泊松分布离散型随机变量的分布函数是指随机变量小于等于某一可能值xi的概率。第16页,共81页,2023年,2月20日,星期三2.2.2连续型随机变量的概率分布

如随机变量可取某一(有限或无限)区间内的任何数值,称为连续型随机变量。如小麦株高。在研究连续型随机变量是,实际观测值只能是落在一定的区间内,落在一定区间内的概率可以不为0,但区间可以很小。随机变量Y的值落在区间(y,y+∆y)内的概率为P(y<Y<y+∆y)。当∆y→0时,的极限表示随机变量Y在点y处的概率密度,用f(y)表示,称f(y)为随机变量的概率密度函数。第17页,共81页,2023年,2月20日,星期三f(y)为随机变量的概率密度函数正态分布概率密度函数:第18页,共81页,2023年,2月20日,星期三分布函数(累积分布函数):是随机变量Y取得小于y0值的概率,是对概率密度的积分。分布曲线在区间(-∞,y)所夹的面积。第19页,共81页,2023年,2月20日,星期三-3-2-10123t或u0.40.30.20.1f(x)ab概率P(a<X<b)就是区间(a,b)夹的曲线下面积。概率密度的图形,称为分布曲线。第20页,共81页,2023年,2月20日,星期三&2.3几种常见的概率分布&2.3.10-1分布&2.3.2二项分布&2.3.3泊松分布&2.3.4正态分布(P50)第21页,共81页,2023年,2月20日,星期三2.3.10-1分布若随机变量X只能取0,1两个值,且

P(X=1)=p,P(X=0)=1-p=q,(0<P<1),则称X服从参数为p的0-1分布.

若一随机试验只有两种可能,则称该试验为伯努利试验.μ==0q+1p=Pσ2=Σp(x)(x-μ)2=(0-p)2q+(1-p)2p=pq第22页,共81页,2023年,2月20日,星期三2.3.2

二项分布例1:某养殖场鱼烂鳃病的发生率为0.8,求在随机抽取的10尾鱼中,(1)恰有4尾发病的概率;(2)最多有8尾发病的概率;(3)发病的平均尾数与方差.例2.课本P41例3.1第23页,共81页,2023年,2月20日,星期三1.二项分布的概率函数:特点:总体X只能出现非此即彼两种对立的结果。假定某事件A发生的概率为p,不发生的概率为q,则做n次独立性试验(独立进行n次伯努利试验),发生k(0≤k≤n)次的概率为(或参课本P35表示):则随机变量X服从参数为n和p的二项分布,记为X~B(n,p).第24页,共81页,2023年,2月20日,星期三2.二项分布的特点:(1)P(x=k)=Pn(k)≥0(2)二项分布概率之和等于1.(展开式各项是事件A发生n次的概率)第25页,共81页,2023年,2月20日,星期三二项分布由n和P两个参数决定,其特点是:①当P值较小且n不大时,分布是偏倚的。但随着n的增大,分布逐渐趋于对称,如图3—1所示。③对于固定的n及p,当x增加时,Pn(x)先随之增加并达到某极大值,以后又下降。②当P值趋于0.5时,分布趋于对称,图3—2所示。第26页,共81页,2023年,2月20日,星期三3.服从二项分布的随机变量的特征数b.二项分布的总体方差:

σ2=npq

表示X取值的离散度或变异大小

二项分布的总体平均数μ

表示做n次独立试验,某事件平均出现的次数为np次第27页,共81页,2023年,2月20日,星期三3.二项分布的概率计算应用

例1:有一批芽接苗,其成活率为0.85,今从中随机抽取6株种植,求(1)正好有5株成活的概率?(2)最少有4株成活的概率?(3)最多有4株成活的概率?(4)平均成活数?(5)平均变异?第28页,共81页,2023年,2月20日,星期三(5)总体方差:σ2=npq=6×0.85×0.15=0.765

表示成活株数平均差异0.87

(4)总体平均数μ=np=0.85×6=5.1

随机抽6株,平均5.1株成活。第29页,共81页,2023年,2月20日,星期三

泊松分布是一种可以用来描述和分析随机地发生在单位时间或空间里的稀有事件的概率分布。

例:正常生产线上单位时间生产的不合格产品数,每毫升饮水内大肠杆菌数,意外事故,自然灾害等。2.3.3泊松分布第30页,共81页,2023年,2月20日,星期三当某事件出现的概率p很小,而试验n很大时(n+∞,p-0,np--λ时),二项分布B(n,p)的极限分布,即泊松分布,记为X~P(λ)。当二项分布在p<0.1和np<5时,可用泊松分布近似。1.泊松分布定义第31页,共81页,2023年,2月20日,星期三2.特点:在概率函数内的μ,不但是它的平均数,而且是它的方差.μ=σ2=λ其概率分布条形图的形状决定于λ。用λ=np进行有关计算。3.应用实例(课本P41,例3.5)第32页,共81页,2023年,2月20日,星期三2.3.4正态分布1、正态分布的密度函数和分布函数-3-2-10123两头少,中间多,两侧对称。数据的这种分配规律称为正态分布又称高斯(Gauss)分布,是连续性随机变量的一种最重要的理论分布,是生物统计学的重要基础。正态分布曲线:正态分布密度函数的图像称为正态曲线。第33页,共81页,2023年,2月20日,星期三(1)正态分布概率密度函数:如果随机变量X的概率密度函数满足上式,则称X服从正态分布,记为第34页,共81页,2023年,2月20日,星期三

x:所研究的变数;:x的函数值,称为概率密度函数;:总体平均数;:总体标准差其中,是两个常数,正态分布记为N(,),表示具有平均数为,方差为的正态分布。(样本中的观察值总合叫变数,变数中每个成员为变)第35页,共81页,2023年,2月20日,星期三(1)单峰曲线(2)左右对称(X=μ)(3)在x=μ±σ处曲线各有一拐点(4)曲线图形由μ、σ确定。总体标准差σ表示曲线展开程度。(5)X──〉±∞f(x)──〉0(6)曲线与横坐标所夹的面积等于1(100%)(2)正态分布曲线(正态分布密度函数的图象)特点:第36页,共81页,2023年,2月20日,星期三第37页,共81页,2023年,2月20日,星期三密度函数(3)正态分布的分布函数(累积分布函数):

是随机变量X取得小于x的值的概率第38页,共81页,2023年,2月20日,星期三概率密度函数:正态分布曲线:

正态分布密度函数的图像称为正态曲线。累积分布函数:是随机变量X取得小于X值的概率,是对概率密度的积分。分布曲线在区间(-∞,y)所夹的面积。第39页,共81页,2023年,2月20日,星期三对于任何正态分布,随机变量X的值落入任意区间(a,b)的概率为:

密度函数第40页,共81页,2023年,2月20日,星期三-3-2-10123t或u0.40.30.20.1f(x)ab第41页,共81页,2023年,2月20日,星期三第42页,共81页,2023年,2月20日,星期三2、正态分布的概率计算

根据正态分布的性质,变量在两个定值间取值的概率等于曲线与其x轴在该区间围成的面积。

因此概率的计算即正态分布概率密度函数的定积分计算。

是一个曲线系统。为了一般化的应用,需将正态分布标准化。第43页,共81页,2023年,2月20日,星期三

(1)标准正态分布:=0,

=1时的正态分布称为标准正态分布记作N(0,1)(u)

称为标准化正态分布密度函数,即第44页,共81页,2023年,2月20日,星期三

从表中可以查出Ф(u)的值.其值等于标准正态曲线从-∞到u所夹的曲线下面积。该曲线下的面积表示随机变量U落入区间(-∞,u)的概率。第45页,共81页,2023年,2月20日,星期三(1)在u=0时,达到最大值(2)左右对称,(3)在u=-1和u=1处曲线各有一拐点(4)曲线图形由μ、σ确定(5)X──〉±∞f(x)──〉0(6)曲线与横坐标所夹的面积等于1(100%)标准正态分布特点:第46页,共81页,2023年,2月20日,星期三-3-2-10123t或u0.40.30.20.1f(t)或(u)Фu分布t分布(df=1)图4.3t分布及其与标准正态曲线的比较第47页,共81页,2023年,2月20日,星期三常用标准正态曲线下的面积(概率)积分得[u=-1.96,μ=+1.96](面积)概率为95%

[u=-2.576,μ=+2.576](面积)概率为99%在统计学上称两尾的概率之和P=5%为5%的显著水准P=1%为1%的显著水准第48页,共81页,2023年,2月20日,星期三第49页,共81页,2023年,2月20日,星期三

正态分布表的查法P325附表第50页,共81页,2023年,2月20日,星期三第51页,共81页,2023年,2月20日,星期三第52页,共81页,2023年,2月20日,星期三

正态分布表的查法P325附表第53页,共81页,2023年,2月20日,星期三正态分布的单侧临界值附表3正态分布上侧临界值由α查u值由u

查α值附表2附表3查当α=0.05时的u值第54页,共81页,2023年,2月20日,星期三1.645第55页,共81页,2023年,2月20日,星期三第56页,共81页,2023年,2月20日,星期三第57页,共81页,2023年,2月20日,星期三规定:表示α的上侧临界值表示α的下侧临界值表示α的双侧临界值第58页,共81页,2023年,2月20日,星期三

由于正态分布图形随μ,σ不同而变,不便比较,将X转化为u值:即把原正态分布转化为标准正态分布。(2)正态分布的标准化即新的随机变量服从标准备正态分布第59页,共81页,2023年,2月20日,星期三从N(,2)到N(0,1),从几何意义上说,仅仅是将变量x作了横坐标轴的平移和尺度单位的变化。第60页,共81页,2023年,2月20日,星期三经过标准变换后,X的分布函数第61页,共81页,2023年,2月20日,星期三P54例2.1已知高梁品种“三尺三”的株高Y服从正态分布N(156.2,4.822),求:(1)Y<161cm的概率;(2)Y>164cm的概率;(3)Y在152~162cm的概率。第62页,共81页,2023年,2月20日,星期三第63页,共81页,2023年,2月20日,星期三例2.2

250株小麦的高度分布服从正态分布N(63.33,2.882),问:(1)株高在60cm以下的概率?(2)株高在69cm以上的概率?(3)株高在62~64cm之间的概率?(4)株高在多少cm以上的占全体的95%?第64页,共81页,2023年,2月20日,星期三例2.3已知某作物株高增量(cm)服从正态分布N(250,1.582)若P(x<l1)=P(x≥l2)=0.05,求l1和l2。表3:P(Y>ua)=a第65页,共81页,2023年,2月20日,星期三2.3.4中心极限定理X1=光强X2=光质Xi=光质X6=氧气X5=水X4=NX3=Px1+x2+x3+……….=X已证明,随机变量和的分布趋于正态分布,故X趋于正态分布当n充分大时(极限的原理和方法),无论各个Xi的分布是什么,这个部分和的分布是近似正态的.第66页,共81页,2023年,2月20日,星期三

假设被研究的随机变量X,可以表示为许多相互独立的随机变量Xi的和。如果Xi的数量很大,而且每一个别的Xi对X所起的作用又很小,则随机变量X(和)可以被认为服从或近似地服从正态分布。据此定理才能从单个样本的n个数据所得到的统计量对总体进行估计.1、中心极限定理基本内容第67页,共81页,2023年,2月20日,星期三2、中心极限定理重要推理:若已知总体平均数为μ,标准差为σ,那么,不论该总体是否正态分布,对于从该总体所抽取的含量为n的样本,当n充分大时,其平均数渐近服从正态分布N(μ,σ2/n)---公式推导证明见P57-P58,实例证明见P59例3.11从一个正态总体中抽取的样本,不论样本含量的大小,其样本数均服从正态分布实例证明见P63图3-15第68页,共81页,2023年,2月20日,星期三总体Y:非正态分布,呈正偏的偏态分布第69页,共81页,2023年,2月20日,星期三n=2n=4n=8n=32n=16样本平均数的分布:随样本含量的增加,逐渐趋于正态分布第70页,共81页,2023年,2月20日,星期三例如,设有一个N=4的有限总体,其变量值为2、3、3、4。总体的平均数、方差和标准差第71页,共81页,2023年,2月20日,星期三

当以样本容量n=2进行独立抽样,抽取的所有可能样本数,其平均数、方差和标准差如下表。第72页,共81页,2023年,2月20日,星期三样本观察值x2222333333334444234323342334∑x455656675667677823342.02.52.53.02.53.03.03.52.53.03.03.53.03.53.54.00.00.50.52.00.50.00.00.50.50.00.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论