概率与理论分布_第1页
概率与理论分布_第2页
概率与理论分布_第3页
概率与理论分布_第4页
概率与理论分布_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于概率与理论分布第一节事件、概率和随机变量◆

事件和事件发生的概率◆

事件之间的关系◆

计算概率的法则◆

随机变量第四章第2页,共36页,2024年2月25日,星期天一、事件和事件发生的概率事件:每种可能出现的情况称为事件。它是指事物发生某种情况或试验中获得某种结果。概率:就是用来度量每一事件出现的可能性大小的数字特征。频率:在n次试验中,事件A出现的次数叫做A在这n次试验中的频数,而A的频数与试验次数的比叫事件A在n次试验中出现的频率.记为第3页,共36页,2024年2月25日,星期天

频率和概率是不相同的,只有当试验次数无限增大时,任一事件的频率趋于稳定,这时频率又称统计概率.这时的频率和概率才是一样的.调查株数(n)52550100200500100015002000受害株数(a)212153372177351525704植株受害频率(a/n)0.400.480.300.330.360.3540.3510.3500.352第4页,共36页,2024年2月25日,星期天

随机事件:指在同一组条件下,可能发生也可能不发生的事件。也就是说,在某一特定的条件下,可能这样出现也可能那样出现,可能发生的只是其中的几种情况,这种事件称为随机事件。

第5页,共36页,2024年2月25日,星期天二、事件之间的关系1.和事件:事件A和事件B至少有一个发生构成的新事件称事件A和事件B的和事件。记作A+B。2.积事件:事件A和事件B同时发生构成的新事件,又叫变事件,记作AB3.互斥事件:A和B不可能同时存在(或发生)即AB为不可能事件,那么称事件A和事件B是互斥事件。4.对立事件:事件A和B不可能同时发生,但必须发生其一,即A+B为必然事件,AB为不可能事件,这样A、B互为对立事件B是A的对立,记为第6页,共36页,2024年2月25日,星期天5.完全事件系:n个事件两两互斥,且每次试验必有其一出现。则这n个事件构成完全事件系。6.事件的独立性(独立事件):事件A发生与否不影响事件B发生的可能性,反之亦然,那么就称事件A对于事件B是独立的。简称独立事件。

第7页,共36页,2024年2月25日,星期天三、计算概率的法则法则1:互斥事件的加法:假定两互斥事件的概率分别为P(A)和P(B)。则事件A与B的和事件的概率等于事件A的概率与事件B的概率之和,即P(A+B)=P(A)+P(B)。加法定理对于多个两两互斥的事件也成立。P(A+B+…+N)=P(A)+P(B)+…P(N)。推理1:完全事件系的概率:完全事件系的和事件概率等于1。P(A+B+…N)=P(A)+P(B)+…P(N)=1。推理2:对立事件的概率:对立事件的概率互补。若事件A的概率为P(A),那么其对立事件的概率为

因为第8页,共36页,2024年2月25日,星期天法则2:独立事件的乘法:假定P(A)和P(B)是两个独立事件A与B各自出现的概率,则事件A与B同时出现的概率就等于两独立事件出现概率的乘积,即,乘法定理对于n个相互独立的事件也成立,即推理1:若n个事件A、B、…N彼此独立,且当P(A)=P(B)=…P(N)时,则P(AB…N)=[P(A)]n。推理2:非独立事件的乘法:如果事件A和B是非独立的,那么事件A与B同时发生的概率为事件A的概率P(A)乘以事件A发生的情况下事件B发生的概率P(B/A),即P(AB)=P(A)P(B/A)

第9页,共36页,2024年2月25日,星期天四、随机变量

随机变量:是指从随机变数中所取得的某一实数值。随机变量离散型随机变量连续型随机变量第10页,共36页,2024年2月25日,星期天离散型随机变量:试验只有几个确定的结果,并可一一列出,变量y的取值可用实数表示,且y取某一值时,其概率是确定的,这种类型的变量称为离散型随机变量。将这种变量所有可能取值及其对应概率一一列出所形成的分布称离散型随机变量的概率分布,也可用函数f(y)表示,称为概率函数。连续型随机变量:变量y的取值仅是一个范围,且y在该范围内取值时,其概率是确定的。这时取y为一固定值是无意义的,因为在连续尺度上一点的概率几乎为0。这种类型的变量称为连续型随机变量。第11页,共36页,2024年2月25日,星期天对于随机变量,若存在非负可积函数对任意a和b(a<b)都有则称y为连续型随机变量,f(y)称为y的概率密度函数或分布密度。因此,它的分布由密度函数所确定。若已知密度函数,则通过定积分可求得连续型随机变量在某一区间的概率。第12页,共36页,2024年2月25日,星期天第二节二项式分布◆

二项总体、二项式分布◆

二项式分布的概率的计算方法◆

二项式分布的形状和参数

第四章第13页,共36页,2024年2月25日,星期天一、二项总体、二项式分布二项总体:这种由“非此即彼”的事件构成的总体,叫做二项总体。为便于研究,通常将二项总体中的“此”事件以变量“1”表示,记为概率p;将“彼”事件以变量“0”表示,具概率q。因此二项总体又称为“0、1”总体,其概率为p+q=1或q=1-p。第四章第14页,共36页,2024年2月25日,星期天二项式分布:如果从二项总体抽取n个个体,可能得到y个个体属于“此”,那么属于“彼”的个体为n-y。由于是随机独立地从总体中抽取个体的,每项一次抽取的个体均有可能属于“此”,也有可能属于“彼”,那么得到的y个“此”个体的数目可能为0、1、2、…n个。此处将y作为间断性资料的变量,则y共有n+1种取值,这n+1种取值又各有其概率,因而由变量及其概率就构成了一个分布,这个分布叫做二项式概率分布,简称二项式分布或二项分布。第15页,共36页,2024年2月25日,星期天二、二项式分布概率的计算方法

举例说明:大豆子叶颜色由2对隐性重叠基因控制,在其F2代黄子叶表现为显性,黄和青以3:1比例分离。(以二粒荚为例来说明)。全部可能的结果有四种:⑴两粒都是黄的(YY)3/4×3/4=9/16⑵第一次是青的第二次是黄的(GY)1/4×3/4=3/16⑶第一次是黄的第二次是青的(YG)3/4×1/4=3/16⑷两粒都是青的(GG)1/4×1/4=1/16假设y(黄子叶粒数)为变量,黄色子叶的概率为0.75,青色子叶的概率为0.25。那么其概率分别为(见上面)。第16页,共36页,2024年2月25日,星期天

如果一粒豆荚中有三粒种子,那么就有8种可能的情况。⑴全部是青子叶(GGG)1/64⑵仅有一粒黄子叶种子(GGY、GYG、YGG)9/64⑶具有两粒黄了叶种子(YYG、YGY、GYY)27/64⑷全部是黄子叶种子(YYY)27/64数学上的组合公式为n相当于豆荚内种子数,y相当于黄子叶种子数。因此由此可以推知二项分布的概率函数为:第17页,共36页,2024年2月25日,星期天

例如:某种昆虫在某地区的死亡率为40%,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽样10头为一组治疗。试问如新药无疗效,则在10头中死3头、2头、1头以及全部愈好的概率为多少?按照上面的公式进行计算:7头愈好,3头死去的概率为:8头愈好,2头死去的概率为:9头愈好,1头死去的概率为:10头全部愈好的概率为:

第18页,共36页,2024年2月25日,星期天受害株数概率函数P(y)P(y)F(y)nP(y)P(0)0.11600.116046.40P(1)0.31240.4284124.96P(2)0.33640.7648134.56P(3)0.18110.954972.44P(4)0.04880.994719.52P(5)0.00531.00002.12如果每次抽5个单株,抽n=400次,则理论上我们能够得到y=2的次数应为:理论次数=400╳P(2)=400╳0.3364=134.56(次)对于任意y,其理论次数为:理论次数=nP(y)。

第19页,共36页,2024年2月25日,星期天三、二项式分布的形状和参数

对于一个二项式总体,如果p=q,二项式分布呈对称形状,如果p

q,二项式分布则表现偏斜形状。但如果n

时,即使p

q,二项式总体分布的情况也趋于对称形状,所以二项分布的形状是由n和p两个参数决定的。二项总体的平均数

、方差

2和标准差

的公式为:

=np,

2=npq,。例如上述棉田受害调查结果,n=5,p=0.35,所以可求得总体参数为:

=np=5×0.35=1.75株,株。

第20页,共36页,2024年2月25日,星期天第21页,共36页,2024年2月25日,星期天第三节

普松分布

普松分布的平均数、方差和标准差为:

=m,

2=m,,这一分布包括一个参数m(m=np),而且其分布的的形状与m的大小有关,m值越小分布越偏斜,当m值适当大时,则分布趋于对称形状。普松分布的概率函数为:

第四章第22页,共36页,2024年2月25日,星期天第四节

正态分布

正态分布的研究意义★二项式分布的极限——正态分布★正态分布曲线的特性★计算正态分布曲线区间面积或概率的方法

第四章第23页,共36页,2024年2月25日,星期天一、正态分布的研究意义

⑴自然界许多现象趋于正态分布⑵许多其他非正态分布的资料在一定条件下也接近正态分布⑶绝少部分资料的抽样分布,当n适当大时,接近正态分布

第24页,共36页,2024年2月25日,星期天二、二项式分布的极限——正态分布

因为正态分布是二项分布的极限,所以可以由二项分布导出正态分布。对于二项分布,当p=q=0.5时,无论n值大小,二项分布的多边形都必定是对称的;如p

q,而n又很大时,这一多边仍然是对称的。当n

时,则可进一步推导出一个表示观察值y出现的概率函数方程:

第25页,共36页,2024年2月25日,星期天三、正态分布曲线的特性

⒈它是一条对称分布的曲线,且对称轴为y=

,即以平均数为对称轴。⒉随着

的不同,呈现一系列曲线而并不是一条曲线。

确定它在y轴上的位置,

确定它的变异度。不同

的总体具有不同的曲线位置和变异度,所以任何一个正态分布曲线,必须在确定了

后,才能确定曲线位置和形状。⒊从原点所竖立的纵轴是FN(y)的最大值y0,,所以正态分布曲线的算术平均数、中数、众数三者是相等的,都合于

点上。且多数次数分布在平均数附近。

第四章第26页,共36页,2024年2月25日,星期天⒋正态分布曲线在

-

=1

处有拐点,曲线两尾向左右延伸,永不接触,所以y

时,分布曲线以y轴为渐近线。⒌正态分布曲线与

轴之间的总面积等于1。⒍正态曲线的任何两个y的定值间的面积或概率完全以曲线

而确定。第27页,共36页,2024年2月25日,星期天下面为几对常见的区间与其相对应的面积或概率的数字:

区间

1

面积或概率=0.6827

2

0.9545

3

0.9973

1.960

0.9500

2.576

0.9900

第28页,共36页,2024年2月25日,星期天四、计算正态分布曲线区间面积或概率的方法

如果变数y取值介于a、b之间,且a

bP(a

y

b)或者简写为P(a

y

b)

可以通过正态分布曲线下区间的面积来表示其概率。我们知道求曲线下区间的面积,数学上通常用定积分来表示第29页,共36页,2024年2月25日,星期天先将y转换为u

,转化的公式为:例题假定y是一随机变数,具有正态分布,平均数

=30,标准差

=5,试计算小于26,小于40的概率,或者介于26和40之间的概率以及大于40的概率。第30页,共36页,2024年2月25日,星期天

查附表2,当

=-0.8时,FN(26)=0.2119,说明这一分布从-到26范围内的变量占全部变量数的21.19%,或者说y26的概率为0.2119。同样计算FN(40)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论