试验统计 第四章 概率的理论分布和抽样分布_第1页
试验统计 第四章 概率的理论分布和抽样分布_第2页
试验统计 第四章 概率的理论分布和抽样分布_第3页
试验统计 第四章 概率的理论分布和抽样分布_第4页
试验统计 第四章 概率的理论分布和抽样分布_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验设计和统计分析,第四章理论分布和抽样分布,本课程以盖军编辑的实验统计方法一书为教材。、第二章实验设计和实施,第三章数量分布和平均值、变异,第五章统计假设测试,第八章参数估计方法,第六章方差分析,第七章开方测试,第九章线性回归和相关,第一章科学实验和错误控制第13章多因素测试结果的统计分析,第15章抽样调查,第11章曲线回归,第4章概率的理论分布和抽样分布,第2节事件和概率,第3节正态分布,第4节抽样分布,不可能事件,第1节事件和概率,随机事件,概率,必然的事件,事件发生的概率以p()表示。例如P(A)、P(B)等。概率的有效范围为01,即0P(A)1。必需事件记录为1,即P()=1的概率。

2、事件不能记录为0,即P()=0。随机事件的概率在01之间,即0P(A)1。可以扩展到第一部分和概率、事件之间的关系和/或事件、产品(交叉)事件、n个事件中的一个或多个激发事件。可以扩展到n个事件同时发生的事件。事件和概率、事件之间的关系和事件、产品事件、互不相容事件、相反事件、事件系统、事件独立、完全互不相容事件系统、第一个事件和概率、计算事件概率的法则、互不相容事件的加法法则、n两个互不相容事件概率等于n个事件概率。如果AB=,则P(A B)=P(A) P(B)。也就是说,如果AiAj=,则P(Ai)=P(Ai)。第一节和概率,计算事件概率的法则,相互排斥事件的加法法则,独立事件的乘法法则,

3、都可以导致n个单独事件发生的概率乘以n个单独事件发生的概率,分别等于n个事件发生的概率。即P(Ai)=P(Ai)。即P(AB)=P(A)P(B)。相反事件的概率,第一节和概率,计算事件概率的法则,互斥,独立事件的乘法,完全互斥的概率之和为1。也就是说,如果AiAj=A1 A2 An=,则P(Ai)=1。非独立事件的乘法,即P(AB)=P(A)P(B|A)。其中P(B|A)是事件A发生时事件B发生的概率,称为条件概率。使用随机变量量化第一部分事件和概率、随机事件和随机事件的结果。如果可以用数字表示随机事件的结果,就可以对随机事件的发生规则进行有效的研究。随机变量,可以将随机事件的每个结果表示为随

4、机变量。所有可能的结果构成了随机变量。因此伴随变量是随机变量的数据集。如果随机事件只有几个结果,则相应的伴随变量是不连续的随机变量。如果随机事件在一定范围内连续可能的结果数不清,则该随机变量是连续随机变量。对于第一节事件和概率,离散随机变量,可以计算随机事件结果发生的概率。调查2500堆种子等“从这堆中随机抽取的品种”。其中a品种为250个,b品种为1000个,c品种为750个,d品种为500个。只有四种结果。发生概率为:可以用不连续的端序变量y表示。得到概率分布表。如果概率P(y)和变量y之间存在函数关系f(y),就可以得到概率分布函数。第二部分第二个分布检查一般随机事件,使用随机变量表示结

5、果,查看此随机变量的概率分布。您可以使用任何变数(例如,y)来表示它,在某些情况下,您会记住y=0,而在其他情况下,则记录y=。在考试或调查中只存在两种结果的相反随机事件很常见。即,调查人的性别、农作物疾病与否、扔硬币是否积极等。调查所有(狗)研究对象,获取y值,构成整体。这整个由0个或1个相反事件组成的整体称为两个整体。以下是显示两种总体概率分布的简单示例:如果事件发生的概率为p,则该事件的概率为q=1-p,并执行n次迭代独立实验。此事件发生y次的可能性(概率)是多少?第二节二项式分布是大豆的子叶有黄色和绿色两种,这种颜色由隐性重叠基因两对控制。有一对基因差异的大豆子叶品种与青子叶品种杂交,

6、结果后代(F1代)为黄子叶。F1代自交得到的F2代子叶为3/4黄,1/4青。如果在整个F2代中随机抽取n粒大豆,其中y粒是黄色子叶的可能性有多大?想象一下有两个豆子的豆荚(即n=2)的例子。y=0,即两颗都是青色,y=1,1颗是青色,1颗是黄色:y=2,两颗是黄色:请总结一下。问题是,如果事件发生的概率为p,相反事件发生的概率为q=1-p,n如果进行重复独立试验,那么事件发生y次的概率(概率)是多少?例如:n=2、p=3/4、q=1/4、y可以是0,1,2。p(y=0)=(1)(1/4)(1)(3/4)0(1/4)2=(1)p0q 2-0 p(y=1)问题是,如果事件发生的概率为p,相反事件发

7、生的概率为q=1-p,n如果进行重复独立试验,那么事件发生y次的概率(概率)是多少?例如:n=2、p=3/4、q=1/4、y可以是0,1,2。p(y=0)=(1)(1/4)(1)(3/4)0(1/4)2=(1)p0q 2-0 p(y=1)p(y=0)=(1)(1/4)(1/4)(1/4)=(1)p0q 3-0 p(y=1)=(3) 第二部分第二个分布,N=3点p(y=0)=(1)p0q 3-0 p(y=1)=(3)p1q 3-1 p(y=2)=(3) 系数来自杨辉三角形。y项的概率与牛顿第二项的y项完全相同。其中y=0,1,n。如果随机变量y的概率分布函数是,则随机变量y遵循参数n,p的二项式

8、分布或贝萨丽分布。可以认为,通过重复独立实验获得的所有数据都遵循贝努利分布。这种数据通常称为二项式分布数据。第二部分的第二个分布,例如4.1 (p.54)问,在特定棉田中,每只盲蝽危险的概率是p=0.35,现在随机挑选5株,其中0,1,2,3,4,5株牺牲的概率是多少。0,1,2,3,4,5棵树牺牲的概率是?n=5,p=0.35,q=0.65,记住受害者数y,使用两个分布函数,受害者数y的概率分布和累积概率为:第二部分第二种分布,另一个例子:一套产品中混合了15%的次品。由此随机选出了5个,问其中0,1,2,3,4,5个是次品的概率是多少,有0,1,2,3,4,5个是次品的概率是多少?n=5,

9、p=0.15,q=0.85,次品数y,作为两个分布函数数,次品数y的概率分布和累计概率为:第二节的第二个分布,比较这两个例子的概率分布表和概率分布图,这两个分布的形式由n和p的两个参数决定。如果P=q=0.5,则分布是对称的。如果是P q,则分布不对称。p和q的差值越大,分布越歪。使用概率分布表计算随机变量y的总体平均值和总体方差2的第二部分的第二个分布。通过合计数列,y的总平均值为:以同样的方式,y的总体方差如下:y的总标准差(平方方差)为:从上述棉田中牺牲的例子中,n=5,p=0.35,随机抽取一次。0、1、2、3、4、5株可能会牺牲。但是如果无数次被选中,平均会遭受多少棵树的损失呢?y的

10、总体平均值的公式计算方法为:平均值=NP=50.35=1.75。这个平均值有代表性吗?可以用总体标准差来测量,总体标准差为。随机变量y遵循具有参数m的泊松分布,如果第二部分的第二分布、第二分布的极限泊松分布、随机变量y的概率分布函数为,则可以应用泊松分布来处理在特定空间(或时间)中发生的概率较小的系数数据。例如,特定面积内特定植物(或昆虫)的数量;显微镜特定视野中特定细菌(或病毒)的数量;一段时间内对网站的访问次数;被一个海网捕捉的任何稀有鱼类的尾巴数等。第二部分的第二个分布与泊松分布的总体平均值相同,并且当m大时分布倾斜。m越大,对称越大。例如,在p.58表4.4中,用Student的190

11、7年血细胞计,将1 mm2的视野除以400,计算了每个晶格中酵母的实际观察数。使用泊松分布概率函数与计算的理论数进行比较。可以看出两列数字很合适。理论上的数值计算方法:用实际数据计算平均值:1872/400=4.68;在概率函数中替换m以获得每个y的概率。将每个y的概率乘以400,得出相应的理论数。因此,当y=0时,P(0)=(4.680e-4.68)/0!=0.00275;理论数:0.00995400=3.71;如果Y=1,则P(1)=(4.681e-4.68)/1!=4.68 0.00275=0.043426;理论数字:0.043426 400=47.37;如果Y=2,则P(2)=(4.6

12、82e-4.68)/2!=4.682 0.00955/2=0.101616;理论数:0.101616 400=40.65;第三节正态分布在连续随机变量中有无数可能的连续值,这是因为与不连续随机变量一样,无法计算每个可能值的发生可能性。实际上,连续随机变量正好等于某个值的概率为零。如果任意事件在一定范围内具有大量连续的可能结果,则该随机变量称为连续随机变量。对于连续随机变量,只能计算被调查对象的观察在一定范围内的概率。寻找连续随机变量的合适函数,并使用该函数在特定区间上的常数积分来表示变量落在该区间上的概率。这些函数称为相应随机变量的分布密度函数。第三部分的正态分布如果为随机变量y找到函数f(y

13、),则具有以下特征:如果y是任意实数,则f(y)0,即f(y)是非负函数。间距(-,)中y的广义积分,即f(y)和y轴之间的总面积为1。也就是说,y落在区间(y1,y2)之间的概率等于该区间内的明确积分。函数f(y)称为随机变量y的分布密度函数。原始函数称为概率分布函数,简称分布函数。在第三部分的正态分布中,随机变量y落入间隔(y1,y2)的概率为:随机变量y的概率密度函数为时,随机变量y与参数一起遵循正态分布。记录为。其中是y的平均值,是y的方差。概率分布函数如下:可以使用密度函数创建正态分布曲线的图像。第三节正态分布,正态曲线的特性:单峰,倒铃,y=到f(y)最大;y时f(y)0;y=绕轴

14、左右对称。曲线和水平轴之间的面积为1。Y=有两个拐点。如果不变更,则变更将曲线左右转换,且不变更造型;=0时,镜射轴与垂直轴重合。说明指示数据的中心位置。不变时,变化改变曲线的形状,对称轴不变;随着变化,曲线变得更细,中间的面积变得更大。曲线变大,中间的面积变小。说明是对数据变化程度的测量。是第三部分的正态分布,所以随机变量y落在间隔(y1,y2)的概率是:正态分布函数是:计算这种固定积分不是一件容易的事,需要探索更简单、更容易的方法。第三部分的正态分布使原始变量y在地块(y1,y2)之间的概率可以计算为u在地球之间(u1,u2)的概率。y的平均值,方差为2,所以平均值为:方差:统计学家已经计算了标准正态分布的概率。我们只能计算与其他u对应的(u)值。部分iii正态分布,检查p.357计划2: (1)=0.1587,(1)=0.84

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论