生物统计学课件正态分布和抽样分布_第1页
生物统计学课件正态分布和抽样分布_第2页
生物统计学课件正态分布和抽样分布_第3页
生物统计学课件正态分布和抽样分布_第4页
生物统计学课件正态分布和抽样分布_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学课件正态分布和抽样分布演示文稿目前一页\总数五十七页\编于二十点生物统计学课件正态分布和抽样分布目前二页\总数五十七页\编于二十点二、正态分布的密度函数和累积函数1、密度函数和正态曲线对于平均数是µ,标准差是的正态分布,其密度函数为:其中:-∞<x<∞,>0。目前三页\总数五十七页\编于二十点正态分布密度函数在直角坐标上的图象称正态曲线x决定正态曲线最高点横坐标的值,决定正态曲线最高点纵坐标的值和曲线的开张程度,越小,曲线越陡峭,数据越整齐。N(,2)N(156,4.82),N(15,4)正态曲线有一组而不是一条目前四页\总数五十七页\编于二十点2、正态分布的累积函数对于任何总体分布,随机变量X的值落入任意区间(a,b)的概率,为:目前五页\总数五十七页\编于二十点非标准正态分布:目前六页\总数五十七页\编于二十点目前七页\总数五十七页\编于二十点目前八页\总数五十七页\编于二十点三、标准正态分布称=0,=1时的正态分布为标准正态分布,记为N(0,1)。1、标准正态分布的密度函数和累积函数密度函数:其中:-∞u∞目前九页\总数五十七页\编于二十点累积函数:标准正态分布的分布曲线目前十页\总数五十七页\编于二十点标准正态分布的累积分布曲线u目前十一页\总数五十七页\编于二十点2、标准正态分布的特性•在u=0时,(u)达到最大值•当u不论向哪个方向远离0时,e的指数都变成一个绝对值值越来越大的负数,因此(u)的值都减小。•曲线以纵坐标为对称轴,即

(u)=(-u)目前十二页\总数五十七页\编于二十点2、标准正态分布的特性•曲线在u=-1和u=1处有两个拐点•曲线和横轴所夹的面积为1•对于标准正态曲线的累积分布函数Φ(u)的值,有编制好的数值表,从表中可以查出Φ(u)的值。目前十三页\总数五十七页\编于二十点•下列一些值很重要:P(-1u1)=0.6827,P(-2u2)=0.9543,P(-3u3)=0.9973,P(-1.96u1.96)=0.9500,P(-2.576u2.576)=0.9900目前十四页\总数五十七页\编于二十点四、正态分布表(累积函数表)的查法1、标准正态分布随机变量落在某区间(a,b)内的概率,可以从标准正态分布表中查出。附表2列出了对于-2.99U2.99时的(u)的值。附表2正态分布表查P(u-1.23)=(-1.23)=0.10935P(u2.21)=(2.21)=0.98645目前十五页\总数五十七页\编于二十点2、利用下面的一些关系式,从附表2中可以查到一些常用的概率b、P(U>u)=(-u)a、P(0<U<u)=(u)-0.5b、P(U>u)=1-(u)目前十六页\总数五十七页\编于二十点c、P(|U|>u)=2(-u)d、P(|U|<u)=1-2(-u)e、P(u1<U<u2)=(u2)-(u1)目前十七页\总数五十七页\编于二十点例:P(-0.82<U<1.15)=(1.15)-(-0.82)=0.87493-0.20611=0.66882

3、非标准正态分布:常见的情形是N(,2),为了能够使用正态分布表,可将N(,2)化成N(0,1),再按上述方法从正态分布表中查取相应的数值。化为标准正态分布的方法:令:于是,X的累积函数:目前十八页\总数五十七页\编于二十点例:已知“三尺三”高粱品种的株高分布服从正态分布N(156.2,4.822)(cm),求株高低于161cm的概率,株高高于164cm的概率和株高在152cm和162cm之间的概率?解:已知株高X服从N(156.2,4.822),当X<161cm时,标准正态离差目前十九页\总数五十七页\编于二十点当X>164cm时,当152<X<162时,目前二十页\总数五十七页\编于二十点五、正态分布的分位数1、单侧分位数上侧分位数:下侧分位数:当时的当时的0.052、双侧分位数时的当目前二十一页\总数五十七页\编于二十点3、正态分布上侧分位数(u)表的查法:u0.01=2.326u0.05/2=1.960u0.01/2=2.576目前二十二页\总数五十七页\编于二十点六、中心极限定理假设被研究的随机变量X,可以表示为许多相互独立的随机变量Xi的和,那么,如果Xi的数量很大,而且每一个别的Xi对于X所起的作用很小,则可以被认为X服从或近似地服从正态分布。生物界乃至整个自然界中,符合正态分布的现象非常之多,所以正态分布是生物统计学的基础。目前二十三页\总数五十七页\编于二十点复习思考题①什么是随机变量?举例说明随机变量的种类?②举例说明如何利用随机变量表示一个事件?如何利用随机变量定义总体和样本?③为什么连续型随机变量取得某一具体观测值的概率是0?④离散型随机变量和连续型随机变量的累积函数有何区别?⑤累计函数和分布曲线的主要用途。⑥二项分布的应用前提和条件?泊松分布和二项分布概率函数的关系?⑦正态分布的意义和特点。⑧正态分布的密度函数和分布曲线的特点。⑨什么是正态分布的分位数?都有哪些种?目前二十四页\总数五十七页\编于二十点第六节抽样分布生物统计学最核心的问题就是研究总体和样本之间的关系问题总体样本抽样统计推断从一个已知的总体中,独立随机地抽取含量为n的样本,研究所得样本的各种统计量的概率分布,即为抽样分布。目前二十五页\总数五十七页\编于二十点一、从一个正态总体中抽取的样本统计量的分布(一)、样本平均数的分布1、标准差已知时样本平均数的分布----u分布若随机变量X服从N(,2),当我们以n为样本容量从N(,2)中抽样,则以抽取的样本平均数作为随机变量时,服从正态分布,且:即:将平均数标准化,则:u服从N(0,1)目前二十六页\总数五十七页\编于二十点若X来自非正态总体,或有限总体,只要样本容量n足够大,则从总体中抽取的样本平均数依然服从正态分布,且有:将平均数标准化,则:,u服从N(0,1)即:目前二十七页\总数五十七页\编于二十点例:假如某总体由三个数字2、4、6组成,现在从该总体中做放回式抽样,样本容量样本样本数n=124631平均数246n=222,24,42,26,62,44,46,64,6632平均数233444556n=3222,224,244,246,426,624,442,446,644,664,666,33

平均数22.673.334443.334.674.675.336n=434=81n=535=243n=636=729n=838=6561n=10310=59049n=205904959049目前二十八页\总数五十七页\编于二十点2、标准差未知时的样本平均数的分布----t分布若总体的方差是未知的,即标准差未知,可以用样本的标准差s代替总体的标准差,则变量变为tu符合N(0,1)分布,t则不服从标准正态分布,而是服从具有(n-1)自由度的t分布,其中称为样本标准误差。目前二十九页\总数五十七页\编于二十点t分布的密度函数:目前三十页\总数五十七页\编于二十点t分布也是一种对称分布,它只有一个参量,即自由度,以df表示。所谓自由度是指独立观察值的个数。随着df的增加,t分布越来越接近于标准正态分布,df=∞时,=0,=1,t分布与N(0,1)重合,因此,当n很大时的t分布可以近似地按N(0,1)分布处理。目前三十一页\总数五十七页\编于二十点t分布的分位数:上侧分位数下侧分位数单侧分位数双侧分位数:t-t/2/2t-tt/2目前三十二页\总数五十七页\编于二十点t分布的分位数表查t5,0.05=2.015t5,0.05

/2=2.571目前三十三页\总数五十七页\编于二十点(二)、样本方差的分布从N(,2)中以n为样本容量进行抽样,抽取的样本标准差s,为连续型随机变量,当我们以称该随机变量为s2的标准化的随机变量,且该随机变量仍为连续型的随机变量。作为一个新的随机变量时,称上式为具有n-1自由度的卡方。我们以来命名新的随机变量,则有:目前三十四页\总数五十七页\编于二十点分布是概率分布曲线随自由度df而改变的一类分布,它的密度函数为:目前三十五页\总数五十七页\编于二十点分布的分布曲线及分位数目前三十六页\总数五十七页\编于二十点目前三十七页\总数五十七页\编于二十点分位数表的查法目前三十八页\总数五十七页\编于二十点二、从两个正态分布总体中抽取的样本统计量的分布若有N1(1,12)和N2(2,22),从N1中以n1为样本容量进行抽样,并独立地从N2中以n2为样本容量进行抽样,求出研究和的分布,则依下列情形的不同而不同。目前三十九页\总数五十七页\编于二十点(一)、标准差i已知时,两个平均数的差的分布----u分布若以作为新的随机变量,则从统计学(随机变量的数学期望)理论可以证明,做正态分布,且有:即:服从N()目前四十页\总数五十七页\编于二十点现将标准化,则标准化的随机变量u为:目前四十一页\总数五十七页\编于二十点(二)标准差i未知但相等时,两个平均数的差()的分布----t分布若==则用和代替,应以样本方差的加权平均数来替代,即有:目前四十二页\总数五十七页\编于二十点此时的标准化随机变量转化为:t=且有自由度df=n1+n2-2。

此时,有最小的抽样误差。若n1=n2=n,则有:目前四十三页\总数五十七页\编于二十点(三)两个样本方差比的分布——F分布从平均数和方差分别为(1,12)和(2,22)的两个正态总体中,抽出含量分别为n1和n2的样本,并分别求出它们的样本方s12和s22,则标准化后的样本方差之比称为F。F为连续型随机变量:F分布的分布曲线的形状是由一对自由度df1和df2决定的:df1=n1-1,df2=n2-1目前四十四页\总数五十七页\编于二十点1.F分布的分布曲线目前四十五页\总数五十七页\编于二十点2.F分布的分位数若P(Fdf1,df2>Fdf1,df2,)=,称Fdf1,df2,

为的上侧分位数。若P(Fdf1,df2>Fdf1,df2,1-)=1-,称Fdf1,df2,1-为的下侧分位数。上侧分位数的表示方法:Fdf1,df2,下侧分位数的表示方法:Fdf1,df2,1-双侧分位数的表示方法:Fdf1,df2,1-/2,

Fdf1,df2,/2目前四十六页\总数五十七页\编于二十点若P(F>F)=,称F为的上侧分位数。若P(F<F)=,称F为的下侧分位数???若P(F>F1-)=1-,称F1-为的下侧分位数。即:P(F<F1-)=,称F1-为的下侧分位数。辨误!目前四十七页\总数五十七页\编于二十点下侧分位数的换算:目前四十八页\总数五十七页\编于二十点2.F上侧分位数表的查法:F4,20,0.01=4.431,F4,20,0.99=1/F20,4,0.01=1/14.02=0.071目前四十九页\总数五十七页\编于二十点抽样分布①如何初步判断一个生物性状是否符合正态分布?②在一个正态总体中抽取的样本平均数的分布,与总体标准差有怎样的关系?③2分位数和F分位数的下侧分位数表示方法为什么与t分位数、u分位数的下侧分位数表示方法不同?④查找下列分位数:20.05,3;20.95,3;F4,20,0.05;F4,20,0.095;t20,0.05;t20,0.05/2;-t15,0.05;u0.05;u0.05/2;u0.01;u0.01/2目前五十页\总数五十七页\编于二十点作业:P26:1.1,P27:1.3,P28:1.7,1.12。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论