




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物统计学课件正态分布和抽样分布演示文稿本文档共57页;当前第1页;编辑于星期二\3点31分生物统计学课件正态分布和抽样分布本文档共57页;当前第2页;编辑于星期二\3点31分二、正态分布的密度函数和累积函数1、密度函数和正态曲线对于平均数是µ,标准差是的正态分布,其密度函数为:其中:-∞<x<∞,>0。本文档共57页;当前第3页;编辑于星期二\3点31分正态分布密度函数在直角坐标上的图象称正态曲线x决定正态曲线最高点横坐标的值,决定正态曲线最高点纵坐标的值和曲线的开张程度,越小,曲线越陡峭,数据越整齐。N(,2)N(156,4.82),N(15,4)正态曲线有一组而不是一条本文档共57页;当前第4页;编辑于星期二\3点31分2、正态分布的累积函数对于任何总体分布,随机变量X的值落入任意区间(a,b)的概率,为:本文档共57页;当前第5页;编辑于星期二\3点31分非标准正态分布:本文档共57页;当前第6页;编辑于星期二\3点31分本文档共57页;当前第7页;编辑于星期二\3点31分本文档共57页;当前第8页;编辑于星期二\3点31分三、标准正态分布称=0,=1时的正态分布为标准正态分布,记为N(0,1)。1、标准正态分布的密度函数和累积函数密度函数:其中:-∞u∞本文档共57页;当前第9页;编辑于星期二\3点31分累积函数:标准正态分布的分布曲线本文档共57页;当前第10页;编辑于星期二\3点31分标准正态分布的累积分布曲线u本文档共57页;当前第11页;编辑于星期二\3点31分2、标准正态分布的特性•在u=0时,(u)达到最大值•当u不论向哪个方向远离0时,e的指数都变成一个绝对值值越来越大的负数,因此(u)的值都减小。•曲线以纵坐标为对称轴,即
(u)=(-u)本文档共57页;当前第12页;编辑于星期二\3点31分2、标准正态分布的特性•曲线在u=-1和u=1处有两个拐点•曲线和横轴所夹的面积为1•对于标准正态曲线的累积分布函数Φ(u)的值,有编制好的数值表,从表中可以查出Φ(u)的值。本文档共57页;当前第13页;编辑于星期二\3点31分•下列一些值很重要:P(-1u1)=0.6827,P(-2u2)=0.9543,P(-3u3)=0.9973,P(-1.96u1.96)=0.9500,P(-2.576u2.576)=0.9900本文档共57页;当前第14页;编辑于星期二\3点31分四、正态分布表(累积函数表)的查法1、标准正态分布随机变量落在某区间(a,b)内的概率,可以从标准正态分布表中查出。附表2列出了对于-2.99U2.99时的(u)的值。附表2正态分布表查P(u-1.23)=(-1.23)=0.10935P(u2.21)=(2.21)=0.98645本文档共57页;当前第15页;编辑于星期二\3点31分2、利用下面的一些关系式,从附表2中可以查到一些常用的概率b、P(U>u)=(-u)a、P(0<U<u)=(u)-0.5b、P(U>u)=1-(u)本文档共57页;当前第16页;编辑于星期二\3点31分c、P(|U|>u)=2(-u)d、P(|U|<u)=1-2(-u)e、P(u1<U<u2)=(u2)-(u1)本文档共57页;当前第17页;编辑于星期二\3点31分例:P(-0.82<U<1.15)=(1.15)-(-0.82)=0.87493-0.20611=0.66882
3、非标准正态分布:常见的情形是N(,2),为了能够使用正态分布表,可将N(,2)化成N(0,1),再按上述方法从正态分布表中查取相应的数值。化为标准正态分布的方法:令:于是,X的累积函数:本文档共57页;当前第18页;编辑于星期二\3点31分例:已知“三尺三”高粱品种的株高分布服从正态分布N(156.2,4.822)(cm),求株高低于161cm的概率,株高高于164cm的概率和株高在152cm和162cm之间的概率?解:已知株高X服从N(156.2,4.822),当X<161cm时,标准正态离差本文档共57页;当前第19页;编辑于星期二\3点31分当X>164cm时,当152<X<162时,本文档共57页;当前第20页;编辑于星期二\3点31分五、正态分布的分位数1、单侧分位数上侧分位数:下侧分位数:当时的当时的0.052、双侧分位数时的当本文档共57页;当前第21页;编辑于星期二\3点31分3、正态分布上侧分位数(u)表的查法:u0.01=2.326u0.05/2=1.960u0.01/2=2.576本文档共57页;当前第22页;编辑于星期二\3点31分六、中心极限定理假设被研究的随机变量X,可以表示为许多相互独立的随机变量Xi的和,那么,如果Xi的数量很大,而且每一个别的Xi对于X所起的作用很小,则可以被认为X服从或近似地服从正态分布。生物界乃至整个自然界中,符合正态分布的现象非常之多,所以正态分布是生物统计学的基础。本文档共57页;当前第23页;编辑于星期二\3点31分复习思考题①什么是随机变量?举例说明随机变量的种类?②举例说明如何利用随机变量表示一个事件?如何利用随机变量定义总体和样本?③为什么连续型随机变量取得某一具体观测值的概率是0?④离散型随机变量和连续型随机变量的累积函数有何区别?⑤累计函数和分布曲线的主要用途。⑥二项分布的应用前提和条件?泊松分布和二项分布概率函数的关系?⑦正态分布的意义和特点。⑧正态分布的密度函数和分布曲线的特点。⑨什么是正态分布的分位数?都有哪些种?本文档共57页;当前第24页;编辑于星期二\3点31分第六节抽样分布生物统计学最核心的问题就是研究总体和样本之间的关系问题总体样本抽样统计推断从一个已知的总体中,独立随机地抽取含量为n的样本,研究所得样本的各种统计量的概率分布,即为抽样分布。本文档共57页;当前第25页;编辑于星期二\3点31分一、从一个正态总体中抽取的样本统计量的分布(一)、样本平均数的分布1、标准差已知时样本平均数的分布----u分布若随机变量X服从N(,2),当我们以n为样本容量从N(,2)中抽样,则以抽取的样本平均数作为随机变量时,服从正态分布,且:即:将平均数标准化,则:u服从N(0,1)本文档共57页;当前第26页;编辑于星期二\3点31分若X来自非正态总体,或有限总体,只要样本容量n足够大,则从总体中抽取的样本平均数依然服从正态分布,且有:将平均数标准化,则:,u服从N(0,1)即:本文档共57页;当前第27页;编辑于星期二\3点31分例:假如某总体由三个数字2、4、6组成,现在从该总体中做放回式抽样,样本容量样本样本数n=124631平均数246n=222,24,42,26,62,44,46,64,6632平均数233444556n=3222,224,244,246,426,624,442,446,644,664,666,33
平均数22.673.334443.334.674.675.336n=434=81n=535=243n=636=729n=838=6561n=10310=59049n=205904959049本文档共57页;当前第28页;编辑于星期二\3点31分2、标准差未知时的样本平均数的分布----t分布若总体的方差是未知的,即标准差未知,可以用样本的标准差s代替总体的标准差,则变量变为tu符合N(0,1)分布,t则不服从标准正态分布,而是服从具有(n-1)自由度的t分布,其中称为样本标准误差。本文档共57页;当前第29页;编辑于星期二\3点31分t分布的密度函数:本文档共57页;当前第30页;编辑于星期二\3点31分t分布也是一种对称分布,它只有一个参量,即自由度,以df表示。所谓自由度是指独立观察值的个数。随着df的增加,t分布越来越接近于标准正态分布,df=∞时,=0,=1,t分布与N(0,1)重合,因此,当n很大时的t分布可以近似地按N(0,1)分布处理。本文档共57页;当前第31页;编辑于星期二\3点31分t分布的分位数:上侧分位数下侧分位数单侧分位数双侧分位数:t-t/2/2t-tt/2本文档共57页;当前第32页;编辑于星期二\3点31分t分布的分位数表查t5,0.05=2.015t5,0.05
/2=2.571本文档共57页;当前第33页;编辑于星期二\3点31分(二)、样本方差的分布从N(,2)中以n为样本容量进行抽样,抽取的样本标准差s,为连续型随机变量,当我们以称该随机变量为s2的标准化的随机变量,且该随机变量仍为连续型的随机变量。作为一个新的随机变量时,称上式为具有n-1自由度的卡方。我们以来命名新的随机变量,则有:本文档共57页;当前第34页;编辑于星期二\3点31分分布是概率分布曲线随自由度df而改变的一类分布,它的密度函数为:本文档共57页;当前第35页;编辑于星期二\3点31分分布的分布曲线及分位数本文档共57页;当前第36页;编辑于星期二\3点31分本文档共57页;当前第37页;编辑于星期二\3点31分分位数表的查法本文档共57页;当前第38页;编辑于星期二\3点31分二、从两个正态分布总体中抽取的样本统计量的分布若有N1(1,12)和N2(2,22),从N1中以n1为样本容量进行抽样,并独立地从N2中以n2为样本容量进行抽样,求出研究和的分布,则依下列情形的不同而不同。本文档共57页;当前第39页;编辑于星期二\3点31分(一)、标准差i已知时,两个平均数的差的分布----u分布若以作为新的随机变量,则从统计学(随机变量的数学期望)理论可以证明,做正态分布,且有:即:服从N()本文档共57页;当前第40页;编辑于星期二\3点31分现将标准化,则标准化的随机变量u为:本文档共57页;当前第41页;编辑于星期二\3点31分(二)标准差i未知但相等时,两个平均数的差()的分布----t分布若==则用和代替,应以样本方差的加权平均数来替代,即有:本文档共57页;当前第42页;编辑于星期二\3点31分此时的标准化随机变量转化为:t=且有自由度df=n1+n2-2。
此时,有最小的抽样误差。若n1=n2=n,则有:本文档共57页;当前第43页;编辑于星期二\3点31分(三)两个样本方差比的分布——F分布从平均数和方差分别为(1,12)和(2,22)的两个正态总体中,抽出含量分别为n1和n2的样本,并分别求出它们的样本方s12和s22,则标准化后的样本方差之比称为F。F为连续型随机变量:F分布的分布曲线的形状是由一对自由度df1和df2决定的:df1=n1-1,df2=n2-1本文档共57页;当前第44页;编辑于星期二\3点31分1.F分布的分布曲线本文档共57页;当前第45页;编辑于星期二\3点31分2.F分布的分位数若P(Fdf1,df2>Fdf1,df2,)=,称Fdf1,df2,
为的上侧分位数。若P(Fdf1,df2>Fdf1,df2,1-)=1-,称Fdf1,df2,1-为的下侧分位数。上侧分位数的表示方法:Fdf1,df2,下侧分位数的表示方法:Fdf1,df2,1-双侧分位数的表示方法:Fdf1,df2,1-/2,
Fdf1,df2,/2本文档共57页;当前第46页;编辑于星期二\3点31分若P(F>F)=,称F为的上侧分位数。若P(F<F)=,称F为的下侧分位数???若P(F>F1-)=1-,称F1-为的下侧分位数。即:P(F<F1-)=,称F1-为的下侧分位数。辨误!本文档共57页;当前第47页;编辑于星期二\3点31分下侧分位数的换算:本文档共57页;当前第48页;编辑于星期二\3点31分2.F上侧分位数表的查法:F4,20,0.01=4.431,F4,20,0.99=1/F20,4,0.01=1/14.02=0.071本文档共57页;当前第49页;编辑于星期二\3点31分抽样分布①如何初步判断一个生物性状是否符合正态分布?②在一个正态总体中抽取的样本平均数的分布,与总体标准差有怎样的关系?③2分位数和F分位数的下侧分位数表示方法为什么与t分位数、u分位数的下侧分位数表示方法不同?④查找下列分位数:20.05,3;20.95,3;F4,20,0.05;F4,20,0.095;t20,0.05;t20,0.05/2;-t15,0.05;u0.05;u0.05/2;u0.01;u0.01/2本文档共57页;当前第50页;编辑于星期二\3点31分作业:P26:1.1,P27:1.3,P28:1.7,1.12。P41
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 项目管理价值链分析题目及答案
- 理解项目管理质量标准的考试试题及答案
- 2025年会计报表编制技巧试题及答案
- 理财师的自我提升方法试题及答案
- 鹤壁玻璃平开门施工方案
- 2024年项目管理师专用试题及答案
- 探讨证券从业资格证考试的知识要求试题及答案
- 理解特许金融分析师考试的语言技巧试题及答案
- 2024年项目管理专业人士考试知识图谱试题及答案
- 绿化内井盖施工方案设计
- 围墙拆除工程施工方案
- 性发育异常疾病课件
- 动态分析与设计实验报告总结
- 清水河储能电站施工方案设计
- 从汽车检测看低空飞行器检测发展趋势
- 《短视频拍摄与制作》课件-3短视频中期拍摄
- 中铁投资公司招聘笔试题
- 2024年十堰市中小学教师职称晋升水平能力测试题附答案
- 中药热奄包在急性胃炎治疗中的应用研究
- 观光小火车方案
- 《资本论》思维导图
评论
0/150
提交评论