第3章抽样误差陆ppt课件_第1页
第3章抽样误差陆ppt课件_第2页
第3章抽样误差陆ppt课件_第3页
第3章抽样误差陆ppt课件_第4页
第3章抽样误差陆ppt课件_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 抽样误差Sampling Error易洪刚Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University.主要内容抽样误差中心极限定理规范误分布 2 分布F分布 .1. 抽样误差 Sampling Error 抽样误差中心极限定理规范误统计分布.了解抽样误差的重要性总体同质、个体变异总体参数未知样本代表性、抽样误差随机抽样样本统计量知统计推断风 险.抽样误差sampling error,sampling variability 由抽样引起的样本统计量与总体参数间

2、的差别。 缘由:个体变异抽样 表现:样本统计量与总体参数间的差别不同样本统计量间的差别 抽样误差是不可防止的! 抽样误差是有规律的! .假设一个知总体,从该总体中抽样,对每个样本计算样本统计量(均数、方差等),察看样本统计量的分布规律抽样分布规律。均数的模拟实验.均数的模拟实验调查:样本均数的均数与总体均数有何关系?样本均数的规范差与总体规范差有何关系?样本均数的分布外形如何?不同的样本含量对上述性质的影响如何?.抽样分布规律 = 5.0 = 0.5样本含量n =10抽样次数m =100 =5.19 S =0.42 =5.04 S = 0.44红细胞计数 =5.03 S =0.52.Fract

3、ionx2.52.83.13.43.744.34.64.95.25.55.86.16.46.777.37.67.90.1.2.3图 正态分布N5.00,0.502总体分布.结论 1各样本均数未必等于总体均数;样本均数间存在差别;. 由抽样实验所得的100个样本作出其均数分布直方图如图4.1。曲线是对抽样得到的100个 数据拟合的分布曲线。 .Fraction2.52.83.13.43.744.34.64.95.25.55.86.16.46.777.37.67.90.1.2.3.4.5.6.7.8.91图 从正态分布N5.00,0.502总体中抽样样本均数的分布 .图 从正态分布N5.00,0.

4、502总体中抽样样本均数的分布 Fraction4.14.44.755.35.65.90.1.2.3.4.5.结论2 的分布很有规律,围绕着,中间多,两边少,左右根本对称;样本均数的变异范围较之原变量的变异范围大大减少;.2.中心极限定理 Central Limit Theorem 抽样误差中心极限定理规范误分布.中心极限定理(central limit theorem) 一从均数为、规范差为 的正态总体中,独立随机抽取例数为n的样本,样本均数 的分布服从正态分布;样本均数的均数为 ;样本均数的规范差为 。.不同类型的总体分布,对于统计量分布有何影响?正态分布总体偏三角分布总体均匀分布总体指数

5、分布总体双峰分布总体中心极限定理.中心极限定理 二从非正态(nonnormal)分布总体(均数为,方差为)中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,那么只需样本含量足够大(n50),样本均数也近似服从正态分布。样本均数的均数为 ;样本均数的规范差为 。.3.规范误 standard error 抽样误差中心极限定理规范误分布.规范误(standard error)样本统计量的规范差称为规范误。样本均数的规范差称为均数的规范误。均数的规范误表示样本均数的变异度。当总体规范差未知时,用样本规范差替代,前者称为实际规范误,后者称为样本规范误。.与规范差的关系1、意义上

6、规范差描画个体值之间的变异,即察看值间的离散程度;而规范误是描画统计量的抽样误差,即样本统计量和总体参数的接近程度;2、用途上规范差常用于表现察看值的动摇范围;规范误常表示抽样误差的大小,估计总体参数可信区间。3、与样本含量规范差是随着样本含量的增多,逐渐趋于稳定。规范误是随着样本含量的增多,逐渐减少。区别.与规范差的关系首先,规范差和规范误都是变异目的,阐明个体之间的变异用规范差,阐明统计量之间的变异用规范误。其次,当样本含量不变时,规范差大,规范误亦越大,均数的规范误与规范差成正比。联系.4. t分布 t-distribution 抽样误差中心极限定理规范误分布.正态分布的规范化变化假设

7、X N(,) , 那么 。 因 ,那么 。 .从正态分布总体中1000次抽样的 u 值的分布(n=4)Fractionu-4-3-2-1012340.05.1.15.2均数为 0.007559规范差为 1.006294 .t 分布的概念实践任务中,总体方差未知。所以,用样本方差替代总体方差,此时 的分布如何?.从正态分布总体中1000次抽样的 值的分布(n=4)Fractiont-8-6-4-2024680.05.1.15.2.25.3.35均数为 0.05696规范差为 1.55827 .t 分布的概念用样本方差替代总体方差,此时不服从正态分布。.1908年,W.S.Gosset (1876

8、-1937)以笔名Student发表了著名的t分布,证明了:设从正态分布N(,2)中随机抽取含量为n的样本,样本均数和规范差分别为 和s,设:那么t值服从自在度为n-1的t分布。t 分布的概念记为:.图 自在度分别为1、5、时的t分布t分布图形 f(t) =(规范正态曲线) =5 =10.10.2-4-3-2-1012340.3.t分布的特征t分布是一簇曲线,当不同时,曲线外形不同;单峰分布,以0为中心,左右对称;当逼近时,t分布逼近u分布,故规范正态分布是t分布的特例;t分布曲线下面积是有规律的。请看演示t 分布.t界值表表上阴影部分,表示t,以外的尾部面积占总面积百分数,即概率P。表中数据

9、表示与确定时相应的t界值critical value,常记为t,。.-t0t抽样总体样本t1t2t3t4tn-3tn-2tn-1tn统计量分布t分布阐明,从正态分布总体中随机抽取的样本,由样本计算的t值接近0的能够性较大,远离0的能够性较小。 .例如,当=10,单尾概率=0.05时,查表得单尾t0.05,10=1.812,那么:P(t-1.812)=0.05或P(t1.812)=0.05阐明:按t分布的规律,从正态分布总体中抽取样本含量为n=11的样本,那么由该样本计算的t值大于等于1.812的概率为0.05,或者小于等于-1.812的概率亦为0.05。-1.81200.050.051.812

10、.例如,当=10,双尾概率=0.05时,查表得双尾t0.05,102.228,那么: P(t-2.228)+P(t2.228)0.05或:P(-2.228t2.228)=1-0.05=0.95。阐明:按t分布的规律,从正态分布总体中抽取样本含量为n=11的样本,那么由该样本计算的t值大于等于2.228的概率为0.025,小于等于-2.228的概率亦为0.025。-2.22800.0250.0252.228.单尾:P(t- t,)=,或P(tt,)=双尾:P(t- t/2,)+P(tt/2,)=, 即P(-t/2,t t/2,)=1-t0tt分布曲线下面积规律.5. 2分布 chi-distri

11、bution 抽样误差中心极限定理规范误分布. 2 分布 设从正态分布N(,2)中随机抽取含量为n的样本,样本均数和规范差分别为 和s,设:2值服从自在度为n-1的2分布(2-distribution) .=4=3=520246810120.00.10.20.30.40.5f(2)=1=2=6 2 分布 请看演示 c2 分布.2分布的特征 (1) 2分布为一簇单峰正偏态分布曲线 ;随的逐渐加大,分布趋于对称。(2) 自在度为的2分布,其均数为,方差为2。(3) 自在度为的2分布实践上是个规范正态分布变量之平方和。 2=u12+ u22+ uv2 .3.840.050.0250.0251.96-

12、1.962分布与正态分布的关系.(4) 每一自在度下的2分布曲线都有其本身分布规律。自在度为1的2分布界值0.00.10.20.30.40.53.840.05.2分布是方差的抽样分布。 2分布阐明,从正态分布的总体中随机抽样,所得样本的方差s2接近于总体方差2的能够性大,远离总体方差的能够性小。即2值接近其均数n-1的能够性大,远离n-1的能够性小。2分布的特征 .自在度10时,20.025,1020.48,20.975,103.25。从正态分布的总体中随机抽样,得到的样本其2值大于等于20.48的概率为0.025,小于等于3.25的概率亦为0.025。P(23.25)+P(220.48)0.

13、05 2分布的特征 .2分布近似描画具有某种属性的实践频数Ai与实际频数Ti之间的抽样误差 2分布的特征 .6. F分布 F-distribution 抽样误差中心极限定理规范误分布.F分布 设从两个方差相等的正态分布N(1,2)和N(2,2)总体中随机抽取含量分别为n1和n2的样本,样本均数和规范差分别为 、s1和 和s2。设:那么F值服从自在度为(n1-1,n2-1)的F分布(F-distribution)。 .F分布的特征 (1) F分布为一簇单峰正偏态分布曲线,与两个自在度有关。 (2) 假设F服从自在度为(1,2)的F分布,那么其倒数1/F服从自在度为(2,1)的F分布。(3) 自在度为(1,2)的F分布,其均数为2/(2-2),与第一自在度无关。(4) 第一自在度11时,F分布实践上是t分布之平方;第二自在度2时,F分布实践上等于2分布。 请看演示F分布.(5) 每一对自在度下的F分布曲线下的面积分布规律。 PFF分布的特征 .F分布阐明,从两个方差相等的正态分布总体中随机抽取含量分别为n1和n2的样本,计算所得F值,应接近v2/(v2-2)。F(0.05;20,20)= 2.12

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论