抽样误差与抽样分布ppt课件_第1页
抽样误差与抽样分布ppt课件_第2页
抽样误差与抽样分布ppt课件_第3页
抽样误差与抽样分布ppt课件_第4页
抽样误差与抽样分布ppt课件_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、抽样误差与抽样分布-抽样分布1.抽样误差从脉搏总体均数 为72.5次,规范差 为6.3次的正态分布总体中随机抽样。样本个数为10,样本量为9.n=10 .2.例4-1 样本量为9,从N(72.5,6.32)中共随机抽取10个样本3.计算样本均数的均数:计算样本均数的规范差:4.例4-2 P51 随机反复抽样共抽10个样本,样本量为25。计算样本均数的均数和规范差.5.表4-2 样本量为25 从N(72.5,6.32)共随机抽取10个样本6.7.抽样误差结果:各样本均数不一定等于总体均数样本均数间存在差别样本均数的分布规律:围绕总体均数上下动摇样本均数的变异:由样本均数的规范差描画,样本均数的动

2、摇幅度远小于原始资料的动摇幅度抽样误差根本上在0附近近似对称地随机动摇在同一总体进展随机抽样,随着样本例数的添加,样本均数的动摇幅度在减小。8.抽样误差抽样误差Sampling error 由抽样引起的样本统计量与总体参数间的差别来源:个体变异抽样表现样本统计量与总体参数间的差别样本统计量间的差别9.样本均数的规律性随机的在概率意义下是有规律的-抽样分布经过大量反复抽样,借助频数表描画样本均数的变异规律(抽样分布)与个体察看值变异规律有关即使只需一个样本资料,也可由样本资料的个体察看值的变异规律间接得到样本均数的变异规律抽样分布10.正态总体样本均数的分布例4-3 按样本量为9和样本量为25

3、在上述总体中N(72.5,6.3)进展随机抽样每次抽取10000个样本并计算各自的样本均数以10000个样本均数作为一个新的样本制造频率密度分布图11.抽样1样本含量n=9 的平均数 =72.54 的规范差 =2.14样本均数的分布原始资料的分布实际值12.抽样2样本含量 n=25 的平均数 =72.50 的规范差 =1.27 实际值13.抽样3样本含量 n=36 的平均数 =72.50 的规范差 =1.06 实际值14.从正态分布的总体 中随机抽取样本含量为n的样本X1,X2,Xn,其样本均数 服从正态分布,总体均数为 ;样本均数的总体规范差假设 ,那么其中恣意一个随机样本Xn的均数正态总体

4、样本均数的分布15.样本均数的规范差 ,称为样本均数的规范误(standard error of mean ,SE),简称均数规范误它反映样本均数之间的离散程度,也反映样本均数抽样误差的大小。误差大小 ,本质是要估计 的分布特征 正态总体样本均数的分布16.由于实践 往往未知,需求用样本 来估计 ,样本均数规范误的估计式为留意区别:证明:正态总体样本均数的分布17.非正态总体样本均数的分布例4-4 从总体均数为1,总体方差为2的卡方分布中抽样,样本大小分别为4,9,200。每次抽10000个样本制造频率密度分布图18.19.样本含量n=4 的平均数 = 1.0111 的规范差 = 0.7084

5、 的中位数 =0.853120.样本含量n=9 的平均数 =1.0078 的规范差 =0.4771 的中位数 =0.928021.样本含量n=200 的平均数 =1.0078 的规范差 =0. 1004 的中位数 =0. 997322.从非正态卡方分布总体中随机抽样所得样本均数 :在样本含量较小时呈偏态样本含量较大时接近正态分布均数 一直在总体均数 附近均数 的规范差非正态总体样本均数的分布23.中心极限定理及其运用样本均数 总体规范差是个体资料X的总体规范差的 ;即实际规范误实际规范误的样本估计值为样本均数 与个体资料X的集中位置一样,即样本均数 的总体均数与个体资料X的总体均数 一样24.

6、中心极限定理及其运用假设个体资料X服从正态总体 ,那么样本均数 也服从正态分布 ;个体资料X服从偏态分布,当样本量n较大时,样本均数 近似服从正态分布25. 例4-5 大规模普查得某地安康成年男子血红蛋白总体均数为 . 随机抽样,样本量为100, ,实际规范误和样本均数的估计规范误。26.二、率的抽样误差和抽样分布 总体率由样本率估计例如,设样本的个体数(即样本含量)为n,假设x为样本的某目的阳性个体数,那么可用样本阳性率 估计研讨人群的阳性率 (总体阳性率); 由于个体差别和偶尔性的影响,样本率也存在抽样误差-由抽样呵斥样本率与总体率(研讨人群的率)的差别 样本率是随机的,但在概率意义下也是

7、有规律的-样本率的分布。27.随机抽样实验,分别在总体率=0.25,0.5,的总体中随机抽样,其总体率和样本含量n每种情况分别随机抽10000个样本,每个样本计算其样本率,把同一种情况的10000个样本率视为一个新的样本资料作频率图 样本率的分布 28.抽样129.抽样130.抽样331.抽样432.33.34.结果总体率一样时,样本含量越大,样本率的分布越趋向对称。样本含量n一样时,越偏离0.5,样本率的分布越偏态分布。总体率0.5时,恣意样本含量的样本率都呈对称分布。样本率p的样本规范差 。样本率的分布 35.中心极限定理及其推论假设样本中的个体个数(即样本含量)为n,总体率为,样本率为p

8、,那么样本率的总体均数等于总体率样本率的总体规范差(即率的规范误) 由于总体率通常是未知的,因此用样本率p来估计,故率的规范误的估计值常表示为 36.对于大量反复随机抽样而言,样本率p围绕着总体率 动摇样本含量n越大,这种动摇越小。当n的值充分大时,p的分布就近似于均数为 ,规范差为 的正态分布。这里样本含量n “充分大指 、 且n40。当总体率0.5时,那么样本率p的分布为对称分布 当样本含量n为定值时,总体率越接近0.5,样本率p近似正态分布的程度就越好 中心极限定理及其推论37.STATA命令模拟各种分布模拟正态分布的样本均数分布 Simumean 样本量 均数 规范差模拟类似卡方分布的

9、均数分布 Simuchis 样本量 均数模拟指数分布的均数分布 Simuexp 样本量 均数38. t分布 , 规范正态分布与t统计量 实践研讨中未知,用样本的规范差S作为的一个近似值(估计值)替代,得到变换后的统计量并记为 39.如在正态总体N(168.18,62)中随机抽样,样本量分别取n =5,n =100,均抽10000个样本,分别计算t值和U值并作相应t的频数图 t分布40. t分布样本含量n=5样本含量n=100 t统计量的频率密度图 41.结果小样本时,t统计量和U统计量的分布有明显差别大样本时,t统计量和U统计量的分布非常接近。频率密度图当样本量较大时,统计量t的频率密度图与规

10、范正态分布曲线非常接近样本含量较小时,t统计量的峰值比规范正态分布的峰值略小,双侧尾部的值那么较规范正态分布略大 t分布42.英国统计学家W. S. Gosset(1908)设 并给出了统计量t的分布规律,并称统计量t的分布规律为t分布,自在度为v,记为t(v)分布。 每个自在度v对应一个分布,因此t分布是一簇分布 t分布仅与总体均数有关,与总体规范差无关 t分布43.STATA命令模拟各种分布模拟双峰分布的均数分布 Simubpeak 样本量 均数模拟三角形分布的均数分布 Simutrang 样本量 均数44.三条t分布密度曲线 t分布v=1v=5v=45.t分布的图形特征分布特征 t分布曲线是单峰的关于t = 0对称自在度越大,t值越小 t分布与正态分布的关系 自在度v较小时,t分布与规范正态分布相差较大,并且t分布曲线的尾部面积大于规范正态分布曲线的尾部面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论