参数估计基础_第1页
参数估计基础_第2页
参数估计基础_第3页
参数估计基础_第4页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1参数估计基础-抽样分布2抽样误差o从总体均数 为155.4cm,标准差 为5.3cm的正态分布总体中随机抽样。样本大小为30,nnXS2, 11,X Sn=3033,XS22,XS .3从正态总体 抽样得到的1000个样本均数的频数分布(ni=30)2(155.4,5.3 )N4Mean=155.426 Std=0.9665抽样误差o结果:n各样本均数不一定等于总体均数n样本均数间存在差异n样本均数的分布规律:围绕总体均数上下波动n样本均数的变异:由样本均数的标准差描述。6抽样误差o抽样误差Sampling error n由抽样引起的样本统计量与总体参数间的差异o来源:n个体变异n抽样o表现

2、n样本统计量与总体参数间的差异n样本统计量间的差异7o样本均数的规律性n随机的n在概率意义下是有规律的-抽样分布n通过大量重复抽样,借助频数表描述n样本均数的变异规律(抽样分布)与个体观察值变异规律有关o即使只有一个样本资料,也可由样本资料的个体观察值的变异规律间接得到样本均数的变异规律抽样分布8正态总体样本均数的分布o已知某地高三男生的平均身高为 ,标准差为 ,将其视为一个总体。o从该总体中随机抽样n样本含量为nn每次抽取10000个样本并计算各自的样本均数n以10000个样本均数作为一个新的样本制作频数图168.15cm6.00cm9抽样1Fractionmeana150160170180

3、0.05.1样本含量n=4 的平均数 =168.19 的标准差 =2.9670 xx63.0410抽样2样本含量 n=16 的平均数 =168.158 的标准差 =1.4884 xx61.516Fractionmeana1601651701750.02.04.06.0811抽样3Fractionmeana1501601701800.05.1样本含量 n=36 的平均数 =168.1493 的标准差 =0.9997 xx61.03612o从正态分布的总体 中随机抽取样本含量为n的样本X1,X2,Xn,其样本均数 n服从正态分布,总体均数为 ;n样本均数的总体标准差o若 ,则其中任意一个随机样本X

4、n的均数2( ,)N X2( ,)XN 2( ,)xXN 正态总体样本均数的分布xn资料的总体标准差13o样本均数的标准差 ,称为样本均数的标准误(standard error of mean ,SE),简称均数标准误o它反映样本均数之间的离散程度,也反映样本均数抽样误差的大小。o误差大小 ,实质是要估计 的分布特征 X正态总体样本均数的分布XXX14o由于实际 往往未知,需要用样本 来估计 ,样本均数标准误的估计式为o注意区别:o证明:XXSSn正态总体样本均数的分布XXXSS和和()E XXXnXXS15非正态总体样本均数的分布o从总体均数为1的指数分布中抽样,样本大小分别为4,9,100

5、。每次抽10000个样本制作频数分布图161718抽样1样本含量n=4 的平均数 =1.0133 的标准差 =0.5031 的中位数 =0. 9298xx10.54Fractionmeanx.0517593.794670.0675x19抽样2样本含量n=9 的平均数 =0.9959 的标准差 =0. 3332 的中位数 =0.9574xx10.339xFractionmeanx.1912692.731850.068320抽样3样本含量n=100 的平均数 =0.9993 的标准差 =0.1001 的中位数 =0.9958xx10.1100 xFractionmeanx.6546351.4984

6、80.070421o从非正态指数分布总体中随机抽样所得样本均数 :n在样本含量较小时呈偏态(非指数型)n样本含量较大时接近正态分布n均数 始终在总体均数 附近n均数 的标准差非正态总体样本均数的分布XX1XXn的总体标准差22中心极限定理及其应用o样本均数 总体标准差是个体资料X的总体标准差的 ;即理论标准误o理论标准误的样本估计值为o样本均数 与 个体资料X的集中位置相同,即样本均数 的总体均数与 个体资料X的总体均数 相同Xxn1/nXXSSnXX23中心极限定理及其应用o若个体资料X服从正态总体 ,则样本均数 也服从正态分布 ;o个体资料X服从偏态分布,当样本量n较大时,样本均数 近似服

7、从正态分布2( ,)N 2( ,)XXN X/XXXXUn(0,1)UNX2( ,)XXN 24o例3.3 已知在某地7岁正常发育男孩的身高服从正态分布N(121,52)o正常发育7岁男孩身高的95%范围为 (111.2,130.8)o若在该地正常7岁男孩中随机抽一个样本,样本含量为100,则样本均数的95范围为 =(120.2,121.98), 596. 1121100596. 112125 t分布o , 标准正态分布与t统计量 o实际研究中未知,用样本的标准差S作为的一个近似值(估计值)代替,得到变换后的统计量并记为 (0,1)XUNnXtSn2( ,)XN 26o如在正态总体N(168.

8、18,62)中随机抽样,样本量分别取n =5,n =100,均抽10000个样本,分别计算t值和U值并作相应t的频数图 t分布27 t分布样本含量n=5样本含量n=100 t统计量的频数图 28o结果n小样本时,t统计量和U统计量的分布有明显差别n大样本时,t统计量和U统计量的分布非常接近。o频数图n当样本量较大时,统计量t的频数图与标准正态分布曲线非常接近n样本含量较小时,t统计量的峰值比标准正态分布的峰值略小,双侧尾部的值则较标准正态分布略大 t分布29o英国统计学家W. S. Gosset(1908)设 并给出了统计量t的分布规律,并称统计量t的分布规律为t分布,自由度为v,记为t(v)

9、分布。 o每个自由度v对应一个分布,因此t分布是一簇分布 ot分布仅与总体均数有关,与总体标准差无关 t分布/XtSn1n2( ,)XN 30o三条t分布密度曲线 t分布v=1v=5v=31t分布的图形特征o分布特征 nt分布曲线是单峰的n关于t = 0对称n自由度越大,t值越小o t分布与正态分布的关系 n自由度v较小时,t分布与标准正态分布相差较大,并且t分布曲线的尾部面积大于标准正态分布曲线的尾部面积n当自由度 时,t分布逼近于标准正态分布。32t分布的界值 o给定自由度v,t分布曲线的双侧尾部面积为时对应的t值,记为并称 为t的双侧界值 o单侧界值 :一侧尾部面积为时对应的t值o对称性

10、得:单侧曲线下面积=2双侧曲线下面积o同样的尾部面积,t分布的界值要大于标准正态分布的界值 vt, 2/vt,33 t分布界值示意图,表示阴影的面积 34样本率的分布 o总体率由样本率估计n例如,设样本的个体数(即样本含量)为n,若x为样本的某指标阳性个体数,则可用样本阳性率 估计研究人群的阳性率 (总体阳性率); o由于个体差异和偶然性的影响,样本率也存在抽样误差-由抽样造成样本率与总体率(研究人群的率)的差异 o样本率是随机的,但在概率意义下也是有规律的-样本率的分布。nxp 35o随机抽样试验,分别在总体率=0.4,0.5,0.01的总体中随机抽样,其总体率和样本含量no每种情况分别随机

11、抽10000个样本,每个样本计算其样本率,把同一种情况的10000个样本率视为一个新的样本资料作频数图 样本率的分布 36抽样137抽样138抽样339抽样440o结果n总体率相同时,样本含量越大,样本率的分布越趋向对称。n样本含量n相同时,越偏离0.5,样本率的分布越偏态分布。n总体率0.5时,任意样本含量的样本率都呈对称分布。n样本率p的样本标准差 。n)(1样本率的分布 41中心极限定理及其推论o若样本中的个体个数(即样本含量)为n,总体率为,样本率为p,则n样本率的总体均数等于总体率n样本率的总体标准差(即率的标准误) n由于总体率通常是未知的,因而用样本率p来估计,故率的标准误的估计值常表示为 PnP)1 (1)PPPSn42n对于大量重复随机抽样而言,样本率p围绕着总体率波动n样本含量n越大,这种波动越小。当n的值充分大时,p的分布就近似于均数为 ,标准差为 的正态分布。这里样本含量n “充分大”指 、 且n40。n当总体率0.5时,则样本率p的分布为对称分布 n当样本含量n为定值时,总体率越接近0.5,样本率p近似正态分布的程度就越好 中心极限定理及其推论(1)n5n(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论