参数估计基础_第1页
参数估计基础_第2页
参数估计基础_第3页
参数估计基础_第4页
参数估计基础_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

参数估计基础---抽样分布赵耐青复旦大学卫生统计教研室2内容抽样误差1抽样分布2STATA命令33随机抽样的样本是随机的对于任何一个随机试验,当完成随机试验后的随机试验结果是确切的,根本谈不上随机,所以随机都是指随机试验前而言的。在随机抽样前,抽样者是无法知道随机抽样的结果,当然也无法知道抽到的这个样本的均数。任何两个抽样者独立地分别在同一总体进行随机抽取一个样本,样本量相同,所抽到的这两个样本的样本均数一般是不同的。所以,对于随机抽样前而言,随机抽样的样本均数是随机的。4抽样误差抽样误差Samplingerror对于随机抽样而言,总体参数的样本统计量估计值与总体参数间的差异称为抽样误差来源:个体变异随机抽样表现总体参数的样本统计量估计值与其总体参数间的差异对于总体参数估计,不同随机抽样的样本统计量之间的差异5抽样误差从总体均数为72.5,标准差为6.3cm的正态分布总体中随机抽样,样本量n=9,25。样本均数的抽样误差=样本均数-总体均数n=9,25…

….6样本量和样本均数及其离散程度7样本量和样本均数的离散程度8抽样误差结果:各样本均数不一定等于总体均数样本均数间存在差异样本均数的分布规律:围绕总体均数上下波动样本均数的变异:由样本均数的标准差描述。9样本均数的规律性随机的在概率意义下是有规律的---抽样分布通过大量重复抽样,借助频数表描述样本均数的变异规律(抽样分布)与个体观察值变异规律有关即使只有一个样本资料,也可由样本资料的个体观察值的变异规律间接得到样本均数的变异规律抽样分布10正态总体样本均数的分布已知某地成人男子的脉搏平均数为,标准差为,将其视为一个总体。以上述背景,用计算机随机模拟这个总体,并且模拟从该总体中进行随机抽样样本含量为n每次抽取10000个样本并计算各自的样本均数以10000个样本均数作为一个新的样本制作频数图1112从正态分布的总体中随机抽取样本含量为n的样本X1,X2,…,Xn,可以证明:样本均数服从正态分布,总体均数为;样本均数的总体标准差正态总体样本均数的分布13样本均数的标准差,称为样本均数的标准误(standarderrorofmean,SE),简称均数标准误它反映样本均数之间的离散程度,也反映样本均数抽样误差的大小。误差大小,实质是要估计的分布中的离散程度特征正态总体样本均数的分布14由于实际往往未知,需要用样本来估计,样本均数标准误的估计式为注意区别:证明:样本均数的期望值和标准差也为正态总体样本均数的分布正态总体样本均数的分布正态总体样本均数的分布正态总体样本均数的分布正态总体样本均数的分布正态总体样本均数的分布正态总体样本均数的分布正态总体样本均数的分布15非正态总体样本均数的分布从总体均数为1的指数分布中抽样,样本大小分别为4,9,100。每次抽10000个样本制作频数分布图16非正态总体样本均数的分布17抽样1样本含量n=4

的平均数=1.0133

的标准差=0.5031

的中位数=0.929818抽样2样本含量n=9

的平均数=0.9959

的标准差=0.3332

的中位数=0.957419抽样3样本含量n=100

的平均数=0.9993

的标准差=0.1001

的中位数=0.995820从非正态指数分布总体中随机抽样所得样本均数:在样本含量较小时呈偏态(非指数型)样本含量较大时接近正态分布均数始终在总体均数附近均数的标准差非正态总体样本均数的分布21中心极限定理及其应用样本均数总体标准差是个体资料X的总体标准差的;即理论标准误理论标准误的样本估计值为样本均数与个体资料X的集中位置相同,即样本均数的总体均数与个体资料X的总体均数相同22中心极限定理及其应用若个体资料X服从正态总体,则样本均数也服从正态分布;个体资料X服从偏态分布,当样本量n较大时,样本均数近似服从正态分布23

t分布,标准正态分布与t统计量实际研究中

未知,用样本的标准差S作为

的一个近似值(估计值)代替

,得到变换后的统计量并记为24如在正态总体N(168.18,62)中随机抽样,样本量分别取n=5,n=100,均抽10000个样本,分别计算t值和U值并作相应t的频数图

t分布25

t分布样本含量n=5样本含量n=100

t统计量的频数图

26结果小样本时,t统计量和U统计量的分布有明显差别大样本时,t统计量和U统计量的分布非常接近。频率密度图当样本量较大时,t统计量的频率密度图与标准正态分布曲线非常接近样本含量较小时,t统计量的峰值比标准正态分布的峰值略小,双侧尾部的值则较标准正态分布略大

t分布27英国统计学家W.S.Gosset(1908)设并给出了统计量t的分布规律,称统计量t的分布规律为t分布,自由度为v,记为t(v)分布。

每个自由度v对应一个分布,因此t分布是一簇分布t分布仅与总体均数有关,与总体标准差无关

t分布28三条t分布密度曲线

t分布v=1v=5v=∞29t分布的图形特征分布特征

t分布曲线是单峰的关于t=0对称自由度越大,t值越小

t分布与正态分布的关系

自由度v较小时,t分布与标准正态分布相差较大,并且t分布曲线的尾部面积大于标准正态分布曲线的尾部面积当自由度时,t分布逼近于标准正态分布。30t分布的界值给定自由度v,t分布曲线的双侧尾部面积为

时对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论