《卫生统计学》第六章 参数估计基础_第1页
《卫生统计学》第六章 参数估计基础_第2页
《卫生统计学》第六章 参数估计基础_第3页
《卫生统计学》第六章 参数估计基础_第4页
《卫生统计学》第六章 参数估计基础_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章参数估计基础抽样分布与抽样误差t分布总体均数及总体率的估计.抽样分布与抽样误差在实际工作中,由于总体中各观察对象之间存在着个体变异,且随机抽取的样本又只是总体中的一部分,因此计算的样本统计量,不一定恰好等于相应的总体参数。这种由于个体变异的存在,在抽样研究中产生的样本统计量与相应的总体参数间的差异,称为抽样误差(samplingerror).一、样本均数的抽样分布与抽样误差实验6-1:假定某年某地13岁女生身高服从正态分布N(155.4,5.32)(cm)。利用计算机在该总体中随机抽取100个样本,每个样本n=30,即可求得如表6-1第(2)列中的100个样本均数。由这100个样本均数,可绘成样本均数的频率分布表(表6-2)。观察样本均数抽样分布的特点.样本均数恰好等于总体均数的情况很少;样本均数之间亦存在差异;样本均数的分布围绕总体均数左右基本对称,呈近似正态分布;样本均数之间的变异明显小于原始变量值之间的变异;样本均数抽样分布的特点:.已证明:从正态总体N(μ,σ2)中,随机抽取例数为n的样本,样本均数也服从正态分布,此正态分布为N(μ,);.均数的抽样误差——指由抽样而造成的样本均数与总体均数之间的差异。

称标准误,它说明均数抽样误差的大小。n越大,标准误越小,样本均数的抽样误差亦越小实际工作中,σ常未知,而是用样本标准差s来估计,则有常用来说明均数的抽样误差的大小。

.即使从偏态总体抽样,当n足够大时,样本均数也近似正态分布(见实验6-2,观察图6-1及图6-2的变化)。.实验6-3,摸球实验。观察二项分布总体中样本频率的分布特征。一个口袋内装有形状、重量完全相同的黑球和白球,其中黑球比例为20%(π=20%),从中重复摸球50次(ni=50),计算摸到黑球的频率(样本率pi)。这样的实验重复进行100次,将每次得到黑球的频率列成频率分布表即表6-3,观察表中的频率分布特征。二、样本频率的抽样分布与抽样误差.由此分布可知:样本率与样本率之间;样本率与总体率之间均存在差异,即抽样误差。根据二项分布的原理,样本频率的总体概率为π,率的标准误为

σp=

实际工作中,总体率往往未知,常用样本率来近似代替总体率,则有

Sp=反映率的抽样误差的大小。例6-1..t分布前面讲过,对正态变量x采用变换,则将正态分布N(μ,σ2)变换为标准正态分布N(0,1)。

已知样本均数也服从正态分布,那么对采用Ζ变换,即可将其变换为标准正态分布。

.但实际工作中需用来估计,这样,对正态变量采用的就不是Ζ变换而是t变换了,即

其结果即为t分布。观察t分布曲线图

.图6-4自由度为1、5、∞的t分布.t分布的特征:只有一个参数ν以0为中心,左右对称的单峰分布;t分布是一簇曲线,形态变化与n(即自由度)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(Ζ分布)曲线。t分布峰部较矮,尾部翘得较高,说明远侧的t值的个数相对较多,即尾部面积(概率P)较大。自由度ν越小这种情况越明显,ν渐大时,t分布渐逼近标准正态分布;当ν=∞时,t分布就成为标准正态分布了。附表2,t界值表P467

.总体均数及总体概率的估计参数估计有两种方法:1.点(值)估计:未考虑抽样误差2.区间估计:可信区间又称置信区间(confidenceinterval,CI)指按一定的概率估计总体均数的可能范围。概率1-α称为可信度(置信度),常取95%或99%.一、总体均数可信区间的计算**:方法:1.t分布法:

σ未知且n较小时

2.正态近似法:

σ已知或σ未知但n较大时.1.t分布法:σ未知且n小时,某自由度的t曲线下有95%的t值在±之间,即:

故总体均数μ的95%可信区间为:

(,)

.2.正态近似法:1)σ已知时,正态曲线下有95%的Ζ值在±1.96之间,即:P(-1.96≤Ζ≤+1.96)=0.95

P(-1.96≤≤+1.96)=0.95移项后整理得,总体均数μ的95%可信区间为()

.2)σ未知,但n足够大(n>50)时,可知t分布逼近Ζ分布,此时t曲线下有95%的t值在±1.96之间即:P(-1.96≤t≤+1.96)=0.95

P(-1.96≤≤+1.96)=0.95

P(≤≤)=0.95故总体均数μ的95%可信区间为(,)

.总体均数μ的单侧(1-α)置信区间为:总体均数的95%可信区间的含义:该区间包括总体均数μ的概率为95%或总体均数有95%的概率在该区间范围内.二、总体概率可信区间的计算1.查表法:n≤50,特别是p接近0或100%时,可查附表6(P478-480),二项分布概率的置信区间表,例6-4。注意:附表6中X值只列出了X≤n/2部分,当X>n/2时,应以n-X值查表,然后用100减去查得的数值,即为所求的区间。2.正态近似法**:当n较大且np和n(1-p)均大于5时,二项

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论