卫生统计学:第五章参数估计_第1页
卫生统计学:第五章参数估计_第2页
卫生统计学:第五章参数估计_第3页
卫生统计学:第五章参数估计_第4页
卫生统计学:第五章参数估计_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 参数估计,学习目标: 1 能够阐述抽样误差的概念,理解并计算标准误。 2 能够理解和运用t分布。 3 能够理解并计算单个总体参数、两总体参数之差的置信区间。 4 能够运用统计软件对实际资料进行参数估计。,内容提要,第一节 抽样误差 第二节 t分布 第三节 单个总体参数的置信区间 第四节 两总体参数之差的置信区间 第五节 案例讨论(自学),第一节 抽样误差,抽样误差定义: 在总体中随机抽样,由于个体间存在差异,抽得的样本计算出的指标不太可能恰好等于总体指标,因此通过样本推断总体总会有误差。这种由个体差异产生、随机抽样造成的样本统计量(statistics)与总体参数(parameter)

2、间的差异以及样本统计量间的差异,称为抽样误差(sampling error)。,图5.1可以得出抽样分布的特点 各样本均数未必等于总体均数; 各样本均数间存在差异; 样本均数的分布很有规律,围绕着总体均数中间多,两边少,左右基本对称,也服从正态分布; 样本均数间变异较原变量值的变异小,即样本均数的标准差明显变小,标准误,标准误(standard error, SE) 即样本均数的标准差,可用于衡量抽样误差的大小。 理论上可以证明,标准误,因通常未知,用S来估计。计算标准误采用下式,标准误,从上述公式可知,均数标准误的大小与标准差的大小成正比,而与样本例数n的平方根成反比。在实际应用中,若标准差

3、固定不变,可通过增加样本含量来减小均数的标准误,从而降低抽样误差。 数理统计理论证明,在非正态分布总体中进行类似的抽样,当样本含量足够大(如大于50),其样本均数也近似服从正态分布,且样本均数的总体均数等于原总体的均数,样本均数的标准误是原总体标准差的,二、样本率的抽样误差,对于计数资料,若在同一总体中重复抽样,抽出的样本频率与总体概率间的差异以及各样本频率间的差别,为样本率的抽样误差。,二、样本率的抽样误差,例5.2 若在一个非透明容器中装有黑白两色球,除颜色外,球的其他特性完全相同,其中黑球所占比例=50%。从容器中随机摸出60只球(n=60),然后将球放回容器,搅匀在摸。重复这样的实验1

4、00次,得到每次摸出黑球所占的比例(样本频率Pi)分布情况见表5.2,样本率的抽样误差,第二节 t 分布,随机变量x N ( , 2 ),标准正态分布 N(0,12),抽 样,样本均数 N( , 2 /n),标准正态分布 N(0,12), 未知 S 代替,u变换,Student t分布自由度:n-1,t 变换,t分布曲线,t 分布的图形与特征 以0为中心,左右对称的单峰分布; t分布曲线是一簇曲线,其形态变化与自由度的大小有关。 自由度越小,则t 值越分散,t分布曲线的峰部越矮而尾部翘得越高;说明尾部面积(概率P)就越大;与u分布曲线相比,t 分布低平; 自由度逐渐增大时,t 分布逐渐逼近u

5、分布(标准正态分布);当趋于时, 逼近 ,t 分布即为u分布。,第二节 t 分布,第三节 单个总体参数的置信区间,一、总体均数的置信区间 (一)t分布法 (二)正态近似法 二、总体率的置信区间 (一)查表法 (二)正态近似法,第三节 单个总体参数的置信区间,统计推断包括:参数估计(parameter estimation)和假设检验(hypothesis test)。 参数估计是指由样本统计量估计总体参数,包括点估计(point estimation)和区间估计(interval estimation)两种方法。 点估计就是用样本统计量直接作为相应总体参数的估计值。 区间估计是指按预先给定的概

6、率(1-)确定一个包含未知总体参数的范围。,概念:根据样本均数,按照预先给定的概率(1)称为置信度(confidence level)所确定的包含未知总体参数的一个数值范围,这个范围称为总体均数的可信区间(confidence interval, CI ) 。 置信区间通常由两个数值即可信限(confidence limit, CL)构成。其中较小的值称可信下限(lower limit, L),较大的值称可信上限(upper limit, U),一般表示为LU。,一、总体均数的置信区间,一、总体均数的置信区间,一、总体均数的置信区间,一、总体均数的置信区间,一、总体均数的置信区间,一、总体均数

7、的置信区间,一、总体均数的置信区间,例5.4 为研究某山区健康成年男子的脉搏平均水平,现在该山区随机抽取80名健康成年男子,测得脉搏数(次/min)见表5.4, 求其健康成年男子脉搏平均水平的95%置信区间。,一、总体均数的置信区间,可信区间(confidence interval, CI)是根据一定的可信度估计得到的区间。 估计正确的概率(1)称为可信度或置信度(confidence level),常取95或99。 * 总体均数的95%可信区间的涵义是指:从理论上来说,做100次抽样,可算得100个可信区间,平均有95个可信区间包括总体均数,只有5个可信区间不包括总体均数。,二、总体率的置信

8、区间,总体率置信区间的计算根据样本含量n的不同有两种方法。 (一)查表法 (二)正态近似法,(一)查表法,(一)查表法,(二)正态近似法,(二)正态近似法,第四节 两总体参数之差的置信区间,一、 两总体均数差的置信区间 二、两总体率差的置信区间,一、 两总体均数差的置信区间,一、 两总体均数差的置信区间,一、 两总体均数差的置信区间,例5.7 为研究某种外用中药搽剂对小鼠琼脂肉芽肿的抑制作用,某医院医师选取一级昆明种雌小鼠21只,随机分为实验组10只和对照组11只,分别测得其实验前的肉芽肿重,见表5.7,试估计实验前两组小鼠的肉芽肿重均数之差的95%置信区间。,一、 两总体均数差的置信区间,一、 两总体均数差的置信区间,二、两总体率差的置信区间,二、两总体率差的置信区间,例5.8 为评价甲、乙两种降压药的临床疗效

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论