第五章参数估计基础(7版1)_第1页
第五章参数估计基础(7版1)_第2页
第五章参数估计基础(7版1)_第3页
第五章参数估计基础(7版1)_第4页
第五章参数估计基础(7版1)_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 1第五章 参数估计基础宁夏医科大学公共卫生学院宁夏医科大学公共卫生学院流行病与卫生统计学系流行病与卫生统计学系郭忠琴郭忠琴2014.32 2学学 习习 要要 点点一、抽样分布与抽样误差一、抽样分布与抽样误差 掌握标准误的概念和计算掌握标准误的概念和计算二、二、t 分布分布 掌握掌握 t 分布的图形特征及分布的图形特征及 t 值表的使用值表的使用三、总体均数及总体概率的估计三、总体均数及总体概率的估计 掌握置信区间的计算方法、决定置信区间掌握置信区间的计算方法、决定置信区间优劣的两个要素。优劣的两个要素。3 3第一节第一节 抽样分布与抽样误差抽样分布与抽样误差 统计分析:统计分析:统计描述统

2、计描述和和统计推断统计推断 统计推断(统计推断(statistical inference )从总体中随从总体中随机抽取一个样本,通过样本信息了解总体特征或参机抽取一个样本,通过样本信息了解总体特征或参数,这种方法叫统计推断。数,这种方法叫统计推断。统计推断:统计推断:参数估计参数估计和和假设检验假设检验参数估计(参数估计( estimation of parameter ) 样本指样本指标值(统计量)估计总体指标值(参数)的过程。标值(统计量)估计总体指标值(参数)的过程。4 4第一节第一节 抽样分布与抽样误差抽样分布与抽样误差 参数估计:参数估计:点值估计点值估计和和区间估计区间估计点值估

3、计(点值估计(Point estimation ):就是用相应样本统):就是用相应样本统计量直接作为其总体参数的估计值。计量直接作为其总体参数的估计值。区间估计(区间估计(Confidence interval CI):按预先给定):按预先给定的概率的概率(1-)估计总体参数的可能范围估计总体参数的可能范围,该范围就称该范围就称为总体参数的为总体参数的1置信区间置信区间。 5 5第一节第一节 抽样分布与抽样误差抽样分布与抽样误差熟悉总体与样本、统计量与参数、误差与抽样误差熟悉总体与样本、统计量与参数、误差与抽样误差误差误差:泛指测得值与真值之差,样本指标与总体指:泛指测得值与真值之差,样本指标

4、与总体指标之差。误差按其产生的原因与性质分为两大类标之差。误差按其产生的原因与性质分为两大类(系统误差和偶然误差)。(系统误差和偶然误差)。抽样误差抽样误差:由:由产生的、由于产生的、由于而造成的而造成的样本统计量与样本统计量及样本统计量与总体参数样本统计量与样本统计量及样本统计量与总体参数之间的差异称为抽样误差。无倾向性,不可避免。之间的差异称为抽样误差。无倾向性,不可避免。6 6第一节第一节 抽样分布与抽样误差抽样分布与抽样误差均数的抽样误差:均数的抽样误差: 由个体变异产生的、由于抽样而造成的样本均由个体变异产生的、由于抽样而造成的样本均数与样本均数及样本均数与总体均数之间的差异称数与样

5、本均数及样本均数与总体均数之间的差异称为均数的抽样误差。用于表示均数抽样误差的指标为均数的抽样误差。用于表示均数抽样误差的指标叫样本均数的标准差,也称样本均数的标准误。叫样本均数的标准差,也称样本均数的标准误。一、样本均数的抽样分布与抽样误差一、样本均数的抽样分布与抽样误差7 7抽样实验:假定从抽样实验:假定从1313岁女学生身高总体均数岁女学生身高总体均数 ,总体标准差总体标准差 的正态总体中进行随机抽样。的正态总体中进行随机抽样。)(4 .155cm )(3 . 5cm 8 8抽样实验:假定从抽样实验:假定从1313岁女学生身高总体均数岁女学生身高总体均数 ,总体标准差总体标准差 的正态总

6、体中进行随机抽样。的正态总体中进行随机抽样。)(4 .155cm )(3 . 5cm 9 9v样本均数的分布特点:样本均数的分布特点: 1.1.各样本均数未必等于总体均数;各样本均数未必等于总体均数; 2.2.样本均数之间存在差异;样本均数之间存在差异; 3.3.样本均数的分布很有规律,围绕着总体均数,中样本均数的分布很有规律,围绕着总体均数,中间多,两边少,左右基本对称,也服从间多,两边少,左右基本对称,也服从正态分布正态分布。 4.4.样本均数的变异较之原变量的变异大大缩小。样本均数的变异较之原变量的变异大大缩小。第一节第一节 抽样分布与抽样误差抽样分布与抽样误差10101111第一节第一

7、节 抽样分布与抽样误差抽样分布与抽样误差12121313 1)从正态总体)从正态总体N(,2)中,随机抽取例数为中,随机抽取例数为n的多的多个样本,样本均数个样本,样本均数 服从正态分布;即使是从偏态服从正态分布;即使是从偏态总体中随机抽样,当总体中随机抽样,当n足够大时足够大时(如如n50), 也近也近似正态分布。似正态分布。数理统计推理和中心极限定理表明:数理统计推理和中心极限定理表明: 2)从均数为)从均数为,标准差为,标准差为的正态或偏态总体中抽的正态或偏态总体中抽取例数为取例数为n的样本,样本均数的标准差即标准误的样本,样本均数的标准差即标准误 。XnX/XX第一节第一节 抽样分布与

8、抽样误差抽样分布与抽样误差1414 身高组段身高组段 频数频数 组中值组中值 fx fx2 152.6 1 152.9 153.2 4 153.5 153.8 4 154.1 154.4 22 154.7 155.0 25 155.3 155.6 21 155.9 156.2 17 156.5 156.8 3 157.1 157.4 2 157.7 158.0 1 158.3 合计合计 100 表表8-2 100个样本均数的频数表与标准误的计算表个样本均数的频数表与标准误的计算表第一节第一节 抽样分布与抽样误差抽样分布与抽样误差1515 标准误的大小与标准误的大小与的大小成正比,与的大小成正比

9、,与n n的平方根的平方根成成反比,而反比,而为定值,说明可以通过增加样本例数来减为定值,说明可以通过增加样本例数来减少标准误,以降低抽样误差。少标准误,以降低抽样误差。未知,用样本标准差未知,用样本标准差S S来估计来估计总体标准差总体标准差。用用 来表示均数抽样误差的大小。来表示均数抽样误差的大小。nX/nSSX/ XS(标准误的理论值)(标准误的理论值)(标准误的估计值)(标准误的估计值)1616 例例5-1 2000年某研究所随机调查某地健康成年某研究所随机调查某地健康成年男子年男子27人,得到血红蛋白的均数为人,得到血红蛋白的均数为125g/L,标,标准差为准差为15g/L 。试估计

10、该样本均数的抽样误差。试估计该样本均数的抽样误差。lgnSSX/89. 227/15/第一节第一节 抽样分布与抽样误差抽样分布与抽样误差1717二二 、样本频率的抽样分布与抽样误差、样本频率的抽样分布与抽样误差 从同一总体中随机抽出观察单位相等的多个样本,从同一总体中随机抽出观察单位相等的多个样本,样本率与总体率及各样本率之间都存在差异,这种差样本率与总体率及各样本率之间都存在差异,这种差异是由于抽样引起的,称为异是由于抽样引起的,称为。 表示频率的抽样误差大小的指标叫表示频率的抽样误差大小的指标叫第一节第一节 抽样分布与抽样误差抽样分布与抽样误差1818 :总体率,:总体率,n:样本例数。:

11、样本例数。 当当未知时,未知时,p (当样本含量足够大,且(当样本含量足够大,且p和和1-p不太小)不太小) 公式为公式为: :率的标准误的估计值,:率的标准误的估计值,p:样本率。:样本率。 据数理统计的原理,率的标准误用据数理统计的原理,率的标准误用 表示表示 P nP 1 nPPSP 1PS第一节第一节 抽样分布与抽样误差抽样分布与抽样误差1919 例例5-2 某市随机调查了某市随机调查了50岁以上的中老年妇女岁以上的中老年妇女776人,其中患有骨质疏松症者人,其中患有骨质疏松症者322人,患病率为人,患病率为41.5%,试计算该样本频率的抽样误差。,试计算该样本频率的抽样误差。 %77

12、. 10177. 0776415. 01415. 0nP1PSP 第一节第一节 抽样分布与抽样误差抽样分布与抽样误差2020 一、一、t分布的概念分布的概念 在统计应用中,可以把任何一个均数为在统计应用中,可以把任何一个均数为,标准差,标准差为为的正态分布的正态分布N(,2)转变为转变为=0,=1的标准正态分布,的标准正态分布,即将正态变量值即将正态变量值X用用 来代替。来代替。也服从正态分布,也服从正态分布,XXXzXXSXSXt服从标准正态分布服从标准正态分布N(0,1)服从服从=n-1的的t分布分布 XZXX21212222t分布曲线特点:分布曲线特点: 1) t分布曲线是单峰分布,它以

13、分布曲线是单峰分布,它以0为中心,左为中心,左右对称。右对称。 2)t分布的形状与样本例数分布的形状与样本例数n有关。自由度越有关。自由度越小,则小,则 越大,越大,t 值越分散,曲线的峰部越矮,尾部值越分散,曲线的峰部越矮,尾部翘的越高。翘的越高。 3) 当当 n时,则时,则S逼近逼近,t分布逼近标准分布逼近标准正态分布。正态分布。t分布不是一条曲线,而是一簇曲线。分布不是一条曲线,而是一簇曲线。二、二、t 分布的图形和分布的图形和t 分布表分布表XS23232424与单侧概率相对应的与单侧概率相对应的t值用值用 表示,与双侧概率相对表示,与双侧概率相对应的应的t值用值用 表示。表示。,t,

14、 2/t 由于由于t t分布是以分布是以0 0为中心的对称分布,表中只列出为中心的对称分布,表中只列出了正值,故查表时,不管了正值,故查表时,不管t t值正负只用绝对值表示。值正负只用绝对值表示。 2525 一、参数估计的概念一、参数估计的概念 统计推断包括参数估计和假设检验。参数估计就统计推断包括参数估计和假设检验。参数估计就是用样本指标(统计量)来估计总体指标(参数)。是用样本指标(统计量)来估计总体指标(参数)。第三节第三节 总体均数及总体概率的估计总体均数及总体概率的估计参数估计参数估计点估计点估计(point estimation)区间估计区间估计(interval estimati

15、on)二、二、置信区间的计算置信区间的计算2626 ,即认为即认为20002000年该地所有健康成年男性血红年该地所有健康成年男性血红蛋白量的总体均数为蛋白量的总体均数为125125g/L 。1.点估计点估计: 用样本统计量直接作为总体参数的估计值用样本统计量直接作为总体参数的估计值。 例如例如 于于2000年测得某地年测得某地2727例健康成年男性血红蛋白例健康成年男性血红蛋白量的样本均数为量的样本均数为125125g/L,试估计其总体均数。,试估计其总体均数。X同理,例同理,例5-25-2中中776776名名5050岁以上的中老年妇女骨质疏松症的样本岁以上的中老年妇女骨质疏松症的样本患病率

16、作为总体患病率的点值估计值,即认为该市所有患病率作为总体患病率的点值估计值,即认为该市所有5050岁以岁以上的中老年妇女骨质疏松症的总体患病率约为上的中老年妇女骨质疏松症的总体患病率约为41.5%41.5%。 第三节第三节 总体均数及总体概率的估计总体均数及总体概率的估计27272. 区间估计:按预先给定的概率区间估计:按预先给定的概率(1)估计总体参数估计总体参数的可能范围的可能范围,该范围就称为该范围就称为。 预先给定的概率(1)称为,常取95%或99%。如无特别说明,一般取双侧95%。 可信区间由两个数值即可信区间由两个数值即构成,其中最小值构成,其中最小值称为下限,最大值称为上限。严格

17、讲,可信区间不包称为下限,最大值称为上限。严格讲,可信区间不包括上下限两个端点值。括上下限两个端点值。第三节第三节 总体均数及总体概率的估计总体均数及总体概率的估计2828通式:通式: (双侧)(双侧)(二)、置信区间的计算(二)、置信区间的计算 由由z z分布,分布,标准标准正态曲线下有正态曲线下有95%95%的的z z值在值在1.961.96之间之间。96. 1X96. 1X 95%的双侧置信区间:的双侧置信区间:99%的双侧置信区间:的双侧置信区间:XzX2/XX96. 1X96. 1X Z Z/2/2为标准正态变量,为标准正态变量,Z Z/2/2相当于按相当于按=时及时及P P取取,由

18、附,由附表表2 2查的的查的的t t界值。界值。 XX96. 1X,96. 1X XX58. 2X,58. 2X 2929通式:通式: (双侧)(双侧) 由由t t分布可知,自由度越大,分布可知,自由度越大,t t分布越逼近标准正态分布越逼近标准正态分布,此时分布,此时t t曲线下有曲线下有95%95%的的t t值约在值约在1.96之间,即95%的双侧置信区间:99%的双侧置信区间:96. 1sX96. 1X X2/SZX XXS96. 1XS96. 1X XXS96. 1X,S96. 1X XXS.X,S.X582582 第三节第三节 总体均数及总体概率的估计总体均数及总体概率的估计3030

19、例例5-4 5-4 某市某市20002000年随机测量了年随机测量了9090名名1919岁健康男大学生岁健康男大学生的身高,其均数为的身高,其均数为172.2cm172.2cm,标准差为,标准差为4.5cm,4.5cm,,试估,试估计该地计该地1919岁健康男大学生的身高的岁健康男大学生的身高的95%95%置信区间。置信区间。XSzX2/9612050.Z/. 1 .173, 3 .171905 . 496. 12 .172S96. 1XX 该市该市1919岁健康男大学生的身高的岁健康男大学生的身高的95%95%置信区间置信区间(171.3,173.1)cm(171.3,173.1)cm第三节

20、第三节 总体均数及总体概率的估计总体均数及总体概率的估计3131,此时此时 某自由度的某自由度的t t曲线下有曲线下有95%95%的的t t值约在值约在t0.05()之间, 通式:95%的双侧置信区间:的双侧置信区间:99%的双侧置信区间的双侧置信区间: 2/05. 0X2/05. 02/05. 02/05. 0tsXtttt XstX ,2/ t t/2, /2, 是按自由度是按自由度=n-1=n-1,由附表,由附表2 2查得的查得的t t值值。 X2/05. 0X2/05. 0StXStX X2/05. 0X2/05. 0StX,StX X/.X/.StX,StX20102010 第三节第

21、三节 总体均数及总体概率的估计总体均数及总体概率的估计3232例例5-3 5-3 已知某地已知某地2727例健康成年男性血红蛋白量的均数例健康成年男性血红蛋白量的均数为为 ,标准差,标准差S=15g/LS=15g/L , ,试问该地试问该地健康成年男健康成年男性血红蛋白量的性血红蛋白量的95%95%和和99%99%置信区间。置信区间。本例本例n=27n=27,S=15S=15 94.130,06.11938. 2056. 21252715tX262/05. 0 LgX/12595%CI: 02.133,98.11638. 2779. 21252715tX262/01. 0 99%CI:第三节第

22、三节 总体均数及总体概率的估计总体均数及总体概率的估计3333 置信区间的两个要素置信区间的两个要素 1. 准确度:反映置信度准确度:反映置信度1-的大小,即区间包的大小,即区间包含总体均数的概率大小。含总体均数的概率大小。2. 精度:反映区间的长度。精度:反映区间的长度。 在置信度确定的情况下,增加样本例数,在置信度确定的情况下,增加样本例数,会减小会减小 t, 和和 ,可减少区间长度,提高,可减少区间长度,提高精度。精度。XS第三节第三节 总体均数及总体概率的估计总体均数及总体概率的估计3434: 95%的参考值范围是指同质总体内包括的参考值范围是指同质总体内包括95%个体值的估计个体值的

23、估计范围。范围。若总体为正态分布,常按 计算。 95%的可信区间是指按的可信区间是指按95%的置信度估计的总体参数的所的置信度估计的总体参数的所在范围。若为大样本,按在范围。若为大样本,按 计算。计算。: 置信区间用标准误,参考值范围用标准差。置信区间用标准误,参考值范围用标准差。 三、均数置信区间与参考值范围的区别三、均数置信区间与参考值范围的区别SX96. 1XSX96. 1思考!思考!第三节第三节 总体均数及总体概率的估计总体均数及总体概率的估计3535 标准差与标准误的区别标准差与标准误的区别:标准差是描述样本中个体值间的变异程度的:标准差是描述样本中个体值间的变异程度的指标,标准差越

24、小,表示变量值围绕均数的波动越小。标准误指标,标准差越小,表示变量值围绕均数的波动越小。标准误是描述样本均数间变异程度的指标,标准误越小,表示样本均是描述样本均数间变异程度的指标,标准误越小,表示样本均数围绕总体均数的波动越小。数围绕总体均数的波动越小。:标准差常用于表示变量值对均数波动的:标准差常用于表示变量值对均数波动的大小,当资料呈正态分布时,与均数结合可估计正常值范大小,当资料呈正态分布时,与均数结合可估计正常值范围,计算变异系数等;标准误常用于表示样本统计量(样围,计算变异系数等;标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波本均数,样本率)对总体参

25、数(总体均数,总体率)的波动情况,可估计参数的可信区间,进行假设检验。动情况,可估计参数的可信区间,进行假设检验。第三节第三节 总体均数及总体概率的估计总体均数及总体概率的估计3636;二者均为变异指标,如果把总体中各样本均数;二者均为变异指标,如果把总体中各样本均数看成一个变量,则标准误可称为样本均数的标准差。看成一个变量,则标准误可称为样本均数的标准差。当样本含量不变时,均数的标准误与标准差成正比。当样本含量不变时,均数的标准误与标准差成正比。两者均可与均数结合运用,但描述的内容各不相同。两者均可与均数结合运用,但描述的内容各不相同。:当样本含量足够大时,标准差:当样本含量足够大时,标准差趋向稳定。而标准误随例数的增大而减小,甚至趋向趋向稳定。而标准误随例数的增大而减小,甚至趋向于于0。若样本含量趋向于总例数,则标准误接近于。若样本含量趋向于总例数,则标准误接近于0。第三节第三节 总体均数及总体概率的估计总体均数及总体概率的估计3737 总体概率的置信区间与样本含量总体概率的置信区间与样本含量n,阳性频率,阳性频率p的的大小有关,可根据大小有关,可根据n和和p的大小选择以下两种方法。的大小选择以下两种方法。 当样本含

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论