参数估计基础课件_第1页
参数估计基础课件_第2页
参数估计基础课件_第3页
参数估计基础课件_第4页
参数估计基础课件_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生统计学(第五版)第五章参数估计基础第一节抽样分布与抽样误差第二节t分布第三节总体均数及总体概率的估计

抽样研究的目的就是要用样本信息来推断相应总体的特征,这一过程称为统计推断。统计推断包括两方面:参数估计和假设检验抽样误差:由于生物固有的个体变异的存在,从某一总体中随机抽取一个样本,所得样本统计量与相应的总体参数往往是不同的,这种差异称为抽样误差

无倾向性,不可避免。(一)均数的抽样误差:由个体变异产生的、由于抽样而造成的样本均数与样本均数及样本均数与总体均数之间的差异称为均数的抽样误差。表示均数抽样误差大小的指标称均数的标准误,简称标准误。也就是样本均数的标准差。标准误的意义:1、标准差的特点均存在,只是表示均数的标准差。2、表示抽样误差大小。(二)均数的抽样分布

从总体中随机抽取若干样本,计算出样本均数(标准差),这些样本均数的分布即为均数的抽样分布。是抽样分布的一种。

均数的抽样分布有一定的规律。p69:表5-1

样本均数的分布特点:1.各样本均数未必等于总体均数;2.样本均数之间存在差异;3.样本均数的分布很有规律,围绕着总体均数,中间多,两边少,左右基本对称,也服从正态分布。数理统计推理和中心极限定理表明:

1)从正态总体N(µ,σ2)中,随机抽取例数为n的多个样本,样本均数服从正态分布;即使是从偏态总体中随机抽样,当n足够大时(如n>50),也近似正态分布。

2)从均数为µ,标准差为σ的正态或偏态总体中抽取例数为n的样本,样本均数的标准差即标准误为:

例5-12000年某研究所随机调查某地健康成年男子27人,得到血红蛋白的均数为125g/L,标准差为15g/L。试估计该样本均数的抽样误差。均数的抽样分布:1.样本均数服从正态分布:2.样本均数服从标准正态分布:(n较大)3.样本均数服从t分布:详见后(n较小)一、样本均数的抽样误差与抽样分布二、样本频率的抽样误差与抽样分布当π未知时,p

π(为样本含量足够大,且p和1-p不太小)公式为:

:率的标准误的估计值,p:样本率。

例5-2某市随机调查了50岁以上的中老年妇女776人,其中患有骨质疏松症者322人,患病率为41.5%,试计算该样本频率的抽样误差。(二)频率的抽样分布

从总体中随机抽取若干样本,计算出样本频率,这些频率的分布即为频率的抽样分布。也是抽样分布的一种。频率的抽样分布也有一定的规律。p72:表5-3

第一节抽样分布与抽样误差第二节t分布第三节总体均数及总体概率的估计

一、t分布的概念服从ν=n-1的t分布正确使用t界值表!

与单侧概率相对应的t值用表示,与双侧概率相对应的t值用表示。

由于t分布是以0为中心的对称分布,表中只列出了正值,故查表时,不管t值正负只用绝对值表示。

第一节抽样分布与抽样误差第二节t分布第三节总体均数及总体概率的估计一、参数估计的概念二、总体均数的估计三、总体概率的估计二、总体均数的估计

1.点估计:

用样本统计量直接作为总体参数的估计值。例如于2000年测得某地27例健康成年男性血红蛋白量的样本均数为125g/L,试估计其总体均数。

,即认为2000年该地所有健康成年男性血红蛋白量的总体均数为125g/L。2.区间估计:按预先给定的概率(1-α)估计总体均数的可能范围,该范围就称为总体均数的1-α置信区间(confidenceintervalCI)。预先给定的概率(1-α)称为置信度,常取95%或99%。如无特别说明,一般取双侧95%。

置信区间由两个数值即置信限构成,其中最小值称为下限,最大值称为上限。严格讲,置信区间不包括上下限两个端点值。3、置信区间的计算(1)σ已知,按标准正态分布原理计算通式:(双侧)

Zа/2为标准正态变量,Zа/2相当于按ν=∞时及P取α,由附表2查的的t界值。

95%的双侧置信区间:99%的双侧置信区间:(2)σ未知但样本例数n足够大(n>50)时

通式:(双侧)95%的双侧置信区间:99%的双侧置信区间:例5-4某市2000年随机测量了90名19岁健康男大学生的身高,其均数为172.2cm,标准差为4.5cm,,试估计该地19岁健康男大学生的身高的95%置信区间。该市19岁健康男大学生的身高的95%置信区间(171.3,173.1)cm(3)σ未知且样本例数n较小时,按t分布原理

通式:tа/2,ν是按自由度ν=n-1,由附表2查得的t值。95%的双侧置信区间:99%的双侧置信区间:例5-3已知某地27例健康成年男性血红蛋白量的均数为,标准差S=15g/L,试问该地健康成年男性血红蛋白量的95%和99%置信区间。本例n=27,S=1595%CI:99%CI:

4、置信区间的意义

从总体中进行随机抽样,由样本均数计算置信区间,有1-α的可能得到包含总体均数的置信区间。所有样本计算的所有置信区间包含总体均数的置信区间不包含总体均数的置信区间1-α

α

5、置信区间的两个要素(1)准确度:反映置信度1-α的大小,即区间包含总体均数的概率大小。(2)精度:反映区间的长度。在置信区间确定的情况下,增加样本例数,会减小tа,ν和,可减少区间长度,提高精度。一、参数估计的概念二、总体均数的估计三、总体概率的估计(一)点估计例5-2中776名50岁以上的中老年妇女骨质疏松症的样本患病率作为总体患病率的点值估计值,即认为该市所有50岁以上的中老年妇女骨质疏松症的总体患病率约为41.5%。

(二)区间估计总体概率的置信区间与样本含量n,阳性频率p的大小有关,可根据n和p的大小选择以下两种方法。1.正态近似法当样本含量足够大,且p和1-p不太小即np和n(1-p)均≥5时,则样本率的分布近似正态分布。公式为:

P为样本率,为率的标准误的估计值。

例5-7用某种仪器检查已确诊的乳腺癌患者94例,检出率为78.3%。估计该仪器乳腺癌总体检出率的95%置信区间。分析:本例样本例数较大,且样本率p不太小,可用正态近似法:

2.查表法(1)按二项分布原理:p接近0或1,n较小时,以n及发生数x查附表6.1-6.3。p78:例5-5/5-6

例5-5某医院对39名前列腺癌患者实施开放手术治疗,术后有合并症者2人,试估计该手术合并症发生概率的95%置信区间。注意:此表仅列出X≤n/2的95%置信区间。

例5-6某医生用某药物治疗31例脑血管梗塞患者,其中25例患者治疗有效,试求该药物治

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论