医学统计学课件:第六章 总体均数的估计与假设检验_第1页
医学统计学课件:第六章 总体均数的估计与假设检验_第2页
医学统计学课件:第六章 总体均数的估计与假设检验_第3页
医学统计学课件:第六章 总体均数的估计与假设检验_第4页
医学统计学课件:第六章 总体均数的估计与假设检验_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章总体均数的估计与假设检验第一节

均数的抽样误差与标准误

一、抽样误差与标准误抽样总体样本统计量

参数

统计推断

概念:抽样研究的目的就是要用样本信息来推断总体特征。由于存在变异,抽样后各个样本均数往往不等于总体均数

,且各样本均数间也不一定相等。这种由抽样造成的样本均数与总体均数的差异或各样本均数之间的差异称为抽样误差,抽样误差是不可避免的。

若某市某年14岁健康女生身高资料服从μ=155.4cm,σ=5.30cm的正态分布。从该正态分布N(155.4,5.32)的总体中随机抽样,每次样本含量n=10,共抽取100次,得到100个样本的样本均数和标准差,频数分布见表。

组段

频数151~1152~6153~15154~19155~27156~16157~8158~5159-1603

合计100100个样本均数的分布

样本均数的频数分布表,提示样本均数的抽样分布具有如下特点:1.样本均数未必等于总体均数;2.各样本均数间存在差异;3.样本均数围绕总体均数,呈正态分布;4.样本均数的变异范围较原变量的变异范围大为缩小。

(100个样本均数的均数为155.52cm,

标准差为1.68cm)

理论证明:若从正态总体中,反复多次随机抽取样本含量固定为n

的样本,这些样本均数也服从正态分布,即的总体均数仍为,样本均数的标准差为。1.从正态总体中重复随机抽取样本含量为n的样本,样本均数服从正态分布;

2.从偏态总体中重复随机抽样,当样本含

量n足够大时(n

>50),样本均数也近似

服从正态分布;

3.样本均数的总体均数

等于原总体均

;数理统计推论与中心极限定理

抽样分布

抽样分布示意图

抽样分布

抽样分布示意图4.样本均数的标准差比原观察值的标准差要小,标准差为:(理论值)(估计值)

标准误的意义(SE):

即样本均数的标准差,反映样本均数间的离散程度,也反映样本均数与总体均数间的差异,说明均数抽样误差的大小。标准误越大,说明抽样误差越大,用样本统计量作为总体参数估计值的可靠程度越差,反之亦然。二、标准误的用途

1.表示抽样误差的大小:标准误越小说明抽样误差越小,样本均数与总体均数越接近,用样本均数推论总体均数的可靠性越大;2.用于估计总体均数的可信区间;3.用于均数的假设检验。例:为了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取36名1岁婴儿,算得血红蛋白的平均浓度为121.3g/L,标准差为8.2g/L。计算该次抽样的标准误。(g/L)

大量研究资料显示,当地1岁婴儿血红蛋白的平均浓度为123.7g/L,标准差为11.9g/L。计算该次抽样的标准误。(g/L)三、标准差与标准误的区别和联系

区别:

1.意义:

标准差:描述观察值之间的离散程度,标准差越小,表示观察值围绕均数的分布比较集中,说明均数的代表性较好,反之亦然。

标准误:描述样本均数的离散程度,表示抽样误差的大小,标准误小,表示抽样误差小,样本均数与总体均数较接近,用样本均数推断总体均数的可靠性大,反之亦然。

2.表示方法:

标准差:

标准误:3.计算公式:

标准差:

标准误:

4.用途:

标准差:用于估计观察值的分布范围,制定医学参考值范围。

标准误:用于估计总体均数的可信区间、进行假设检验。

5.与样本含量的关系:

标准差:随着样本含量的增多,逐渐趋于稳定(一般200例以上)。

标准误:随着样本含量的增多,逐渐减小.若样本含量趋近于总体观察单位的数量,则标准误趋近于0,抽样误差几乎消失。

联系:

1.两者均是表示变异程度大小的指标:

说明观察值之间的变异程度用标准差,

说明统计量之间的变异程度用标准误。

2.标准误与标准差的大小成正比,当样本含量不变时,标准差越大标准误也越大。第二节t分布一、t分布的概念随机变量X~N

(m,s2)标准正态分布Z~N(0,12)s0m1xz

~N(m,s2/n)标准正态分布z~N(0,12)m01z

~N(m,s2/n)标准正态分布z~N(0,12)m01t

在实际工作中,

通常未知,常用S作为的估计值,但已不再服从标准正态分布,而是服从自由度为ν=n-1的

t分布。二、t分布的图形与特征

不同自由度下的t分布图

1.

t分布的图形t分布曲线是一簇曲线。当自由度ν不同时,曲线的形状不同。当ν→∞时,t分布趋近于标准正态分布,但当自由度较小时,t分布与标准正态分布的差异较大。t分布曲线的形状随自由度的大小而变化。2.

t分布的特征

⑴.单峰分布,以0为中心,左右两侧对称;

⑵.曲线形态随自由度不同而变化:自由度ν

越小,则t值越分散,t分布的峰部越矮而尾部翘得越高;当ν→∞时,t分布曲线与标准正态分布重合。因此,t分布曲线下面积为95%或99%的界值不是一个常量;⑶.t分布曲线是一簇曲线。t分布界值表自由度ν概率,P单侧0.250.200.100.050.0250.010.0050.00250.0010.0005双侧0.500.400.200.100.050.020.010.0050.0020.00111.0001.3763.0786.31412.70631.82163.657401000.6770.8451.2901.6601.9842.3642.6262.8713.1743.3902005000.6750.8421.2831.6481.9652.3342.5862.8203.1373.31010000.6750.8421.2821.6461.9622.3302.5812.8133.0983.300∞0.67450.84161.28161.64491.96002.32632.57582.80703.09023.2905-t0tt分布界值表自由度ν概率,P单侧0.250.200.100.050.0250.010.0050.00250.0010.0005双侧0.500.400.200.100.050.020.010.0050.0020.00111.0001.3763.0786.31412.70631.82163.657401000.6770.8451.2901.6601.9842.3642.6262.8713.1743.3902005000.6750.8421.2831.6481.9652.3342.5862.8203.1373.31010000.6750.8421.2821.6461.9622.3302.5812.8133.0983.300∞0.67450.84161.28161.64491.96002.32632.57582.80703.09023.2905表示方法:单侧概率t值:tα,ν,双侧概率t值:tα/2,ν

3.t界值表的特点:

(1).在同一自由度下,|t|值越大,概率P值越小;(2).在相同|t|值时,双侧概率P值为单侧概率P值的两倍;

(3).概率P值一定的情况下,自由度越大,|t|

值越小;自由度越小,|t|值越大;

(4).当ν≥100时,双侧t的界值接近标准正态分布的z值,

ν=∞时,

t值=z值。

(5).表示方法:单侧尾部概率t值:tα,ν,,双侧尾部概率t值:tα/2,ν

三、t分布的应用

1.总体均数的区间估计;2.t检验。第三节总体均数的估计一、可信区间(CI)的概念

1.点值估计:用相应样本统计量直接作为其总体参数的估计值。

优点:估计方法简单易行;

缺点:⑴没有考虑抽样误差的大小;⑵缺乏概率的保证。

2.区间估计:按预先给定的概率,所确定的可能包含未知总体参数所在的范围。该范围称为总体参数的可信区间或置信区间;

预先给定的概率1-α称为可信度或置信度,

常取95%或99%。若无特别说明,一般取双侧95%。二、总体均数可信区间的计算95%01.σ未知,n较小:按t分布的原理计算:双侧:单侧:例:为了解某地1岁婴儿的血红蛋白浓度,

从该地随机抽取25名1岁婴儿,测得其血红蛋白平均数为123.7g/L,标准差为11.9g/L。估计该地1岁婴儿血红蛋白的平均浓度。

σ未知,n较小:按t分布的原理计算:双侧:2.σ已知或σ未知,但是n足够大(>50)

时,按正态分布原理计算可信区间。σ已知:

σ未知,但n足够大:双侧:双侧:单侧:单侧:

例:某地抽得正常成人200名,测得其血清胆固醇的均数为3.64mmol/L,

标准差为1.20mmol/L,试估计其

95%可信区间。

⑴.可信区间确切涵义:从总体中作随机抽样,根据每个样本可算得一个可信区间,如95%的可信区间,意味着作100次抽样,算得100个可信区间,有95个可信区间包含总体均数(估计正确),有5个可信区间不包含总体均数(估计错误)。5%是小概率事件,对一次抽样而言出现的可能性很小,因此,在实际应用中,就认为总体均数在算得的可信区间内。

图6-1模拟抽样成年男子红细胞数100次的95%可信区间示意图

******⑵.可信区间通常由两个数值即可信限构成,较小的称下限,较大的称上限,可信区间是开区间。

⑶.可信区间是随机的,总体参数是固定的,所以可信区间包含总体参数的可能性为1-α.

⑷.可信区间的两个要素

1.准确性:反映在可信度的大小,1-α越接近1,可信区间包含μ的概率越大。

2.精确性:反映在区间的宽度,区间宽度愈窄,精确性越高。若在样本量确定的情况下,两者是矛盾的,视情况而定。但不能笼统地认为99%可信区间比95%可信区间好,一般95%较为常用。要同时提高准确性和精确性,须增加样本含量。三、可信区间与医学参考值范围的区别1.意义:

医学参考值范围:

绝大多数正常人的解剖、生理、生化等各种指标的波动范围;

个体观察值的波动范围。

总体均数的可信区间:

按预先给定的概率,所确定的未知总体参数可能所在的范围;医学参考值范围:双侧:百分位数法:单侧:2.计算公式:σ已知或σ未知,但n足够大:

σ未知,n较小:双侧:双侧:或:总体均数的可信区间:

3.样本含量的作用:

医学参考值范围:

样本量越大,参考值范围越稳定总体均数的可信区间:

样本量越大,可信区间范围越窄

4.应用:

医学参考值范围:⑴.进行统计描述;

⑵.估计绝大多数观察对象某项指标的分布范围;

⑶.判断某项指标正常与否。

总体均数的可信区间:

⑴.进行统计推断;

⑵.估计未知的总体均数可能所在的范围;

⑶.进行均数的假设检验。第四节假设检验

(hypothesistesting)

一、假设检验的基本思想:

根据研究目的,先对总体的参数或分布做出某种假设,然后用适当的统计方法,根据样本提供的信息,对所做出的假设进行检验,依据检验结果做出是否拒绝该假设的判断,这种方法称为假设检验(又称显著性检验)。

是利用小概率反证法思想,从问题的对立面H0出发,间接判断要解决的问题H1是否成立。在H0成立的条件下计算检验统计量,最后通过所获得的P值加以判断。当P值小于或等于预先规定的概率值α,即是小概率事件。根据小概率事件的原理:小概率事件在一次抽样中发生的可能性很小,如果它发生了,则有理由怀疑原假设H0,认为其对立面H1成立,该结论可能犯大小为α的错误.

例:根据大量调查,已知健康成年男子的脉搏均数为72次/分。某医生在某山区抽样调查25名健康成年男子,求得脉搏均数为74.2次/分,标准差为6.0次/分,能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?

由于样本均数有抽样误差,对一个样本均数X与一个已知的或假设的总体均数

0作比较,它们之间的差异可能有两种原因:

1.由于抽样误差所致山区成年男子脉搏的总体均数与一般成年男子的脉搏总体均数相同,也是72次/分,现在所得样本均数74.2次/分,仅仅是由于抽样误差造成的,统计上称之为差异无统计学意义。

2.由于环境因素的影响两个均数间有本质差异,即山区成年男子脉搏总体均数与一般成年男子脉搏的总体均数不同。现在所得样本均数74.2与总体均数72有着本质的差别,不是抽样误差所致,统计上称之为差异有统计学意义。如何判断?利用反证法的思想,假设它们属于同一总体,如果差异不大,可以用抽样误差解释,认为它们属于同一总体;如果差异很大,不能用抽样误差解释,则认为它们不属于同一总体。多大的差异算是由抽样误差造成的?根据抽样分布理论计算t值或z值,确定P值后进行判断。如果差异大,检验统计量就大,所对应的P值就小;当P值小于预先规定的概率值α(0.05或0.01)则为小概率事件,即在一次抽样中发生的可能性很小,如果它发生了,就有理由认为假设不成立,认为假设的对立面成立。这个结论的正确性冒着犯5%错误的风险。二假设检验的基本步骤:1.建立检验假设、确定检验水准

2.选择检验方法、计算检验统计量

3.确定P值,做出推断结论1、建立检验假设,确定检验水准

(1)H0:μ=μ0(无效假设)

(2)H1:μ≠μ0(备择假设)

注意:①检验假设针对的是总体,而非样本;②H0和H1是相互联系、对立的假设,缺一不可;③H0的形式一般为:某两个(或多个)总体参数相等、两总体参数差为0,或………无效;④H1的内容要反映出检验的单双侧。

单侧、双侧检验:

⑴.一般情况用双侧检验,较为稳妥。⑵.双侧检验:甲组均数大于乙组均数或乙组均数大于甲组均数的情况均可能出现,宜用双侧检验;

⑶.单侧检验:根据专业知识,已知甲组均数不会小于乙组均数,可应用单侧检验;

⑷.单侧检验较双侧检验更容易得出“有统计学意义”的结论,应在有充分专业依据时使用;应用单侧检验时应说明。

(3)α:检验水准,是预先规定的概率值,它确定了小概率事件的水准。在实际工作中常取0.05,但并非一成不变,可以根据不同的目的给予不同的设置。

检验水准α:是预先规定的拒绝域的概率值(犯Ⅰ型错误的概率)。

假设检验中,先提出假设,然后在假设成立的前提下看实际抽到的样本是否属于小概率事件,若属于小概率事件,则拒绝该假设;若不属于小概率事件,则不拒绝该假设。

2、选择检验方法,计算检验统计量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论