医学科研中的统计学方法:总体均数的估计及假设检验_第1页
医学科研中的统计学方法:总体均数的估计及假设检验_第2页
医学科研中的统计学方法:总体均数的估计及假设检验_第3页
医学科研中的统计学方法:总体均数的估计及假设检验_第4页
医学科研中的统计学方法:总体均数的估计及假设检验_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

参数估计主要内容:抽样误差与区间估计populationsamplesamplesampling抽样研究(samplingstudy):在总体中随机抽取一定数量观察单位作为样本。由样本信息推断总体特征,这一过程称为统计推断(statisticalinference)100份样本的均数和标准差

将这100份样本的均数看成新变量值,按第二章的频数分布方法,得到这100个样本均数得直方图见图1。图1随机抽样所得100个样本均数的分布100个样本均数的抽样分布特点:①

②100个样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。③样本均数的分布曲线为中间高,两边低,左右对称,近似服从正态分布。

④样本均数的标准差明显变小:即样本均数的标准差,可用于衡量抽样误差的大小。因通常σ未知,计算标准误采用下式:标准误(standarderror,SE)

通过增加样本含量n来降低抽样误差。样本均数的标准差称为标准误。标准误与标准差成正比,当总体中各观测值变异很小时,样本均数与总体均数的差异小,抽样误差小。标准误与样本含量的平方根成反比,样本含量越大,抽样误差越小标准误反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异。计算100个样本的标准差S,由此可计算每一样本的抽样误差大小。第99个样本3个抽样实验结果图示抽样实验小结

均数的均数围绕总体均数上下波动。

均数的标准差即标准误与总体标准差相差一个常数的倍数,即

样本均数的标准误(StandardError)=样本标准差/

从正态总体N(m,s2)中抽取样本,获得均数的分布仍近似呈正态分布N(m,s2/n)

。中心极限定理centrallimittheorem①即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。②随着样本量的增大,样本均数的变异范围也逐渐变窄。描写抽样误差大小的统计量称为标准误。

对计量资料,其计算公式为:影响抽样误差的因素

观察个体具有的个体差异。样本含量。抽样方法。按抽样误差大小排序整群抽样,单纯随机抽样,系统抽样,分层抽样。

例1

测量140名正常人的空腹血糖,得试计算标准误。

t分布(t-distribution)随机变量XN(m,s2)标准正态分布N(0,12)Z变换均数标准正态分布N(0,12)Studentt分布自由度:n-1图2不同自由度下的t分布图t分布的特征①以0为中心,左右对称的单峰分布;②t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近Z分布(标准正态分布);当趋于∞时,t分布即为Z分布。t界值表(附表2)1.8122.228-2.228tf(t)ν=10的t分布图

参数的估计点估计(pointestimation):由样本统计量直接估计总体参数区间估计(intervalestimation):在一定可信度下,同时考虑抽样误差总体均数的估计参数估计:用样本指标值(统计量)

估计总体指标值(参数)。(1

)称为可信度或置信度(confidencelevel),常取95%。置信区间通常两个数值即置信限(confidencelimit,CL)构成,较小的称为置信下限(lowerlimit,L),较大的称为置信上限(upperlimit,U),一、置信区间的有关概念

按预先给定的概率(1

),确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidenceinterval,CI)二、总体均数置信区间的计算s未知,且n较小,按t分布s已知,或s未知但n足够大,按Z分布Z0.05/2=1.96

三、可信区间估计的优劣

一是可信度1

(准确度),愈接近1愈好,如99%的可信度比95%的可信度要好;二是区间的宽度(精密度),区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。

在可信度确定的情况下,增加样本含量可减小区间宽度。四、总体均数可信区间与参考值范围的区别

测得25名1岁婴儿血红蛋白均数为123.7g/L,标准差为11.9g/L。计算1岁婴儿血红蛋白均数的95%可信区间。查表即1岁婴儿血红蛋白均数的95%可信区间(118.8,128.6).测量140名正常人的空腹血糖,得试计算95%可信区间。95%可信区间为(88.55±1.96×1.096)即(86.40,90.70)。假设检验的概念与原理

1.思维逻辑

2.基本步骤假设检验的原理已知一般中学男生的心率平均值为74次/分钟,标准差6次/分钟,为了研究经常参加体育锻炼的中学男生心脏功能是否增强,在某地区中学中随机抽取常年参加体育锻炼的男生100名,得到心率平均值为65次/分钟。是由于碰巧?还是由于必然的原因?运用假设检验来处理这类问题。假设检验的概念由样本信息对相应总体的特征进行推断称为统计推断。若对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设,称为假设检验(hypothesistesting)。

样本1同一总体差异抽样误差引起

样本2总体甲样本1

差异本质不同引起(本质不同)总体乙样本2假设检验的原因P>0.05无统计学意义P<0.05有统计学意义不能用抽样误差来解释1.反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。反证法原理:

某事(结果)假设检验的原理A(不能直接证明)B(容易证明)假设检验的原理2.概率论(小概率):如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是“不会发生的”。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的。小概率事件原理:

某事(结果)A(绝大多数情况下发生)B(一般情况下不发生)(1)建立检验假设,确定检验水准

H0(无效假设nullhypothesis):μ1=μ2即两总体均数相等

H1(备择假设alternativehypothesis)

:μ1≠

μ2即两总体均数不等(单、双侧检验?)检验水准

=?(常取0.05或0.01)2、假设检验的步骤单、双侧检验备择假设中双侧检验:

μ

≠μ0(即μ>μ0

,或μ<μ0)单侧检验:

(1)μ>μ0

(根据专业角度μ不可能小于μ0) (2)μ<μ0(根据专业角度μ不可能大于μ0

)注:一般情况下均采用双侧检验。(2)计算统计量

根据资料类型与分析目的选择适当的公式计算出统计量,比如计算出u值或t值。注意:在检验假设成立的情况下,才会出现的分布类型或公式。(3)确定概率值(P),作出推断结论将计算得到的u值或t值与查附表得到u

或t

,ν,比较,得到P(犯假阳性错误的概率)值的大小。根据u分布和t分布我们知道,如果|u|≥u

或|t|≥

u

则P≤

;如果|u|<u

或|t|<u

则P>

。作出推断结论

如果P>

,认为在检验假设H0成立的条件下,得到等于或大于现有统计量u值或t值的可能性大于

,不属于小概率事件,则不拒绝H0,差别无统计学意义,结论是不认为两总体均数不相等。

如果P≤

,我们认为在检验假设H0成立的条件下,得到等于或大于现有统计量u值或t值的可能性小于

,可判断为小概率事件,则拒绝H0,接受H1,差别有统计意义,结论是两总体均数不相等,或者某一总体均数大于(或小于)另一总体均数。结果不拒绝检验假设拒绝检验假设正确理解结论的概率性(都隐含着犯错误的可能性)。假设有一前提条件H0:μ

=μ0成立P

>

α

对立条件H1:μ

μ0

假设检验方法不拒绝步骤总结:假设有一前提条件H0:μ

=μ0成立

P≤α

对立条件H1:μ

μ0

假设检验方法拒绝同时接受假设检验在两种假设条件下进行:总体分布已知—参数检验总体分布未知—非参数检验49两类错误50I型错误和II型错误

假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立,然后在假定H0成立的条件下计算检验统计量,最后根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。51

I型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是

(其值等于检验水准)

II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是

(其值未知)

52表2可能发生的两类错误531-

:检验效能(power):当两总体确有差别,按检验水准

所能发现这种差别的能力。54图3I型错误与II型错误示意图(以单侧u检验为例)

55减少I型错误的主要方法:假设检验时设定

值。减少II型错误的主要方法:提高检验效能。提高检验效能的最有效方法:增加样本量。如何选择合适的样本量:实验设计。ab减少(增加)I型错误,将会增加(减少)II型错误增大n

同时降低a与ba与b间的关系57

假设检验的统计意义与实际意义581.要有严密的研究设计,尤其是下因果结论。2.不同的资料应选用不同检验方法。3.正确理解“统计学意义”一词的含义。

594.结论不能绝对化,提倡使用精确P值。

5.注意统计P值大小与医学/临床/生物学差异大小的区别

6.可信区间与假设检验各自不同的作用,要结合使用。

60可信区间在统计推断上提供的信息

61

一方面,可信区间亦

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论