参数估计与假设检验2016-7-3_第1页
参数估计与假设检验2016-7-3_第2页
参数估计与假设检验2016-7-3_第3页
参数估计与假设检验2016-7-3_第4页
参数估计与假设检验2016-7-3_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

参数估计与假设检验实例结果

(1)现患状况:浏阳市18岁以上成年人糖尿病患病率为5.4%(95%CI:4.8%-5.9%),其中男性为5.0%(95%CI:4.3%-5.8%),女性为5.7%(95%CI:4.9%-6.7%);高血压患病率为27.2%(95%CI:26.0%-28.4%),其中男性为26.5%(95%CI:24.9%-28.1%),女性为27.9%(95%CI:26.3%-29.7%);糖尿病患者合并高血压的患病率为2.6%(95%CI:2.2%,3.1%),其中男性为2.4%(95%CI:1.9%,2.9%),女性为2.9%(95%CI:2.3%,3.6%),糖尿病患者中合并高血压的比例为48.7%(148/304)。非条件多因素logistic回归分析结果显示与糖尿病有关的因素是:既往吸烟1.890(95%CI:1.175,3.040)、饮酒0.684(95%CI:0.482,0.970)、胆固醇1.411(95%CI:1.003,1.986)、甘油三酯2.190(95%CI:1.671,2.871)、腹型肥胖1.750(95%CI:1.358,2.253)、高血压1.760(95%CI:1.362,2.274),

非条件多因素logistic回归分析结果显示有既往吸烟1.936(95%CI:1.059,3.540)、甘油三酯异常3.236(95%CI:2.267,4.619)、肥胖5.343(95%CI:1.174,24.325)、腹型肥胖1.737(95%CI:1.119,2.699),表3-1浏阳市18岁以上不同性别、年龄糖尿病患病率年龄(岁)男

性女

性合

计调查数患病数率(%)调查数患病数率(%)调查数患病数率(%)18-2923710.423310.447020.430-39400

9

2.341281.98121721880374.21743643.750-59630447.0530427.91160867.760-69501336.63584011.2859738.570-792622911.1216209.34784910.280以上7268.37479.5146138.9合计29651495.027031555.756683045.4表3-5糖尿病合并高血压单因素分析结果因素糖尿病组非糖尿病组检验统计量P值性别:男70(3.2)21021.8010.180

女78(4.0)1871年龄(岁):18-291(0.2)456131.9760.00030-395(0.7)72640-4926(1.9)137350-5944(5.9)72360-6946(9.4)44270-7918(8.4)19780以上8(12.5)56婚姻:

未婚5(2.2)22027.0160.000已婚120(3.3)3504丧偶22(9.7)204离异1(2.4)40本章开始学习统计推断(statisticalinference)方法,内容涉及参数估计和假设检验的基本概念和原理。

统计推断参数估计假设检验总体样本抽取部分观察单位

统计量

参数

统计推断统计推断

statisticalinference如:样本均数样本标准差S

样本率P如:总体均数总体标准差总体率参数估计(estimationofparameters)

包括:点估计与区间估计假设检验(testofhypothesis)

统计学中的统计推断包括两个重要的方面:一是利用样本统计量的信息对相应总体参数值做出推断,如用样本均数估计总体均数,用样本标准差S估计总体标准差等,称之为点估计。另一个是利用样本统计量来推断我们是否接受一个事先的假设,称之为假设检验。本章只讨论参数估计,假设检验将在下一章中讨论。而参数估计又分为点估计与区间估计。

一、抽样误差在医学研究中,绝大多数情况是由样本信息推断总体特征。由于个体存在差异,因此通过样本推论总体时会存在一定的误差,如样本均数往往不等于总体均数,这种由抽样造成的样本统计量与总体参数的差异称为抽样误差(samplingerror)。第一节参数估计抽样试验

从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n=5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。按上述方法再做样本含量n=10、样本含量n=30的抽样实验;比较计算结果。抽样试验(n=5)抽样试验(n=10)抽样试验(n=30)1000份样本抽样计算结果总体的均数总体标准差s均数的均数均数标准差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.09133个抽样实验结果图示(一)均数的标准误统计学中为了区别个体观察值之间变异的标准差与反映样本均数之间变异的标准差,将后者称为均数的标准误(standarderrorofthemean)。显然,均数的标准误小于原始测量值的标准差,均数的标准误越小说明估计越精确,因此可以用均数的标准误表示均数抽样误差的大小。均数的标准误用符号表示,计算公式为:

在样本含量一定的情况下,均数的标准误与标准差成正比,均数的标准误与样本含量的平方根成反比,说明在同一总体中随机抽样,样本含量越大,均数的标准误越小。均数的标准误反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异。

统计上通常将统计量(如样本均数、样本率p等)的标准差称为标准误(standarderror,SE)。所以,样本均数的标准差又称为样本均数的标准误,是反映样本均数抽样误差大小的指标。

特点:

1.总体标准误的大小与总体标准差成正比,与样本含量的平方根成反比。即当样本含量n一定时,标准差越大,即样本的个体差异越大,标准误就越大,样本均数的抽样误差就越大;标准差越小,标准误就越小,即样本均数抽样误差就越小。

2.当标准差一定时,n越大,标准误就越小;n越小,标准误就越大。故影响抽样误差大小的主要因素是样本含量。作为总体参数(常数)通常是未知的,因而,在实际工作中常用样本标准差S来估计。

实际中,总体标准差往往未知,因而通常用样本标准差代替,求得样本均数标准误的估计值,计算公式为:例3-1

在某地随机抽查成年男子140人,得红细胞均数,标准差,试计算其标准误。 按公式计算得:(二)率的标准误样本率的标准差也称为率的标准误(standarderrorofrate),可用来描述样本率抽样误差的大小。率的标准误越小,则率的抽样误差越小,率的标准误越大,则率的抽样误差越大。公式为:在一般情况下,总体率往往是未知的,此时可用样本率来代替总体率,其估计值为:二、可信区间的概念点估计:是使用单一的数值直接作为总体参数的估计值,如用估计相应的,用估计相应的。该法表达简单,但未考虑抽样误差的影响,无法评价参数估计的准确程度。区间估计(intervalestimation)是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。事先给定的概率称为可信度,计算得到的区间称为可信区间(confidenceinterval,CI)。总体均数的估计

总体均数的点估计(pointestimation)与区间估计参数的估计点估计:由样本统计量直接估计总体参数区间估计:在一定可信度(Confidencelevel)下,同时考虑抽样误差区间估计总体均数的区间估计(intervalestimation)是利用样本信息给出一个区间,并同时给出重复试验时该区间包含总体均数的概率。

1)可信区间的涵义

从总体中作随机抽样,对于含量为n的每个样本而言,都可以算得一个区间。以95%的可信区间为例,意味着在同一总体中作100次重复抽样,可得100个可信区间,平均有95个可信区间包含总体均数(估计正确),只有5个可信区间不包含总体均数(估计不正确),或对于某一个区间而言,它包含总体均数的可能性为95%,而不包含总体均数的可能性仅为5%。因此在实际应用中,以这种方法估计总体均数犯错误的概率仅为5%。

2)可信区间具有两个要素

(1)准确度(accuracy),即可信区间包含的概率的大小,一般而言概率越大越好。

(2)精密度(precision),反映区间的长度,区间的长度越窄,估计的精密度越好,反之越差。

(一)已知一般情况其中为标准正态分布的双侧界值。

95%可信区间:三、总体均数的区间估计(二)未知通常未知,这时可以用其估计量S代替,但已不再服从标准正态分布,而是服从著名的t分布。

图6-1

不同自由度的t

分布图

ConfidenceintervalWilliamGosset可信区间的计算:原理与前完全相同,仅仅是两侧概率的界值有些差别。即需要注意:在小样本情况下,应用这一公式的条件是原始变量服从正态分布。在大样本下可以用替换。可信区间:Confidenceinterval例3-2

某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32g/L,标准差为0.57g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。下限:上限:Confidenceinterval例3-3

试计算例6-1中该地成年男子红细胞总体均数的95%可信区间。本例属于大样本,可采用正态近似的方法计算可信区间。因为,则95%可信区间为:

下限:上限:Confidenceinterval单侧可信区间:前面涉及的都是双侧可信区间。但有些情况下,我们所关心的仅仅是单侧的可信限。单侧可信区间与双侧可信区间的计算公式基本相同,只需将公式中的抽样分布的双侧界值换成单侧界值,同时只取下限或上限。Confidenceinterval实际中,有时需要计算两个总体均数差值的可信区间,例如通过计算两种降压药物平均降压的差值比较两种药物的差别,其双侧可信区间的计算公式为 其中,为自由度,为两样本均数之差的标准误。

四、两总体均数差的区间估计当两总体方差相同时,其中为两样本的合并方差。当两样本的样本含量均较大时,上述计算可信区间中的可用相应的代替,而且无论两总体的方差是否相同,有Confidenceinterval例3-4

评价复方缬沙坦胶囊与缬沙坦胶囊对照治疗轻中度高血压的有效性,将123名患者随机分为两组,其中试验组和对照组分别为54例和48例。经六周治疗后测量收缩压,试验组平均下降15.77mmHg,标准差为13.17mmHg;对照组平均下降9.53mmHg,标准差为13.55mmHg。试估计两组收缩压平均下降差值的95%可信区间。Confidenceinterval由公式计算:下限:上限:五、总体率的区间估计

1.

样本率的区间估计:利用二项分布可估计其总体率可信区间,一般取。对于,且接近于0或1时,可直接查附表6百分率的可信区间表得到其总体率的可信区间。例3-52003年4~6月某医院重症监护病房收治重症SARS患者38人,其中死亡14人,求SARS病死率的95%可信区间。(查附表6,95%的可信区间为22%~54%)。

2.当较大,和均不太小,如和均大于5时,可利用样本率近似服从正态分布的原理来估计总体率的可信区间,计算公式为

,例6-6

某区疾病预防控制中心2002年对该乡镇250名小学生进行贫血的检测,结果发现有86名贫血者,检出率为34.40%,求贫血检出率95%的可信区间。

六、两总体率差值的区间估计在大样本情况下,可采用正态近似法对两总体率差值进行可信区间估计,其计算公式为:X1和X2分别表示两组中某事件发生的例数。例3-7

某医院口腔科医生用极固宁治疗牙本质过敏症,以双氟涂料作对照,进行了1年的追踪观察,结果见表6-1所示,试估计两组有效率差别95%的可信区间。

表6-1治疗牙本质过敏症两组有效率的比较组别总牙数有效数有效率(%)试验组776179.22对照组693855.07合计1469967.81Confidenceinterval本例:

两组总体率差别95%的可信区间为

Confidenceinterval第二节假设检验一、基本原理假设检验(hypothesistest):统计推断另一重要内容,其目的是比较总体参数之间有无差别。

例3-8

使用黑加仑油软胶囊治疗高脂血症,30名患者治疗前后的血清甘油三酯检测结果的差值为1.38±0.76(mmol/L),问治疗后血清甘油三酯是否有所改善?假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。

假设检验基本思想

样本治疗前后甘油三酯的变化(差值)问题归纳:样本疗效药物作用+机遇

对上面问题可以作如下考虑:

问题:究竟多大能够下“有效”的结论?Hypothesistest假设的基本思想是,首先对所需要比较的总体提出一个无差别的假设,然后通过样本数据去推断是否拒绝这一假设。如服从t分布图3-2

利用t分布进行假设检验原理示意图Hypothesistest假设检验步骤

Procedureofhypothesistesting

Step1:setuptesthypothesis(H0vs.H1)andsignificantlevel,Nullhypothesis:Theobserveddifferenceisduetochance(I.e.,thereisnorealdifference),Alternativehypothesis:Thereisarealdifference;Step2:selectandcalculatethestatistic;Step3:findthePvalueandmakeaconclusion.除t分布外,针对不同的资料还有其他各种检验统计量及分布,如F分布、分布等,应用这些分布对不同类型的数据进行假设检验的步骤相同,其差别仅仅是需要计算的检验统计量不同。

二、基本步骤(一)建立假设和确定检验水准假设检验中,包括原假设(nullhypothesis)和备择假设(alternativehypothesis)两种假设。Hypothesistest原假设符号为,指需要检验的假设,如治疗前后血清甘油三酯没有差别,即这一假设通常与我们要验证的结论相反,是计算检验统计量和P值的依据。备择假设符号为,是在成立证据不足的情况下而被接受的假设,如拒绝治疗前后血清甘油三酯相同的假设,可表示为

Hypothesistest备择假设有双侧和单侧两种情况。双侧检验指无论是正方向还是负方向的误差,若显著地超出检验水准则拒绝,即为双侧检验。单侧检验指仅在正方向或负方向误差超出规定的水准时则拒绝,如治疗后血清甘油三酯下降的假设可表示为:或双侧检验和单侧检验应如何选择,需根据研究目的和专业知识而定。 Hypothesistest建立检验假设的同时,还必须给出检验水准。检验水准亦称显著性水准(significantlevel),用

表示,是预先规定的拒绝域的概率值,实际中一般取或。显然,值越大越容易得出有差别的结论。Hypothesistest(二)选择检验方法和计算检验统计量根据资料类型、研究设计方案和统计推断的目的,选择适当的检验方法和计算公式。许多假设检验方法是以检验统计量来命名的,如t检验、z检验、F检验和检验等。Hypothesistest(三)根据P值做出统计推断查表得到检验用的临界值,然后将算得的统计量与拒绝域的临界值作比较,确定值。如对双侧检验,则,按检验水准拒绝,接受;若,则不能拒绝

。HypothesistestJerzyNeyman若,不拒绝H0,但不能下“无差别”或“相等”的结论,只能下“根据目前试验结果,尚不能认为有差别”的结论。

t检验概述

BASICCONCEPTIONOFtTESTStudent'st-testAmethodoftestinghypothesesaboutthe

mean

ofasmallsampledrawnfromanormallydistributedpopulationwhenthepopulationstandarddeviationisunknown.In1908WilliamSealyGosset,publishingunderthepseudonymStudent,developedthet-testandtdistribution.Thetdistributionisafamilyofcurvesinwhichthenumberofdegreesoffreedomspecifiesaparticularcurve.Asthesamplesizeincreases,thetdistributionapproachesthebellshapeofthestandardnormaldistribution.Inpractice,fortestsinvolvingthemeanofasampleofsizegreaterthan30,thenormaldistributionisusuallyapplied.Preferablewhenthen<60Certainlyifn<30t检验的应用条件

AssumptionsNormaldistribution(正态分布)Equalvariance(两总体方差相等(方差齐性)Randomsampling(随机样本)t检验依据的检验统计量是服从t分布的t值两独立样本均数的t检验

ttestforIndependentsamples

两样本的完全随机分组设计,即将受试对象(试验单位)完全随机地分为两组,分别接受两种不同的处理。由于当两组样本含量相等,两个样本均数之差的抽样误差最小,检验效能最高,故应采用适当的随机分组方法,如随机排列的分段随机化,使两组样本含量相等。The2SampleIndependentt-TestUsedtocomparemeansbetweentwogroups.Assumesthedataarecontinuousandhaveasymmetric,uni-modal(onepeak)distribution.Assumesthetwogroupsareindependent.Thetteststatisticinvolvesthedifferencebetweenthesampleaveragesofthe2groups.Usingourknowledgeofthedistribution,wecancomputeap-valuetohelpdecidewhetherornottorejectthenullhypothesis.完全随机设计资料的一般形式设有两个平均数的差值-=d,统计学认为,从样本直接得出的结论是不可靠的。因为抽样误差的随机性,每次抽样两样本平均数的差并不均等于d。造成这种差异可能有两种原因

品种造成的差异,即是两总体本质不同所致

试验误差(或抽样误差)The2SampleIndependentt-Test正常成年男性血红蛋白

140g/L

130.83g/L男性铅作业工人血红蛋白

140g/L一种假设H0另一种假设H1抽样误差总体不同

本质差异抽样研究:通过样本研究其所代表的总体。设两个总体平均数分别为,试验研究的目的,就是要给、是否相同做出推断。由于总体平均数、未知,在进行显著性检验时只能以样本平均数、作为检验对象,更确切地说,是以(-)作为检验对象。为什么以样本平均数作为检验对象呢?这是因为样本平均数具有下述特征:

1、离均差的平方和∑(-)2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。

2、样本平均数是总体平均数的无偏估计值,即E()=μ。

3、根据统计学中心极限定理,样本平均数服从或逼近正态分布。

由上所述,一方面我们有依据由样本平均数和的差异来推断总体平均数、相同与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于试验误差(或抽样误差)的不可避免性

通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。所以观测值由两部分组成,即

=+

总体平均数反映了总体特征,表示误差。若样本含量为n,则可得到n

个观测值:,,,。于是样本平均数

说明样本平均数并非总体平均数,它还包含试验误差的成分,对于接受不同处理的两个样本来说,则有:

=+,=+

这说明两个样本平均数之差(-)也包括了两部分:一部分是两个总体平均数的差(-),叫做试验的处理效应(treatmenteffect);另一部分是试验误差(-)。

样本平均数的差(-)包含有试验误差,它只是试验的表面效应。因此,仅凭(-)就对总体平均数、是否相同下结论是不可靠的。只有通过显著性检验才能从(-)中提取结论。对(-)进行显著性检验就是要分析:试验的表面效应(-)主要由处理效应(-)引起的,还是主要由试验误差所造成。虽然处理效应(-)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。例如:两样本比较的u检验(two-sampleu-test)

适用于两样本含量较大(如n1>30且n2>30)时。检验统计量为

两均数之差的标准误的估计值两均数之差的标准误的估计值由于u0.05/2=1.96,u0.01/2=2.58,|u|>u0.01/2,得P<0.01,按α=0.05水准,拒绝H0,接受H1,两组间差别有统计学意义。可以认为试验组和对照组退热天数的总体均数不相等,两组的疗效不同。试验组的平均退热天数比对照组短。例7-7已计算了的95%的可信区间:天,给出了两总体均数差别的数量大小。

两均数之差的标准误的估计值I型错误和II型错误

假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立,然后在假定H0成立的条件下计算检验统计量,最后根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。检验水准与两类错误

I型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是(其值等于检验水准)

II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是(其值未知)

但n

一定时,

增大,则减少。

可能发生的两类错误图3-2I型错误与II型错误示意图(以单侧u检验为例)

1-

:检验效能(power):当两总体确有差别,按检验水准所能发现这种差别的能力。ab减少(增加)I型错误,将会增加(减少)II型错误增大n

同时降低a与ba与b间的关系减少I型错误的主要方法:假设检验时设定

值。减少II型错误的主要方法:提高检验效能。提高检验效能的最有效方法:增加样本量。如何选择合适的样本量:实验设计。假设检验注意事项(1)可比性(2)正确选用假设检验方法(3)差别的实际意义(4)判断结论时不能绝对化(5)单侧检验与双侧检验(6)报告结果应写出统计量值、具体P值(1)可比性(2)正确选用假设检验方法(3)差别的实际意义(4)判断结论时不能绝对化(5)单侧检验与双侧检验(6)报告结果应写出统计量值、具体P值为了保证试验结果的可靠及正确,要有严密合理的试验或抽样设计,保证各样本是从相应同质总体中随机抽取的。并且处理间要有可比性,即除比较的处理外,其它影响因素应尽可能控制相同或基本相近。否则,任何显著性检验的方法都不能保证结果的正确(1)可比性(2)正确选用假设检验方法(3)差别的实际意义(4)判断结论时不能绝对化(5)单侧检验与双侧检验(6)报告结果应写出统计量值、具体P值选用的显著性检验方法应符合其应用条件由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,所用的显著性检验方法也不同,因而在选用检验方法时,应认真考虑其适用条件,不能滥用。要正确理解差异显著或极显著的统计意义。显著性检验结论中的“差异显著”或“差异极显著”不应该误解为相差很大或非常大,也不能认为在专业上一定就有重要或很重要的价值。“显著”或“极显著”是指表面上如此差别的不同样本来自同一总体的可能性小于0.05或0.01,已达到了可以认为它们有实质性差异的显著水平。有些试验结果虽然差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论