版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫生统计学HealthStatisticsLI2023/10/4《卫生统计学》网上教案2第一章绪论2第一节卫生统计学的定义和内容3第二节统计工作的步骤4第三节统计学中的几个根本概念5第四节学习卫生统计学应注意的问题8第二章定量资料的统计描述8第一节数值变量资料的频数表8第二节集中趋势的统计描述指标10第三节离散程度的统计描述指标12第三章正态分布及其应用14第一节正态分布的概念和特征14第二节正态分布的应用16第四章总体均数的估计和假设检验18第一节抽样研究与抽样误差18第二节t分布21第三节总体均数的估计23第四节假设检验的根本步骤24第五节样本与总体比拟的假设检验26第六节配对设计〔paireddesign〕资料的假设检验27第七节两样本比拟的假设检验28第八节第一类错误与第二类错误29第五章方差分析30第一节方差分析的根本思想31第二节完全随机设计的单因素方差分析〔one-wayANOVA〕34第三节随机区组设计的两因素方差分析〔two-wayANOVA〕36第四节多个样本均数间的多重比拟39第五节多个样本的方差齐性检验43第六节变量变换44第六章定性资料的统计描述45第七章二项分布与Poisson分布及其应用48第一节二项分布的概念与特征48第二节二项分布的应用51第三节Poisson分布的概念与特征52第四节Poisson分布的应用55第八章2检验58第一节四格表资料的2检验58第二节配对四格表资料的2检验60第三节四格表资料的Fisher确切概率法62第四节行×列表资料的2检验64第五节多个样本率比拟的2分割法65第六节频数分布拟合优度的2检验69第九章秩和检验70第一节配对设计和单样本资料的符号秩和检验71第二节完全随机化设计两独立样本的秩和检验73第三节完全随机化设计多组独立样本的秩和检验74第四节随机化区组设计资料的秩和检验75第五节多个样本间的多重比拟77第六节小结80第十章直线回归与相关81第一节直线回归81第二节直线相关分析90第三节等级相关94第四节曲线拟合96第十二章统计表和统计图99第十三章实验设计105第一节实验设计的特点及分类106第二节实验设计的根本要素106第三节实验设计的根本原那么109第四节常用的实验设计方法123第十四章调查设计131第一节调查研究的特点131第二节调查设计的根本原那么与内容132第三节常用的抽样方法134第四节调查的质量控制134第十五章医学人口统计学与疾病统计常用指标135第一节医学人口统计常用指标135第二节疾病统计常用指标140第一章绪论学时分配:2学时掌握内容:1、卫生统计学的定义2、统计工作的步骤3、统计学中的几个根本概念4、学习卫生统计学应注意的问题了解内容:卫生统计学的内容第一节卫生统计学的定义和内容1、卫生统计学的定义统计学〔statistics〕是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,到达去伪存真、去粗取精、正确认识世界的一种重要手段。卫生统计学〔healthstatistics〕是应用数统计学的原理与方法研究居民健康状况以及卫生效劳领域中数据的收集、整理和分析的一门科学。Webster国际大辞典〔第三版〕对统计学的定义是“asciencedealingwiththecollection,analysis,interpretationandpresentationofnumericaldata〞。LastJM主编的一本流行病学辞典对统计学的定义是“thescienceandartofdealingwithvariationindatathroughcollection,classificationandanalysisinsuchawayastoobtainreliableresults〞。由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程〞,但在实际工作中,许多人往往是忽略了设计、收集和归类〔整理〕,到了分析数据时才想到统计学,此时难免发生“悔之晚矣〞的憾事。作为统计学的应用者应充分认识到这一点。2、卫生统计学的内容:1〕健康统计:医学人口统计、疾病统计和生长发育统计等;2〕卫生效劳统计:包括卫生资源利用、医疗卫生效劳的需求、医疗保健体制改革等方面的统计学问题。本教材的主要内容为:1〕卫生统计学的根本原理和方法:包括统计描述〔定量资料和分类资料的描述性指标以及常用统计图表〕、常见的理论分布及其应用〔正态分布、二项分布与Poisson分布〕、总体参数的估计〔分总体均数、总体率和总体平均数〕、假设检验〔t检验、u检验、方差分析、χ2检验、秩和检验等〕、回归与相关、多元线性回归与logistic回归、实验设计和调查设计〔第2~第14章〕;2〕健康统计:医学人口与疾病统计中常用的指标〔第15章〕、寿命表〔第16章〕、生存率分析〔第17章〕;3〕常用的综合评价方法〔第18章〕。第二节统计工作的步骤统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤:1、设计〔design〕:在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的根底上,对将要进行的研究工作所做的全面设想。其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环,也是指导以后工作的依据〔详见第13、14章〕。2、收集资料〔collection〕:遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的根本原那么。卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作方案与措施、检查与总结工作的依据。如法定传染病报表,职业病报表,医院工作报表等。②经常性工作记录:如卫生监测记录、健康检查记录等。③专题调查或实验。3、整理资料〔sortingdata〕:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条理化,便于进一步计算统计指标和分析。其过程是:首先对原始资料进行准确性审查〔逻辑审查与技术审查〕和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开〞的原那么对资料进行质量分组,并在同质根底上根据数值大小进行数量分组;最后汇总归纳。4、分析资料〔analysisofdata〕:其目的是计算有关指标,反映数据的综合特征,说明事物的内在联系和规律。统计分析包括统计描述〔descriptivestatistics〕和统计推断〔inferentialstatistics〕。前者是用统计指标与统计图〔表〕等方法对样本资料的数量特征及其分布规律进行描述〔详见第2、6、12章〕;后者是指如何抽样,以及如何用样本信息推断总体特征〔详见第4、5、7、8、9、10、11、17、18章〕。进行资料分析时,需根据研究目的、设计类型和资料类型选择恰当的描述性指标和统计推断方法。统计工作的四个步骤紧密相连、不可分割,任何一步的缺陷,都将影响整个研究结果。第三节统计学中的几个根本概念1、同质〔homogeneity〕与变异〔variation〕严格地讲,同质是指被研究指标的影响因素完全相同。但在医学研究中,有些影响因素往往是难以控制的〔如遗传、营养等〕,甚至是未知的。所以,在统计学中常把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。例如研究儿童的身高时,要求性别、年龄、民族、地区等影响身高较大的、易控制的因素要相同,而不易控制的遗传、营养等影响因素可以忽略。同质根底上的个体差异称为变异。如同性别、同年龄、同民族、同地区的健康儿童的身高、体重不尽相同。事实上,客观世界充满了变异,生物医学领域更是如此。哪里有变异,哪里就需要统计学。假设所研究的同质群体中所有个体一模一样,只需观察任一个体即可,无须进行统计研究。2、总体〔population〕与样本〔sample〕任何统计研究都必须首先确定观察单位〔observedunit〕,亦称个体〔individual〕。观察单位是统计研究中最根本的单位,可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。总体是根据研究目确实定的同质观察单位的全体,或者说,是同质的所有观察单位某种观察值〔变量值〕的集合。例如欲研究山东省2002年7岁健康男孩的身高,那么,观察对象是山东省2002年的7岁健康男孩,观察单位是每个7岁健康男孩,变量是身高,变量值〔观察值〕是身高测量值,那么山东省2002年全体7岁健康男孩的身高值构成一个总体。它的同质根底是同地区、同年份、同性别、同为健康儿童。总体又分为有限总体〔finitepopulation〕和无限总体〔infinitepopulation〕。有限总体是指在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限个,如上例;无限总体是抽象的,无时间和空间的限制,观察单位数是无限的,如研究碘盐对缺碘性甲状腺病的防治效果,该总体的同质根底是缺碘性甲状腺病患者,同用碘盐防治;该总体应包括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果,没有时间和空间范围的限制,因而观察单位数无限,该总体为无限总体。在实际工作中,所要研究的总体无论是有限的还是无限的,通常都是采用抽样研究。样本是按照随机化原那么,从总体中抽取的有代表性的局部观察单位的变量值的集合。如从上例的有限总体〔山东省2002年7岁健康男孩〕中,按照随机化原那么抽取100名7岁健康男孩,他们的身高值即为样本。从总体中抽取样本的过程为抽样,抽样方法有多种,详见第14章。抽样研究的目的是用样本信息推断总体特征。统计学好比是总体与样本间的桥梁,能帮助人们设计与实施如何从总体中科学地抽取样本,使样本中的观察单位数〔亦称样本含量,samplesize〕恰当,信息丰富,代表性好;能帮助人们挖掘样本中的信息,推断总体的规律性。3、资料〔data〕与变量〔variable〕及其分类总体确定之后,研究者应对每个观察单位的某项特征进行测量或观察,特征称为变量。如“身高〞、“体重〞、“性别〞、“血型〞、“疗效〞等。变量的测定值或观察值称为变量值〔valueofvariable〕或观察值〔observedvalue〕,亦称为资料。按变量的值是定量的还是定性的,可将变量分为以下类型,变量的类型不同,其分布规律亦不同,对它们采用的统计分析方法也不同。在处理资料之前,首先要分清变量类型。1〕数值变量〔numericalvariable〕:其变量值是定量的,表现为数值大小,可经测量取得数值,多有度量衡单位。如身高〔cm〕、体重〔kg〕、血压〔mmHgkPa〕、脉搏〔次/min〕和白细胞计数〔×109/L〕等。这种由数值变量的测量值构成的资料称为数值变量资料,亦称为定量资料〔quantitativedata〕。大多数的数值变量为连续型变量,如身高、体重、血压等;而有的数值变量的测定值只能是正整数,如脉搏、白细胞计数等,在医学统计学中把它们也视为连续型变量。2〕分类变量〔catagoricalvariable〕:其变量值是定性的,表现为互不相容的类别或属性。分类变量可分为无序变量和有序变量两类:〔1〕无序分类变量〔unorderedcategoricalvariable〕是指所分类别或属性之间无程度和顺序的差异。,它又可分为①二项分类,如性别〔男、女〕,药物反响〔阴性和阳性〕等;②多项分类,如血型〔O、A、B、AB〕,职业〔工、农、商、学、兵〕等。对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。〔2〕有序分类变量〔ordinalcategoricalvariable〕各类别之间有程度的差异。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量〔各等级〕的频数表,所得资料称为等级资料。变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化。例如血红蛋白量〔g/L〕原属数值变量,假设按血红蛋白正常与偏低分为两类时,可按二项分类资料分析;假设按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时,可按等级资料分析。有时亦可将分类资料数量化,如可将病人的恶心反响以0、1、2、3表示,那么可按数值变量资料〔定量资料〕分析。4、随机事件〔randomevent〕与概率〔probability〕医学研究的现象,大多数是随机现象,对随机现象进行实验或观察称为随机试验。随机试验的各种可能结果的集合称为随机事件,亦称偶然事件,简称事件。例如用相同治疗方案治疗一批某病的患者,治疗转归可能为治愈、好转、无效、死亡四种结果,对于一个刚入院的患者,治疗后究竟发生哪一种结果是不确定的,可能发生的每一种结果都是一个随机事件。对于随机事件来说,在一次随机试验中,某个随机事件可能发生也可能不发生,但在一定数量的重复试验后,该随机事件的发生情况是有规律可循的。概率是描述随机事件发生的可能性大小的数值,常用P表示。例如,投掷一枚均匀的硬币,随机事件A表示“正面向上〞,用n表示投掷次数;m表示随机事件A发生的次数;f表示随机事件A发生的频率〔f=m/n〕,0≤m≤n,0≤f≤1。用不同的投掷次数n作随机试验,结果如下:m/n=8/10=0.8,7/20=0.35,……,249/500=0.498,501/1000=0.501,10001/2000=0.5000,由此看出当投掷次数n足够大时,f=m/n→0.5,称P(A)=0.5,或简写为:P=0.5。当n足够大时,可以用f估计P。随机事件概率的大小在0与1之间,即0<P<1,常用小数或百分数表示。P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。P=1表示事件必然发生,P=0表示事件不可能发生,它们是确定性的,不是随机事件,但可以把它们看成随机事件的特例。假设随机事件A的概率P(A)≤,习惯上,当=0.05时,就称A为小概率事件。其统计学意义是小概率事件在一次随机试验中不可能发生。例如,某都市大街上疾驶的汽车撞伤行人的事件的发生概率为1/万,但大街上仍有行人,这是因为“被撞〞事件是小概率事件,所以行人认为自己上街这“一次试验〞中不会发生“被撞〞事件。“小概率〞的标准是人为规定的,对于可能引起严重后果的事件,如术中大出血等,可规定=0.01,甚至更小。第四节学习卫生统计学应注意的问题卫生统计学是从事公共卫生领域研究和工作的必要根底。预防医学专业的学生在学习本课程时应注意:1、医学生在学习过程中必须运用逻辑思维方法掌握卫生统计学的根本知识、根本技能、根本概念和根本方法。切忌死记硬背、生搬硬套,应通过实例提高综合分析问题的能力。2、掌握调查设计和实验设计的原那么,培养收集、整理、分析统计资料的系统工作能力。在统计工作中要以实事求是、严谨的科学态度对待原始资料,反对伪造和篡改统计数字。通过学习这门课程,逐步树立起实事求是、严谨的工作作风。3、在学习统计指标与分析方法时,应重点掌握统计公式的意义、用途和应用条件,不必深究其数学推导。最终掌握正确的分析思路:进行资料分析时,需根据研究目的、设计类型和资料类型选择恰当的描述性指标和统计推断方法。〔王洁贞〕第二章定量资料的统计描述学时分配:4学时掌握内容:1、频数表的编制2、集中趋势的描述3、离散趋势的描述第一节数值变量资料的频数表统计描述是用统计指标、统计图或统计表描述资料的分布规律及其数量特征。频数表是统计描述中经常使用的根本工具之一。1.频数表〔frequencytable〕的编制在观察值个数较多时,为了解一组同质观察值的分布规律和便于指标的计算,可编制频数分布表,简称频数表。〔1〕求全距〔range〕:找出观察值中的最大值与最小值,其差值即为全距〔或极差〕,用R表示。〔2〕确定组段和组距:根据样本含量的大小确定“组段〞数,一般设8-15个组段,观察单位较少时组段数可相对少些,观察单位较多时组段数可相对多些,常用全距的1/10取整做组距,以便于汇总和计算。第一组段应包括全部观察值中的最小值,最末组段应包括全部观察值中的最大值,并且同时写出其下限与上限。各组段的起点和终点分别称为下限和上限,某组段包含下限,但不包含上限,其组中值为该组段的〔下限+上限〕/2。相邻两组段的下限之差称为组距。〔3〕列表划记:确定组段界限,列成表2.1的形式,采用计算机或用划记法将原始数据汇总,得出各组段的观察例数,即频数,表中的第〔1〕、〔3〕栏即所需的频数表。表2.1某地110名18岁男大学生身高〔cm〕均数的频数表2.频数分布的特征由频数表可看出频数分布的两个重要特征:集中趋势〔centraltendency〕和离散程度(dispersion)。身高有高有矮,但多数人身高集中在中间局部组段,以中等身高居多,此为集中趋势;由中等身高到较矮或较高的频数分布逐渐减少,反映了离散程度。对于数值变量资料,可从集中趋势和离散程度两个侧面去分析其规律性。3.频数分布的类型频数分布有对称分布和偏态分布之分。对称分布是指多数频数集中在中央位置,两端的频数分布大致对称。偏态分布是指频数分布不对称,集中位置偏向一侧,假设集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布,如冠心病、大多数恶性肿瘤等慢性病患者的年龄分布为负偏态分布。临床上正偏态分布资料较多见。不同的分布类型应选用不同的统计分析方法。4.频数表的用途可以揭示资料分布类型和分布特征,以便选取适当的统计方法;便于进一步计算指标和统计处理;便于发现某些特大或特小的可疑值。第二节集中趋势的统计描述指标描述一组同质观察值的平均水平或中心位置的常用指标有均数、几何均数、中位数等。1.均数〔mean,average〕:是算术均数〔arithmeticmean〕的简称。常用表示样本均数,表示总体均数。均数用于反映一组同质观察值的平均水平,适用于正态或近似正态分布的数值变量资料。其计算方法有:〔1〕直接法:用于样本含量较少时,其公式为:〔2.1〕式中,希腊字母Σ(读作sigma)表示求和;X1,X2,…,Xn为各观察值;n为样本含量,即观察值的个数。〔2〕加权法〔weightingmethod〕:用于频数表资料或样本中相同观察值较多时,其公式为:〔2.2〕式中,X1,X2,…,Xk与f1,f2,…,fk分别为频数表资料中各组段的组中值和相应组段的频数(或相同观察值与其对应的频数)。2.几何均数〔geometricmean〕用G表示,适用于①对数正态分布,即数据经过对数变换后呈正态分布的资料;②等比级数资料,即观察值之间呈倍数或近似倍数变化的资料。如医学实践中的抗体滴度、平均效价等。其计算方法有〔1〕直接法:或〔2.3〕〔2〕加权法:〔2.4〕注意:计算几何均数时观察值中不能有0,因0不能取对数;一组观察值中不能同时有正或负值。3.中位数〔median〕用表示。中位数是一组由小到大按顺序排列的观察值中位次居中的数值。中位数可用于描述①非正态分布资料〔对数正态分布除外〕;②频数分布的一端或两端无确切数据的资料③总体分布不清楚的资料。在全部观察中,小于和大于中位数的观察值个数相等。(1)直接法:将观察值由小到大排列,按式〔2.6〕或式〔2.7〕计算。为奇数,(1.5)为偶数,(1.6)式中下标、、为有序数列的位次。、、为相应位次的观察值。〔2〕频数表法:用于频数表资料。计算步骤是:①计算的大小,并按所分组段由小到大计算累计频数和累计频率,如表2.1第(3)、〔4〕栏;②确定所在组段。累计频数中大于的最小数值所在的组段即为所在的组段;或累计频率中大于50%的最小频率所在的组段即为所在的组段。③按式〔2.7〕求中位数。〔2.7〕式中:L、i、分别为所在组段的下限、组距和频数;为小于L的各组段的累计频数。例1.1由表2.1计算中位数M。表2.1199名食物中毒患者潜伏期的M和PX的计算潜伏期〔小时〕〔1〕人数f(2)累计频数Σf(3)累计频率(%)(4)=(3)/n0~303015.112~7110150.824~4915075.436~2817889.448~1419296.560~619899.572~841199100.0合计199本例n=199,根据表2.3第(2)栏数据,自上而下计算累计频数及累计频率,见第(3)、〔4〕栏。,由第〔3〕栏知,101是累计频数中大于99.5的最小值,或由第〔4〕栏知50.8%是大于50%的最小的累计频率,故M在“12~〞组段内,将相应的L、i、f50、代入〔2.8〕,求得M。M=P50==12+12/71〔199×50%-30〕=23.75(小时)4.百分位数〔percentile〕用Px表示。一个百分位数Px将一组观察值分为两局部,理论上有X%的观察值比它小,有〔100-X〕%的观察值比它大,是一种位置指标。中位数是一个特定的百分位数,即M=P50。百分位数的计算步骤与中位数类似,首先要确定Px所在的组段。先计算,累计频数中大于的最小值所在的组段就是Px所在组段。计算见公式〔2.8〕。(2.8)式中:L、i、fx分别为Px所在组段的下限、组距和频数;为小于L的各组段的累计频数。百分位数用于描述一组数据某一百分位位置的水平,多个百分位数的结合应用时,可描述一组观察值的分布特征;百分位数可用于确定非正态分布资料的医学参考值范围。应用百分位数,样本含量要足够大,否那么不宜取靠近两端的百分位数。第三节离散程度的统计描述指标描述数值变量资料频数分布的另一主要特征是离散程度,用变异指标表示。只有把集中指标和离散指标结合起来才能全面反映资料的分布特征。常用变异指标有全距、四分位数间距、方差、标准差、变异系数。1.全距〔range,简记为R〕:亦称极差,是一组同质观察值中最大值与最小值之差。它反映了个体差异的范围,全距大,说明变异度大;反之,全距小,说明变异度小。用全距描述定量资料的变异度大小,虽然计算简单,但缺乏之处有:①只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度;②样本含量越大,抽到较大或较小观察值的可能性越大,那么全距可能越大。因此样本含量相差悬殊时不宜用全距比拟。2.四分位数间距〔quartile,简记为Q〕:为上四分位数QU〔即P75〕与下四分位数QL(即P25)之差。四分位数间距可看成是中间50%观察值的极差,其数值越大,变异度越大,反之,变异度越小。如例2.7中,已求得QU=P75=35.82小时,QL=P25=15.34小时,那么四分位数间距Q=QU-QL==35.82-15.34=20.48(小时)。由于四分位数间距不受两端个别极大值或极小值的影响,因而四分位数间距较全距稳定,但仍未考虑全部观察值的变异度,常用于描述偏态频数分布以及分布的一端或两端无确切数值资料的离散程度。3.方差〔variance〕:为了全面考虑观察值的变异情况,克服全距和四分位数间距的缺点,需计算总体中每个观察值X与总体均数的差值(X-),称之为离均差。由于Σ(X-μ)=0,不能反映变异度的大小,而用离均差平方和Σ(X-)2(sumofsquaresofdeviationsfrommean)反映之,同时还应考虑观察值个数N的影响,故用式〔2.9〕即总体方差σ2表示。〔2.9〕在实际工作中,总体均数μ往往是未知的,所以只能用样本均数作为总体均数的估计值,即用代替,用样本例数n代替N,但再按式〔2.9〕计算的结果总是比实际小。英国统计学家W.S.Gosset提出用n-1代替n来校正,这就是样本方差s2其公式为:〔2.10〕式中的n-1称为自由度〔degreeoffreedom〕。4.标准差〔standarddeviation〕:方差的度量单位是原度量单位的平方,将方差开方后与原数据的度量单位相同。标准差大,表示观察值的变异度大;反之,标准差小,表示观察值的变异度小。计算见公式〔2.11〕和〔2.12〕。(1.11)(1.12)离均差平方和常用SS或lXX表示。数学上可以证明:,所以,样本标准差的计算公式可写成:直接法:〔2.13〕加权法:(1.14)5.变异系数〔coefficientofvariation,简记为CV〕:常用于比拟度量单位不同或均数相差悬殊的两组或多组资料的变异度。其公式为〔2.15〕〔丁守銮〕第三章正态分布及其应用学时分配:2学时掌握内容:1、正态分布的概念、特征和标准正态分布2、正态分布的应用第一节正态分布的概念和特征一、正态分布的概念由表1.1的频数表资料所绘制的直方图,图3.1〔1〕可以看出,顶峰位于中部,左右两侧大致对称。我们设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条顶峰位于中央〔均数所在处〕,两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图3.1〔3〕。这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布〔normaldistribution〕。由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。图3.1频数分布逐渐接近正态分布示意图为了应用方便,常对正态分布变量X作变量变换。〔3.1〕该变换使原来的正态分布转化为标准正态分布(standardnormaldistribution),亦称u分布。u被称为标准正态变量或标准正态离差〔standardnormaldeviate〕。二、正态分布的特征:1.正态曲线〔normalcurve〕在横轴上方均数处最高。2.正态分布以均数为中心,左右对称。3.正态分布有两个参数,即均数和标准差。是位置参数,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,那么曲线沿横轴越向左移动。是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭。通常用表示均数为,方差为的正态分布。用N〔0,1〕表示标准正态分布。4.正态曲线下面积的分布有一定规律。实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数〔频数分布〕或观察值落在该区间的概率。正态曲线下一定区间的面积可以通过附表1求得。对于正态或近似正态分布的资料,均数和标准差,就可对其频数分布作出概约估计。查附表1应注意:①表中曲线下面积为-∞到u的左侧累计面积;②当μ、σ和X时先按式〔3.1〕求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数和标准差S分别代替μ和σ,按式求得u值,再查表;③曲线下对称于0的区间面积相等,如区间〔-∞,-1.96〕与区间〔1.96,∞〕的面积相等,④曲线下横轴上的总面积为100%或1。正态分布曲线下有三个区间的面积应用较多,应熟记:①标准正态分布时区间〔-1,1〕或正态分布时区间〔μ-1σ,μ+1σ〕的面积占总面积的68.27%;②标准正态分布时区间〔-1.96,1.96〕或正态分布时区间〔μ-1.96σ,μ+1.96σ〕的面积占总面积的95%;③标准正态分布时区间〔-2.58,2.58〕或正态分布时区间〔μ-2.58σ,μ+2.58σ〕的面积占总面积的99%。如图3.2所示。图3.2正态曲线与标准正态曲线的面积分布第二节正态分布的应用某些医学现象,如同质群体的身高、红细胞数、血红蛋白量、胆固醇等,以及实验中的随机误差,呈现为正态或近似正态分布;有些资料虽为偏态分布,但经数据变换后可成为正态或近似正态分布,故可按正态分布规律处理。1.估计正态分布资料的频数分布例1.10某地1993年抽样调查了100名18岁男大学生身高〔cm〕,其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求、、范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比拟。本例,、未知但样本含量n较大,按式〔3.1〕用样本均数和标准差S分别代替和,求得u值,u=(168-172.70)/4.01=-1.17。查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.1210=12.10%。该地18岁男大学生身高在168cm以下者,约占总数12.10%。其它计算结果见表3.1。表3.1100名18岁男大学生身高的实际分布与理论分布身高范围〔cm〕实际分布理论分布〔%〕人数百分数〔%〕168.69~176.716767.0068.27164.84~180.569595.0095.00162.35~183.059999.0099.002.制定医学参考值范围:亦称医学正常值范围。它是指所谓“正常人〞的解剖、生理、生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含量足够大的“正常人〞,所谓“正常人〞不是指“健康人〞,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;根据指标的实际用途确定单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。常用方法有:〔1〕正态分布法:适用于正态或近似正态分布的资料。双侧界值:单侧上界:,或单侧下界:〔2〕对数正态分布法:适用于对数正态分布资料。双侧界值:;单侧上界:,或单侧下界:。常用u值可根据要求由表3.2查出。〔3〕百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料。双侧界值:P2.5和P97.5;单侧上界:P95,或单侧下界:P5。表3.2常用u值表参考值范围(%)单侧双侧800.8421.282901.2821.645951.6451.960992.3262.5763.正态分布是许多统计方法的理论根底:如t分布、F分布、分布都是在正态分布的根底上推导出来的,u检验也是以正态分布为根底的。此外,t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。〔丁守銮〕第四章总体均数的估计和假设检验学时分配:8学时掌握内容:1.t分布的概念和特征2.总体均数的区间估计3.总体率的区间估计4.假设检验的根本步骤5.假设检验的根本原理6.常用的数值型变量假设检验的方法熟悉:1、抽样误差的概念2、引起抽样误差的原因3、均数、率的标准误的计算4、标准差和标准误的区别了解内容:1.假设检验中概率P与检验水准的关系2.抽样研究的意义3.中心极限定理的内容第一节抽样研究与抽样误差一.抽样研究〔一〕抽样研究的意义前面已经讲述了总体与样本两个统计学术语,人们在医学研究中多采用由样本信息来推论总体特征的方法,这在实际工作中是十分必要的,经理论与实践证明也是行之有效的。目前对某一总体进行研究的最重要、最常用的方法就是抽样研究。由于研究对象很多是无限总体,要直接研究总体的情况是不可能的。即使对有限总体来说,假设包含的观察单位数过多,需要消耗大量的人力、物力和时间,而且也不易组织,难以保证工作的质量。有的时候,观察的实质就是一种破坏性实验,根本就不允许对总体中的每一个体逐一观察。如对一批注射药剂作质量检查,不可能将所有的药剂瓶都翻开加以检验,这显然是不可能的。抽样研究作为一种由局部认识整体的观察方法,从古到今一直被人们自觉或不自觉地应用着,如炒菜时尝尝咸淡,就医时取几滴血作化验等。实践证明这是行之有效的方法。目前抽样研究的理论与技术已开展成熟,只要严格按照有关抽样研究的要求去做,这是完全可行的。所以,在实际工作中人们多采用抽样研究的方法,其目的就是要用样本信息来推断总体特征,这就叫统计推断〔statisticalinference〕。〔二〕抽样研究和抽样误差抽样研究是指从总体中按照随机化的原那么,抽取一定数量的个体组成样本进行研究,从而推断总体的研究方法。在实际工作中,由于总体中各观察对象之间存在着个体变异,且随机抽取的样本又只是总体中的一局部,因此计算的样本统计量,不一定恰好等于相应的总体参数。这种由于个体变异的存在,在抽样研究中产生的样本统计量与相应的总体参数间的差异,称为抽样误差〔samplingerror〕,同样,来自同一总体的假设干样本的统计量之间,也会存在误差,这种误差也反映在样本统计量与总体参数间的差异。当样本是来自相应总体的随机样本时,抽样误差为随机误差,其误差大小可以依据中心极限定理进行估计。中心极限定理的内容是,以数值变量资料为例,假设从均数为μ的正态总体中以固定n反复屡次〔比方100次〕抽样时,所得的样本均数的分布是正态分布;即使是从偏态总体中抽样,只要足够大,的分布也近似正态分布。在抽样研究中抽样误差是不可防止的,根据资料的性质和指标种类的不同,抽样误差有多种,例如:①从某地7岁男童中随机抽取110名,测得平均身高为119.95cm,该样本均数不一定等于该地7岁男童身高的总体均数,这种样本均数与总体均数间的差异,称为均数的抽样误差。②某县为血吸虫病流行区,从该县人群中随机抽取400人,测得的血吸虫感染人数为60人,感染率为15%,该样本率不一定等于该地人群的总体感染率。此为样本率与总体率之间的差异,称为率的抽样误差。此外,样本方差和相应的总体方差也存在抽样误差,后面介绍的相关系数和回归系数也有抽样误差的问题。二.均数的抽样误差在抽样研究中,假设从同一总体中随机抽取样本含量相同的假设干个样本,并计算出某种样本统计量〔如样本均数〕,由于生物间的个体变异是客观存在的,抽样误差是不可防止的,这些样本统计量之间具有离散趋势。数理统计研究说明,抽样误差具有一定的规律性,可以用特定的指标来描述。这个指标称为标准误〔standarderror〕,标准误除了反映样本统计量之间的离散程度外,也反映样本统计量与相应总体参数之间的差异,即抽样误差大小。本章主要介绍最常用的均数标准误以及率的标准误。〔一〕均数标准误的意义将来自同一总体的假设干个样本均数看成一组新的观察值,研究其频数分布,包括集中趋势和离散趋势,可计算样本均数的均数和标准差。例3.1假定某市16岁女中学生的身高分布服从均数〔μ〕为155.4cm,标准差〔σ〕为5.3cm的正态分布。现用电子计算机作抽样模拟试验,每次随机抽出10个观察值〔即样本含量n=10〕,共抽取100个样本,求得100个样本均数并编制成频数分布表如表4.1。表4.1100个样本均数的频数分布〔μ=155.4cm,σ=5.3cm〕组段〔cm〕频数151~1152~6153~15154~19155~27156~16157~8158~5159~3合计100从表4.1中可以发现,当原始观察值的分布为正态分布时,这些样本均数的频数分布根本服从正态分布。统计理论证明,假设原始观察值的分布为偏态分布,当样本含量n足够大时,其样本均数的分布仍近似服从正态分布。所以,可以求得样本均数的均数为155.38cm,与总体均数155.4cm接近。中心极限定理说明,样本均数的均数等于原总体的总体均数〔μ〕。同样,也可以求得样本均数的标准差为,为了与描述观察值离散程度的标准差相区别,用均数标准误来表示样本均数的标准差。均数标准误反映来自同一总体的样本均数的离散程度以及样本均数与总体均数的差异程度,也是说明均数抽样误差大小的指标。均数标准误大,说明各样本均数的离散程度大,抽样误差就大。反之亦然。〔二〕均数标准误的计算数理统计可以证明,均数标准误的计算公式为:〔4.1〕式中为均数标准误的理论值,σ为总体标准差,n为样本含量。σ时,可按式〔4.1〕求得均数标准误的理论值。上述例子中μ=155.4cm,n=10,可得:=计算结果与样本均数的标准差1.71cm相近。由于在抽样研究中σ常属未知,通常用一个样本的标准差〔s〕来估计,所以,在实际工作中,常用式〔4.2〕计算均数标准误的估计值〔〕〔4.2〕由式〔4.1〕或〔4.2〕可见,当n一定时,均数标准误与标准差成正比。标准差越大,均数标准误越大,即观察值的离散程度越高,均数的抽样误差越大。当标准差一定时,均数标准误和成反比。样本含量越大,均数的抽样误差越小。因此,在实际工作中,可通过适当增加样本含量和减少观察值的离散程度〔如选择同质性较好的总体〕来减少抽样误差。〔三〕均数标准误的用途:1.衡量样本均数的可靠性由于均数标准误越小,均数的抽样误差越小,样本均数就越可靠。2.估计总体均数的可信区间。3.用于均数的假设检验。第二节t分布一.t分布(t-distribution)〔一〕u分布在前一章中,我们已经讲述了正态分布〔normaldistribution〕是数理统计中的一种重要的理论分布,是许多统计方法的理论根底。正态分布有两个参数,μ和σ,决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X通过u变换[]转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布〔standardnormaldistribution〕,亦称u分布。根据中心极限定理,通过上述的抽样模拟试验说明,在正态分布总体中以固定n〔本次试验n=10〕抽取假设干个样本时,样本均数的分布仍服从正态分布,即N〔μ,σ〕。所以,对样本均数的分布进行u变换[],也可变换为标准正态分布N(0,1)〔二〕t分布由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换t=,统计量t值的分布称为t分布。t分布有如下特征:1.以0为中心,左右对称的单峰分布;2.t分布是一簇曲线,其形态变化与n〔确切地说与自由度ν〕大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布〔u分布〕曲线,如图4.1。t=图4.1自由度为1、5、∞的t分布对应于每一个自由度ν,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律,计算较复杂。因此,统计学家上根据自由度ν的大小与t分布曲线下面积的关系,编制了附表2,t界值表,以便于应用。表中的横标目为自由度ν,纵标目为概率P,表中数字表示自由度ν为某值时,P为某值时,t的界值。因t分布是以0为中心的对称分布,故附表中只列出正值,如果算出的t值为负值,可以用绝对值查表。t分布曲线下面积为95%或99%的界值不是一个常量,而是随着自由度大小而变化的,分别用和表示。第三节总体均数的估计统计推断包括两个重要的方面:参数估计和假设检验。假设检验在后面的章节中讨论,这里先讨论参数估计。参数估计就是用样本指标〔称为统计量,statistic〕来估计总体指标〔参数,parameter〕。参数估计有两种方法:〔一〕点估计〔pointestimation〕如在服从正态分布的总体中随机抽取样本,可以直接用样本均数来估计总体均数,样本标准差来估计总体标准差。该方法虽然简单易行,但未考虑抽样误差,而抽样误差在抽样研究中又是客观存在的、不可防止的,会随不同的样本对总体参数作出不同的点估计。〔二〕区间估计〔intervalestimation〕即按一定的概率〔可信度〕估计未知的总体参数可能所在的范围〔或称可信区间〕的估计方法。区间估计是在随机抽取样本后,考虑抽样误差存在的情况下的估计方法,较为准确可靠。统计学上通常用95%〔或99%〕可信区间表示总体参数有95%〔或99%〕的概率在某一范围,可根据资料的条件选用不同的方法。下面以总体均数的95%可信区间为例,介绍其计算公式。σ时按正态分布原理计算,σ未知时按t分布的原理计算。1.σ时由u分布可知,正态曲线下有95%的u值在±1.96之间,即:P〔-1.96≤u≤+1.96〕=0.95P〔-1.96≤≤+1.96〕=0.95移项后整理得,故总体均数μ的95%可信区间为〔〕〔4.5〕2.σ未知,但n足够大〔如n>100〕时由t分布可知,当自由度越大,t分布越逼近u分布,此时t曲线下有95%的t值在±1.96之间,即:P〔-1.96≤t≤+1.96〕=0.95P〔-1.96≤≤+1.96〕=0.95P〔≤≤〕=0.95故总体均数μ的95%可信区间为〔,〕〔4.6〕3.σ未知且n小时某自由度的t曲线下有95%的t值在±之间,即:故总体均数μ的95%可信区间为〔,〕〔4.7〕例3.3对某人群随机抽取20人,用某批号的结核菌素作皮试,平均浸润直径为10.9cm,标准差为3.86cm。问这批结核菌素在该人群中使用时,皮试的平均浸润直径的95%可信区间是多少?该例n=20,n较小,按公式〔4.7〕计算。ν=20-1=19,查t界值表,得=2.093估计这批结核菌素在该人群中使用,皮试的平均浸润直径的95%可信区间为〔10.9-2.093*3.86/,10.9+2.093*3.86/〕cm即(9.1,12.7)cm。〔三〕可信区间的注意问题1.可信区间的涵义意思是从总体中作随机抽样,每个样本可以算得一个可信区间。如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确,估计错误的只有5次。5%是小概率事件,实际发生的可能性很小,当然这种估计方法会有5%犯错误的风险。2.可信区间的两个要素:一是准确度,反映在可信度的大小,即区间包含总体均数的概率的大小,愈接近1愈好。二是精密度,反映在区间的长度,长度愈小愈好。在样本含量确定的情况下,二者是矛盾的,假设只管提高可信度,会把区间变得很长,故不宜认为99%可信区间比95%可信区间好,需要兼顾准确度和精密度,一般来说95%可信区间更为常用,在可信度确定的情况下,增加样本含量,可减少区间长度,提高精密度。〔王淑康〕第四节假设检验的根本步骤一、假设检验的根本思想在抽样研究中,由于样本所来自的总体其参数是未知的,只能根据样本统计量对其所来自总体的参数进行估计,如果要比拟两个或几个总体的参数是否相同,也只能分别从这些总体中抽取样本,根据这些样本的统计量作出统计推断,籍此比拟总体参数是否相同。由于存在抽样误差,总体参数与样本统计量并不恰好相同,因此判断两个或多个总体参数是否相同是一件很困难的事情。如医生在某山区随机测量了25名健康成年男子的脉搏,平均次数为74.2次/分钟,标准差为5.2次/分钟,但是根据医学常识,一般男子的平均脉搏次数为72次/分钟,问该山区男子脉搏数与一般男子是否不同?要答复这个看似简单的问题并非易事。这个问题难以从正面直接答复,可以先假定该山区所有男子脉搏数数值组成一个总体,其总体均数和标准差均为未知数,不妨分别以、表示。如果我们假设该山区男子的脉搏数与一般地区的男子相同,即属于同一总体,=72,所测量的25名男子的平均脉搏数〔样本均数〕之所以不恰好等于72次/分,是由于抽样误差所致。如果上述假设成立,那么理论上讲,样本均数很可能在总体均数〔=72〕的附近,样本均数远离总体均数的可能性很小。如果将样本均数变换为值,那么值很可能在0的附近,值远离0的可能性很小。如果值很小上述假设可能不正确,可拒绝上述假设。假设检验包括单侧检验和双侧检验两种情况,当根据专业知识两总体的参数中甲肯定不会小于乙,或甲肯定不会大于乙时,可考虑用单侧检验,否那么,宜用双侧检验。假设检验中的如何下检验结论(以检验为例):1、单侧检验:如计算统计量为正值拒绝,接受不拒绝如计算统计量为负值拒绝,接受不拒绝2、双侧检验:拒绝,接受不拒绝二、假设检验的一般步骤假设检验一般分为三步:1、建立假设,确定检验水准。一般假设检验中的检验假设〔或称为零假设、无效假设〕,假设样本来自同一总体,即其总体参数相等。往往建立两个假设,除建立检验假设外,还建立备择假设,作为拒绝检验假设时的备选假设,检验水准为拒绝检验假设是犯第一类错误的概率。2、为选择检验方法,并计算统计量。的类型不同、变量的分布类型不同、研究目的不同,都决定着选择何种检验方法。因此需选择适宜的检验方法,并计算统计量。3、为根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定值,以值与检验水准比拟,假设,那么拒绝,接受;假设,那么不拒绝。第五节样本与总体比拟的假设检验本章第一节中,在某山区随机测量25名男子的脉搏数得一样本均数,而一般男子的脉搏数为可视为一般地区男子的总体均数。假设该山区男子的脉搏数与一般地区相同,即于一般地区的男子属于同一总体,并将该样本均数转化为值〔式1〕〔式2〕式中为样本均数;为总体的均数;为样本标准差;为样本含量。如果样本含量足够大时,可将样本均数转化为值〔式3〕例1以上述资料为例,比拟某山区男子的脉搏数与一般地区的男子是否相同。假设检验的过程如下:1、建立假设,确定检验水准。:该山区男子脉搏数与一般地区男子相等,即:该山区男子脉搏数与一般地区男子不等,即2、选择检验方法计算统计量自由度3、查界值表,确定值,以查界值表得,,本例的统计量值为2.115,大于界值,因此,按水准,拒绝,接受,可认为该山区男子的脉搏数与一般地区的男子不同。本例中值确实切值为如果本例用单侧检验,其与双侧检验相同,但有不同,根据专业知识知道,山区男子的脉搏数不会低于一般地区,因此为:该山区男子脉搏数高与一般地区男子,即,所得的值为:。第六节配对设计〔paireddesign〕资料的假设检验配对设计是为了控制某些非处理因素对实验结果的影响。将那些因素相同或相近的受试对象配成对子,使得同一对子中的受试对象除处理因素不同外,其他因素相同或相近,同一对子中的两受试对象分别接受不同的处理,其实验结果的差异可以简单的认为是“纯〞处理因素的作用。对于配对资料可以分析其差值。对配对资料的分析,一般用配对检验〔pairedt-test〕,其检验假设为:差值的总体均数为零。计算统计量的公式为〔式4〕〔式5〕式中为差值的均数;为差值的标准差;为对子数。例1将大白鼠按照同窝、同性别和体重接近的的原那么配成8对,每对中两只大白鼠随机确定一只进食正常饲料,另一只进食缺乏维生素E饲料,一段时间以后,测量两组大白鼠的肝中维生素的A的含量如表1,问食物中维生素E的缺乏能否影响大白鼠肝中维生素A的含量?表1两种饲料喂养大白鼠肝中维生素A的含量对子号〔1〕正常饲料〔2〕缺乏维生素E饲料〔3〕差值〔4〕〔5〕13350245011001210000220002400-400160000330001800120014400004395032007505625005380032505503025006375027001050110250073450250095090250083050175013001690000合计——65007370000计算得:两种饲料喂养的大白鼠肝中维生素含量相等,即:两种饲料喂养的大白鼠肝中维生素含量不等,即查表知,,按水准,拒绝,接受,可认为两组大白鼠肝中维生素A的含量不等,维生素E缺乏饲料组的大白鼠肝中维生素A含量低。第七节两样本比拟的假设检验完全随机设计两样本的比拟,用检验或检验时,要求样本服从正态分布,并且两样本方差齐同。如果资料满足上述要求,样本含量小时,用下式计算统计量〔式6〕〔式7〕式中和分别为两样本的均数;为两样本均数差值的标准误,可用下式计算〔式8〕如果样本含量足够大时,可计算统计量〔式9〕如果方差不齐,可以考虑用检验。两样本的方差是否齐同,可对样本的方差做方差齐性检验〔式10〕,式中和分别为较大和较小的方差,和分别为方差较大和较小样本的样本含量。根据计算得的统计量,查界知表〔方差齐性检验用〕,作出推断。第八节第一类错误与第二类错误假设检验是反证法的思想,依据样本统计量作出的统计推断,其推断结论并非绝对正确,结论有时也可能有错误,错误分为两类。Ⅰ型错误又称第一类错误〔typeⅠerror〕:拒绝了实际上成立的,为“弃真〞的错误,其概率通常用表示。可取单尾也可取双尾,假设检验时研究者可以根据需要确定值大小,一般规定=0.05或=0.01,其意义为:假设检验中如果拒绝时,发生Ⅰ型错误的概率为5%或1%,即100次拒绝的结论中,平均有5次或1次是错误的。Ⅱ型错误又称第二类错误〔typeⅡerror〕:不拒绝实际上不成立的,为“存伪〞的错误,其概率通常用表示。只取单尾,假设检验时值一般不知道,在一定情况下可以测算出,如两总体的差值〔如〕、样本含量和检验水准。以以下图说明两类错误:图a中为均数〔〕的总体和均数〔〕未知的总体。从后者中随机抽样,其样本均数〔〕服从正态分布,假设,那么正态曲线为图〔b〕中右侧曲线,假设那么正态曲线为左侧曲线。将样本均数变换为值曲线如图〔c〕。假设为单侧检验,从图〔c〕中可以清楚地看出两条曲线下与的意义,即为成立,但由于,被错误地拒绝的概率;而为:不成立,但由于,不被拒绝的概率。第五章方差分析学时分配:6学时掌握内容:1、方差分析的根本思想2、完全随机设计的单因素方差分析3、随机区组设计的两因素方差分析熟悉内容:1、多个样本均数间的多重比拟2、变量变换了解内容:多个样本的方差齐性检验第一节方差分析的根本思想1、方差分析的意义前述的t检验和u检验适用于两个样本均数的比拟,对于k个样本均数的比拟,如果仍用t检验或u检验,需比拟次,如四个样本均数需比拟次。假设每次比拟所确定的检验水准=0.05,那么每次检验拒绝H0不犯第一类错误的概率为1-0.05=0.95;那么6次检验都不犯第一类错误的概率为(1-0.05)6=0.7351,而犯第一类错误的概率为0.2649,因而t检验和u检验不适用于多个样本均数的比拟。用方差分析比拟多个样本均数,可有效地控制第一类错误。方差分析(analysisofvariance,ANOVA)由英国统计学家R.A.Fisher首先提出,以F命名其统计量,故方差分析又称F检验。2、方差分析的根本思想下面通过表5.1资料介绍方差分析的根本思想。例如,有4组进食高脂饮食的家兔,接受不同处理后,测定其血清肾素血管紧张素转化酶〔ACE〕浓度〔表5.1〕,试比拟四组家兔的血清ACE浓度。表5.1对照组及各实验组家兔血清ACE浓度〔u/ml〕对照组实验组A降脂药B降脂药C降脂药61.2482.3526.2325.4658.6556.4746.8738.7946.7961.5724.3613.5537.4348.7938.5419.4566.5462.5442.1634.5659.2760.8730.3310.9620.6848.23329.92372.59229.17191.001122.68()667726〔N〕54.9962.1032.7427.2943.18〔〕18720.9723758.128088.596355.4356923.11()由表5.1可见,26只家兔的血清ACE浓度各不相同,称为总变异;四组家兔的血清ACE浓度均数也各不相同,称为组间变异;即使同一组内部的家兔血清ACE浓度相互间也不相同,称为组内变异。该例的总变异包括组间变异和组内变异两局部,或者说可把总变异分解为组间变异和组内变异。组内变异是由于家兔间的个体差异所致。组间变异可能由两种原因所致,一是抽样误差;二是由于各组家兔所接受的处理不同。正如第四章所述,在抽样研究中抽样误差是不可防止的,故导致组间变异的第一种原因肯定存在;第二种原因是否存在,需通过假设检验作出推断。假设检验的方法很多,由于该例为多个样本均数的比拟,应选用方差分析。方差分析的检验假设H0为各样本来自均数相等的总体,H1为各总体均数不等或不全相等。假设不拒绝H0时,可认为各样本均数间的差异是由于抽样误差所致,而不是由于处理因素的作用所致。理论上,此时的组间变异与组内变异应相等,两者的比值即统计量F为1;由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量F应接近于1。假设拒绝H0,接受H1时,可认为各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。此时的组间变异远大于组内变异,两者的比值即统计量F明显大于1。在实际应用中,当统计量F值远大于1且大于某界值时,拒绝H0,接受H1,即意味着各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。〔5.1〕方差分析的根本思想是根据研究目的和设计类型,将总变异中的离均差平方和SS及其自由度分别分解成相应的假设干局部,然后求各相应局部的变异;再用各局部的变异与组内〔或误差〕变异进行比拟,得出统计量F值;最后根据F值的大小确定P值,作出统计推断。例如,完全随机设计的方差分析,是将总变异中的离均差平方和SS及其自由度分别分解成组间和组内两局部,SS组间/组间和SS组内/组内分别为组间变异〔MS组间〕和组内变异〔MS组内〕,两者之比即为统计量F〔MS组间/MS组内〕。又如,随机区组设计的方差分析,是将总变异中的离均差平方和SS及其自由度分别分解成处理间、区组间和误差3局部,然后分别求得以上各局部的变异〔MS处理、MS区组和MS误差〕,进而得出统计量F值〔MS处理/MS误差、MS区组/MS误差〕。3、方差分析的计算方法下面以完全随机设计资料为例,说明各局部变异的计算方法。将N个受试对象随机分为k组,分别接受不同的处理。归纳整理数据的格式、符号见下表:处理组〔i〕123…k……合计……1〕总离均差平方和〔sumofsquares,SS〕及自由度〔freedom,ν〕总变异的离均差平方和为各变量值与总均数〔〕差值的平方和,离均差平方和和自由度分别为:〔5.2〕=N-1〔5.3〕2〕组间离均差平方和、自由度和均方组间离均差平方和为各组样本均数()与总均数()差值的平方和〔5.4〕〔5.5〕〔5.6〕3〕组内离均差平方和、自由度和均方组内离均差平方和为各处理组内部观察值与其均数〔〕差值的平方和之和,。数理统计证明,总离均差平方和等于各局部离均差平方和之和,因此,〔5.7〕〔5.8〕〔5.9〕4〕三种变异的关系:=N-1=(k-1)+(N-k)=可见,完全随机设计的单因素方差分析时,总的离均差平方和〔SS总〕可分解为组间离均差平方和〔SS组间〕与组内离均差平方和〔SS组内〕两局部;相应的总自由度〔〕也分解为组间自由度〔〕和组内自由度〔〕两局部。5〕方差分析的统计量:〔5.10〕4、方差分析的应用条件与用途方差分析的应用条件为①各样本须是相互独立的随机样本;②各样本来自正态分布总体;③各总体方差相等,即方差齐。方差分析的用途①两个或多个样本均数间的比拟;②分析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元线性回归分析中偏回归系数的假设检验;⑤两样本的方差齐性检验等。第二节完全随机设计的单因素方差分析〔one-wayANOVA〕1、用途:用于完全随机设计的多个样本均数间的比拟,其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计〔completelyrandomdesign〕不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原那么将受试对象随机分配到一个处理因素的多个水平中去,然后观察各组的试验效应;在观察研究〔调查〕中按某个研究因素的不同水平分组,比拟该因素的效应。2、计算公式:完全随机设计的单因素方差分析是把总变异的离均差平方和SS及自由度分别分解为组间和组内两局部,其计算公式如下。表5.2单因素方差分析的计算公式变异来源离均差平方和(SS)自由度〔)均方(MS)F总变异N-1组间变异k-1组内变异N-k*C为校正数3、分析步骤〔以例说明〕:例5.1某军区总医院欲研究A、B、C三种降血脂药物对家兔血清肾素血管紧张素转化酶〔ACE〕的影响,将26只家兔随机分为四组,均喂以高脂饮食,其中三个试验组,分别给予不同的降血脂药物,对照组不给药。一定时间后测定家兔血清ACE浓度〔u/ml〕,如表5.1,问四组家兔血清ACE浓度是否相同?本例的初步计算结果见表5.1下部,方差分析的计算步骤为1〕建立检验假设,确定检验水准H0:四组家兔的血清ACE浓度总体均数相等,μ1=μ2=μ3=μ4H1:四组家兔的血清ACE浓度总体均数不等或不全相等,各μi不等或不全相等α=0.052〕计算统计量F值按表5.2所列公式计算有关统计量和F值=5515.3665ν总=N-1=26-1=25ν组间=k-1=4-1=3ν组内=N-K=26-4=22表5.3例5.1的方差分析表变异来源总变异8445.787625组间变异5515.366531838.455513.80组内变异2930.421122133.20233〕确定P值,并作出统计推断以=3和=22查F界值表〔方差分析用〕,得P<0.01,按0.05水准拒绝H0,接受H1,可认为四总体均数不同或不全相同。注意:根据方差分析的这一结果,还不能推断四个总体均数两两之间是否相等。如果要进一步推断任两个总体均数是否相同,应作两两比拟,见本章第四节。第三节随机区组设计的两因素方差分析〔two-wayANOVA〕1、用途:用于随机区组设计的多个样本均数比拟,其统计推断是推断各样本所代表的各总体均数是否相等。随机区组设计考虑了个体差异的影响,可分析处理因素和个体差异对实验效应的影响,所以又称两因素实验设计,比完全随机设计的检验效率高。该设计是将受试对象先按配比条件配成配伍组〔如动物实验时,可按同窝别、同性别、体重相近进行配伍〕,每个配伍组有三个或三个以上受试对象,再按随机化原那么分别将各配伍组中的受试对象分配到各个处理组。值得注意的是,同一受试对象不同时间〔或部位〕重复屡次测量所得到的资料称为重复测量数据〔repeatedmeasurementdata〕,对该类资料不能应用随机区组设计的两因素方差分析进行处理,需用重复测量数据的方差分析。2、计算公式:随机区组设计的两因素方差分析是把总变异中的离均差平方和SS与自由度分别分解成处理间、区组间和误差三局部,其计算公式见表5.4。表5.4两因素方差分析的计算公式变异来源离均差平方和自由度均方总N-1处理间k-1区组间b-1误差*#b区组数3、分析步骤〔以例说明〕:例5.2某医师研究A、B和C三种药物治疗肝炎的效果,将32只大白鼠感染肝炎后,按性别相同、体重接近的条件配成8个配伍组,然后将各配伍组中4只大白鼠随机分配到各组:对照组不给药物,其余三组分别给予A、B和C药物治疗。一定时间后,测定大白鼠血清谷丙转氨酶浓度〔IU/L〕,如表5.5。问四组大白鼠的血清谷丙转氨酶是否相同。表5.5四组大白鼠血清谷丙转氨酶浓度〔IU/L〕区组对照组试验组合计A药组B药组C药组1845.1652.4624.3445.12566.92834.7741.3772.3432.52780.83826.5675.6632.5362.72497.34812.8582.8473.6348.72217.95782.8491.8462.8345.92083.36745.6412.2431.8312.81902.47730.4494.6484.9296.32006.28684.3379.5380.7228.41672.96262.24430.24262.92772.417727.7()782.78553.78532.86346.55553.99()4925110.042571668.142391246.57995764.1410883788.89()本研究的主要目的在于比拟不同治疗方法的效果,同时还可以比拟不同区组间大鼠血清谷丙转氨酶浓度是否相同。计算步骤为1〕建立检验假设,确定检验水准H0:四组大白鼠的血清谷丙转氨酶浓度含量相同,μ1=μ2=μ3=μ4H1:各处理组的血清谷丙转氨酶浓度含量不同或不全相同,各μi不等或不全相等H0:各区组的血清谷丙氨酶含量相同H1:各区组的血清谷丙氨酶含量不同或不全相同均等于0.052〕计算统计量F值按表5.4中公式计算各统计量。本例的初步计算结果见表5.5下半部。ν总=N-1=32-1=31ν处理=k-1=4-1=3ν区组=b-1=8-1=7ν误差=(k-1)(b-1)=(4-1)(8-1)=21列方差分析表,见表5.6。表5.6例5.2的方差分析表变异来源总变异1062809.287031处理间变异766562.77843255520.9261102.798区组间变异244047.7597734863.965714.026误差52198.7489212485.65473〕确定P值并作出统计推断以=3,=21查F界值表,得F0.01(3,21)=4.87。本例F=102.798>F0.01(3,21),P<0.01,按=0.05水准拒绝H0,接受H1,可认为各处理组大白鼠的血清谷丙转氨酶含量不同或不全相同。如果要进一步推断任两个总体均数是否相同,应作两两比拟,见本章第四节。以=7,=21查F界值表,得F0.01(7,21)=3.65。本例F=14.026>F0.01(7,21),P<0.01,按=0.05水准拒绝H0,接受H1,可认为各区组大白鼠的血清谷丙转氨酶含量不同或不全相同。第四节多个样本均数间的多重比拟当方差分析的推断结果为拒绝H0,接受H1,各总体均数不同或不全相同时,不能说明各总体均数两两之间是否不同,为此,可在方差分析的根底上,利用方差分析得到的信息,对均数进一步作两两比拟,也称多重比拟〔multiplecomparisons〕。均数间两两比拟的方法有多种,本节仅介绍Newman-Keuls检验和最小显著差〔LSD〕t检验。1、Newman-Keuls检验亦称Student-Newman-Keuls〔SNK〕检验,简称q检验。q统计量计算公式为〔5.12〕式中、分别为两比照组的样本均数;为两比照组样本均数差值的标准误,假设两比照组样本含量相同,即nA=nB=n,其计算公式为式5.13,否那么计算公式
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论