试验设计课程论文_第1页
试验设计课程论文_第2页
试验设计课程论文_第3页
试验设计课程论文_第4页
试验设计课程论文_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节方差分析的基本思想1、方差分析的意义前述的广检验和"检验适用于两个样本均数的比较,对于斤个样本均数的比较,如果仍用r检验或〃检验,需比较"力肚-即次,如四个样木均数需比较O_3(4-2)r=s次。假设每次比较所确定的检验水准0=0.05,则每次检验拒绝加不犯第一类错误的概率为1-0.05=0.95;那么6次检验都不犯第一类错误的概率为(1-0.05)6二0.7351,而犯第一类错误的概率为0.2649,因而力检验和u检验不适用于多个样本均数的比较。用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysisofvariance,AN0VA)由英国统计学家R.A.Fisher首先提出,以尸命名其统计量,故方差分析乂称尸检验。2、方差分析的基木思想下面通过表5.1资料介绍方差分析的基本思想。例如,有4组进食高脂饮食的家兔,接受不同处理后,测定其血清肾素血管紧张素转化酶(ACE)浓度(表5.1),试比较四组家兔的血清ACE浓度。表5.1对照组及各实验组家兔血清ACE浓度(u/ml)对照组实验组A降脂药B降脂药C降脂药61.2482.3526.2325.4658.6556.4746.8738.7946.7961.5724.3613.5537.434&7938.5419.4566.5462.5442.1634.5659.2760.8730.3310.9620.6848.23329.92372.59229.17191.001122.68(2>)667726(N)54.9962.1032.7427.2943.18(壬)18720.9723758.128088.596355.4356923.11(£刊由表5.1可见,26只家兔的血清ACE浓度各不相同,称为总变异;四组家兔的血清ACE浓度均数也各不相同,称为组间变异;即使同一组内部的家兔血清ACE浓度相互间也不相同,称为组内变异。该例的总变异包括组间变异和组内变异两部分,或者说可把总变异分解为组间变异和组内变异。组内变异是由于家兔间的个体差异所致。组间变异可能由两种原因所致,一是抽样课差;二是由于各组家兔所接受的处理不同。正如第四章所述,在抽样研究中抽样误差是不可避免的,故导致组间变异的第一种原因肯定存在;第二种原因是否存在,需通过假设检验作出推断。假设检验的方法很多,由于该例为多个样本均数的比较,应选用方差分析。方差分析的检验假设加为各样本來自均数相等的总体,//I为各总体均数不等或不全相等。若不拒绝加时,可认为各样本均数间的差异是由于抽样误差所致,而不是由于处理因素的作用所致。理论上,此时的组间变异与组内变异应相等,两者的比值即统计量尸为1;由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量尸应接近于1。若拒绝加,接受川吋,可认为各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。此时的组间变异远大于组内变异,两者的比值即统计量尸明显大于1。在实际应用中,当统计量尸值远大于1且大于某界值时,拒绝加,接受//I,即意味着各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。(5.1)方差分析的基本思想是根据研究目的和设计类型,将总变界中的离均差平方和SS及其自由度#分别分解成相应的若干部分,然后求各相应部分的变异;再用各部分的变异与组内(或误差)变异进行比较,得出统计量尸值;最后根据尸值的大小确定户值,作岀统计推断。例如,完全随机设计的方差分析,是将总变异中的离均差平方和SS及其自由度丫分别分解成组间和组内两部分,SS组间/"组间和SS组内/#组内分别为组间变异(於组间)和组内变异(於组内),两者之比即为统计量FQIS组间/於组内)。又如,随机区组设计的方差分析,是将总变异屮的离均差平方和SS及其自由度V分別分解成处理间、区组间和误差3部分,然后分别求得以上各部分的变异(MS处理、MS区组和於误差),进而得出统计量尸值(於处理/於误差、於区组/於误差)。3、方差分析的计算方法下面以完全随机设计资料为例,说明各部分变异的计算方法。将川个受试对象随机分为斤组,分别接受不同的处理。归纳整理数据的格式、符号见下表:处理组(,)123… kx«… 阳JT %x¥•••g•••X33•••… 殆••••••%JC^■■■合计E阳ixv/-I»3… 九1)总离均差平方和(sumofsquares,SS)及自由度(freedom,v)总变异的离均差平方和为各变量值与总均数(壬)差值的平方和,离均差平方和和自由度分别为:•X * (5.2)临二旧(5.3)2)组间离均差平方和、自由度和均方组间离均差平方和为各组样本均数(芻)与总均数(片)差值的平方和

(5.4)= (5.5)(5.4)= (5.5)3)组内离均差平方和、自由度和均方组内离均差平方和为各处理组内部观察值与其均数(右)差值的平方和之和,w川 。数理统计证明,总离均差平方和等于各部分离均差平方和之和,因此,轧电一买M(5.7)(5.8)(5.9)(5.9)4)三种变异的关系:轨=-3o"=ZZKx¥-«)+(^i-羽M/-1 4-1/-I=23沟&-了+迟迟(%-2尸M i-1/-I临二AH二(41)+(心Q二0亠0可见,完全随机设计的单因素方差分析时,总的离均差平方和(SS总)可分解为组间离均差平方和(SS组间)与组内离均差平方和(SS组内)两部分;相应的总自由度(N)也分解为组间自由度(3)和组内自由度(J)两部分。5)方差分析的统计量:(5.10)4、方差分析的应用条件与用途方差分析的应用条件为①各样本须是相互独立的随机样本;②各样本来自正态分布总体;③各总体方差相等,即方差齐。方差分析的用途①两个或多个样本均数间的比较;②分析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元线性回归分析中偏回归系数的假设检验;⑤两样本的方差齐性检验等。第二节完全随机设计的单因素方差分

析(one-wayANOVA)1、用途:用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计(completelyrandomdesign)不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去,然后观察各组的试验效应;在观察研究(调查)中按某个研究因素的不同水平分组,比较该因素的效应。2、计算公式:完全随机设计的单因素方差分析是把总变异的离均差平方和SS及自由度卩分别分解为组间和组内两部分,其计算公式如下。表5.2单因素方差分析的计算公式变异来源离均差平方和(SS)自由度(T均方(於)F总变异A-1组间变异丈蛍竺D —1组内变异辄-牡.Wk 玉*C为校正数c=3、分析步骤(以例说明):例5.1某军区总医院欲研究A、B、C三种降血脂药物对家兔血清肾素血管紧张素转化酶(ACE)的影响,将26只家兔随机分为四组,均喂以高脂饮食,其屮三个试验组,分别给予不同的降血脂药物,对照组不给药。一定时间后测定家兔血清ACE浓度(u/ml),如表5.1,问四组家兔血清ACE浓度是否相同?木例的初步计算结果见表5.1下部,方差分析的计算步骤为1)建立检验假设,确定检验水准A0:四组家兔的血清ACE浓度总体均数相等,“1二“2二“3二“4四组家兔的血清ACE浓度总体均数不等或不全相等,各不等或不全相等a=0.052)计算统计量尸值按表5.2所列公式计算有关统计量和尸值=Ex1-C-W21U -8WJ8M=5515.3665-MUJ8M-5SZ5JM5■V3U2I!-MUJ8M-5SZ5JM5■V3U2I!y总=7^1=26-1=25y组间=41=4-1=3K组內二2胆26-4二22叫■丑丿g.i,y«M32930A2!l22I13JOIO.4555I33J01O-L3J802930A2!l22I13JOIO.4555I33J01O-L3J80表5.3例5.1的方差分析表MS F1838.455513.80133.2010TOC\o"1-5"\h\zMS F1838.455513.80133.2010总变异 8445. 7876 25组间变异 5515. 3665 3组内变异 2930. 4211 223)确定"值,并作出统计推断以勺二3和◎二22查尸界值表(方差分析用),得/?<0.01,按少=0.05水准拒绝加,接受//I,可认为四总体均数不同或不全相同。注意:根据方差分析的这一结果,还不能推断四个总体均数两两之间是否相等。如果要进一步推断任两个总体均数是否相同,应作两两比较,见本章第四节。第三节随机区组设计的两因素方差分

析(two-wayANOVA)1、用途:用于随机区组设计的多个样本均数比较,其统计推断是推断各样本所代表的各总体均数是否相等。随机区组设计考虑了个体差异的影响,可分析处理因素和个体差异对实验效应的影响,所以乂称两因素实验设计,比完全随机设计的检验效率高。该设计是将受试对象先按配比条件配成配伍组(如动物实验时,可按同贯别、同性别、体重相近进行配伍),每个配伍组有三个或三个以上受试对象,再按随机化原则分别将各配伍组中的受试对象分配到各个处理组。值得注意的是,同一受试对彖不同时间(或部位)重复多次测量所得到的资料称为重复测量数据(repeatedmeasurementdata)/对该类资料不能应用随机区组设计的两因素方差分析进行处理,需用重复测量数据的方差分析。2、计算公式:随机区组设计的两因素方差分析是把总变异中的离均差平方和SS与自由度/分别分解成处理间、区组间和误差三部分,其计算公式见表5・4。表5.4两因素方差分析的计算公式变异来源离均差平方和卿白il度丫均方皿F总心1处理间41买.J%召 c区组间Zrl%叫齐1*误差(*-1)^-1)%*°#b区组数3、分析步骤(以例说明):

10883788.89(亩)例5.2某医师研究A、B和C三种药物治疗肝炎的效果,将32只大白鼠感染肝炎后,按性别相同、体重接近的条件配成8个配伍组,然后将各配伍组中4只大白鼠随机分配到各组:对照组不给药物,其余三组分别给予A、B和C药物治疗。一定吋间后,测定大白鼠血清谷丙转氨酶浓度(IU/L),如表5.10883788.89(亩)区组对照组A药组试验组B药组C药组合计1845.1652.4624.3445.12566.92834.7741.3772.3432.52780.83826.5675.6632.5362.72497.34812.8582.8473.634&72217.95782.8491.8462.8345.92083.36745.6412.2431.8312.81902.47730.4494.6484.9296.32006.28684.3379.5380.7228.41672.9£冲6262.24430.24262.92772.417727.7(珀)782.78553.78532.86346.55553.99(壬)表5.5四组大白鼠血清谷丙转氨酶浓度(1U/L)迟€4925110.04257166&142391246.57995764.14本研究的主要目的在于比较不同治疗方法的效果,同时还可以比较不同区组间大鼠血清谷丙转氨酶浓度是否相同。计算步骤为1)建立检验假设,确定检验水准加:四组大白鼠的血清谷丙转氨酶浓度含量相同,口\二口2二口3二"各处理组的血清谷丙转氨酶浓度含量不同或不全相同,各不等或不全相等加:各区组的血清谷丙氨酶含量相同Hi:各区组的血清谷丙氨酶含量不同或不全相同。均等于0.052)计算统计量F值

按表5.4中公式计算各统计量。木例的初步计算结果见表5.5下半部。=766562.77846362.21+4430J21-I-42S2.91=766562.77846362.21+4430J21-I-42S2.91+2772^-9820979.603=244047.759725S6.9342780."+A+1672.91-9820979.6C3=1062809.2870-7665£2.7?84-24^047.7557-52198.7489=1062809.2870-7665£2.7?84-24^047.7557-52198.7489=7^1=32-1=31/处理=A-1=4-1=3V区组=Z?-1=8-1=7k误差二(41)(Zrl)=(4-1)(8-1)=212»nonsI2»nonsIU■述JT焙十血3SS.■ExJ-C-UK83n8JB9-900979103-L0SM9J870

34853.9657=14.02634853.9657=14.026列方差分析表,见表5.6。表5.6例5.2的方差分析表变异来源SSVasF总变异1062809.287031处理间变异766562.77843255520.9261102.798区组间变异244047.7597734863.965714.026误差52198.7489212485.65473)确定"值并作出统计推断以^1=3,匕二21查尸界值表,得尸0.01(3,21)二4.87。本例F=102.798>F0.01(3,21),^<0.01,按a二0.05水准拒绝加,接受771,可认为各处理组大白鼠的血清谷丙转氨酶含量不同或不全相同。如果要进一步推断任两个总体均数是否相同,应作两两比较,见本章第四节。以8=7,^=21查尸界值表,得尸0.01(7,21)=3.65。本例尸二14.026>A0.01(7,21),/K0.01,按/二0.05水准拒绝加,接受HI,可认为各区组人白鼠的血清谷丙转氨酶含量不同或不全相同。第四节多个样本均数间的多重比较第四节多个样本均数间的多重比较当方差分析的推断结果为拒绝加,接受皿,各总体均数不同或不全相同时,不能说明各总体均数两两之间是否不同,为此,可在方差分析的基础上,利用方差分析得到的信息,对均数进一步作两两比较,也称多重比较(multiplecomparisons)。均数间两两比较的方法有多种,本节仅介绍Newman-Keuls检验和最小显著差(LSD)广检验。1、Newman-Keuls检验亦称Student-Newman-Keuls(SNK)检验,简称q检验。g统计量计算公式为« (5.12)式中元▲、心分别为两对比组的样本均数;—为两对比组样本均数差值的标准误,若两对比组样本含量相同,即加二加二刀,其计算公式为式5.13,否则计算公式为式5.14(5.13)(5.14)(5.14)式中%为方差分析的组内均方,若为两因素或两因素以上的方差分析,则为误差项均方"J;加、加分别为两样本的样本含量。以实例介绍Q检验的步骤。例5.4用。检验对表5.1资料中四组家兔的血清ACE浓度作两两间比较。1.建立检验假设,确立检验水准05。M):两对比组家兔血清ACE含量总体均数相同,即如二血//I:两对比组家兔血清ACE含量总体均数不同,即血*用a=0.052•计算统计量g值。(1)将各组按样本均数从大到小排序(1)将各组按样本均数从大到小排序依次为凤、爲、鬲、耳。并将各对比组列入表11列入表11第(1)栏,栏中数字为各组的序号。序号均数 样本含量原组别1鬲二62.106A降脂药组26对照组旳=54.9937B降脂药组可二32.74石二27.石二27.297C降脂药组表5.11四组家兔血清ACE均数的两两比较(q检验)对比组组数a对比组组数aq界值P值q0.05q0.01⑷=(2)/(3)与与与与与与1±11110/^007.1129.364.7124.5401.516.与与与与与与1±11110/^007.1129.364.7124.5401.516.47⑹2.953.58⑺4.024.64>0.05<0.01434.814.5407.6743.965.02<0.01322.254.5404.9022.954.02<0.01427.704.5406.1033.584.64<0.0145.454.3621.2522.952.95>0.05(2) 计算各对比组均数的差值心-耳,如-8,-42.10-MM-7.1I,余类推。将各对比组均数差值列入第(2)栏。(3) 计算各对比组均数差值的标准误,按式5.13或式5.14计算各对比组均数差值的标准误,并列入第(3)栏。如J133.2010—£—J133.2010—£—=4.71211332010,1I1~2~'&坊=4.540(4) 计算统计量q°两对比组的样本均数之差除以其标准误得统计量q,即第(2)与第(3)栏数据的比值。如第1组与第2组:7.ll/4.712=1.51o余见第(4)栏。(5) 确定组数纸组数是指两对比组间所包含的组数(包括两对比组本身),如第1组与第2组比较,组数a二2;第2组与第4组Z间比较组数a=3o余类推,见第(5)栏。(6) 查q界值。根据组数a及自由度(方差分析中组内或误差自由度)查g界值表。本例v=22,查得条昨**二2.95。余见第(6)和第(7)栏。3•确定户值,并作岀统计推断本例第1组与第2组、第3组与第4组比较的°统计量均小于05,00.05,不拒绝加,故尚不能认为A药组与对照组、B药组与C药组家兔的血清ACE浓度不同;其余各对比组的Q统计量均大于如.01,^<0.01,拒绝加接受皿,可认

为A药组与B药组、A药组与C药组、对照组与B药组、对照组与C药组的家兔血清ACE浓度不同。2、最小显著差(LSD)广检验g检验对斤个均数的两两比较需k(k-l)/2次。若扫8,则需比较28最小显著差(theleastsignificantdifference,LSD)法可以简化两两比较的计算步骤。其检验假设也为:肛如二如,M:如.如。方法为:首先计算拒绝加,接受皿所需样木均数差值的最小值氐-耳I,即LSD。然后各对比组的国一无・1与相应的LSD比较,只要对比组的检-砒大于或等于LSD,即拒绝/X),接受/ZI;否则,得到相反的推断结论。LSD-1检验通过计算各对比组的氐-耳I与其标准误之比值是否达到方检验的界由此推算出最小显著差LSD,而不必计算每一对比组的广值ZSD=国-讣―脸“(占+冷V 松沟(5.16)(5.15)式屮心、和和”▲、力分别为对比组屮两样本的均数及样本含量,叫“和y为方差分析中组内(或课差)的离均差平方和与自由度。如果两对比组的样本含量相同,即时,则(5.17)(5.17)例5.5用LSD-t检验对例5.1中四组家兔血清ACE浓度作两两比较。本例二133.2010,"二22,查十界值表,得gi・"l9建立检验假设,确定检验水准。加:两对比组家兔血清ACE含量总体均数相同,即M:两对比组家兔血清ACE含量总体均数不同,即a=0.052•计算统计量(1)计算各对比组均数的差值氐一和,见表5.11第(2)列。(2)计算各对比组的最小显著差,并列入表5.11第(3)、第(4)列。如%■心6时,据式5.17冲卄「如“冲笃3.82叫乜朋卿呼牝8.78余类推。表5.11四组家兔血清ACE均数的两两比较(LSD-1检验)对比组氐LSD0.05LSD0.01"值A药组与对照组7.1113.8218.78>0.05A药组与B药组29.3613.321&10<0.01A药组与C药组34.8113.321&10<0.01对照组与B药组22.2513.3218.10<0.01对照组与C药组27.7013.321&10<0.01B药组与C药组5.4512.7917.39>0.05确定P值,并作出推断结论。当相互对比的两组丘孔1大于或等于界值吋,戶小于或等于相应的概率;反之,戶大于相应的概率。本例对照组与A药组、B药组与C药组的均小于LSD0.05,P大于0.05,不拒绝加;其余对比组

的Kj-siI均大于LSDO.Ol,/KO.01,拒绝/X),接受//I。可见,LSD-t检验的结论与药组与C药组的第五节多个样本的方差齐性检验方差分析的条件之一为方差齐,即各总体方差相等。因此在方差分析之前,应首先检验各样本的方差是否具有齐性。常用方差齐性检验(testforhomogeneityofvariance)推断各总体方差是否相等。木节将介绍多个样木的方差齐性检验,本法由Bartlett于1937年提岀,称Bartlett法。该检验方法所计算的统计量服从,分布。所用公式如下:(5.18)或,■2匕⑷-叫或,■2匕⑷-叫*-迟鸟-弘耳]Cx3■空空Eg-D©昭-£匕-DE彳]C(5.19)(5.20)(5.21)式中®为第2•组的统计学中的几个基本概念1>同质(homogeneity)与变异(variation)严格地讲,同质是指被研究指标的影响因素完全相同。但在医学研究中,有些影响因素往往是难以控制的(如遗传、营养等),甚至是未知的。所以,在统计学中常把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。例如研究儿童的身高时,要求性别、年龄、民族、地区等影响身高较大的、易控制的因素要相同,而不易控制的遗传、营养等影响因素可以忽略。同质基础上的个体差异称为变异。如同性别、同年龄、同民族、同地区的健康儿童的身高、体重不尽相同。事实上,客观世界充满了变异,牛物医学领域更是如此。哪里有变异,哪里就需要统计学。若所研究的同质群体中所有个体一模一样,只需观察任一个体即可,无须进行统计研究。2、 总体(population)与样本(sample)任何统计研究都必须首先确定观察单位(observedunit),亦称个体(individual)o观察单位是统计研究中最基木的单位,可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。总体是根据研究口的确定的同质观察单位的全体,或者说,是同质的所有观察单位某种观察值(变量值)的集合。例如欲研究山东省2002年7岁健康男孩的身高,那么,观察对象是山东省2002年的7岁健康男孩,观察单位是每个7岁健康男孩,变量是身高,变量值(观察值)是身高测量值,则山东省2002年全体7岁健康男孩的身高值构成一个总体。它的同质基础是同地区、同年份、同性别、同为健康儿童。总体又分为有限总体(finitepopulation)和无限总体(infinitepopulation)□有限总体是指在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限个,如上例;无限总体是抽象的,无时间和空间的限制,观察单位数是无限的,如研究碘盐对缺碘性甲状腺病的防治效果,该总体的同质基础是缺碘性甲状腺病患者,同用碘盐防治;该总体应包括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果,没有时间和空间范围的限制,因而观察单位数无限,该总体为无限总体。在实际工作中,所要研究的总体无论是有限的还是无限的,通常都是采用抽样研究。样木是按照随机化原则,从总体中抽取的有代表性的部分观察单位的变量值的集合。如从上例的有限总体(山东省2002年7岁健康男孩)中,按照随机化原则抽取100名7岁健康男孩,他们的身高值即为样本。从总体屮抽取样本的过程为抽样,抽样方法有多种,详见第14章。抽样研究的目的是用样本信息推断总体特征。统计学好比是总体与样木间的桥梁,能帮助人们设计与实施如何从总体中科学地抽取样本,使样本中的观察单位数(亦称样本含量,samplesize)恰当,信息丰富,代表性好;能帮助人们挖掘样本中的信息,推断总体的规律性。3、 资料(data)与变量(variable)及其分类总体确定之后,研究者应对每个观察单位的某项特征进行测量或观察,特征称为变量。如“身高”、“体重”、“性别”、“血型”、“疗效”等。变量的测定值或观察值称为变量值(valueofvariable)或观察值(observedvalue),亦称为资料。按变量的值是定量的还是定性的,可将变量分为以下类型,变量的类型不同,其分布规律亦不同,对它们采用的统计分析方法也不同。在处理资料之前,首先耍分清变量类型。1) 数值变量(numericalvariable):其变量值是定量的,表现为数值大小,可经测量取得数值,多有度量衡单位。如身高(cm)、体重(kg).血压(mmHgkPa)、脉搏(次/min)和白细胞讣数(X109/L)等。这种由数值变量的测量值构成的资料称为数值变量资料,亦称为定量资料(quantitativedata)o大多数的数值变量为连续型变量,如身高、体重、血压等;而有的数值变量的测定值只能是正整数,如脉搏、白细胞计数等,在更学统计学中把它们也视为连续型变量。2) 分类变量(catagoricalvariable):其变量值是定性的,表现为互不相容的类别或属性。分类变量可分为无序变量和有序变量两类:(1) 无序分类变量(unorderedcategoricalvariable)是指所分类别或屈性之间无程度和顺序的差别。,它乂可分为①二项分类,如性别(男、女),药物反应(阴性和阳性)等;②多项分类,如血型(0、A、B、AB),职业(工、农、商、学、兵)等。对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。(2) 有序分类变量(ordinalcategoricalvariable)各类别之间有程度的差别。如尿糖化验结果按一、土、+、++、+++分类;疗效按治愈、显效、好转、无效分类。对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。变量类型不是一成不变的,根据研究目的的需要,各类变量Z间可以进行转化。例如血红蛋口量(g/L)原属数值变量,若按血红蛋口正常与偏低分为两类时,可按二项分类资料分析;若按重度贫血、中度贫血、轻度贫血、止常、血红蛋白增高分为五个等级时,可按等级资料分析。有时亦可将分类资料数量化,如可将病人的恶心反应以0、1、2、3表示,则可按数值变量资料(定量资料)分析。4、随机事件(randomevent)与概率(probability)医学研究的现象,大多数是随机现象,对随机现象进行实验或观察称为随机试验。随机试验的各种可能结果的集合称为随机事件,亦称偶然事件,简称事件。例如用相同治疗方案治疗一批某病的患者,治疗转归可能为治愈、好转、无效、死亡四种结果,对于一个刚入院的患者,治疗后究竟发生哪一种结果是不确定的,可能发生的每一种结果都是一个随机事件。对于随机事件来说,在一次随机试验屮,某个随机事件可能发生也可能不发生,但在一定数量的重复试验后,该随机事件的发生情况是有规律可循的。概率是描述随机事件发生的可能性大小的数值,常用P表示。例如,投掷一枚均匀的破币,随机事件A表示“正面向上”,用n表示投掷次数;m表示随机事件A发生的次数;f表示随机事件A发牛的频率(f二m/n),OWmWn,OWfWl。用不同的投掷次数n作随机试验,结果如下:m/n=8/10=0.8,7/20=0.35,……,249/500=0.49&501/1000二0.501,10001/2000=0.5000,由此看出当投掷次数n足够大时,f=m/n->0.5,称戶(A)二0.5,或简写为:住0・5。当n足够大时,可以用f估计P。随机事件概率的大小在0与1之间,即0</Kl,常用小数或百分数表示。P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发牛的可能性越小。*1表示事件必然发生,*0表示事件不可能发生,它们是确定性的,不是随机事件,但可以把它们看成随机事件的特例。若随机事件A的概率PgS习惯上,当壬0.05时,就称A为小概率事件。其统计学意义是小概率事件在一次随机试验中不可能发生。例如,某都市人街上疾驶的汽车撞伤行人的事件的发生概率为1/万,但大街上仍有行人,这是因为“被撞”事件是小概率事件,所以行人认为自己上街这“一次试验”中不会发生“被撞”事件。“小概率”的标准臼是人为规定的,对于可能引起严重后果的事件,如术中大出血等,可规定沪0.01,甚至更小。第一节方差分析的基本思想1、方差分析的意义前述的r检验和〃检验适用于两个样本均数的比较,对于斤个样本均数的比较,-如果仍用广检验或"检验,需比较“ 21优-2)1次,如四个样本均数需比较°"30-2)1=6次。假设每次比较所确定的检验水准◎二0.05,则每次检验拒绝加不犯第一类错误的概率为1-0.05=0.95;那么6次检验都不犯第一类错误的概率为(1-0.05)6=0.7351,而犯第一类错误的概率为0.2649,因而广检验和〃检验不适用于多个样木均数的比较。用方差分析比较多个样木均数,可有效地控制第一类错误。方差分析(analysisofvariance,AN0VA)由英国统计学家R.A.Fisher首先提出,以尸命名其统计量,故方差分析又称尸检验。2、方差分析的基本思想下面通过表5.1资料介绍方差分析的基木思想。例如,有4组进食高脂饮食的家兔,接受不同处理后,测定其血清肾素血管紧张素转化酶(ACE)浓度(表5.1),试比较四组家兔的血清ACE浓度。表5.1对照组及各实验组家兔血清ACE浓度(u/ml)

对照组实验组A降脂药B降脂药C降脂药61.2482.3526.2325.465&6556.4746.8738.7946.7961.5724.3613.5537.4348.793&5419.4566.5462.5442.1634.5659.2760.8730.3310.9620.6848.23*z329.92372.59229.17191.001122.68(2?)667726(N)54.9962.1032.7427.2943.18(才)X18720.9723758.12808&596355.4356923.11(£/)由表5.1可见,26只家兔的血清ACE浓度各不相同,称为总变异;四组家兔的血清ACE浓度均数也各不相同,称为组间变界;即使同一组内部的家兔血清ACE浓度相互间也不相同,称为组内变异。该例的总变异包括组间变异和组内变异两部分,或者说可把总变异分解为组间变异和组内变异。组内变异是由于家兔间的个体差异所致。组间变异可能由两种原因所致,一是抽样误差;二是由于各组家兔所接受的处理不同。正如第四章所述,在抽样研究中抽样课差是不可避免的,故导致组间变界的第一种原因肯定存在;第二种原因是否存在,需通过假设检骑作出推断。假设检验的方法很多,由于该例为多个样木均数的比较,应选用方差分析。方差分析的检验假设加为各样本来自均数相等的总体,M为各总体均数不等或不全相等。若不拒绝加时,可认为各样本均数间的差异是由于抽样误差所致,而不是由于处理因素的作用所致。理论上,此时的组间变异与组内变异应相等,两者的比值即统计量尸为1;由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量尸应接近于1。若拒绝加,接受皿时,可认为各样木均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。此时的组间变异远人于组内变异,两者的比值即统计量"明显大于1。在实际应用屮,当统计量厂值远大于1且大于某界值时,拒绝加,接受//I,即意味着各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。鈕0(5.1)方差分析的基本思想是根据研究目的和设计类型,将总变异中的离均差平方和SS及其自由度V分别分解成和应的若干部分,然后求各相应部分的变异;再用各部分的变异与组内(或误差)变异进行比较,得出统计量F值;最后根据尸值的大小确定户值,作出统计推断。例如,完全随机设计的方差分析,是将总变异屮的离均差平方和SS及其自由度丁分别分解成组间和组内两部分,SS组间/"组间和SS组内/丫组内分别为组间变界(於组间)和组内变界(於组内),两者之比即为统计量F(MS组间/於组内)。又如,随机区组设计的方差分析,是将总变异中的离均差平方和SS及其自由度#分别分解成处理间、区组间和误差3部分,然后分别求得以上各部分的变异(MS处理、MS区组和於误差),进而得出统计量尸值(於处理/」於误差、於区组/於误差)。3、方差分析的计算方法下面以完全随机设计资料为例,说明各部分变异的计算方法。将川个受试对象随机分为&组,分别接受不同的处理。归纳整理数据的格式、符号见下表:处理组(/)123… kxn xn… 附•••••••••… 殆••••••叫 %* 耳■合计 2刁坊…刀4…“1)总离均差平方和(sumofsquares,SS)及自由度(freedom,v)总变界的离均差平方和为各变量值与总均数(壬)差值的平方和,离均差平方和和自由度分别为:

2)组间离均差平方和、自由度和均方组间离均差平方和为各组样本均数(耳)与总均数(壬)差值的平方和(5.4)畑=上-1(5.5)(5.4)畑=上-1(5.5)(5.6)3)组内离均差平方和、自由度和均方组内离均差平方和为各处理组内部观察值与其均数(兀)差值的平方和之和,SS^二丈立(冲一掰U貝 O数理统计证明,总离均差平方和等于各部分离均差平方和之和,因此,畐・=离吃-畐0(5.7)畑上(5.8)J(5.9)4)三种变界的关系:牡=-50—£乞m-N)+(«■IU i-1M=十%二Ml二(Ql)+d二烁可见,完全随机设计的单因素方差分析时,总的离均差平方和(SS总)可分解为组间离均差平方和(SS组间)与组内离均差平方和(SS组内)两部分;相应的总自由度(N)也分解为组间自由度(3)和组内自由度(J)两部分。5)方差分析的统计量:F= (5.io)4、方差分析的应用条件与用途方差分析的应用条件为①各样本须是相互独立的随机样本;②各样本来自正态分布总体;③各总体方差相等,即方差齐。方差分析的用途①两个或多个样本均数间的比较;②分析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元线性回归分析中偏回归系数的假设检验;⑤两样本的方差齐性检验等。第二节完全随机设计的单因素方差分

析(one-wayANOVA)1、 用途:用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计(completelyrandomdesign)不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去,然后观察各组的试验效应;在观察研究(调查)屮按某个研究因素的不同水平分组,比较该因素的效应。2、 计算公式:完全随机设计的单因素方差分析是把总变异的离均差平方和SS及自由度旷分别分解为组间和组内两部分,其计算公式如下。表5.2单因素方差分析的计算公式变异來源离均差平方和(S3)自由度(◎均方(阍F总变异21组间变异■■k~\J£ —cJ耳组内变异J*c为校止数3、分析步骤(以例说明):例5.1某军区总医院欲研究A、B、C三种降血脂药物对家兔血清肾素血管紧张素转化酶(ACE)的影响,将26只家兔随机分为四组,均喂以高脂饮食,其中三个试验组,分别给予不同的降血脂药物,对照组不给药。一定时间后测定家兔血清ACE浓度(u/ml),如表5.1,问四组家兔血清ACE浓度是否相同?本例的初步计算结果见表5.1下部,方差分析的计算步骤为1)建立检验假设,确定检验水准加:四组家兔的血清ACE浓度总体均数相等,〃1二〃2二〃3二〃4//I:四组家兔的血清ACE浓度总体均数不等或不全相等,各不等或不全相等

a二0.052)计算统计量尸值按表5.2所列公式计算有关统计量和尸值4-844$jm=Exa-C-MMlll-4B07J4-844$jm=Exa-C-MMlll-4B07J=5515.=5515.3665-M4SJ8M・5T$U-»3M2I!-M4SJ8M・5T$U-»3M2I!k总=7^1=26-1=25r组间二41k总=7^1=26-1=25r组间二41二4-1=3r级內三皆用26-4二22■驯却■!«»>»3j尹.伽22_1838,4555"133JOiO1130变异来源SSVMSF总变异8445.787625组间变异5515.366531838.455513.80表5.3例5.1的方差分析表组内变异 2930.组内变异 2930.421122133.20103)确定"值,并作出统计推断以乃二3和乃二22查尸界值表(方差分析用),得^<0.01,按。=0.05水准拒绝A0,接受可认为四总体均数不同或不全相同。注意:根据方差分析的这一结果,还不能推断四个总体均数两两之间是否相等。如果要进一步推断任两个总体均数是否相同,应作两两比较,见本章第四节。第三节随机区组设计的两因素方差分

析(two-wayANOVA)1、 用途:用于随机区组设计的多个样本均数比较,其统计推断是推断各样本所代表的各总体均数是否相等。随机区组设计考虑了个体差异的影响,可分析处理因素和个体差异对实验效应的影响,所以又称两因素实验设计,比完全随机设计的检验效率高。该设计是将受试对象先按配比条件配成配伍组(如动物实验时,可按同窝别、同性别、体重相近进行配伍),每个配伍组有三个或三个以上受试对象,再按随机化原则分别将各配伍组中的受试对象分配到各个处理组。值得注意的是,同一受试对象不同时间(或部位)重复多次测量所得到的资料称为重复测量数据(repeatedmeasurementdata),对该类资料不能应用随机区组设计的两因素方差分析进行处理,需用重复测量数据的方差分析。2、 计算公式:随机区组设计的两因素方差分析是把总变异屮的离均差平方和SS与自由度y分别分解成处理间、区组间和误差三部分,其计算公式见表5.4。表5.4两因素方差分析的计算公式变异来源 离均差平方和彌 自由度丫均方逐F总 eP-cb 八匚1

处理间k-1□叫ftA*C区组间b~lJvn叫误差盂*#b区组数3、分析步骤(以例说明):例5.2某医师研究A、B和C三种药物治疗肝炎的效果,将32只大口鼠感染肝炎后,按性别相同、体重接近的条件配成8个配伍组,然后将各配伍组中4只大白鼠随机分配到各组:对照组不给药物,其余三组分别给予A、B和C药物治疗。一定时间后,测定大白鼠血清谷丙转氨酶浓度(IU/L),如表5.5。问四组大白鼠的血清谷丙转氨酶是否相同。表5.5四组大白鼠血清谷丙转氨酶浓度(IU/L)区组对照组A药组试验组B药组C药组合计1845.1652.4624.3445.12566.92834.7741.3772.3432.52780.83826.5675.6632.5362.72497.34812.8582.8473.6348.72217.95782.8491.8462.8345.92083.36745.6412.2431.8312.81902.47730.4494.6484.9296.32006.28684.3379.5380.7228.41672.96262.24430.24262.92772.417727.7(迟*)782.78553.78532.86346.55553.99(〒), 10883788.89£W4925110. 042571668.142391246.57995764.14 -f/-< (»)本研究的主要目的在于比较不同治疗方法的效果,同吋还可以比较不同区组间人鼠血清谷丙转氨酶浓度是否相同。计算步骤为

1)建立检验假设,确定检验水准加:四组大白鼠的血清谷丙转氨酶浓度含量相同,二"2二“3二“4各处理组的血清谷丙转氨酶浓度含量不同或不全相同,各不等或不全相等A0:齐区组的血清谷丙氨酶含量相同M:各区组的血清谷丙氨酶含量不同或不全相同Q均等于0.052)计算统计量尸值按表5.4中公式计算各统计量。本例的初步计算结果见表5.5下半部。JT 32SS.=ExJ-C=10883nU9-K3W9J03=UMM»28n=76(562.7784c_6262.21+443021+423+277241-9820979.603=76(562.7784c_6262.21+443021+423+277241-9820979.603=244047.75»725KJ1+2780用+A44672少-9820979.6C3SS蘇・SS. ■1062809.2870-7SS5C2.77842WM7.7597=52198.7489二Ml二32-1二31r处理二41二4-1二3v区组=/t-1=8-1=7k误差二(41)(Zt-1)=(4-1)(8-1)=21

j瞥今樂—呼1=7呼1=721尸一叫_2»血网MS^y.3«$jS$e湎0湎034863.9657*85.4547=14026列方差分析表,见表5.6o表5.6例5.2的方差分析表变异来源SSVF总变异1062809.287031处理间变异766562.77843255520.9261102.798区组间变界244047.7597734863.965714.026误差52198.7489212485.65473)确定P值并作出统计推断以匕二3,匕二21查尸界值表,得F0.01(3,21)M.87O木例尸二102.798>F0.01(3,21),戶〈0・01,按0=0.05水准拒绝加,接受虫,可认为各处理组大白鼠的血清谷丙转氨酶含量不同或不全相同。如果要进一步推断任两个总体均数是否相同,应作两两比较,见本章第四节。以“二7,v2=21查尸界值表,得F0.01(7,21)=3.65。本例尸二14.026>F0.01(7,21),7K0.01,按空二0.05水准拒绝A0,接受//I,可认为各区组大白鼠的血清谷丙转氨酶含量不同或不全相同。第四节多个样本均数间的多重比较

当方差分析的推断结果为拒绝加,接受皿,各总体均数不同或不全相同时,不能说明各总体均数两两之间是否不同,为此,可在方差分析的基础上,利用方差分析得到的信息,对均数进一步作两两比较,也称多重比较(multiplecomparisons)o均数间两两比较的方法有多种,本节仅介绍Newman-Keuls检验和最小显著差(LSD)广检验。1、Newman-Keuls检验亦称Student-Newman-Keuls(SNK)检验,简称g检验。g统计量计算公式为式中君、忌分别为两对比组的样本均数;J为两对比组样本均数差值的标准误,若两对比组样本含量相同,即ZE,其计算公式为式5.13,否则计算公式为式5.14(5.13)(5.13)式中%为方差分析的组内均方,若为两因素或两因素以上的方差分析,则为误差项均方 加、加分别为两样本的样本含量。以实例介绍Q检验的步骤。例5.4用q检验对表5.1资料中四组家兔的血清ACE浓度作两两间比较。1.建立检验假设,确立检验水准。。A0:两对比组家兔血清ACE含量总体均数相同,即他-用//I:两对比组家兔血清ACE含量总体均数不同,即a=0.052•计算统计量q值。

(1)将各组按样本均数从人到小排序:依次为石、(1)将各组按样本均数从人到小排序:依次为石、心、码、兀。并将各对比组列入表11第(1)栏,栏屮数字为各组的序号。序号均数样本含量原组别1石二62.106A降脂药组2元2=54.996对照组3屁二32.747B降脂药组4石二27.297C降脂药组表5.11四组家兔血清ACE均数的两两比较(q检验)对比组组数aq界值对比组qO.05q0.01=(2)/(3) (5)(6) (7)与与与与与与1111110/^0O27.114.712329.364.540434.814.5403与与与与与与1111110/^0O27.114.712329.364.540434.814.540322.254.540427.704.54045.454.3621.516.477.674.906.101.252.954.02>0.053.584.64<0.013.965.02<0.012 2.954.02<0.013.584.64<0.012.952.95>0.05(2)计算各对比组均数的差值孔-轧如野-%■血余类推。将各对比组均数差值列入第(2)栏。(3)计算各对比组均数差值的标准误,按式5.13或式5.14计算各对比组均数差值的标准误,并列入第(3)栏。如J133.2010二4.7严二4.J133.2010二4.7严二4.540(4) 计算统计量qo两对比组的样本均数之差除以其标准误得统计量q,即第(2)与第(3)栏数据的比值。如第1组与第2组:7.11/4.712二1.51。余见第(4)栏。(5) 确定组数弧组数是指两对比组间所包含的组数(包括两对比组本身),如第1组与第2组比较,组数a二2;第2组与第4组Z间比较组数a=3o余类推,见第(5)栏。(6)查0界值。根据组数3及自由度(方差分析中组内或误差自由度)查0界值表。本例Y二22,查得仇列》»二2.95。余见第(6)和第(7)栏。3•确定P值,并作岀统计推断本例第1组与第2组、第3组与第4组比较的q统计量均小于qO.05,Q0.05,不拒绝加,故尚不能认为A药组与对照组、B药组与C药组家兔的血清ACE浓度不同;其余各对比组的g统计量均大于<70.01,X0.01,拒绝加接受//I,可认为A药组与B药组、A药组与C药组、对照组与B药组、对照组与C药组的家兔血清ACE浓度不同。2、最小显著差(LSD)广检验Q检验对&个均数的两两比较需k(k-l)/2次。若扫8,则需比较28最小显著差(theleastsignificantdifference,LSD)法可以简化两两比较的计算步骤。其检验假设也为:尙:血二知,M: 方法为:首先计算拒绝加,接受川所需样本均数差值的最小值E-Hl,即LSD。然后各对比组的同-丑I与相应的LSD比较,只要对比组的昆-耳I大于或等于LSD,即拒绝加,接受//I;否则,得到相反的推断结论。LSD-广检验通过计算各对比组的氐-孔I与其标准误Z比值是否达到方检验的界值由此推算出最小显著差LSD,而不必计算每一对比组的广值——+^-)"勺(5.16)式中去、秸和W、"分别为对比组中两样木的均数及样木含量,叫■和#为方差分析中组内(或误差)的离均差平方和与自由度。如果两对比组的样木含量相同,即吋,贝IJ

iSD■肉张字iSD■肉张字(5.17)例5.5用LSD-t检验对例5.1中四组家兔血清ACE浓度作两两比较。木例視%二133.2010,"二22,查广界值表,得3>・2血,i«ui-1819建立检验假设,确定检验水准。/X):两对比组家兔血清ACE含量总体均数相同,即皿=花・//I:两对比组家兔血清ACE含量总体均数不同,即a=0.052•计算统计量(1)计算各对比组均数的差值氐Y」,见表5.11第(2)列。(2)计算各对比组的最小显著差,并列入表5.11第(3)、第(4)列。如九f6时,据式5.17皿”盼如•呻呼葺§丄2皿01皿01■氐-切A2.819戶耳亟=18.78余类推。表5.11四组家兔血清ACE均数的两两比较(LSD-1检验)对比组LSD0.05LSD0.01戶值A药组与对照组7.1113.821&78>0.05A药组与B药组29.3613.3218.10<0.01A药组与C药组34.8113.321&10<0.01对照组与B药组22.2513.3218.10<0.01

对照组与C药组 27.对照组与C药组 27.70B药组与C药组5.4513.3212.791&1017.39<0.01>0.05确定戶值,并作出推断结论。当相互对比的两组庇-勺I大于或等于界值时,户小于或等于相应的概率;反Z,户大于相应的概率。本例对照组与A药组、B药组与C药组的氐■无」均小于LSD0.05,户大于0.05,不拒绝/X);其余对比组的均大于LSD0.01,K0.01,拒绝加,接受加。可见,LSD-t检验的结论与q检验一致。第五节多个样本的方差齐性检验方差分析的条件之一为方差齐,即各总体方差相等。因此在方差分析之前,应首先检验各样本的方差是否具有齐性。常用方差齐性检验(testforhomogeneityofvariance)推断各总体方差是否相等。本节将介绍多个样本的方差齐性检验,本法由BartlettT*1937年提出,称Bartlett法。该检验方法所计算的统计量服从北力分布。所用公式如下:或,(5.18)(519)"-1)鬧-Eg-或,(5.18)(519)"-1)鬧-Eg-DT]C(5.20)命殆■右I(5.21)式中旳为第f组的样木含量;彳为第了组的样木方差;&为样木个数;C为校正数。

用自由度查/界值表,若Z'值大于等于*界值,则戶值小于等于相应的概率,反Z,户值大于相应的概率。如果未经校正的/值小于/界值,贝IJ校正后的/值更小,可不必再计算校正*值。例5.7对照组、A降脂药组、B降脂药组和C降脂药组家兔的血清胆|占|醇含量(mmol/L)的均数分别为5.845、2.853、2.972和1.768,方差分别为5.941、2.370、0.517和0.581,样本含量分别为6、6、6和7,问四样本的方差是否齐同?建立检验假设和确定检验水准/K): = 各总体方差不同或不全相同◎二0.052.计算统计量乂"值初步计算结果如表5.12。表5.12四样本方差齐性检验的计算=2.268=2.268分组,彳老7(网-垢15.941529.7051.78188&9093922.370511.8500.862894.3144530.51752.585-0.65971-3.2985640.58163.486-0.54300-3.25803合计—2147.626—6.66725£(^-Dta^=21xta22S8£(^-Dta^=21xta22S8=17.19687F G7-19687-6.66425)1-090 =9.6633•确定"值,作出统计推断结论。本例自由度为v=3,查界值表,得0.025>/>0.01,按少二0.05水准拒绝加,接受川,可以认为四总体方差不同或不全相同。统计表和统计图掌握统计表的编制基本原则掌握统计表的编制基本要求要求统计表和统计图是统计描述的重要方法。咲学科学研究资料经过整理和计算各种统计指标后,所得结果除了用适当的文字说明外,常将统计资料及其指标以表格列出(称为统计表,statisticaltables),或将统计资料形象化,利用点的位置、线断的升降、直条的长短或面积的大小等形式直观表示事物间的数量关系(称为统计图,statisticalgraph)□统计表与统计图可以代替冗长的文字叙述,表达清楚,对比鲜明。一、常用统计表(一)统计表的结构与编制1.统计表的结构统计表由标题、标冃、线条和数字构成。如下表所示:表号标题横标目名称 纵标目 合计横标目 数字合计列表的原则重点突岀,简单明了,即一张表一般表达一个中心内容,便于分析比较;主谓分明,层次清楚,符合逻辑,明确被说明部分(主语)与说明部分(谓语)。编制要求(1)标题要能概括表的内容,写于表的上端中央,一般应注明时间与地点。

(2) 标目标目是表格内的项目。以横、纵向标目分别说明主语与谓语,文字简明,层次清楚。横标目列在表的左侧,一般用来表示表中被研究事物的主要标志;纵标目列在表的上端,一般用来说明横标目的各个统计指标的内容。标目内容一般应按顺序从小到大排列,小的放在上面,不同时期的资料可按年份、月份先后排列,有助于说明其规律性。(3) 线条线条不易过多,常用3条线表示,谓之“三线图”。表的上下两条边线可以用较粗的横线,一般省去表内的线条,但合计可用横线隔开。表的左右两侧的边线可省去,表的左上角一般不用对角线。(4) 数字以阿拉伯数字表示。表内的数字必须正确,小数的位数应一致并对齐,暂缺与无数字分别以“…”、表示,为“0”者记作“0”,不应有空项。为方便核实与分析,表一般应有合计。(5) 说明一般不列入表内。必要说明者可标“※”号,于表下加以说明。(二)统计表的种类通常按分组标志多少分为简单表与组合表。•简单表(simpletable)rh一组横标目和一组纵标目组成,如表2・10。表2-102001年某省不同地区的卫生系统反应性评分比较表2-11表2-112001年某省不同地区、性别的卫生系统反应性评分比较地区省会城市一般城市县及乡村合计调查人数217100地区省会城市一般城市县及乡村合计调查人数217100371688男评分均值706.60517.15669.88659.26调查人数11652600768女评分均值698.07487.92684.74673.43地区调查人数评分均值省会城市333703.63一般城市152507.15县及乡村971679.06合计1456666.73•复合表(combinativetable)是由2组及以上的横标目和纵标目相结合起来或1组横标目和2组及以上纵标目结合起来以表达他们之I'可关系的统计表,如表2・11。二、常用统计图I矢学领域中常用的统计图有条图、百分条图、圆图、线图、半对数图、直方图、散点图、箱式图与统计地图等。•绘制统计图的基本要求O根据资料的性质和分析目的决定适当的图形。O标题应说明资料的内容、时间和地点,一般位于图的下方。O图的纵、横轴应注明标冃及对应单位,尺度应等距或具有规律性,一般自左而右、白上而下、由小到大。O为使图形美观并便于比较,统计图的长宽比例一般为7:5,有时为了说明问题也可加以变动。o比较、说明不同事物时,可用不同颜色或线条表示,并常附图例说明,但不宜过多。•常用统计图的适用条件与绘制条图(bargraph)条图用等宽长条的高度表示按性质分类资料各类别的数值大小,用于表示他们之间的对比关系,一般有单式(图2-3)与复式(图2-4)之分.制图要求:一般以横轴为基线,表示各个类别;纵轴表示其数值大小。纵轴尺度必须从0开始,中间不宜折断。在同一图内尺度单位代表同一数量时,必须相等。各直条宽度应相等,各直条之间的间隙也应相等,其宽度与直条的宽度相等或为直条宽度的l/2o直条的排列通常由高到底,以便比较。复式条图绘制方法同上,所不同的是复式条图以组为单位,1组包括2个以上直条,直条所表示的类别应用图例说明,同一组的直条间不留空隙。图2-32001年某省不同地区的卫生系统反应性评分比较□男□女□男□女图2-42001年某省不同地区、性别的卫生系统反应性评分比较圆图(piegraph)圆形图适用于百分构成比资料,表示事物各组成部分所占的比重或构成。以圆形的总面积代表100%,把面积按比例分成若干部分,以角度大小來表示各部分所占的比重(图2-5)o敎授9.礦副敎授53.2滋讲师21.4%教辅人员敎授9.礦副敎授53.2滋讲师21.4%教辅人员2b・锻助教10.2%图2-52001年某医科大学公共卫生学院专业技术人员构成制图要求:先绘制以大小适当的圆形。由于圆心角为360度,因此每1%相当于3.6度的圆周角,将各部分百分比分别乘以3.6度即为各构成部分应占的圆周角度数。圆形图上各部分自圆的12点开始由大到小按顺时针方向依次绘制,其他置最•简单表(simpleUible)由一组横标目和一组纵标目组成,如表2-10。表2-102001年某省不同地区的卫生系统反应性评分比较地区调查人数评分均值省会城市333703.63一般城市152507.15县及乡村971679.06合计1456666.73•复合表(combinativetable)是由2组及以上的横标目和纵标目相结合起來或1组横标目和2组及以上纵标目结合起来以表达他们之间关系的统计表,如表2-1R表2-112001年某省不同地区、性别的卫生系统反应性评分比较地区男调查人数 评分均值地区男调查人数 评分均值女调查人数 评分均值省会城市217706.60116698.07一般城市100517.1552487.92县及乡村371669.88600684.74合计688659.26768673.43二、常用统计图I矢学领域中常用的统计图有条图、百分条图、圆图、线图、半对数图、直方图、散点图、箱式图与统计地图等。•绘制统计图的基本要求O根据资料的性质和分析目的决定适当的图形。O标题应说明资料的内容、时间和地点,一般位于图的下方。O图的纵、横轴应注明标目及对应单位,尺度应等距或具有规律性,一般自左而右、白上而下、由小到大。O为使图形美观并便于比较,统计图的长宽比例一般为7:5,有吋为了说明问题也可加以变动。o比较、说明不同事物时,可用不同颜色或线条表示,并常附图例说明,但不宜过多。•常用统计图的适用条件与绘制1.条图(bargraph)条图用等宽长条的高度表示按性质分类资料各类别的数值大小,用于表示他们之间的对比关系,一般有单式(图2-3)与复式(图2-4)之分.制图要求:(1) 一般以横轴为基线,表示各个类别;纵轴表示其数值大小。(2) 纵轴尺度必须从0开始,中间不宜折断。在同一图内尺度单位代表同一数量吋,必须相等。(3) 各直条宽度应相等,各直条之间的间隙也应相等,其宽度与直条的宽度相等或为直条宽度的l/2o(4) 直条的排列通常由高到底,以便比较。(5) 复式条图绘制方法同上,所不同的是复式条图以组为单位,1组包括2个以上直条,直条所表示的类别应用图例说明,同一组的直条间不留空隙。图2-32001年某省不同地区的卫生系统反应性评分比较

图2-42001年某省不同地区、性别的卫生系统反应性评分比较圆图(piegraph)圆形图适用于百分构成比资料,表示事物各组成部分所占的比重或构成。以圆形的总面积代表100%,把面积按比例分成若干部分,以角度大小来表示各部分所占的比重(图2-5)o助教02%教辅人员25.5兴助教02%教辅人员25.5兴敎授9・關讲师21.4%訓教授33.2鬲图2-52001年某医科大学公共卫生学院专业技术人员构成制图要求:(1) 先绘制以大小适当的圆形。由于圆心角为360度,因此每1%相当于3.6度的圆周角,将各部分百分比分别乘以3.6度即为各构成部分应占的圆周角度数。(2) 圆形图上各部分自圆的12点开始由大到小按顺时针方向依次绘制,其他置最绘制要求(普通线图):(1)横轴表示某一连续变量(时间或年龄等);纵轴表示某种率或频数,其尺度必须等距(或具有规律性)。(2)同一图内不应有太多的曲线,通常W5条,以免观察不清。

(3)如有几根线,可用不同的图线(实线、虚线等)来表示,并用图例说明。(4)图线应按实际数字绘制成折线,不能任意改为光滑曲线。5・直方图5・直方图(histogram)直方图用于表达连续性资料的频数分布。以不同直方(图2-8)o图2-82001年某地区居民受教育年限分布制图要求:(1) 一般纵轴表示被观察现象的频数(或频率),横轴表示连续变量,以各矩形(宽为组距)的面积表示各组段频数。(2) 直方图的各直条间不留空隙;各直条间可用直线分隔,但也可不用直线分隔。(3) 组距不等时,横轴仍表示连续变量,但纵轴是毎个横轴单位的频数。6・散点图(scatterdiagram)散点图以直角坐标系中各点的密集程度和趋势来表示两现象间的关系(图2-9)。根据点的散布情况,推测2种事物或现象有无相关,故常在对资料进行相关分析之前使用。oooooo54321oooooo54321(5图2-9某地区饮水氟含量与氟骨症患病率散点图制图要求:(2)一般横轴代表自变量或可进行精确测量、严格控制的变量,纵轴则代表与自变量有依存关系的因变量。(2)纵轴和横轴的尺度起点可根据需要设置。Excel数据处理之三方差分析第三节方差分析在数据分析工具库屮提供了3种基本类型的方差分析:单因素方差分析、双因素无重复试验和可重复试验的方差分析,本节将分别介绍这三种方差分析的应用:单因素方差分析在进行单因素方差分析Z前,须先将试验所得的数据按一定的格式输入到工作表中,其中每种水平的试验数据可以放在一行或一列内,具体的格式如图3・1,图中每个水平的试验数据结果放在同一行内。ABCDEFG1ABCD=巧试验次数2LEVEL15.565.585.545.583LEVEL25.925.905・885・884LEVELS5.425.425.405.385LEVEL45.645.625.605.646LEVEL5\、5.888.865.86.5.8679 I"图3-1数据输入完成以后,操作工具〉数据分析,选择数据分析工具对话框内的单因素方差分析,出现如图3-2的对话框,对话框的内容如下:输入区域:选择分析数据所在区域,可以选择水平标志,针对图3-1的数据进行分析时选取(绿色)和黄色区域。分组方式:提供列与行的选择,当同一水平的数据位于同一行时选择行,位于同一列时选择列,本例选择行。如果在选取数据时包含了水平标志,则选择标志位于第一行,本例选取。Q:显著性水平,一般输入0.05,即95%的置信度。图3-25. 输出选项:按需求选择适当的分析结果存储位置。按图3-2输入选项后,对图3-1的数据分析的结果如图3-3所示。

■・■・■■■■■10方差分析:单因素方差分析111213SUMMARY组观测数求和平均方差14LEVEL1422.265.5650.00036715LEVEL2423.585.8950.0003677/16LEVEL3421.625.4050.000367//17JLEVEL4122.55.6250.000367/18LEVEL5426.466.6152.2401/19/20i1JFIK(1S(]net21方差分析22差异源SSdfMSFP-valueFcrit23组间3.6516840.912922.0363440.1406813.05556824组内6.7247150.4483132526总计10.3763819图3-3双因素无重复试验方差分析与单因素方差分析类似,在分析前需将试验数据按一定的格式输入工作表屮,如图3・4所示:图3・4数据输入完成以后,操作工具〉数据分析,选择数据分析工具库屮的双因素无重复方差分析,出现如图3・5的对•话框,对话框的内容如下:输入区域:选择数据所在区域,可以包含因素水平标志。果数据输入时选择了因素水平标志,请选择标志按钮。显著性水平Q:根据实际情况输入,一般选择0.05o输出选项:按需要选择分析结果存储的位置。图3-5分析图3・4屮的数据,对话框如图3・5输入

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论