浙江大学医学统计学方差分析举例_第1页
浙江大学医学统计学方差分析举例_第2页
浙江大学医学统计学方差分析举例_第3页
浙江大学医学统计学方差分析举例_第4页
浙江大学医学统计学方差分析举例_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章方差分析方差分析(analysis of varianee, ANOV A)是R.A. Fisher提出的,是数理统计的基本方法之 一,是医学研究中分析数据的一种工具。目前各种实验设计的方法在医学领域中得到越来越广泛的应用,取得了可喜的效果。方差分析就是实验设计中分析数据的一种有效方法。方差分析主要应用范围是:两个及两个以上样本均数所代表的总体均数之间差异的比 较;同时可分析多个因素的作用;可以分析因素间的交互作用等。实际上,检验两个样本均数代表的总体均数差异的t检验是方差分析的特例。方差分析的应用条件: 各个样本来自正态总体; 各个样本是相互独立的随机样本; 各样 本代表的总体方差齐性

2、等。 方差分析可以说是检验几个样本代表的具有相同方差、相互独立的正态总体均数是否相等的问题的一种统计分析方法。第一节 单因素方差分析在医学领域中经常会遇到这样的问题,有几种不同的治疗方案,要比较它们的治疗效果;几位检验员检查同一份血样,想了解他们的检验技术是否有所不同;给药的不同时间对病人的治疗效果是否有影响。这里研究的对象:治疗方案、检验员、给药时间称为因素。当研究 的因素只有一个时, 称为单因素问题, 所做的实验叫单因素实验。相应的设计叫单因素设计(完全随机设计/成组设计),在实验研究,将受试对象按照完全随机方法分配到各处理组或 对照组之中;在抽样研究中,指研究对象从相互独立的总体中按随机

3、化的方法抽样得到。此类资料的组间总体均数的比较可以考虑用单因素方差分析(one-way ANOV A)。一、问题的提出先看一个例子。例4.1将24名贫血患者随机分为三组,分别用甲、乙、丙三种方案治疗,治疗一月后血红 蛋白变化量见表4-1,要分析三种治疗方案对贫血患者的疗效是否有差异。表4-1三种方案治疗贫血患者血红蛋白的变化量(g%)ABC0.51.42.12.3-0.21.93.72.32.0Xij2.40.7-0.31.10.21.12.71.20.93.60.00.53.2-0.40.8刀刀Xj19.55.29.033.7(刀 X)ni88824( n)2.43750.65001.125

4、0Xi1.1042( X )256.699.4215.02281.13 (刀 X )二 X ij(*资料来自:刘玉秀等主编新药临床研究设计与统计分析)从平均值来看,治疗方案不同对贫血患者的疗效是有一定影响的,但仔细观察一下数 据就会发现如下问题:(1)同一治疗方案下患者血红蛋白的变化量并不完全一样,产生这种变异的原因是由 于患者之间个体变异的存在以及由于各种偶然因素引起的随机测量误差所致。(2)不同治疗方案下患者血红蛋白的变化量并不完全一样,产生这种变异的原因包括 治疗方案的不同、患者之间个体变异的存在以及由于各种偶然因素引起的随机测量误差等。由于患者之间个体变异的存在以及由于各种偶然因素引起

5、的随机测量误差的存在,对于不同治疗方案下得到的不同疗效是由于方案不同引起的呢,还是有患者之间个体变异的存在以及由于各种偶然因素引起的随机测量误差造成的?因此,应做仔细的分析以后再下结论为好。由于治疗方案不同引起的患者血红蛋白的变化量的变异叫做处理变异。例4-1的全部24个数据,参差不齐,它们的变异叫做总变异。产生总变异的原因一是 随机测量误差,一是处理变异。方差分析解决这类问题的思想是:1. 由数据的总变异中分解出处理变异和随机测量误差,并赋予它们的数量表示。2. 用处理变异和随机测量误差在一定意义上进行比较,如果两者相差不大,说明处理的不同对研究指标的影响不大;如处理变异比随机测量误差大得多

6、,说明处理的不同影响是很大的,不可忽视。3. 选择较好的处理或确定进一步实验的方向。 因此,首要的问题是如何给变异一个数量表示。 最后再介绍两个常用的术语。1. 水平一一因素在实验时所分的等级或组分叫水平。在例4-1中,治疗方案分三个水平:A、B、C。2. 处理一一在一项实验中,同一实验条件下的实验叫做一个处理,不同实验条件下的实验叫做不同处理。在例 4-1中有三个处理。二、变异的数量表示有n个参差不齐的数据X1,X2,Xn,它们之间的差异称为变异。如何给变异一个数量表示 呢?一个最直观的想法就是用极差R表示.极差简单直观,便于计算,但是其缺点是对数据提供的信息利用不够。人们后来有想出另一种表

7、达的方法一一离均差平方和,以SS记之,n即 SS八(Xj _X)2i =4SS是每个数据离平均值有多远的一个测度,它越大表示数据间的差异越大。由于求和符号后面的部分是非负数, 所以,在同样的波动程度下,数据多的平方和要大 于数据少的平方和,因此仅用平方和来反映波动的大小还是不够的。我们要设法消去数据个数的多少给平方和带来的影响。为此引进自由度的概念。一个直观的想法是用平方和除以相应的项数,但是从数理统计的理论上可以证明这不是一个最好的办法,而应把项数加以修正,这个修正的数叫做自由度。设有n个数Xj,i=1,2,,n。如果有m个(Ow m< n)线形约束关系,并且这 m个方程是互n相独立的

8、,即方程系数矩阵的秩等于m,则S=Xi2的自由度是n-m。i很容易可以证明,对于 n个数据的离均差平方和的自由度v =n-1。这么来确定自由度似乎还是比较麻烦,对于常见的方差分析类型,在以后各节均有简单的确定自由度的方法,这里只要知道自由度的概念就行。下面引进均方的概念, 所谓均方是指一定的自由度条件下的离均差平方和。常用MS表示,即MS=SSV。其实MS亦是方差。它的值越大,说明数据变异越大;它的值越小,说明 数据变异越小。它在反映数据波动的大小更加合理。可以适用于不同组之间波动程度或说是变异程度的比较。三、单因素方差分析的基本思想和方差分析表的产生方差分析的基本思想就是把所有数据的总变异(

9、离均差平方和) 分解成几个部分,然后将各部分的变异进行比较。 在单因素方差分析中,总变异可分成组间变异和组内变异两部分。(总变异就是所有数据对总均数的离均差平方和,总变异产生的原因是处理因素和随机测量误差;组间变异包括处理因素和随机测量误差;组内变异就是包括随机测量误差。这里所说的随机测量误差也包括个体差异。)然后,把组间变异和组内变异分别除以相应的自由度得 到组间均方和组内均方。在理论上,如果H0成立,则统计量F=MS组间/MS组内应该为1;如果H0不成立,则F值大于1。反过来,我们可以从计算得到的F值大小,来推断 H0是否成立。F值究竟大于多少时,H0不成立,就要查方差分析的 F临界值来判

10、断。下面以例4-1为例来说明方差分析表的产生的基本步骤:1.建立假设并给定检验水准 aH。123 (不同治疗方案对贫血患者的疗效无影响)1 ,不等或不全相等(不同治疗方案对贫血患者的疗效有影响)H km22SS、八X厂X八X C '总二N 1 斗 j #J12' 3:-=0.052 计算F值2(1)列计算表(见表4-1下部),计算各组刀Xj, n, Xi ,、Xjj(2)计算离均差平方和 SS及自由度XjnSS,自由度'、均方MS和F值4-2表示。a)求校正数CCb)计算各离均差平方和整个计算过程可用表表4-2 单因素方差分析计算表变异来源SSMSF值P值SS组间 f

11、M S组间组间SS组间:组间=k -1 MS组间一:组间一 M s组内组内 (误差)SS组内S&内二SS -SS且间组内二匕总-组间虫&MSw-内V组内总计S S总:总二N 一1kSS且间八Ni Xi X八ni' Xijj=1Jn-c;TLc,_k_i $ Ni-组间SS&内=SS、一 SSa间,:组内=总i组间二N K本例:33.72C=47.324i 4i 42SS、八 X C =81.1300-47.3204=33.8096,:总=24-仁232 2 2(195)(52) (90)ss间888忆3204 二i3-715 组间二 3亠2SS内二 SS、一 S

12、S间=33.8096-13.7158=20.0938112.971 2,组内二24 一3 =21 代入方差分析表中(表 4-2),求出相应的MS及F值,见表4-3。3 .查F值表,确定P值,并作出推断下结论。由附表 4 查得 F 0.05(2,21)=3.47,,因 F=7.1675> 尸0.05(2,21)= 3.47,,所以 PV0.05。结论:按=0.05水准,拒绝Ho,可以认为3种不同治疗方案对贫血患者血红蛋白的 疗效是有影响。以上方差分析的结果常以方差分析表的形式表达,如表 4-3所示。表4-3 表4-1资料的方差分析表变异来源SSVMSF值P值组间13.715826.8579

13、7.1675<0.05组内20.0938210.9568总33.809623第二节 双因素方差分析一、问题的提出在医学研究中,影响我们所关心的某个研究指标的因素往往不止一个,而是许多因素。它们相互联结,相互渗透,相互对立,又相互依存。随着因素的增多,要透过表面现象抓住事物的本质,揭示出事物发展的内部规律就愈加困难,这里有两个方面的问题: 一是如何进行实验设计,使得实验次数既少,获得的信息又多;一是如何分析数据。多因素实验最简单 的设计是全面实验,即把每个因素的水平一切可能的组合都做一遍,这种方法的优点是揭示事物内部的规律性比较清楚。但是,全面实验一般实验次数太多,当因素较多时,在实际上是

14、行不通的,因此是不值得提倡的。当只有两个因素时, 我们一般采用随机区组设计、交叉设计、析因设计等等。先看下面三个例子:4窝不同种系的大白鼠例4-2为研究注射不同剂量雌激素对大白鼠子宫重量的影响,取表4-4大白鼠注射不同剂量雌激素后的子宫重量/g合计缝合方法1个月2个月1030(b=4),每窝3只,随机地分配到3个组内k=3)接受不同剂量雌激素的注射,然后测定其 子宫重量,结果见表 4-4。问注射不同剂量的雌激素对大白鼠子宫重量是否有影响?大白鼠7r 、 BT Xj' iy 丿种类0.20.40.80A106116145367B4268115225C70111133314D4263871

15、92n °缝合后时间)44412(N )E65.089.5120.091.5(X )bTV"J壬2603584801 098 近 X )bQT Xjj壬19 66434 37059 508113 542吃 X?)(*资料来自徐勇勇主编医学统计学)例4-3为了研究蒸馏水的PH值和硫酸铜溶液浓度对化验血清中白蛋白与球蛋白的影响,将蒸馏水PH值和硫酸铜浓度分成如表4-5所示的水平进行实验:表4-5蒸馏水的PH值和硫酸铜溶液浓度两因素的水平分组情况水平因素1234PH值5.405.605.705.80硫酸铜浓度0.040.080.10实验米取交叉分组,即同一种血清,在不同的PH值和

16、不同的硫酸铜浓度配比之下各做一次,实验结果(白蛋白与球蛋白之比)如表4-6所示:表4-6血清实验结果(白蛋白与球蛋白之比)PH值硫酸铜浓度5.405.605.705.800.043.52.62.01.40.082.32.01.50.80.102.01.91.20.3对于这样一个实验该如何分析?例4-4将20只神经损伤的家兔随机等分4组,分别用两种神经缝合方法、在缝合后两个时间观察缝合后神经的轴突通过率,试验结果见表4-7。试进行统计分析。表4-7家兔神经缝合后轴突通过率(%)A雌激素剂量/ug *100g10403070外膜缝合5060103010502050束膜缝合307050603030(

17、*资料来自郭祖超主编医学统计学)以上三个例子,均是研究两个因素对观察指标的影响情况的问题,但是从设计角度来看,是稍微有点不同的, 例4-2的设计是随机区组设计(randomized block design )又称配伍组设计。这种设计相当于配对设计的扩大。具体做法是将受试对象按性质(如实验动物的性别、 体重,病人的性别、年龄及病情)相同或相近者组成b个单位组(配伍组),每个单位组中有k个受试对象,分别随机地分配到 k个处理组。这样,各个处理组所用受试对象不仅数量 相同,生物学特点也较均衡。例4-3是利用交叉分组无重复设计,方法是:先将两个因素的各个水平全面组合,然后在不同组合条件下只做一次实验

18、。而例4-4所采取的是交叉分组有重复设计,即析因设计,方法与交叉分组无重复设计基本相同,不同之处就在于在不同组合条件下是进行重复实验的,即实验次数不止一次。对于以上不同的设计情况,其分析数据的方法也各不相同,但是其基本思想大多来自方差分析,所以方差分析是分析双因素数据的一个基本方法。二、无交互作用的双因素方差分析象例4-2随机区组设计资料,或者例 4-3交叉分组无重复设计的资料,均可以使用无交互作用的双因素方差分析的方法。其基本思想类似于单因素的方差分析的方法,将总变异分解成处理变异、区组变异和误差(或者说:因素1的变异、因素2的变异和误差)。下面以例4-2为例介绍其方差分析的步骤-(雌激素对

19、大白鼠子宫重量无影响);0123H/ /不等或不全相等(雌激素对大白鼠子宫重量有影响);11 '2 '3 - 0.012 计算F值列方差分析表,计算各离均差平方和SS,自由度;,均方MS和F值。表4-8随机区组设计的方差分析计算表SSMS处理处理二 k -1MS处理 SS处理处理F处理MS处理MS误差区组二b 1SS组SS组区组F区组 MS区组MS区组SS误差误差S9差二SS、一 SS理-、S误差区蛋' 总一处理一区组 MS误差=N - k 一 b 1误差总计SS、=N -117fb、瓦X ijli =1丿k区组二 b -1处理组间离均差平方和 s$理及自由度、处理的计

20、算与单因素方差分析的一样,单位组间离均差平方和按下式计算:b 2SS立八k X j - x八j 生j =1各部分均方的计算方法也同完全随机设计资料。注意,在计算f处理值时,分母是误差均方MS误差,分子是MS处理。本例:C= 1098 2 =100 467,12SS、 = 113 542 -00 467=13 075 ,2 2 2SS理二 260一358480 -100 467=6 074SS且2 2 2 2367 225 314 1923-100 467 =6 457.67S3差工 13 075-6 074-6 457.67=543.33。列方差分析表:按表 4-8填入离均差平方和并计算相应的

21、自由度;、均方MS和F值,得表4-9。变异来源SSVMSF值P值处理6 074.0023 037.0033.540.01区组6 457.6732 152.5623.77<0.01误差543.33690.55总计13 075.0011表4-9例4-2资料方差分析3 .查F值(附表4)表,确定P值,下结论本例+处理=2 ,”误差二6 ,查附表4得,F0.01(2,6)= 10.92,因F 处理 > F 0.0i(2,)= 10.92,所以 P 0.01 。结论;按=o.oi水准,拒绝 h 0,可以认为3个剂量组的大白鼠子宫重量的差别具 有统计学意义,即注射不同剂量的雌激素对大白鼠子宫的

22、重量有影响。若想进一步了解哪两组间有差别,可进行多个均数的两两比较,具体见本章第三节。随机区组设计在进行方差分析时将区组间的变异从组内变异中分解出来,当区组之间差异有统计学意义时,其误差较完全随机设计小,使试验效率提高。三、有交互作用的双因素方差分析在一些实验中,不仅因素对研究指标有影响,而且因素之间还会联合起来对研究指标产生作用,这个联合的作用叫做交互作用。先看先面两个实验:A1A2A1A2B125B125B2710B273左边一个实验,当A从A1变化到A2时,研究指标都增加3,与B取B1或B2无关;同样,B从B1变化到B2时,研究指标都增加5,与A的水平无关,即A2-A1B2-B 1B13

23、A15B23A25我们将A与B没有交互作用。而右边一个实验情况则大不一样,且看A2-A1B2-B 1B13A15B2-4A2-2这就是说,因素A对指标的影响与 B取什么水平有关,因素B对指标的影响与 A取什 么水平也有关,这时我们就称 A和B之间有交互作用,记作 A X B。现在以例4-4的资料为例来介绍最简单的2 X 2析因设计方差分析。所谓2X 2析因设计(factorial experiment),就是有G个处理组由2个因素(每个因素 有2个水平)全面组合而成,对此就有4个处理组。然后,采用完全随机设计安排4个处理组。2X 2析因设计方差分析的基本思想:是在前面单因素方差分析和无交互作用

24、的方差分 析的基础上对误差进一步分解。将总变异分解成因素A的变异、因素B的变异、交互作用AX B的变异和误差四项。注意: 2X2析因设计实验要求各组例数相等,每组例数不少于2例,否则无法分析因素之间的交互作用。2X 2析因设计方差分析的基本步骤:1. 建立假设和给定检验水准H 0:神经缝合方法对缝合后神经的轴突通过率无影响H 1:神经缝合方法对缝合后神经的轴突通过率有一定的影响H 0:缝合后时间对缝合后神经的轴突通过率无的影响H1:缝合后时间对缝合后神经的轴突通过率有一定的影响H 0:神经缝合方法和缝合后时间无交互作用H神经缝合方法和缝合后时间有交互作用,/. =0.052. 按表4-10 2

25、 X 2析因设计的方差分析表计算表4-10 2 X 2析因设计的方差分析表变异来源VSSmsfp处理间31 2SStr=Ti _Cr主效应a11 八 2"2SSa=A1 ' A22r-CMS aFa= MS a/ MSeB11 4 2 = 2 SSb=B1' B22r-CMSbFb= MSb/ MSe交互作用A X B1SSab =SStr -SSa-SSbMS abFab =MS ab/MSe误差N-4SSe=SSt-SStrMSe合计N-12SSt=匕 X -C注:A1、A2表示A因素两水平的小计;B1> B2表示B因素两水平的小计,Tj(i=1,2,3,4

26、)为4个处理组小计;r为每组的例数;c=' X 2N本例中,i=j=2,r=5,T i=120,T2=220,T3=140,T4=260,Ai=340,A2=400,Bi=260,B2=480,代入表4-10,得到表4-11的结果表4-11例4-4析因实验的方差分析表变异来源ssVmsFP处理26203a18011800.60>0.05B2420124208.07<0.05A X B201200.07>0.05误差480016300总7420193. 查F临界值表,确定P值4. 推断下结论。根据表4-11结果,在=0.05的水准下,只有缝合时间(B因素)对神经的轴突通

27、过率 有影响。第三节 多组间的两两比较当方差分析结果为p<0.05时,只说明k组总体均数之间不同或不完全相同。若想进一步了解哪两组的差别有统计学意义,需进行多个均数间的两两比较或称均数间的多重比较 (multiple compariso n)。若用上一章学习的两均数比较的t检验进行多重比较,将会加大I类错误的概率,从而可能把本无差别的两个总体均数判为有差别。例如,有4个均数,两两组合数为 C42=6,若用t检验做6次比较,且每次比较的检验水准选为二=0.05,则每次比较不犯I类错误的概率为(1-0.05 ), 6次均不犯I类错误的概率为 (1-0.05) 6,这时, 总的检验水准为1-(

28、1-0.05) 6=0.26,比0.05大多了。因此,均数间的多重比较不能直接用 两均数t检验的检验水准和标准误。多重比较检验的方法很多,如最小显著差异检验(Least significant differenee test,LSDtest)、Duca n 多界值检验(Ducan 'multiple range test),亦称 Duncan 新法、Newma n-Keuls 检 验(Student-Newman-Keuls test,SNK test)、Tukey 检验(Tukey ' honest significant differenee test,HSD test)、

29、Scheffe 检验(Scheffe'test)和 Dunnett 检验(Dunnett test)等,这些方法的 原理基本相似,不同的是其检验界值有所不同,SNK检验的敏感性居中。没有一种检验在任何情况下都是最好的。目前对多个均数两两之间的全面比较,最常选用SNK检验法;LSD检验法适用于一对或几对在专业上有特殊意义的均数间差别的比较;Dunnett检验法适用于几个处理组与一个对照组均数差别的多重比较,该检验有专门与之对应的检验临界值。另外还可以通过校正检验水准Bonferroni校正检验(Bonferroni correction test )。下面介绍四种多重比较的常用方法: S

30、NK检验、LSD检验、Dunnett检验和Bonferroni校正检验法。1、SNK检验SNK检验,亦称q检验。检验统计量q的计算方法见下式XiXj其中M S误差'丄+丄)2 e nj 丿式中,X i , ni为第i组的样本均数及样本例数,x i , ni为第j组的样本均数及样本例数,m s误差为方差分析表中的误差均方。完全随机设计资料,m s误差即是m s组内。例4-6 续例4-1。试比较3种治疗方案疗效两两之间的差别。i.建立假设并确定检验水准:H 0 :J j (即任两对比组的血红蛋白含量的总体均数相等);H1:J j (即各对比组的血红蛋白含量的总体均数不等或不全相等);:=0

31、.052 计算q值将3个样本均数从小到大排列,并赋予秩次:均数0.65001.12502.4375组别B万案C万案A万案秩次123列出对比组(见表4-16 第(1)栏),并计算两对比组均数之差的绝对值(见表4-16第(2)栏)。如第一行两对比组均数之差的绝对值为:|0.6500-1.1250| =0.475。 写出两对比组所包含的组数:-(见表4-16第(3)栏)。如第2行,1与3比,包含了 1,2,3三个组,故=3。 计算检验统计量 q值。本例已求得 MS误差=0.9568 (见表4-3),又各组列数均为10,所以,由公式4-5计算q值,其中sx=y警(8+8卜0.3458。结果见表4-16

32、第(4)栏。表4-163个均数两两比较q值表比较组秩次XiXjaqP值(1)(2)(3)(4)(5)1 , 20.475021.374>0.051 , 31.787535.169<0.012, 31.312523.796<0.053.查界q值表(附表5),确定P值,下结论已知、.误差二21,查附表5,=2 时,q=2.95 ;0.05(20,3)=3 时,q3.58 ,q4.64。0.05(20,3)0.01(20,3)以实际的q值和相应的q界值做比较,确定对应的P值(见表4-16第(5)列)。结论:按=0.05水准,除了 1与2组外均拒绝H。,可以认为血红蛋白上升克数在A方

33、案和B方案、A方案和C方案之间有统计学意义,而B方案和C方案之间没有统计学意义。2、LSD检验LSD检验,即最小显著差异(Least significant differenee ) t检验。其统计量 t的计算 公式为:XiXjSr巳误差其中,MS误差注意,这里的LSD检验中t统计量的计算公式与成组设计两样本均数代表的总体均数比较的t检验公式是不同的,区别就在于两样本均数差值的标准误S和自由度的计X i -X j算上,在成组设计两样本均数代表的总体均数比较的t检验公式里是用合并方差s2来计算,v =ni n2 - 2,而这里是用方差分析表中的误差均方MS误差来计算XiX误差3、Dunnett

34、检验Dunnett检验,检验统计量为 q ', q 的计算公式如下Xi-X。Sx-x;其中SXi杀In n。丿这里,Xni分别为第i个实验组的样本均数和样本例数,X。,n。分别为对照组的样本均数和样本例数。4、Bonferroni校正检验多重比较的次数不多(如不超过 5次)时,可以考虑用 Bonferroni校正检验的方法。假 设原来所给的检验水准为,所用的检验统计量是成组设计的两样本比较的t (或u)统计量,需要进行两两比较的次数为m次,则单次的两两比较应以:-/m作为检验的实际水准,这种校正方法称为Bonferroni校正检验。例如,3组均数之间的两两比较,原定=0.05,现在进行

35、了 3次t检验,则其每次t检验的检验水准该取 :/3=0.0167,而不是0.05。第四节方差分析中的若干问题一、题的提出前面已介绍了方差分析的一些常见的一些常见类型,以及这些类型的分析方法。在医学研究的实际问题中有时会提出许多如下的问题:数据缺失了怎么办?数据不符合方差分析的模型怎么办?当某个因素是有统计学意义时,能否进一步判断这个因素的各水平之间两两也有统 计学意义,等等。以上这些问题,就在本节中展开讨论。二、数据的处理方差分析的数据一般都是通过精心安排的试验而获得的,当研究因素超过一个时,要求的数据很整齐的,否则分析时会带来很多麻烦。有时,某些试验不幸做坏了,或者数据丢失了,客观条件不允

36、许重做。 例如,在实验中,一只实验动物不是处理之故而生病或突然死亡, 或由于测量仪器发生故障, 致使实验数据发生缺失,这时就要考虑有无统计学方法进行弥补。 弥补数据可以有各种各样的原则,最常用的是使SSe达到最小的办法。 下面分两种情况进行讨论1、 试验有重复,并且每个处理至少有一个数据没有缺失。这种情况最简单,既然每种处理都有数据,那么缺失的数据就是同处理而没有丢失数据的平均值来代替。如果总共丢失了m个数据,则误差的自由度等于原误差自由度减去m,2、 有些处理的数据缺失。这种情况主要以随机区组设计和正交设计为多见。即补上去的m个数不能算在自由度之内。C大白鼠,剂量0.2和B大白鼠,剂量0.4

37、对应的两个数据缺失,分别记为a和b,按表4-12进行计算。表4-12大白鼠注射不冋剂量雌激素后的子宫重量/g大白鼠 种类雌激素剂量/ugJ*100g3、Xij0.20.40.80i =4A106116145367B42b115157+bCa111133244+aD4263871924- X ij j 1190+a290+b480960+a+b2由表 4-12 得, C=( 960+a+b) /121 2 2 2SStr=x (190+a) +(290+b) +480 -C先看一个例子,假如例4-2中缺失了1 2 2 2 2SSb=x 367 +(157+b) +(244+a) +192 -C42 2 2 2 2SSt=106 +116 + +87 +a +b -CSSe= SSt- SStr- SSb现在SS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论