第7章方差分析⑵

上传人：辰*** IP属地：江苏上传时间：2023-07-30 格式：PPT 页数：283 大小：10.56MB 积分：28 举报 版权申诉

已阅读5页，还剩278页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

试验统计学主讲黄成达试验统计学第四章概率论与数理统计的基础知识本课程使用区靖祥编著的《试验统计学》一书作为课本。全程为50学时，占2.5学分。第二章常用的试验设计第三章试验数据的整理第五章参数区间估计第八章常用试验设计的资料分析第六章统计假设测验第七章方差分析第九章直线相关与回归第一章绪论第十章协方差分析第二节处理平均数间的多重比较第一节方差分析的基本原理第三节方差分量的估计第七章方差分析第四节单向分类资料的方差分析第五节两向分类资料的方差分析第六节系统分组资料的方差分析第七节方差分析的基本假设和数据转换二、组内观察值数目不等的单向分类资料

单向分类资料(one-wayclassifications)是指那些只含有一个可控因素的资料。通常这个可控因素也就是考察因素。根据具体的数据结构又分为两种情况：第四节单向分类资料的方差分析一、组内观察值数目相等的单向分类资料二、每处理组合内有多于一个观察值的两向分类资料

两向分类资料(two-wayclassifications)是指那些含有两个可控因素的资料。根据具体的数据结构又分为两种情况：第五节两向分类资料的方差分析一、每处理组合内只有一个观察值的两向分类资料

在动物学的试验中，由于每一个母本不可能同时与若干个父本交配，所以不能采用交叉式设计的杂交方式，转而使用另一种被称为巢式设计（nesteddesign）的杂交方案。巢式设计的杂交方案以及相类似的试验设计所取得到数据资料称为系统分组的资料(hierarchalclassification)。第六节系统分类资料的方差分析本节介绍对最简单的系统分组的资料的统计分析方法，这类资料为组内又分亚组的单向分类资料方差分析的三个基本假定：第七节基本假设和数据转换在结束本章之前，再稍微详细地讨论一下这些假定。⑴

数据中的各种效应应该具有“可加性”；⑶

所有处理应该具有相同的误差方差，即具有“同质性”。⑵

误差应该是“随机、独立”的，并且具有“平均数为0、方差为的正态分布”；方差分析的三个基本假定：第七节基本假设和数据转换那么，怎么样的数据是可加性的呢？⑴

数据中的各种效应应该具有“可加性”；线性可加模型是方差分析的基础，只有当数据具有可加性时，总平方和才能分解为各项平方和之和；并且，由于数据具有可加性，又必然导致各项效应之和为0，所有误差之和为0。以单向分类资料为例，因为数学模型为：，因此才有：和，即SST＝

SSt＋

SSe。也因此有。此式左边为0，因此右边自然也应该等于0。于是有和。表7.63可加性资料与非可加性资料的比较(a)可加性资料(b)倍加性资料(c)对倍加性资料取对数后处理分组处理分组处理分组121212A1020A1020A1.001.30B3040B3060B1.481.78方差分析的三个基本假定：第七节基本假设和数据转换⑵

误差应该是“随机、独立”的，并且具有“平均数为0、方差为的正态分布”；

首先，在数学模型中的误差效应必须是随机的，因为数据中的k个处理仅仅是从所研究的k个总体中随机抽取出来的k个样本，而F测验正是通过样本统计量对总体参数进行判断的手段。

其次，在观察这个个体时的误差与观察另一个个体时的误差应该是无关的，即误差彼此之间是相互独立的。前面已讨论过，计算F值的两个方差，所来自的（亚）总体应该是正态分布的。方差分析的三个基本假定：第七节基本假设和数据转换因为在方差分布中将k个样本的“组内平方和”和“组内自由度”合并为整个试验的“组内平方和”和“组内自由度”，并利用它们算出的“组内均方”来估计试验误差，其前提必须是各处理的方差是相等的，不相等怎么能合并呢？资料中各组的方差是否相等可以通过Bartlett卡方测验来检验。⑶

所有处理应该具有相同的误差方差，即具有“同质性”。当试验资料不符合上述假定时要先对数据进行一些适当的处理，然后用经过处理的数据进行方差分析。第七节基本假设和数据转换常用的数据变换方法有四种，分别适用下述的四种情况：

㈠剔除一些表现“特殊”的观察值、处理或重复。㈡用同一个体或小区的重复观察值的平均数进行方差分析。㈢对需要分析的资料进行研究，了解它们不符合哪个基本假定，然后针对性地采用下述数据转换方法中的一种，先对数据进行某种尺度变换，用经变换的数据进行方差分析(及多重比较)，而在对分析结果进行解释时，再反代换为原来的尺度。第七节基本假设和数据转换⑴

当数据的时，各观察值的方差近似与其平均数成比例关系：即平均数越大，方差越大。这时宜采用平方根转换，即当有部分观察值小于10时，采用公式：或服从泊松分布的计数资料宜采用这种转换。通常认为计数资料，如每一个显微镜视野中的细菌数、每土方中的昆虫幼蛹数等，都服从泊松分布。第七节基本假设和数据转换服从二项分布的百分数资料宜采用这种变换。例如昆虫死亡率、产品合格率、种子发芽率等都属于这种资料。请注意上式方根号内xijk是百分数，例如当xijk＝75.5%时，x’ijk＝60.33。⑵

当数据的时，宜采用反正弦转换，即。有些百分率不是用计数数据换算得到的，而是用度量数据换算得到的，如玉米种子中的蛋白质含量、花生油中的不饱和脂肪酸含量等，不应当作离散性随机变量看待。不必要采用反正弦代换。第七节基本假设和数据转换当资料不近似服从正态分布或资料不接近于加性模型时，宜采用这种转换。⑶

当数据的时，各观察值的方差近似与其平均数的平方成比例关系。这种资料宜采用对数转换。即当有部分数据小于10时，采用公式：第七节基本假设和数据转换⑷当数据的时，各观察值的标准差近似与其平均数的平方成比例关系。这种资料宜采用倒数转换，即，当有部分数据小于10时，采用公式。第七节基本假设和数据转换如果能事先把您的离散型数据的各处理平均数和方差计算出来，看看它们之间的关系，就可以很容易地决定采用何种尺度变换方法。如果无法决定那种变换更加合适时，可以只变换少数几种处理的数据（这种处理的原数据最好能包括有大、中、小的数字），然后再看看经变换的数据的平均数与方差间有没有上述的关联性，这些关联性最小的那一种变换往往就是最好的变换方法。例7.14五个病人在三种不同室温下淋巴细胞玫瑰花簇形成率（按200个淋巴细胞计算）如表7.64所示。试测验不同室温下这种形成率之间是否有显著差异。黄成达编制黄成达编制31.255.235.415.055.534.5516.065.534.5440.049.034.0336.058.034.0249.048.040.0130~37oC20~25oC4~6oC室温

病人编号

表7.64

不同室温下淋巴细胞玫瑰花簇形成率（%）

黄成达编制黄成达编制黄成达编制黄成达编制4~6oC54321病人编号

表7.65

经反正弦代换后的数据(

)

33.378648.014336.501935.638222.786548.157735.970437.859423.578254.029635.970439.775739.231544.427035.668540.714036.869949.603435.668542.504144.427043.853839.231530~37oC20~25oC室温

黄成达编制黄成达编制黄成达编制黄成达编制

1049.223814总变异

46.3924371.13918误差

0.452320.982183.92834病号间8.64914.45906.4036*297.0782594.15642室温间F0.01F0.05FMSSSdf变异表7.66

例7.14的方差分析表

黄成达编制15.230314.43835.004.74310.32619.93023.393.262LSR0.01LSR0.05SSR0.01SSR0.05g表7.67

查得的SSR值及各种LSR值的计算

表7.68

对不同室温的进行比较的梯形表

室温33.378630~37oC3.123336.50194~6oC11.5124*14.6357*48.014320~25oC平均数黄成达编制

人类T淋巴细胞表面具有绵羊红细胞(SRBC)的受体，故能与SRBC结合形成花环，目前常用E花环；目前常用E花环形成试验来检测T淋巴细胞数量，作为了解人体细胞免疫功能状态的指标之一，总E花环（Et）试验应用最广，反映T细胞活性的是活性花环试验(Ea)。E-花环试验作为体外测定细胞免疫方法之一，其形成百分率下降是细胞免疫功能降低的反映，临床上已用于恶性肿瘤、白血病、自身免疫性疾病、免疫缺陷病、器官移植排斥反应等方面的研究，作为了解这些疾病患者机体细胞免疫状态、预后及疗效观察的指标。T淋巴细胞玫瑰花环：左.（甲紫染色，800×)：可见2个被羊红细胞包围而形成玫瑰环的T淋巴细胞；右.（吖啶橙染色）：图中可见3个染成橙黄色荧光的T淋巴细胞被羊红细胞所包围。淋巴细胞玫瑰花环电镜照片ClassisOverThankYou一、组内观察值数目相等的单向分类资料

如果资料中含有k组数据，每组含n个观察值，全部共有nk个观察值。那么，此类资料观察值的数学模型为：（i＝1，2，…，k，j＝1，2，…，n）因此总变异分解为两大部分：组间变异和组内变异。方差分析表如表7.14所示。黄成达编制黄成达编制dfT＝nk－1总变异MSedfe＝k(n－1)误差F＝MSt/MSeMStdft＝k－1组间随机模型固定模型期望均方(EMS)F值均方平方和自由度变异来源表7.14

组内观察值数目相等的单向分类资料的方差分析表

事实上，在前几节中所举的例子都是这种资料。这里，我们另举一个例子，并且把整个计算过程系统地陈述一遍。以后在各种不同试验设计的分析方法中，也都将按这样的方式进行陈述。

例7.7

在一个塑料大棚内进行番茄无土栽培试验，全部采用同一品种，5种不同的培养液，每种培养液观察4株。试验指标为单株产量，结果如表7.15所示，如果培养液的效应为固定模型，试对5种培养液的效应进行显著性测验。⑴数据整理：黄成达编制黄成达编制黄成达编制265520013898520总和20640016228021162221E3115376386812427333331D2812544315411230252730C24921623189626212425B2711664293610826283024A观察值培养液表7.15

番茄无土栽培试验的产量数据⑵平方和及自由度的分解：总自由度dfT

＝观察值总数－1＝20－1＝19处理间自由度dft＝处理数－1＝5－1＝4误差自由度dfe

＝dfT－dft＝19－4＝15

矫正数C.T.

＝总和平方／观察值总数＝5202/20＝13520总平方和=13898-13520=378总平方和=各观察值的平方之和－C.T.

处理间平方和=55200/4-13520=280误差平方和＝378－280＝98误差平方和=总平方和–各项已知因素的平方和将各项自由度和平方和填入方差分析表。黄成达编制37819总变异6.5339815误差4.893.0610.72**702804处理间F0.01F0.05F均方平方和自由度变异来源表7.16

例7.7的方差分析表⑷多重比较（以Duncan法为例）：①计算标准误：

其中MSe为方差分析表中的误差均方；

n是计算所比较的平均数时用到的观察值数目。

②

查表并计算各种LSR值（误差自由度dfe

=15）：黄成达编制5.854.234.583.3155.754.154.503.2545.584.044.373.1635.323.854.173.012LSR0.01LSR0.05SSR0.01SSR0.05g表7.17

查得的SSR值及各种LSR值的计算3.列梯形表进行比较：黄成达编制5.854.234.583.3155.754.154.503.2545.584.044.373.1635.323.854.173.012LSR0.01LSR0.05SSR0.01SSR0.05g表7.17

查得的SSR值及计算得到的LSR值黄成达编制黄成达编制20E4*24B37**27A148**28C347**11**31D平均数处理表7.18

多重比较的梯形表⑸作统计推断：黄成达编制黄成达编制20E4*24B37**27A148**28C347**11**31D平均数处理表7.18

多重比较的梯形表①

培养液D与培养液E、B之间有显著差异(α=0.01)；②培养液C、A与培养液E之间有显著差异(α=0.01)

；③培养液B与培养液E之间有显著差异(α=0.05)

；

。④其余各处理平均数之间没有显著差异。二、组内观察值数目不等的单向分类资料

如果资料中含有k组数据，其中第i组含ni个观察值，全部共有个观察值。此类资料观察值的数学模型为：（i＝1，2，…，k，j＝1，2，…，ni）因此总变异分解为两大部分：组间变异和组内变异。方差分析表如表7.19所示dft＝k-1黄成达编制黄成达编制黄成达编制SSTdfT总变异MSeSSedfe误差F＝MSt/MSeMStSStdft组间随机模型固定模型期望均方(EMS)F值MSSSdf变异来源表7.19

组内观察值数目不等的单向分类资料的方差分析表其中为各组样本含量的调和平均数，即但是如果利用随机模型对进行估计，即时，可能会出现方差估计值为负的奇怪现象。这时可以使用

代替进行计算。各组内观察值数目相等的试验资料称为平衡资料；各组内观察值数目不等的试验资料称为不平衡资料。利用平衡资料所得到的参数估计值是无偏的，利用不平衡资料所得到的参数估计值不是无偏的。一般地说，如果是经过精心设计来安排试验的话，应尽可能安排平衡试验，避免采用不平衡试验设计。如果是进行一些野外调查，由于特殊条件的要求或限制，不得不采用不平衡设计时，仍应特别注意估计结果的有偏性。例7.8调查四个水库中的氯离子浓度，按水库的水面面积大小取不同数目的样本。数据如表7.20所示，如果各水库的效应为固定模型，试测验各水库间氯离子的浓度之间是否有显著差异。表7.20

四个水库氯离子浓度的数据资料水库观察值

Ⅰ12131415141614

Ⅱ910889109

Ⅲ92101112131211

Ⅳ141011121312黄成达编制黄成达编制3603371131328总和12864874726

Ⅳ10800884808

Ⅲ9567571637

Ⅱ1413721382987

Ⅰni水库表7.20

四个水库氯离子浓度的数据资料的整理⑴数据处理：⑵平方和及自由度的分解：总自由度dfT

=观察值总数–1=28–1=27处理间自由度dft

=处理数–1=4–1=3误差自由度dfe

=dfT–dft

=27–3=24矫正数C.T.=总和平方/观察值总数=3132/28=3498.8929总平方和=3711－3498.8929=212.1071处理间平方和＝3603－3498.8929＝104.1071误差平方和=212.1071－104.1071=108⑶列方差分析表：表7.21

例7.8的方差分析表变因自由度平方和均方FF0.05F0.01处理间3104.107134.70247.712**3.014.72误差24108.00004.5000

总变异27212.1071

⑷多重比较（以Duncan法为例）：①

先计算样本容量的调和平均数或：②

计算标准误：表7.22查得的SSR值及各种LSR值的计算gSSR0.05SSR0.01LSR0.05LSR0.0122.923.962.3533.19233.074.112.4743.33743.154.242.5393.417③

查表并计算各种LSR值（误差自由度dfe=24）如表7.22所示：a.第Ⅰ号水库与第Ⅱ、Ⅲ号水库的氯离子浓度有极显著差异；b.第Ⅱ号水库与第Ⅳ号水库的氯离子浓度有显著差异；c.其余各水库的氯离子浓度之间没有显著差异。④

列梯形表进行比较：黄成达编制黄成达编制黄成达编制9Ⅱ110Ⅲ23*12Ⅳ24**5**14Ⅰ平均数处理表7.23

例7.8的多重比较梯形表⑤

作统计推断：一、每处理组合内只有一个观察值的两向分类资料如果资料中有两个可控因素A和B，其中A有a个水平，B有b个水平，于是共有ab个处理组合。每个处理组合含1个观察值，全部共有ab个观察值。为了陈述上的方便，将数据结构列出如表7.24所示。其中处理组合AiBj的观察值记为xij；第i个A水平的观察值之和及平均数分别记为，第j个B水平的观察值之和及平均数分别记为，全部观察值的总和及平均数分别记为黄成达编制黄成达编制黄成达编制黄成达编制黄成达编制…………xab…xaj…xa2xa1Aa………………………xib…xij…xi2xi1Ai………………………x2b…x2j…x22x21A2x1b…x1j…x12x11A1Bb…Bj…B2B1B因素(j)A因素(i)表7.24

每处理组合只含一个观察值的两向分类资料此类资料观察值的数学模型为：(i＝1，2，…，a；j＝1，2，…，b)因此总变异分解为三大部分：A因素各水平间的变异B因素各水平间的变异剩余的变异(即误差变异)。方差分析表如表7.25所示。表7.25

每处理组合内只有一个观察值的两向分类资料的方差分析表变异来源自由度平方和均方期望均方(EMS)固定模型随机模型混合模型A间dfASSAMSAB间dfBSSBMSB误差DfeSSeMSe总变异dfTSSTdfA＝a－1dfB＝b－1dfe＝(a－1)(b－1)dfT＝ab－1表中列出了固定模型和随机模型的期望均方，如果两个处理效应中有一个(如A)为固定，另一个(如B)为随机，则其模型称为(A固定B随机的)混合模型(mixedmodel)。对各效应进行F测验时采用的F值计算公式应视各项均方的期望值而定，例如在固定模型中，测验A间差异时，F＝MSA/MSe，测验A间差异时，F＝MSB

/MSe。例7.9

六个水稻品种(A1、A2、A3、A4、A5和A6)栽植在四种不同的土壤类型(B1、B2、B3和B4)中，产量数据如表7.26所示，如果品种和土壤类型都是固定效应，试对资料进行适当的分析。黄成达编制黄成达编制黄成达编制6361.563.065.062.5151236937839037562.5063.2563.5061.7566.2560.75250253254247265243表7.26

例7.9的产量资料及数据整理59626564A664626562A561626764A460636460A365686765A260616260A1B4B3B2B1土壤类型（B）品种（A）⒈数据处理：如表7.26所示⒉

平方和及自由度的分解：总自由度dfT=观察值总数–1=24–1=23品种间自由度dfA

=品种数–1=6–1=5土壤类型间自由度dfB

=土壤类型数–1=4–1=3误差自由度dfe=dfT

–dfA–dfB=23–5–3=15误差平方和=142–71–39=32⒊列方差分析表：变异来源自由度平方和均方FF0.05F0.01品种间57114.2006.656**2.9014.556土壤类型间33913.0006.094**3.2875.417误差15322.133总变异23142表7.27

例7.9的方差分析表统计推断：品种间差异极显著；土壤类型间差异也极显著。⒋多重比较在本例中，品种和土壤类型都是固定效应；F测验表明，品种间差异极显著，因此要对不同品种的平均数进行多重比较；同时土壤类型间差异也极显著，如果研究目的要求对土壤差异进行分析，也应对它进行多重比较。现以Duncan法为例说明之。⑴

对品种间差异的多重比较：①

计算标准误：其中b为每品种的观察值数目，在本题为土壤类型种类数。②

查Duncan表得SSR值并计算各种LSR值

(误差自由度dfe

=15)如表7.28。表7.28

查得的SSR值及各种LSR值的计算gSSR0.05SSR0.01LSR0.05LSR0.0123.014.172.203.0533.164.372.313.1943.254.502.373.2953.314.582.423.3463.364.642.453.39③

列梯形表进行比较，如表7.29所示。60.75A11.0061.75A30.751.7562.50A60.751.502.50*63.25A50.251.001.752.75*63.50A42.75*3.00*3.75**4.50**5.50**66.25A2平均数品种

表7.29

对品种平均数的进行比较的梯形表④

根据多重比较做出统计推断：品种A2的产量最高，并且与其它所有品种之间都有显著或极显著差异；b.品种A4与品种A2、品种A1间有显著差异；c.品种A5与品种A1间有显著差异；d.其余各品种之间没有显著差异。⑵

对土壤类型间差异的多重比较：①

计算标准误：其中a为每土壤类型的观察值数目，在本题为品种的数目。②

查Duncan表得SSR值并计算各种LSR值

(误差自由度dfe

=15)如表7.30。表7.30

查得的SSR值及各种LSR值的计算gSSR0.05SSR0.01LSR0.05LSR0.0123.014.171.792.4933.164.371.882.6143.254.501.942.68③

列梯形表进行比较，如表7.31所示。61.5B4162.5B10.51.563.0B32*2.5*3.5**65.0B2平均数土壤类型表7.31

对土壤类型平均数进行比较的梯形表④

根据多重比较做出统计推断：土壤类型B2与其它所有类型之间都有显著或极显著差异；b.其余土壤类型之间没有显著差异。如果土壤类型虽然是可控因素，但不是考察因素，那么，尽管土壤类型之间的F测验显著也可以不进行多重比较（因为你对它的差异与否不感兴趣）。二、每处理组合内有多于一个观察值的两向分类资料如果资料中有两个可控因素A和B，其中A有a个水平，B有b个水平，于是共有ab个处理组合。每个处理组合含n个观察值，全部共有abn个观察值。当每组合含有多于一个观察值时，可以通过方差分析考察因素间的交互作用，我们记因素A和因素B之间的交互作用为(AB)。…………xabn…xab2xab1…xajn…xaj2xaj1…xa2n…xa22xa11Aa……………………………………xibn…xib2xib1…xijn…xij2xij1…xi2n…xi22xi11Ai……………………………………………x2bn…x2b2x2b1…x2jn…x2j2x2j1…x22n…x222x211A2x1bn…x1b2x1b1…x1jn…x1j2x1j1…x11n…x112x111A1Bb…Bj

…B1B因素(j)A因素(i)表7.32

每处理组合内含有n个观察值的两向分类资料为了陈述上的方便，将数据结构列于表7.32。

xijk——处理组合AiBj的第k个观察值记；上表其中：——A因素第i个水平的观察值总和；——B因素第j个水平的观察值的平均数；——B因素第j个水平的观察值总和；——A因素第i个水平的观察值的平均数；——全部观察值的部和数；——全部观察值的平均数。此类资料观察值的数学模型为：（i＝1，2，…，a；j＝1，2，…，b；k＝1，2，…，n）从以上数学模型看出，对于这类资料的分析可以分两步进行：⒈先按模型将总变异分解为处理(组合)间变异和误差变异；这是一个单向分类的方差分析。方差分析表如表7.33所示。如果这一步的F测验不显著，就不必进行第二步。分析就此结束。表7.33

第一步的方差分析表：将总变异分解为处理(组合)间变异和误差变异变异来源自由度平方和均方F值处理间dft＝ab－1SStMStMSt/MSe误差dfe＝ab(n－1)SSeMSe总变异dfT＝abn－1SST⒉如果第一步的F测验显著，应进一步按模型将处理变异分解为A因素各水平间的变异、B因素各水平间的变异和交互作用(AB)引起的变异。该步骤的方差分析表如表7.34所示，在第二步中的F测验值如何计算需要视研究目的所确定的模型而定。表7.34

第二步的方差分析表：将处理间变异分解为A间变异、B间变异和交互作用变异来源自由度平方和均方F值A间dfA＝a－1SSAMSA视模型而确定B间dfB＝b－1SSBMSBAB互作dfAB＝(a－1)(b－1)SSABMSAB处理间dft＝ab－1SStMSt将以上两步合并，得到总的方差分析表，如表7.35所示。表中列出了固定模型和随机模型的期望均方。如果两个处理效应中有一个(例如A)为固定模型，另一个(例如B)为随机模型，这时的模型称为(A固定B随机的)混合模型(mixedmodel)。如表7.35也列出了(A固定B随机的)混合模型的期望均方。SSTdfT总变异MSeSSedfe误差MSABSSABdfABAB互作MSBSSBdfBB间MSASSAdfAA间视模型而定MStSStdft处理间A固定B随机随机模型固定模型期望均方(EMS)F值均方平方和自由度变异来源

表7.35

每处理组合内含有多于一个观察值的两向分类资料的总方差分析表21340例7.10

三个水稻品种(A1、A2、A3)种在四种不同的土壤类型(B1、B2、B3和B4)中，每个组合种了两个小区。产量数据已经过简化，列于表7.36。试对资料进行适当的分析。⒈数据处理：5.258.55.58.04.06.07.03.53.55.04.03.54.5146228912125664144196494910064498175014565130347298252952342541126171116812147710879847567354534979367426345观察值B4B3B2B1B4B3B2B1B4B3B2B1合计A3A2A1处理组合表7.36

例7.10的产量资料及数据整理为了计算因素间的交互作用，将各处理组合之和列成AB二向表如表7.37所示。6.505.004.25表7.37AB二向表6.55.55.04.0408615211089900576146253338135419454601462126393330242704730521711168A3160043840121477A211562943410879A1B4B3B2B1土壤类型（B）品种（A）⒉第一步：将总变异分解为处理间变异和误差变异两部分全试验中，有A因素有3个水平，B因素有4个水平，因此有12个处理组合。每处理组合有2个观察值，全试验共有24个观察值。在第一步中，先利用表7.36的整理结果将12个处理当作为单向分类资料进行方差分析。即将总变异分解为处理间变异和误差变异。步骤如下：⑴平方和及自由度的分解：总自由度dfT=观察值总数–1=24–1=23处理(组合)间自由度dft=处理数–1=12–1=11误差自由度dfe=dfT

–dft

=23–11=12误差平方和=88.5–69.5=19将各项自由度和平方和添入方差分析表得表7.38。⑵列方差分析表：变异来源自由度平方和均方FF0.05F0.01处理间1169.506.3183.99*2.7174.220误差1219.001.583总变异2388.50表7.38

第一步的方差分析表如果处理间差异不显著，结束分析过程。否则需要进行第二步，将处理间的变异进一步分解为A因素各水平间的变异、B因素各水平间的变异和交互作用(AB)引起的变异。⒊第二步：将处理间的变异分解为A间的变异、B间的变异和AB互作⑴平方和及自由度的分解：处理间自由度dft

=处理数–1=12–1=11A因素(品种间)自由度dfA

=品种数–1=3–1=2B因素(土壤类型间)自由度dfB=土壤类型数–1=4–1=3AB交互作用自由度dfAB=dft–dfA–dfB

=11–2–3=6或dfAB=dfA×dfB=2×3=6AB交互作用平方和=69.5–21–19.5=29将各项自由度和平方和添入方差分析表得表7.39。⑵列方差分析表：表7.39

第二步的方差分析表变异来源dfSSMSFF0.05F0.01A间221.0010.506.63*3.8856.927B间319.506.504.11*3.4905.953AB互作629.004.833.05*2.9964.821处理间1169.50将表7.38与表7.39合并的总的方差分析表，如表7.40所示。表7.40

例7.10的方差分析总表变异来源自由度平方和均方FF0.05F0.01处理间1169.506.3183.99*2.7174.220A间221.0010.506.63*3.8856.927B间319.506.504.11*3.4905.953AB互作629.004.833.05*2.9964.821误差1219.001.583总变异2388.50请注意，由于本例中两个因素都是固定模型，所以根据表7.35的期望均方可以确定，各个F值均采用误差均方作分母进行计算。例如，对因素A进行测验时，F＝10.5／1.583＝6.63，对因素B进行测验时，F＝6.5／1.583＝4.11，等等。各项效应均达到显著差异，需要对它们进行多重比较。⑶多重比较(以Duncan法为例)①

对A因素(品种)各水平间差异的多重比较：a.计算标准误：其中bn为每品种的观察值数目。b.查Duncan表得SSR值并计算各种LSR值（误差自由度dfe=12）：表7.41

查得的SSR值及各种LSR值的计算gSSR0.05SSR0.01LSR0.05LSR0.0123.084.321.371.9233.234.551.442.02c.列梯形表进行比较：黄成达编制4.25A10.755.00A21.50*2.25**6.50A3平均数品种表7.42

对品种平均数进行比较的梯形表表7.41

查得的SSR值及各种LSR值的计算gSSR0.05SSR0.01LSR0.05LSR0.0123.084.321.371.4433.234.551.922.02d.结论：

品种A3与其它所有品种之间都有显著或极显著差异；

品种A1与品种A2之间没有显著差异。②对B因素(土壤类型)间差异的多重比较：a.计算标准误：其中an为每类土壤的观察值数目。b.查Duncan表得SSR值并计算各种LSR值（误差自由度dfe

=12）：表7.43

查得的SSR值及各种LSR值的计算gSSR0.05SSR0.01LSR0.05LSR0.0123.084.321.371.9233.234.551.442.0243.334.681.482.08c.列梯形表进行比较：黄成达编制4.0B115.0B20.51.5*5.5B31.01.5*2.5**6.5B4平均数土壤类型表7.44

对土壤类型平均数进行比较的梯形表表7.43

查得的SSR值及各种LSR值的计算gSSR0.05SSR0.01LSR0.05LSR0.0123.084.321.371.9233.234.551.442.0243.334.681.482.08d.统计结论：土壤类型B4与类型B1、B2之间有显著或极显著差异；

其余土壤类型之间没有显著差异。②关于对交互作用进行多重比较：本例中，A因素与B因素之间存在显著的交互作用，表明因素A的最好水平(A3)与因素B的最好水平(B4)结合所得的处理组合(A3B4)并非一定是最好的处理组合；因素A的最差水平(A1)与因素B的最差水平(B1)结合所得的处理组合(A1B1)并非一定是最差的处理组合；这里最差的组合是A1B2、A2B1、A2B2。图7.2展示了本例中因素A和因素B之间的交互作用。B1B2B3B4图7.2

例7.10中因素AB间的互作A3A2A1至于哪些处理之间有显著差异，可以通过对处理间的多重比较来测验。利用表7.37计算出各处理组合的平均数列于表7.45中。表7.45各处理组合的平均数品种（A）土壤类型（B）B1B2B3B4A14.53.54.05.0A23.53.57.06.0A34.08.05.58.5下面对处理平均数进行多重比较：a.计算标准误：其中n为每个处理组合的观察值数目。b.查Duncan表得SSR值并计算各种LSR值（误差自由度dfe=12）：表7.46查得的SSR值及各种LSR值的计算gSSR0.05SSR0.01LSR0.05LSR0.0123.084.322.743.8433.234.552.874.0443.334.682.964.1653.364.762.994.2463.404.843.034.3173.424.923.044.3883.444.963.064.4193.455.023.074.47c.列梯形表进行比较：表7.47

对处理组合平均数进行比较的梯形表序号处理组合平均数－⑨－⑧－⑦－⑥－⑤－④－③－②①A3B48.5

5**4.5**

3.5*

3*2.51.50.5②A3B28.04.5**4*3.5*3*2.521③A2B37.03.5*32.521.51④A2B46.02.521.510.5⑤A3B35.521.510.5⑥A1B45.01.510.5⑦A1B14.510.5⑧A3B1、A1B34.00.5⑨A1B2,A2B1,A2B23.5表7.47

对处理组合平均数进行比较的标记字母表序号处理组合平均数α=0.05α=0.01①A3B48.5aA②A3B28.0a

B③A2B37.0a

bcA

BC④A2B46.0a

bcdA

BC⑤A3B35.5

bcdA

BC⑥A1B45.0

cdA

BC⑦A1B14.5

cdA

BC⑧A3B1、A1B34.0

BC⑨A1B2,A2B1,A2B23.5

C标记字母法d.统计结论：处理A3B4与A3B2、A2B3、A2B4等处理组合之间没有显著差异，但与其它处理组合之间均有显著或极显著差异；处理A3B2与A2B3、A2B4

、A3B3等处理组合之间没有显著差异，但与其它处理之间均有显著或极显著差异。A2B3与A1B2、A2B1、A2B2之间有显著差异；其余处理组合之间没有显著差异。B1土壤类型：序号品种－③①－②①A14.51.0ns0.5ns②A34.00.5ns③A23.5B2土壤类型：序号品种①－②①A38.04.5**②A1，A23.5B3土壤类型：序号品种－③①－②①A27.03.0*1.5ns②A35.51.5ns③A14.0B4土壤类型：序号品种－③①－②①A38.53.5*2.5ns②A26.01.0ns③A15.0下面举一个混合模型的例子。例7.11

为了了解4种不同的去雄方法（A1、A2、A3、A4）在对不同品种的水稻进行操作时的效果，从众多的水稻品种中随机抽取了5个品种（B1、B2、B3、B4、B5）参加试验，共有20个处理组合。每个处理组合观察3株。试验结果如表7.47所示。试对结果进行适当的分析。表7.48

四种去雄方法对不同品种的作用品种去雄方法A1A2A3A4B1434433345774B2245453747676B3435597374688B4434534656977B54565756868787.05.44.84.0182.659总变异1.45058.040误差2.6652.0031.402ns2.03324.412互作3.8282.6064.759**6.927.64品种4.3132.83911.902**24.272.63方法2.3941.8534.523**6.558124.619处理F0.01F0.05FMSSSdf变异来源表7.49

例7.11的方差分析表本例中，四个去雄方法是要比较的对象，因此属于固定效应。五个品种只是从众多的品种中抽取出来的一个样本，因此属于随机效应。这里要特别提醒的是，在象本例这样的混合模型中，F值是如何计算的。

表7.35所提供的期望均方可知:在混合模型中，对AB互作的F测验中的F值应由算得。表7.49表明，AB互作不显著，即各种品种对这四个方法的反应是相同的。对因素B(品种)进行测验：因为因素B是随机模型，所以统计假设为:F值应由算得。F测验表明，如果要对进行估计，则。表7.35所提供的期望均方可知:对因素A

(四种去雄方法)的差异进行测验：因为因素A是固定模型，所以统计假设为:F值应由算得。本例中，F测验显著——不同去雄方法间有显著差异，所以要对因素A的各个水平（去雄方法）进行多重比较。表7.35所提供的期望均方可知:a.计算标准误：分母为bn为每去雄方法的观察值数目。b.查Duncan表得SSR值并计算各种LSR值（使用自由度dfAB=12）：表7.50

查得的SSR值及各种LSR值的计算gSSR0.05SSR0.01LSR0.05LSR0.0123.084.321.1331.59033.234.551.1891.67443.334.681.2251.722分子应为方差分析表中的MSAB

。c.列梯形表进行比较：4.0A10.8ns4.8A20.6ns1.4*5.4A31.6**2.2**3.0**7.0A4平均数去雄方法表7.51

对土壤类型平均数进行比较的梯形表表7.50

查得的SSR值及各种LSR值的计算GSSR0.05SSR0.01LSR0.05LSR0.0123.084.321.1331.59033.234.551.1891.67443.334.681.2251.722d.结论：

去雄方法品种A4与其它所有方法之间都有极显著差异；

方法A3与品种A1之间有显著差异，其它的方法之间没有显著差异。在植物遗传学的研究中，常使用随机模型，即从众多植物品种（或品系或家系）中，随机抽取若干(a)个作母本(A因素)，又随机抽取若干(b)个作父本(B因素)，相互构成ab个杂交组合，将其后代种在同一试验地的若干重复中，收集数据进行分析以了解有关性状的遗传规律。遗传上称这种杂交方案为交叉式设计(crosseddesign)，其资料采用两向分类的方差分析。关于方差分析在这方面的应用，请参阅数量遗传学的有关著作。第六节系统分组资料的方差分析

在动物学的试验中，由于每一个母本不可能同时与若干个父本交配，所以不能采用交叉式设计的杂交方式，转而使用另一种被称为巢式设计（nesteddesign）的杂交方案。巢式设计的杂交方案以及相类似的试验设计所取得到数据资料称为系统分组的资料(hierarchalclassification)。本节只介绍最简单的系统分组的资料的统计分析方法，更复杂的、更多层次的系统分组的资料的分析请参阅有关的参考文献。系统分组的资料又称这类资料为组内又分亚组的单向分类资料。如果资料中分为a组(A)，每组又被分为b个亚组(B)，每个亚组含n个观察值，全部共有abn个观察值。为了陈述上的方便，将其数据结构列于表7.52。……各组平均数

……各组总和……………………亚组平均数……………………亚组总和xibn…xijn…xi2nxi1n………………xibk…xijk…xi2kxi1k………………xib2…xij2…xi22xi12………xib1…xij1…xi21xi11…………

Bj(a)……Bb(i)…Bj(i)…B2(i)B1(i)……

Bj(1)…亚组号(B)Aa…Ai…A1组号(A)（i＝1，2，…，a；j＝1，2，…，b；k＝1，2，…，n）表7.52

巢式设计资料的数据结构系统分组资料观察值的数学模型为：因此总变异分解为三大部分：组间A变异、组内亚组间B(A)的变异和误差E变异。方差分析表如表7.53所示。所有观察值的总和及平均数为：SSTdfT总变异SSedfe误差SSB(A)dfb(a)组内亚组间SSAdfa组间A固定B随机随机模型固定模型期望均方(EMS)SSdf变异来源表7.53

巢式设计资料的方差分析

dfa=a－1dfb(a)=a(b－１)dfe=ab(n－1)dfT=abn－101例7.11

有4个鸡群，每群各是一只公鸡的后代（i=1,2,…,4）；每一群分为3个亚群（j=1,2,…,3）；每个亚群内有5只鸡（k=1,2,…,n），它们全都是同一母鸡的后代。表7.54列出了这些鸡100日龄时的体重（数据已简化）。其中母鸡编号B2(3)表示那是第3只公鸡(A3)属下的第2只母鸡，它与其它公鸡属下的第2只母鸡不是同一只母鸡。⑴

试分析不同公鸡的后代平均数之间的差异，为选择优良父本提供理论依据；⑵试分析同一公鸡不同母鸡的后代平均数之间的差异，为选择优良亲本组合提供理论依据。4.26.24.42.63.6174428649435615212916252936639544.24.87.46.46.633.62.22.82.84.62.63.66142576136910241089225324121196196529169324130412228321022747802742421114370252243732331518111414231318576523334424387537222535496833243654655742333522688833122313子鸡观察值B3(4)B2(4)B1(4)B3(3)B2(3)B1(3)B3(2)B2(2)B1(2)B3(1)B2(1)B1(1)母鸡号总和A4A3A2A1公鸡号表7.54

某鸡群100日龄体重数据资料的整理01⒈

数据处理：如表7.54所示。⒉平方和及自由度的分解：总自由度dfT

＝观察值总数－1＝abn－1＝60－1＝59组间自由度dfa＝组数－1＝a－1＝4－1＝3组内亚组间自由度dfb(a)

＝组数×(组内亚组数－1)

＝a(b－1)＝4(3－1)＝8误差自由度dfe

＝dfT－dfa

－dfb(a)

＝59－3－8＝48

组间平方和，即不同公鸡的后代平均数之间的平方和：

亚组间平方和，即试验中所有全同胞家系（同父同母的小鸡）平均数之间平方和：

组内亚组间平方和，即同一公鸡内的全同胞家系(不同母鸡的后代)之间的平方和：

误差平方和：⒊列方差分析表：

245.659总变异1.57575.648误差2.9072.1385.206**8.265.68公鸡内母鸡间4.2182.79822.1**34.8104.43公鸡间F0.01F0.05FMSSSdf变异来源表7.55

例7.11的方差分析表请注意计算F值公式中的分母。如果两个效应都是固定模型，那么都应该用误差均方作为求F值公式中的分母，即对公鸡间差异进行测验时，F＝MSa/MSe=34.8／1.575＝22.1；对同一公鸡下属的不同母鸡之间差异进行测验时，F＝MSb(a)/MSe=8.2／1.575＝5.206。本例中，两项效应都具有极显著差异。因为是固定模型，所以应该对两项都进行多重比较。01SSTdfT总变异SSedfe误差SSb(a)dfb(a)组内亚组间SSadfa组间A固定B随机随机模型固定模型期望均方(EMS)SSdf变异来源表7.53

巢式设计资料的方差分析

⑴

计算标准误：其中bn为每一只公鸡的后代总数目。⒋对不同父本平均数间差异进行多重比较

(以Duncan法为例）表7.56

查得的SSR值及各种LSR值的计算gSSR0.05SSR0.01LSR0.05LSR0.0122.853.790.9241.22833.003.960.9721.28343.094.071.0011.319⑵查Duncan表得SSR值并计算各种LSR值（误差自由度dfe=48）：⑶列梯形表进行比较：2.6A21.0*3.6A10.81.8**4.4A31.8**2.6**3.6**6.2A4平均数公鸡编号表7.57

不同公鸡后代平均数之间的多重比较表7.56

查得的SSR值及各种LSR值的计算gSSR0.05SSR0.01LSR0.05LSR0.0122.853.790.9241.22833.003.960.9721.28343.094.071.0011.319d.统计结论：①公鸡A3与公鸡A1的后代之间没有显著差异；②其它各公鸡的后代之间均有显著或极显著差异。⑴

计算标准误：其中n为每一只母鸡的后代数目。⒌对同一父本内的不同母鸡间平均数的差异进行多重比较：

(以Duncan法为例）⑵查Duncan表得SSR值并计算各种LSR值（误差自由度dfe=48）：表7.58

查得的SSR值及各种LSR值的计算gSSR0.05SSR0.01LSR0.05LSR0.0122.853.791.6002.12733.003.961.6842.223⑶列梯形表进行比较：2.6B22.2B31ns3.6B10.6ns2.8B1和B21ns2*4.6B3－3母鸡号－1－2母鸡号公鸡A2内公鸡A1内ba表7.59

同一公鸡不同母鸡后代平均数之间的多重比较4.8B33B21.6ns6.4B10.6ns3.6B11.0ns2.6**7.4B23**3.6**6.6B3－1－3母鸡号－1－2母鸡号公鸡A4内公鸡A3内dcd.统计结论：①公鸡A3内的B3母鸡的后代极显著优于另外两只母鸡的后代；②公鸡A4内的B2母鸡的后代极显著优于B3母鸡的后代；③其它母鸡的后代之间均没有显著差异。

注意：在表7.57d中B1平均数与B3平均数之差为1.600，而表7.56中的相应判别临界值LSR0.05也刚好等于1.600，这时如何判断？方法是：1.将这两个1.600保留更多的小数位，大多数情况下不会再相等了，这就可以作出判断；2.如果还是一样，根据对两个平均数进行显著性测验时的统计假设，HO：

≤0vsHA：

＞0，刚好相等时不能拒绝HO，因此，判为差异不显著。如果例7.11中的母鸡仅仅是从鸡群中随机抽取的，研究的目的不在于比较这几只母鸡之后代的优劣，而是看各只公鸡跟任何母鸡结合产生的后代品质是否变异太大，那么将是混合模型。这时的方差分析别如表7.60所示。表7.60

如果母鸡效应为随机时的方差分析表变异来源dfSSMSFF0.05F0.01公鸡间3104.434.84.2

人人文库> 全部分类> 行业资料 > 医学制药

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第7章方差分析⑵

文档简介

温馨提示

最新文档

评论

第7章方差分析⑵

文档简介

温馨提示

最新文档

评论

相关文档