第三讲 DPS应用(2、试验统计分析)

上传人：q*** IP属地：湖北上传时间：2022-06-25 格式：PPT 页数：63 大小：3.62MB 积分：28 举报 版权申诉

已阅读5页，还剩58页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第二章试验统计分析p科学试验，由于受环境随机因素的干扰，科学试验，由于受环境随机因素的干扰，使试验结果往往含有随机影响的成分。对使试验结果往往含有随机影响的成分。对试验结果中处理因素主效应、因素间互作试验结果中处理因素主效应、因素间互作效应及试验误差等变异来源的分析，是生效应及试验误差等变异来源的分析，是生物统计学的重要内容。物统计学的重要内容。一、方差分析p方差分析是科学试验中的常用工具，是生物统计分析的核心内容之一。方差分析是科学试验中的常用工具，是生物统计分析的核心内容之一。p在科学试验中，试验结果往往是变化的，这种变化大体上由两类因素在科学试验中，试验结果往往是变化的，这种变化大体上

2、由两类因素引起。一类是受随机因素影响而产生的波动。这类影响在试验中常常引起。一类是受随机因素影响而产生的波动。这类影响在试验中常常是不能控制的，因而是不可避免的。另一类是人为控制因素的影响使是不能控制的，因而是不可避免的。另一类是人为控制因素的影响使试验结果产生变化。当这类因素对试验结果有显著影响时，必然会明试验结果产生变化。当这类因素对试验结果有显著影响时，必然会明显地改变试验结果，并同随机因素的影响一起出现。反之，当这类因显地改变试验结果，并同随机因素的影响一起出现。反之，当这类因素对试验结果无显著影响时，则相应的变化就不会明显表现出来，从素对试验结果无显著影响时，则相应的变化就不会明显表

3、现出来，从而使试验结果的变化基本上归结于随机因素的影响。科学试验的目的而使试验结果的变化基本上归结于随机因素的影响。科学试验的目的常常是为了判断这类受人们控制的因素对试验结果的影响是否确实存常常是为了判断这类受人们控制的因素对试验结果的影响是否确实存在。在。p方差分析正是通过对试验结果数据变动的分析，对上述问题作出判断方差分析正是通过对试验结果数据变动的分析，对上述问题作出判断的有效工具。因为它可以将随机变动和非随机变动从混杂状态下分离的有效工具。因为它可以将随机变动和非随机变动从混杂状态下分离开来，帮助我们发现起主导作用的变异来源，从而抓住主要矛盾或关开来，帮助我们发现起主导作用的变异来源，

4、从而抓住主要矛盾或关键因素并采取有效措施。键因素并采取有效措施。（一）数据转换p方差分析是以各数据来自独立、正态、等方差这方差分析是以各数据来自独立、正态、等方差这一条件为前提，当正态、等方差的条件不满足时，一条件为前提，当正态、等方差的条件不满足时，应将原始数据进行转换以满足正态、等方差条件应将原始数据进行转换以满足正态、等方差条件后再作方差分析。后再作方差分析。pDPS 系统提供了系统提供了4 种数据转换的常用手段。种数据转换的常用手段。n平方根转换平方根转换：多适用于那些计数的数据资料分析；：多适用于那些计数的数据资料分析；n对数转换对数转换：可用于百分率以及计数数据；：可用于百分率以及

5、计数数据；n反正弦平方根转换反正弦平方根转换：常用于百分率数据的情形；：常用于百分率数据的情形；n倒数转换倒数转换：常用于标准差和平均数成比例增长的一类：常用于标准差和平均数成比例增长的一类数据。数据。（二）试验数据编辑整理格式p1单因素方差分析数据编辑格式单因素方差分析数据编辑格式n按处理次序，一行一个处理，行内依次输入该处理的各个区组按处理次序，一行一个处理，行内依次输入该处理的各个区组(重重复复)的观察或测定值。的观察或测定值。处理重复Ax11x12x13.x1mBx21x22x23.x2mC.Dxa1xa2xa3.xam（二）试验数据编辑整理格式p2 二因素试验方差分析数据编辑格式二

6、因素试验方差分析数据编辑格式n将数据按因素将数据按因素A、B 处理顺序在编辑器中输入。先输处理顺序在编辑器中输入。先输入入A 因素的各处理后再输因素的各处理后再输B 因素的处理，然后依次输因素的处理，然后依次输入各处理中的重复。入各处理中的重复。n对于系统对于系统(巢式巢式)设计和裂区设计，也以类似形式编辑、设计和裂区设计，也以类似形式编辑、排列试验结果数据。在巢式设计中，以排列试验结果数据。在巢式设计中，以A 因素作为处因素作为处理组，理组，B 因素作为亚组对待；在裂区试验中，以因素作为亚组对待；在裂区试验中，以 A 因因素作为主区，素作为主区，B 因素作为裂区对待。因素作为裂区对待。（二）

7、试验数据编辑整理格式p2 二因素试验方差分析数据编辑格式二因素试验方差分析数据编辑格式A因素B因素重复（观察值）11x111x112x113.x11m2x121x122x123.x12m.21x211x212x213.x21m2x221x222x223.x22m. 1xa11xa12xa13.xa1m2xa21xa22xa23.xa2m.（二）试验数据编辑整理格式p3 多因素试验方差分析数据编辑格式多因素试验方差分析数据编辑格式n观察数据按因素处理观察数据按因素处理(因子因子)A、处理、处理B，处理处理K 以及区组以及区组(如果有重复的话如果有重复的话)的顺序输入，的顺序输入，即输入即输入A

8、因素的各处理水平后再输因素的各处理水平后再输B 因素的各因素的各一个处理水平，一个处理水平，如果有重复的话，在一个，如果有重复的话，在一个处理中依次输入各处理中的重复观测值。处理中依次输入各处理中的重复观测值。 n若有两个因子，其若有两个因子，其A 因子有因子有K 个处理，个处理，B 因子因子有有L 个处理，各个处理重复个处理，各个处理重复N 次。其资料输入次。其资料输入顺序为两因素试验的扩展。顺序为两因素试验的扩展。（三）方差分析结果解释p在进行试验结果的分析之前在进行试验结果的分析之前，我们我们必须在思想上牢记：要尽量地利用必须在思想上牢记：要尽量地利用你对问题的非统计学知识。因为实验者

9、在各自的领域内通常有独到的你对问题的非统计学知识。因为实验者在各自的领域内通常有独到的实践经验、受过正规的科学训练、具有高深的知识，这些都可用来分实践经验、受过正规的科学训练、具有高深的知识，这些都可用来分析因素和响应变量之间的关系，这在解释分析结果时是极其有用的，析因素和响应变量之间的关系，这在解释分析结果时是极其有用的，是统计学无法替代的。在进行方差分析结果解释时要点如下是统计学无法替代的。在进行方差分析结果解释时要点如下：n显著水平显著水平p值值：方差分析表中，显著水平方差分析表中，显著水平p值是推断试验处理间差异程度值是推断试验处理间差异程度的指标。只有当显著水平的指标。只有当显著水平

10、p0.05时，一般才认为各个处理间确实存在时，一般才认为各个处理间确实存在着差异。着差异。n区组效应分析区组效应分析：如区组间显著水平如区组间显著水平p0.05时，该试验还可靠吗？答案时，该试验还可靠吗？答案是肯定的。因为所以采用随机区组试验设计来安排试验是肯定的。因为所以采用随机区组试验设计来安排试验，实质上是为了实质上是为了剔除，确切一点来说是分离因土壤、肥力、地势地貌等可能会导致的非剔除，确切一点来说是分离因土壤、肥力、地势地貌等可能会导致的非人为处理差异。区组间显著水平人为处理差异。区组间显著水平p0.05时只说明这类差异确实存在，时只说明这类差异确实存在，并且已从试验结果中分离出来。

11、因此它不影响试验处理结果的解释。当并且已从试验结果中分离出来。因此它不影响试验处理结果的解释。当然，区组间显著水平然，区组间显著水平p0.05，说明试验条件更均衡些，非人为因素对，说明试验条件更均衡些，非人为因素对试验结果的影响更小些。试验结果的影响更小些。（三）方差分析结果解释n多重比较多重比较：一般来说，只有当方差分析表中的显著水平一般来说，只有当方差分析表中的显著水平p0.05时才能进一步作多重比较分析。多重比较可进一步检验各个处理时才能进一步作多重比较分析。多重比较可进一步检验各个处理间两两之间的差异。间两两之间的差异。p在进行多重比较时，必须注意各个处理之间是否存在互作，当交互作在进

12、行多重比较时，必须注意各个处理之间是否存在互作，当交互作用项显著时，简单地分析各个处理间的差异并不是很好的做法。这时用项显著时，简单地分析各个处理间的差异并不是很好的做法。这时，一个因素一个因素(例如，例如，A)的均值间的比较可能由于的均值间的比较可能由于AB交互作用而模糊不交互作用而模糊不清。对这一情况的一种做法是将因素清。对这一情况的一种做法是将因素B固定在一特定水平上，在此水固定在一特定水平上，在此水平上对因素平上对因素A的均值进行多重比较。的均值进行多重比较。p当交互作用显著时，多重比较的另一个做法是比较所有当交互作用显著时，多重比较的另一个做法是比较所有ab个单元的均个单元的均值，以

13、便确定哪一些有显著性差异。在这一分析中，单元均值间的差值，以便确定哪一些有显著性差异。在这一分析中，单元均值间的差异既包含了交互作用效应的，又包含了所有主效应的异既包含了交互作用效应的，又包含了所有主效应的。n多重比较结果多重比较结果：在在DPS中，各个处理凡后面具有相同字母者，表中，各个处理凡后面具有相同字母者，表示它们之间的差异不显著示它们之间的差异不显著；否则；否则差异显著差异显著。（四）单因素完全随机设计p如：如：对以下四个小麦材料单株粒重资料对以下四个小麦材料单株粒重资料(范濂，范濂，1983)进进行方差分析及差异显著性测定。行方差分析及差异显著性测定。p输入待分析资料输入待分析资料

14、定义成数据块定义成数据块进入主菜单，选择进入主菜单，选择“试验统计试验统计完全随机设计完全随机设计单单因素因素试验统计分析试验统计分析”，按回车键执行该选项功按回车键执行该选项功能。能。这时系统将会提示用户选择数据转换方式，如此时直接回这时系统将会提示用户选择数据转换方式，如此时直接回车表示不转换。选择数据转换方式后回车，系统将立即给出分车表示不转换。选择数据转换方式后回车，系统将立即给出分析结果析结果（五）单因素随机区组设计p例如例如，小麦品比试验资料按随，小麦品比试验资料按随机区组试验设计所获得的产量机区组试验设计所获得的产量(张全德等，张全德等，1985)进行方差进行方差分析。分析。p将

15、输入的待分析资料定义成数将输入的待分析资料定义成数据块，然后进入主菜单，选择据块，然后进入主菜单，选择“试验统计试验统计随机随机区组设计区组设计单单因素因素试验统计分析试验统计分析”，按回车键按回车键执行该选项功能。执行该选项功能。这时系统将这时系统将会提示用户选择数据转换方式会提示用户选择数据转换方式，如此时直接回车表示不转换如此时直接回车表示不转换。选择数据转换方式后回车选择数据转换方式后回车，系系统将立即给出分析结果统将立即给出分析结果（六）系统分组(巢式)设计p系统分组系统分组(巢式巢式)设计，即试验单向设计，即试验单向分组，每组分若干个亚组，每个亚分组，每组分若干个亚组，每个亚组内又

16、有若干个观测值。组内又有若干个观测值。p例例：为研究一批玉米自交系的遗传：为研究一批玉米自交系的遗传参数，随机抽得参数，随机抽得21 个自交系，并个自交系，并以其中以其中7 个为父本，每个皆随机地个为父本，每个皆随机地与与3 个母本自交系杂交，共配成个母本自交系杂交，共配成21 个组合。每一组合在田间种个组合。每一组合在田间种3 个小区，共个小区，共63 个小区，完全随机个小区，完全随机区组排列。收获时考查了各个组合区组排列。收获时考查了各个组合的数量形状。现试以每穗行数的结的数量形状。现试以每穗行数的结果果(莫惠栋，莫惠栋，1984)进行方差分析。进行方差分析。p定义数据块，然后进入主菜单，

17、选定义数据块，然后进入主菜单，选择择“试验统计试验统计完全随机设计完全随机设计系系统分组统分组(巢式巢式)设计分析设计分析”项，按回项，按回车后系统给出提示车后系统给出提示，输入处理组数，输入处理组数（7），），回车回车，系统将立即给出分系统将立即给出分析结果析结果（七）二因素(组内无重复)完全随机设计p例如例如，在，在5 种不同温度下研究种不同温度下研究一种微生物的生长和温度的关一种微生物的生长和温度的关系，于接种后不同天数测量其系，于接种后不同天数测量其生长速度，获得一批观测数据生长速度，获得一批观测数据(马育华，马育华，1982)。现以温度。现以温度为类，接种后天数为组进行方为类，接种后

18、天数为组进行方差分析。差分析。p将所输入数据定义成数据块，将所输入数据定义成数据块，再进入主菜单，选择再进入主菜单，选择“试验设试验设计计完全随机设计分析完全随机设计分析二因二因素无重复试验设计分析素无重复试验设计分析”。按按回车键执行该选项功能，按系回车键执行该选项功能，按系统提示选择数据转换方式，如统提示选择数据转换方式，如不转换就直接回车。执行选项不转换就直接回车。执行选项功能后系统将立即给出分析结功能后系统将立即给出分析结果果（八）二因素完全随机设计p例如例如，现有一组土壤、肥料，现有一组土壤、肥料试验数据，试验数据，A 因素为因素为3 种肥种肥料处理，料处理，B 因素为因素为3种土壤

19、种土壤处理，每组合处理，每组合3 次重复。试次重复。试根据试验结果根据试验结果(小麦产量小麦产量)进进行方差分析行方差分析。p定义数据块。菜单下定义数据块。菜单下“试验设试验设计计完全随机设计分析完全随机设计分析二二因素有重复试验设计分析因素有重复试验设计分析”。按系统提示输入因素处理按系统提示输入因素处理数和因素处理数，然后再数和因素处理数，然后再按提示选择数据转换方式，按提示选择数据转换方式，进行运算分析并输出结果。进行运算分析并输出结果。（九）二因素随机区组设计p同（八）：重复同（八）：重复=区组区组p执行执行“试验设计试验设计方差分析方差分析二因素完全随机区组设计二因素完全随机区组设计

20、”功能项功能项（十）多因素随机区组设计p现有现有一试验结果，其中一试验结果，其中A 因素因素2 个处理水平，个处理水平，B 因素因素2 个处理水平，个处理水平，C 因素因素2 个处理水平，个处理水平，D 因素因素5 个处理水平，个处理水平，9 个重复。个重复。p分析时，按提示输入各分析时，按提示输入各个处理及重复的个数个处理及重复的个数(如如下图下图)：（十一）裂区试验设计p首先将整个试验区分成几个大区，在每个大区内安排比首先将整个试验区分成几个大区，在每个大区内安排比较容易表现出差异的因素的几种处理，它们常称为主处较容易表现出差异的因素的几种处理，它们常称为主处理，然后在主处理所在各区内引

21、进第二类因素的各个处理，然后在主处理所在各区内引进第二类因素的各个处理，它们称为副处理理，它们称为副处理。p实践中，某些因为需要占用较大范围，而另一些则需较实践中，某些因为需要占用较大范围，而另一些则需较小范围即可，通常需要占大范围的因素恰恰是容易表现小范围即可，通常需要占大范围的因素恰恰是容易表现出差异的因素。裂区设计在这种情形下是很适用的出差异的因素。裂区设计在这种情形下是很适用的。（十一）裂区试验设计p1两因素裂区设计两因素裂区设计n例如例如（右图）（右图）n进入主菜单，选择执行进入主菜单，选择执行“双因素裂区设计分析双因素裂区设计分析”功能项。功能项。（十一）裂区试验设计p2三因素裂区

22、试验设计三因素裂区试验设计n三因素裂区试验，根据试验设计的不同可分为三因素裂区试验，根据试验设计的不同可分为2 种类型：种类型：p第一种是在主区安排两个处理因素，副区安排一个处理因素第一种是在主区安排两个处理因素，副区安排一个处理因素(AB+C)；p第二种是在主区安排一个处理因素，裂区安排两个处理因素第二种是在主区安排一个处理因素，裂区安排两个处理因素(A+BC)。n这类试验设计及其统计分析较为复杂，但如试验有这种需要，这类试验设计及其统计分析较为复杂，但如试验有这种需要，则往往一个试验可以解决较多的实际问题，故亦颇有用处。则往往一个试验可以解决较多的实际问题，故亦颇有用处。（十一）裂区试验设

23、计n2.1 主区两因素、裂区一个主区两因素、裂区一个因素因素(AB+C )试验统计分析试验统计分析p某作物某作物病害防治试验，主区病害防治试验，主区为作物播种期和种子药剂处为作物播种期和种子药剂处理，播种分理，播种分3个时期：个时期：A1，A2，A3；种子药剂处理分；种子药剂处理分2个水平：个水平：B1，B2；裂区；裂区为作物收获期，分为作物收获期，分3个水平：个水平：C1，C2，C3。p定义成数据块后，执行主区定义成数据块后，执行主区两因素、副区一因素的两因素、副区一因素的AB+C裂区试验统计分析。裂区试验统计分析。在分析过程中，系统会提示在分析过程中，系统会提示输入主处理输入主处理1的水平

24、个数、的水平个数、主处理主处理2的水平个数及副区的水平个数及副区处理水平数处理水平数（十一）裂区试验设计n2.2 主区一因素、裂区两因素试验主区一因素、裂区两因素试验(A+BC 型型)统计分析统计分析p同同(AB+C型型)p定义成数据块后，定义成数据块后，应应执行主区执行主区一一因素、副区因素、副区两两因素的因素的A+BC 型裂区试验统计分析。在分析过程中，系统会提示输入主处型裂区试验统计分析。在分析过程中，系统会提示输入主处理理的水平个数及副区处理的水平个数及副区处理1 、副区处理副区处理2 的水平个数的水平个数（十一）裂区试验设计p3裂裂区试验统计分析裂裂区试验统计分析n例如，在前面的

25、例如，在前面的3 因素裂区实验中，药剂不是种因素裂区实验中，药剂不是种子处理，而是出苗后喷洒施药，这时的试验设计子处理，而是出苗后喷洒施药，这时的试验设计可按裂裂区方式进行：主区为播种期，分可按裂裂区方式进行：主区为播种期，分3个水个水平：平：A1，A2，A3；裂区为施药处理，分；裂区为施药处理，分2 个水个水平：平：B1，B2；再裂区为作物收获期，分；再裂区为作物收获期，分3个水个水平：平：C1，C2，C3。n因裂区试验设计较为复杂，在因裂区试验设计较为复杂，在DPS下，只需在工下，只需在工作表中按主区、裂区、裂裂区的顺序，将各个处作表中按主区、裂区、裂裂区的顺序，将各个处理因素的各个水平编

26、辑输入，然后用鼠标选中理因素的各个水平编辑输入，然后用鼠标选中(上图上图)。再执行。再执行“试验设计试验设计三因素裂裂区设计三因素裂裂区设计”，系统弹出输入区组数目对话框。输入区组数后，系统弹出输入区组数目对话框。输入区组数后，点点“OK”，即可得到裂裂区试验设计方案。，即可得到裂裂区试验设计方案。二、一般线性模型(GLM)p试验设计的种类多种多样，应用前面介绍的根据变异来源将总平方和试验设计的种类多种多样，应用前面介绍的根据变异来源将总平方和进行分解的各种类型的方差分析技术，只适用于平衡数据，即方差分进行分解的各种类型的方差分析技术，只适用于平衡数据，即方差分析模型中每个子类的观察数据个数析

27、模型中每个子类的观察数据个数(也称次级样本容量也称次级样本容量)相等的情况。相等的情况。p实际上，在科学试验中，试验者起初设计的一个完整试验，可能因为实际上，在科学试验中，试验者起初设计的一个完整试验，可能因为在试验过程中出现一些不可预见、难以避免的因素，导致在结果中失在试验过程中出现一些不可预见、难以避免的因素，导致在结果中失去了一些观察值，最后得到的是不完整、非平衡的试验数据。另外，去了一些观察值，最后得到的是不完整、非平衡的试验数据。另外，我们可能为一些特殊目的，有意设计一些不平衡的试验。如某些处理我们可能为一些特殊目的，有意设计一些不平衡的试验。如某些处理组合的试验做起来花费较大或更为

28、困难，因此，在这些单元中可能会组合的试验做起来花费较大或更为困难，因此，在这些单元中可能会少做一些重复；而另外一些处理组合对试验者来说有更大的兴趣，因少做一些重复；而另外一些处理组合对试验者来说有更大的兴趣，因为这些组合有可能是一些新的或从未研究过的状况，试验者会计划在为这些组合有可能是一些新的或从未研究过的状况，试验者会计划在那些组合上多做几次重复。这样，每个处理的样本数量多少不同时，那些组合上多做几次重复。这样，每个处理的样本数量多少不同时，一般称为非平衡数据。一般称为非平衡数据。二、一般线性模型(GLM)p面对非平衡数据方面的问题，面对非平衡数据方面的问题，Goodnight 在在20

29、世纪世纪70 年年代提出了一种将方差分析模型作为线性回归模型进行处理的新代提出了一种将方差分析模型作为线性回归模型进行处理的新方法。他将试验数据先拟合线性回归模型，再用一般的回归显方法。他将试验数据先拟合线性回归模型，再用一般的回归显著性检验方法检验主效应和交互作用效应的平方和的一般线性著性检验方法检验主效应和交互作用效应的平方和的一般线性模型模型(general linear model，GLM)p采用一般线性模型技术，不仅能对各种各样的有平衡试验数据采用一般线性模型技术，不仅能对各种各样的有平衡试验数据的试验设计进行方差分析，解决了试验设计数据处理技术通用的试验设计进行方差分析，解决了试验

30、设计数据处理技术通用化的问题；而且还能对各种试验设计，当试验结果里面各个处化的问题；而且还能对各种试验设计，当试验结果里面各个处理理(或水平或水平)的数据不相等、非平衡的情况下进行方差分析。的数据不相等、非平衡的情况下进行方差分析。pGLM 模型功能很强，可用于各种类型的方差分析。模型功能很强，可用于各种类型的方差分析。二、一般线性模型(GLM)pDPS 对试验数据进行分析前，先编辑定义数据对试验数据进行分析前，先编辑定义数据矩阵，数据矩阵的左边放试验设计处理因子矩阵，数据矩阵的左边放试验设计处理因子(定性定性变量变量)，最右边输入试验结果。如果有定量变量，最右边输入试验结果。如果有定量变量(

31、协变量协变量)，定量变量放在因变量的左边、定性变，定量变量放在因变量的左边、定性变量的右边，一行一个样本量的右边，一行一个样本(试验处理组合试验处理组合)。然后。然后将各个处理因子和试验结果一起定义成数据矩阵。将各个处理因子和试验结果一起定义成数据矩阵。p定义数据矩阵后，在主菜单上选择定义数据矩阵后，在主菜单上选择“试验统计试验统计” “一般线性模型一般线性模型(GLM)”。此时系统会显示下。此时系统会显示下图所示的方差分析模型参数选择界面。图所示的方差分析模型参数选择界面。方差变异来源项列表，用方差变异来源项列表，用A A，B B，大写字母分大写字母分别表示所定义的数据块中的第别表示所定义的

32、数据块中的第1 1，第，第2 2，列试列试验因子，如果有协变量，协变量分别以验因子，如果有协变量，协变量分别以x x1 1，x x2 2，表示。在这里，可选取或剔除方差模型表示。在这里，可选取或剔除方差模型中的变异来源中的变异来源。左边窗口中，选择需要分析的变异来源项目，左边窗口中，选择需要分析的变异来源项目，点击点击按钮，加载到右边窗口中。点击按钮，加载到右边窗口中。点击按钮，按钮，会把所有的变异来源加载到右边窗口中会把所有的变异来源加载到右边窗口中。对于选择进来的变异来源项目，双击鼠标可指定该对于选择进来的变异来源项目，双击鼠标可指定该项目的方差分析的误差项。双击后会在上部的编辑项目的方

33、差分析的误差项。双击后会在上部的编辑框中出现该变异来源的名称，后面跟有分隔符框中出现该变异来源的名称，后面跟有分隔符“/”/”，这时双击其它项目，系统将会把这些项目加载到后这时双击其它项目，系统将会把这些项目加载到后面作为误差项，误差项的组成可以是多个误差的和。面作为误差项，误差项的组成可以是多个误差的和。如指定某一变异来源项目再右击鼠标，则会弹出菜如指定某一变异来源项目再右击鼠标，则会弹出菜单。这时可对该变异来源项目进行操作。单。这时可对该变异来源项目进行操作。在用户界面右边，是一些统计分析的选择项：在用户界面右边，是一些统计分析的选择项：平方和分解类型的选择：系统缺省设置平方和分解类型的

34、选择：系统缺省设置是是III III 型平方和分解方式，可根据需要进型平方和分解方式，可根据需要进行选择。行选择。定性变量编码方法：方差分析时定性变定性变量编码方法：方差分析时定性变量编码方法应采用第二项，即效应编码。量编码方法应采用第二项，即效应编码。如进行数量化理论如进行数量化理论I I分析，则选择第一项适分析，则选择第一项适宜些。宜些。多重比较方法：这里共提供了多重比较方法：这里共提供了6 6 种，可种，可根据需要来选取，缺省的设置是根据需要来选取，缺省的设置是TukeyTukey方法。方法。作为参照的类别：在方差分析里不重要，作为参照的类别：在方差分析里不重要，可不必管它。只是有

35、时在作数量化理论可不必管它。只是有时在作数量化理论I I分分析，可根据专业的要求来设置，以便于回析，可根据专业的要求来设置，以便于回归系数的解释。归系数的解释。输出回归方程：当模型主要任务是因子输出回归方程：当模型主要任务是因子量化，建立定量的回归模型时，需要输出量化，建立定量的回归模型时，需要输出回归方程。回归方程。在上面各个项目设置完后，点击在上面各个项目设置完后，点击“确定确定”按钮，按钮，便可实施统计计算。如进行一般的单因素方差便可实施统计计算。如进行一般的单因素方差分析，或随机区组方差分析，或一般的析因设分析，或随机区组方差分析，或一般的析因设计方差分析，左边的菜单选择项可不考虑。

36、计方差分析，左边的菜单选择项可不考虑。（一）一般方差分析的GLM 模型p一般方差分析问题，即试验误差固定、整个模型只要一个一般方差分析问题，即试验误差固定、整个模型只要一个误差项固定效应模型的误差项固定效应模型的GLM模型分析。模型分析。p这类试验设计有完全随机设计、随机区组设计、拉丁方设这类试验设计有完全随机设计、随机区组设计、拉丁方设计、正交拉丁方设计、不完全区组设计、析因设计、混杂计、正交拉丁方设计、不完全区组设计、析因设计、混杂设计、分式设计及正交设计等。应用设计、分式设计及正交设计等。应用GLM于这类设计的于这类设计的方差分析，相对较简单，即只需要将待分析的项目方差分析，相对较简单，

37、即只需要将待分析的项目(变异变异来源来源)根据需要选入即可。根据需要选入即可。pGLM模型，用于单因素、二因素的完全随机设计、随机模型，用于单因素、二因素的完全随机设计、随机区组设计的方差分析，主要是针对有缺失数据，即非平衡区组设计的方差分析，主要是针对有缺失数据，即非平衡数据情形。平衡数据可用前面介绍的各种方差分析方法，数据情形。平衡数据可用前面介绍的各种方差分析方法，既直观又省事。既直观又省事。例例：某工程师研究在一装配操作中：某工程师研究在一装配操作中5 5种照明水平对产生次品的种照明水平对产生次品的影响。因为在该试验中，时间也许是一个影响因素，她决定影响。因为在该试验中，时间也许是一个

38、影响因素，她决定进行进行5 5个区组试验，每个区组是一星期的一天。同时，该试验个区组试验，每个区组是一星期的一天。同时，该试验含有含有5 5个工作站，这些站也可能是变异的潜在来源。该工程师个工作站，这些站也可能是变异的潜在来源。该工程师决定采用尤顿方设计，它具有决定采用尤顿方设计，它具有5 5天、天、5 5个工作站和个工作站和5 5个照明强度个照明强度处理。处理。该试验的各个处理在该试验的各个处理在DPSDPS电子表格中整理格式如右图阴影部分。电子表格中整理格式如右图阴影部分。分析时只需要将分析时只需要将A A、B B和和C C这这3 3个主效应选入即可，个主效应选入即可，即从可供分析的变异来

39、源的选择框中选择即从可供分析的变异来源的选择框中选择A A，B B和和C(C(分别代表天、工作站和照明处理分别代表天、工作站和照明处理) )并加载到右边并加载到右边框中；多重比较采用缺省的框中；多重比较采用缺省的TukeyTukey方法。点击确定方法。点击确定按钮按钮（一）一般方差分析的GLM 模型方差分析结果表明：日期和工作站方差分析结果表明：日期和工作站之间差异不显著，照明处理间差异之间差异不显著，照明处理间差异极显著。并从结果可以看出照明处极显著。并从结果可以看出照明处理在调整后的各个水平间的差异。理在调整后的各个水平间的差异。（二）混合效应模型方差分析p当处理因子都是随机因子，相应的方

40、差分析模型就称为随机效应模型；当处理因子都是随机因子，相应的方差分析模型就称为随机效应模型；若既有选择型因子，又有随机型因子时，则称混合效应模型。混合模若既有选择型因子，又有随机型因子时，则称混合效应模型。混合模型的方差分析、平方和的分解和固定模型相同，但无效假设和型的方差分析、平方和的分解和固定模型相同，但无效假设和F 统计统计量的计算有所不同。量的计算有所不同。p例如例如，研究围产期窒息对新生儿血液中次黄嘌呤浓度是否有影响，同，研究围产期窒息对新生儿血液中次黄嘌呤浓度是否有影响，同时还想了解新生儿出生后时还想了解新生儿出生后1 1小时内次黄嘌呤浓度是否有变化。可随机小时内次黄嘌呤浓度是否有

41、变化。可随机抽查抽查9 9名围产期窒息新生儿，名围产期窒息新生儿，9 9名不窒息的正常新生儿作为对照，对每名不窒息的正常新生儿作为对照，对每组的组的9 9名新生儿随机地安排名新生儿随机地安排3 3个不同时期个不同时期( (出生时、出生后出生时、出生后2020分钟和出分钟和出生后生后3030分钟分钟) )，分别测得血中的次黄嘌呤浓度如下图。，分别测得血中的次黄嘌呤浓度如下图。p这里，因子这里，因子A A是选择型的，它的是选择型的，它的2 2个水平个水平( (窒息，对照组窒息，对照组) )是研究者关心是研究者关心的因子水平的全部；因子的因子水平的全部；因子B B属随机型因子，因为研究者关心的不仅是

42、属随机型因子，因为研究者关心的不仅是实际观察的实际观察的3 3个时间点，而是个时间点，而是1 1小时内的情况，实际观察的小时内的情况，实际观察的3 3个时间点个时间点仅是所关心的时间点的一个样本。因此，在该例中，一个选择型因子仅是所关心的时间点的一个样本。因此，在该例中，一个选择型因子和一个随机型因子构成了和一个随机型因子构成了2 2因子混合模型。因子混合模型。p因固定模型中所有的因固定模型中所有的F F 值统计量的分母都是误差均方值统计量的分母都是误差均方(MS(MSe e) )，但这里统，但这里统计量计量F FA A=MS=MSA A/MS/MSABAB。为计算。为计算F FA A，需要重

43、新指定误差均方。，需要重新指定误差均方。在在DPS中，首先将各个处理因子和试验结果一中，首先将各个处理因子和试验结果一起定义成数据矩阵；再在主菜单上选择起定义成数据矩阵；再在主菜单上选择“试验统试验统计计” “一般线性模型一般线性模型” 。这时，系统会显示。这时，系统会显示方差分析模型中的变异来源选择界面方差分析模型中的变异来源选择界面在界面中，首先点击在界面中，首先点击按钮，将所有的可供选择的变异来源加到方按钮，将所有的可供选择的变异来源加到方差分析模型中去。由于该模型是混合模型，计算因子差分析模型中去。由于该模型是混合模型，计算因子A的统计量的统计量F所用所用的误差均方不是默认的的误差均

44、方不是默认的MSe，而是，而是MSAB，因此需用户自行指定。，因此需用户自行指定。在均方误差编辑框中，可自己填写有关代码。在均方误差编辑框中，可自己填写有关代码。注意：误差均方代码前须加上符号注意：误差均方代码前须加上符号“/”，如，如“/A*B”，且该代码必须，且该代码必须是上面窗口中已经存在的。输入后按回车键或双击鼠标结束编辑，这是上面窗口中已经存在的。输入后按回车键或双击鼠标结束编辑，这时在中间窗口中显示为时在中间窗口中显示为“A/A*B”。三、最优回归试验设计与分析p方差分析部分介绍的技术主要用于析因试验结果的分析，但在实践中，方差分析部分介绍的技术主要用于析因试验结果的分析，但在实践

45、中，做多个因子的完全试验会有许多实际的困难，因为完全试验所要求的做多个因子的完全试验会有许多实际的困难，因为完全试验所要求的试验次数太多，乃至无法实现。例如，假定要考虑试验次数太多，乃至无法实现。例如，假定要考虑5个三水平因子，个三水平因子，则完全试验则完全试验(重复数为重复数为1)要求做要求做35=243次试验；假如再加一个四水次试验；假如再加一个四水平因子，则完全试验平因子，则完全试验(同样重复数为同样重复数为1)要作要作972次试验。如果要分析次试验。如果要分析全部交互效应，同时还能进行平方和分解，则试验次数还需要加倍！全部交互效应，同时还能进行平方和分解，则试验次数还需要加倍！显然，如

46、此大的试验次数在现实工作中几乎是无法实施的。解决这个显然，如此大的试验次数在现实工作中几乎是无法实施的。解决这个困难的技术之一是采取正交试验设计进行试验。困难的技术之一是采取正交试验设计进行试验。p一般的正交试验设计，像方差分析一样，主要用于析因试验结果的分一般的正交试验设计，像方差分析一样，主要用于析因试验结果的分析。这类技术既能分析各处理因子的影响，又能建立定量的数学模型，析。这类技术既能分析各处理因子的影响，又能建立定量的数学模型，因此是更高级的试验设计技术。因此是更高级的试验设计技术。pDPS中提供了中提供了25个因子的二次正交旋转组合设计及二次通用旋转个因子的二次正交旋转组合设计及二

47、次通用旋转组合设计模型，可自动完成试验方案的生成和试验数据的处理组合设计模型，可自动完成试验方案的生成和试验数据的处理三、最优回归试验设计与分析p简单说，当设计某项试验时，若使试验点到试验中心的距简单说，当设计某项试验时，若使试验点到试验中心的距离相等和同球面上各点回归预测值离相等和同球面上各点回归预测值(x)的方差相等，这样的方差相等，这样的设计就是旋转设计的设计就是旋转设计(rotational design)。p回归旋转设计具有两个突出的特点。第一，它牺牲部分正回归旋转设计具有两个突出的特点。第一，它牺牲部分正交性而获得旋转性，并基本保留回归正交设计试验次数较交性而获得旋转性，并基本保留

48、回归正交设计试验次数较少、计算简便以及部分消除回归系数之间的相关性等优点。少、计算简便以及部分消除回归系数之间的相关性等优点。第二，它有助于克服在回归正交设计中二次回归预测值第二，它有助于克服在回归正交设计中二次回归预测值的方差依赖于试验点在因子空间中的位置这个缺点，即它的方差依赖于试验点在因子空间中的位置这个缺点，即它能有效地克服二次回归正交设计由于无旋转性，能根据预能有效地克服二次回归正交设计由于无旋转性，能根据预测值直接寻求最优区域的缺点。测值直接寻求最优区域的缺点。（一）正交试验统计分析p正交试验是利用一套规格化的表格正交试验是利用一套规格化的表格正交表，科学合理地安排正交表，科学合理

49、地安排试验。其特点是在试验的全部处理组合中，仅挑选部分有代表试验。其特点是在试验的全部处理组合中，仅挑选部分有代表性的水平组合性的水平组合(处理组合处理组合)进行试验，通过部分实施了解全面试进行试验，通过部分实施了解全面试验情况，从中找出较优的处理组合，这样可以大大节省人、财、验情况，从中找出较优的处理组合，这样可以大大节省人、财、物力和时间，使一些难以实施的多因素试验得以实施。物力和时间，使一些难以实施的多因素试验得以实施。p例如，要进行一个例如，要进行一个4 因素因素3 水平的多因素试验，如果全面实施水平的多因素试验，如果全面实施就需要就需要34=81个处理组合，试验规模显然太大，很难实施

50、。但个处理组合，试验规模显然太大，很难实施。但是，如果采用一张是，如果采用一张L9(34)的正交表安排试验，则只要的正交表安排试验，则只要9个处理个处理组合就够了。组合就够了。pL9(34) 的意思是，该正交设计最多可以安排的意思是，该正交设计最多可以安排4个因素个因素(包括互包括互作项作项)，每个因素取，每个因素取3个水平，一共做个水平，一共做9次试验次试验(水平组合数水平组合数)。（一）正交试验统计分析p利用正交表安排试验，一般可分以下几个步骤：利用正交表安排试验，一般可分以下几个步骤：n(1) (1) 确定试验因素和水平数确定试验因素和水平数p根据试验目的确定试验要研究的因素。如果对研究

51、的问题了解较少，可根据试验目的确定试验要研究的因素。如果对研究的问题了解较少，可多选一些因素；对研究的问题了解较多，可少选或抓主要因素进行研究。多选一些因素；对研究的问题了解较多，可少选或抓主要因素进行研究。因素选好后定水平，每个因素的水平可以相等，也可以不等，重要的或因素选好后定水平，每个因素的水平可以相等，也可以不等，重要的或需要详细了解的因素，水平可适当多一些，而对另一些需要相对粗略了需要详细了解的因素，水平可适当多一些，而对另一些需要相对粗略了解的因素，水平可适当少一些。解的因素，水平可适当少一些。p例如，为解决花菜留种问题，进一步提高花菜种子的产量和质量，科技例如，为解决花菜留种问题

52、，进一步提高花菜种子的产量和质量，科技人员考察了浇水、施肥、病害防治和移入温室时间对花果留种的影响，人员考察了浇水、施肥、病害防治和移入温室时间对花果留种的影响，进行了这进行了这4 4个因素各两水平的正交试验。个因素各两水平的正交试验。各因素及其水平见下表各因素及其水平见下表因子因子水平水平1水平水平2A：浇水次数：浇水次数浇浇12 次次根据需要浇水根据需要浇水B：喷药次数：喷药次数发病喷药发病喷药半月喷一次半月喷一次C：施肥次数：施肥次数开花期施硫酸铵开花期施硫酸铵发根、抽苔、开花和结实期各施肥一次发根、抽苔、开花和结实期各施肥一次D：进室时间：进室时间11 月初月初11 月月15 日日（一

53、）正交试验统计分析p利用正交表安排试验，一般可分以下几个步骤：利用正交表安排试验，一般可分以下几个步骤：n(2) (2) 选用合适的正交表选用合适的正交表p根据试验因素水平数以及是否需要估计互作来选择合适的正交根据试验因素水平数以及是否需要估计互作来选择合适的正交表。其原则是既要能安排下全部试验因素，又要使部分试验的表。其原则是既要能安排下全部试验因素，又要使部分试验的水平组合数尽可能的少。水平组合数尽可能的少。p在正交试验中，各试验因素的水平数减在正交试验中，各试验因素的水平数减1之和加之和加1，即为需要的，即为需要的最少试验次数或处理组合数，若有交互作用，需要再加上交互最少试验次数或处理组

54、合数，若有交互作用，需要再加上交互作用的自由度。对于四因素两水平试验来讲，最少需做的试验作用的自由度。对于四因素两水平试验来讲，最少需做的试验次数即处理组合数次数即处理组合数=(21)4+1=5，然后从，然后从2n 因素正交表因素正交表中选用处理组合数稍多于中选用处理组合数稍多于5的正交表安排试验，据此选用的正交表安排试验，据此选用L8(27)正交表。正交表。（一）正交试验统计分析p利用正交表安排试验，一般可分以下几个步骤：利用正交表安排试验，一般可分以下几个步骤：n(3) (3) 进行表头设计，列出试验方案进行表头设计，列出试验方案p所谓表头设计，就是把试验中挑选的各因素填到正交表的表头所谓

55、表头设计，就是把试验中挑选的各因素填到正交表的表头各列各列。p表头设计原则是：不要让主效应间、主效应与交互作用间有表头设计原则是：不要让主效应间、主效应与交互作用间有混杂现象。由于正交表中一般都有交互列，因此当因素少于列混杂现象。由于正交表中一般都有交互列，因此当因素少于列数时，尽量不在交互列中安排试验因素，以防发生混杂；当数时，尽量不在交互列中安排试验因素，以防发生混杂；当存在交互作用时，需查交互作用表，将交互作用安排在合适的存在交互作用时，需查交互作用表，将交互作用安排在合适的列上列上。花菜留种的表头设计花菜留种的表头设计列号1234567因子ABABCACD（一）正交试验统计分析p利用

56、正交表安排试验，一般可分以下几个步骤：利用正交表安排试验，一般可分以下几个步骤：n(3) (3) 进行表头设计，列出试验方案进行表头设计，列出试验方案p表头设计好后，把该正交表中各列水平号换成各因素的具体水表头设计好后，把该正交表中各列水平号换成各因素的具体水平就成为平就成为试验试验方案方案。（一）正交试验统计分析p利用正交表安排试验，一般可分以下几个步骤：利用正交表安排试验，一般可分以下几个步骤：n(4) (4) 试验试验p正交试验方案做出后，就可按试验方案进行试验。如果选用的正交试验方案做出后，就可按试验方案进行试验。如果选用的正交表较小，各列都安排了试验因子，当对试验结果进行方差正交表较

57、小，各列都安排了试验因子，当对试验结果进行方差分析时，就无法估算试验误差；若选用更大的正交表，则试验分析时，就无法估算试验误差；若选用更大的正交表，则试验的处理组合数会急剧增加。为了解决这个问题，可采用重复试的处理组合数会急剧增加。为了解决这个问题，可采用重复试验，也可采用重复取样的方法。重复取样不同于重复试验，重验，也可采用重复取样的方法。重复取样不同于重复试验，重复取样是从同一次试验中取几个样品进行观测或测试，结果每复取样是从同一次试验中取几个样品进行观测或测试，结果每个处理组合也可得到几个数据个处理组合也可得到几个数据。（一）正交试验统计分析p正交设计试验结果分析正交设计试验结果分析n分

58、析前先编辑定义数据矩阵：数据矩阵的左边放正交表，分析前先编辑定义数据矩阵：数据矩阵的左边放正交表，右边输入试验结果右边输入试验结果(试验可是单个或有重复试验可是单个或有重复)，一行一个，一行一个正交试验组合。然后，将正交表和试验结果一起定义成正交试验组合。然后，将正交表和试验结果一起定义成数据矩阵数据矩阵（一）正交试验统计分析p正交设计试验结果分析正交设计试验结果分析n进入菜单选择进入菜单选择“正交试验方差分析正交试验方差分析”功能，系统提示用户输入试验功能，系统提示用户输入试验因子因子(处理处理+空闲因子空闲因子)的总个数的总个数(系统一般能自动识别出来，故一系统一般能自动识别出来，故一般只

59、需回车般只需回车)，然后输入空闲因子所在的列的序号，然后输入空闲因子所在的列的序号(有时亦将有时亦将F值很值很小的变异来源项作为空闲因子列，以增加试验误差的自由度，减少小的变异来源项作为空闲因子列，以增加试验误差的自由度，减少试验误差方差，从而提高假设检验的灵敏度试验误差方差，从而提高假设检验的灵敏度)。从表看出，各项变异来源的从表看出，各项变异来源的F F 值均不显著，这是由于试验误差自由度太小，值均不显著，这是由于试验误差自由度太小，达到显著的临界达到显著的临界F F 值也过大所致。解决这个问题的根本办法是进行重复试验值也过大所致。解决这个问题的根本办法是进行重复试验或重复抽样，也可以将或

60、重复抽样，也可以将F F 值小于值小于1 1 的变异项的变异项( (即即D D 因素和因素和A A，B B 互作互作) )作为空闲作为空闲因子，将他们的平方和与自由度和误差项的平方和自由度合并，作为试验误因子，将他们的平方和与自由度和误差项的平方和自由度合并，作为试验误差平方和的估计值差平方和的估计值(SSe(SSe) )，这样既可以增加试验误差的自由度，也可减少试，这样既可以增加试验误差的自由度，也可减少试验误差方差，从而提高假设检验的灵敏度。验误差方差，从而提高假设检验的灵敏度。（一）正交试验统计分析p正交设计试验结果分析正交设计试验结果分析n第第3 和第和第6 列列F 值很小，作为空闲因

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第三讲 DPS应用(2、试验统计分析)

文档简介

温馨提示

最新文档

评论

第三讲 DPS应用(2、试验统计分析)

文档简介

温馨提示

最新文档

评论

相关文档