




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十章常用实验设计及其统计分析实验(experiment)试验(test)一个生物学研究课题是由一个或多个有关联的单项实验构成的。一个“赖氨酸生产菌改进的例子:1、初始菌株的选择;2、菌株的改进:传统的突变菌株筛选、现代的基因工程改进法;3、赖氨酸含量的测试、分析方法;4、赖氨酸的别离方法;5、生产菌在摇瓶规模上的发酵条件优化;6、生产菌在中试规模和生产规模上的发酵条件优化;7、菌株的保藏方法;8、种子的放大生产;9、生产设备的优化。生物学实验的根本要求实验设计的三个根本原那么简单实验设计比照设计成组比较实验设计配比照较实验设计完全随机分组的实验设计随机区组设计拉丁方设计希腊-拉丁方设计裂区设
2、计正交设计Plackett-Burman优化法 第一节 实验设计的根本原理 一、实验设计的根本概念 实验设计,广义理解是指实验研究课题设计,也就是整个实验方案的拟定。主要包括课题的名称、实验目的,研究依据、内容及预期到达的效果,实验方案,实验单位的选取、重复数确实定、实验单位的分组,实验的记录工程和要求,实验 结 果 的 分析方法 ,经济效益或社 会 效 益 估 计 , 已 具 备 的 条 件,需要购置的仪器设备,参加研究人员的分工,实验时间、地点、进度安排和经费预算,成果鉴定,学术论文撰写等内容。而狭义的理解是指实验单位的选取、重复数目确实定及实验单位的分组。生物统计中的实验设计主要指狭义的
3、实验设计。 实验设计的目的是防止系统误差,控制、降低实验误差,无偏估计处理效应,从而对样本所在总体作出可靠、正确的推断。 二、生物学实验的根本要求为了保证实验的质量,在实验中应尽可能地控制和排除非实验因素的干扰,合理地进行实验设计、准确地进行实验,从而提高实验的可靠程度,使实验结果在生产实际中真正发挥作用。为此,对生物实验有以下几点要求: 1、实验要有代表性 生物实验的代表性包括生物学和环境条件两个方面的代表性。 生物学的代表性,是指作为主要研究对象的品种、个体的代表性,并要有足够的数量。例如,进行品种的比较实验时,所选择的个体必须能够代表该品种,不要选择性状特殊的个体,并根据个体均匀程度,在
4、保证实验结果具有一定可靠性的条件下,确定适当的数量。 环境条件的代表性,是指代表将来方案推广此项实验结果的地区的自然条件和生产条件,如气候、饲料、饲养管理水平及设备等。 代 表 性 决定了实验结果的可利用性 ,如果一个实验没有充分的代表性,再好的实验结果也不能推广和应用,就失去了实用价值。 2、实验要有正确性 实验的正确性包括实验的准确性和实验的精确性。 在进行实验的过程中,应严格执行各项实验要求,将非实验因素的干扰控制在最低水平,以防止系统误差,降低实验误差,提高实验的正确性。 3、实验要有重演性 重演性是指在相同条件下,重复进行同一实验,能够获得与原实验相类似的结果,即实验结果必须经受得起
5、再实验的检验。 由于实验受供试个体之间差异和复杂的环境条件等因素影响,不同地区或不同时间进行的相同实验,结果往往不同;即使在相同条件下的实验,结果也有一定出入。因此,为了保证实验结果的重演性,必须认真选择供试个体,严格把握实验过程中的各个环节,在有条件的情况下,进行屡次或多点实验,这样所获得的实验结果才具有较好的重演性。 三、实验设计的根本要素1、处理因素单因素、多因素、处理水平、固定模型、随机模型;与处理因素相对应的是非处理因素,这是引起实验误差的主要来源。2、受试对象处理因素的客体,进行实验设计时,要保证其同质性。3、处理效应实验效应处理效应实验误差 四、实验方案书的编制1、封面;名称、编
6、制者、时间2、国内外研究动态及参考文献;3、实验目的;实验目的是实验开始前就提出的,不能做这样的“神射手子弹射出后,不管打到哪,都大言不惭地说“这正是我要打的地方!4、预期结果;理论方面,可以得到某个规律或结论;实用上,可以到达某个经济效益、社会效益或生态效益。 5、实验因素及因素水平的选择;6、观测指标的选择及指标的测量方法;7、设计方法的选择;配对设计与成组设计、比照设计、完全随机化设计、随机区组设计、拉丁方设计、裂区设计、套设计、正交设计8、实验方法;实验材料、仪器设备、药品试剂、实验步骤、实验经费 9、实验记录。不能把实验方案上的数值抄过来,称量是多少克就是多少克;实验过程中的意外现象
7、不可不记;五、实验设计的三个根本原那么重复提高精确性统计推断降低误差无偏估计误差估计误差局部控制随机化 一、实验误差的来源 实验处理常常受到各种非处理因素的影响,使实验处理的效应不能真实地反映出来 , 也就是说 ,实验所得到的观测值,不但有处理的真实效应,而且还包含其它因素的影响,这就出现了实测值与真值的差异,这种差异在数值上的表现称为实验误差。 由于产生误差的原因和性质不同,实验误差可分为系统误差片面误差、随机误差抽样误差两类。 系统误差影响实验的准确性,随机误差影响实验的精确性。为了提高实验的准确性与精确性,即提高实验的正确性,必须防止系统误差 ,降低随机误差 。为了 有效地防止系统误差
8、,降低随机误差 ,必 须了解实验误差的来源。 1、实验材料固有的差异 是指各处理的供试个体在遗传和生长发育上或多或少的差异性。 2、环境条件的差异 主要指那些不易控制的环境的差异,如开放环境下的温度、湿度、光照、通风、地质不同所引起的差异等。 3、操作者的操作技术的差异 不同的实验者,或同一个实验者在不同的时间、心态、体能条件下,操作技术不同引起的差异。 4、由一些随机因素引起的偶然差异 如偶然疾病的侵袭、饲料的不稳定等引起的差异。 针对误差的主要来源,应采取切实有效的措施,如尽量选择初始条件一致的实验动物,尽量做到饲养管理一致,认真细致进行观测记载等,力求防止系统误差,降低随机误差。 统计学
9、上通过合理的实验设计既能获得实验处理效应与实验误差的无偏估计,也能控制和降低随机误差,提高实验的精确性。在实验设计时必须遵循以下根本原那么。 一重复 重复是指实验中同一处理实施在两个或两个以上的实验单位上。 在动物实验中,一头动物可以构成一个实验单位,有时一组动物也可构成一个实验单位。 设置重复的主要作用在于估计实验误差和降低实验误差 。如 果 同一处理只实施在一个实验单位上,那么只能得到一个观测值,那么无从看出差异,因而无法估计实验误差的大小。只有当同一处理实施在两个或两个以上的实验单位上,获得两个或两个以上的观测值时,才能估计出实验误差。 样 本 标 准误与标准差的关系是 即平均数抽样误差
10、的大小与重复次数的平方根成反比,故重复次数多可以降低实验误差。但在实际应用时,重复数太多,实验动物的初始条件不易控制一致,也不一定能降低误差。重复数的多少可根据实验的要求和条件而定。如果供试动物个体间差异较大,重复数应多些; 差 异 较小,重复数可少些。 二随机化 随机化是指在某一处理或处理组合安排在哪一个实验个体上进行,必须使用随机的方法,使供试个体进入各实验组的时机相等,以防止实验人员主观倾向的影响。这是在实验中排除非实验因素干扰的重要手段,目的是为了获得无偏的误差估计量。 三局部控制 实验条件的局部一致性 在实验中,当实验环境或实验单位差异较大时,仅根据重复和随机化两原那么进行设计不能将
11、实验环境或 实验单 位 差 异 所 引 起 的变异从实验误差中别离出来,因 而 实验误 差 大 ,实验的 精 确 性 与 检 验的灵敏度低。为 解 决 这 一 问 题 ,在 实验环 境 或 实验单位差异大的 情 况 下 ,可 将 整 个 实验环 境 或 试 验 单 位 分 成 假设 干 个 小 环 境 或 小 组,在 小 环 境 或小组内使 非 处 理 因 素 尽 量 一 致 ,这就是局部控制 。 每 个 比 较 一 致 的 小 环 境或小组,称为单位组或区组。因为单位组之间的差异可在方差分析时从实验误差中别离出来,所以局部控制能较好地降低实验误差。 重复、随机化、局部控制称为费雪三原那么,是
12、实验设计中必须遵循的原那么。第二节 简单实验设计 一、比照设计这种方法是,设定一系列的标准实验区对照区,CK,然后处理区的数据与与它位置相邻的 CK区进行比较,结果以百分数表示。在田间实验时,一个CK区可以与它前后各一个处理区相邻。缺点:无法进行方差分析,一般认为与CK相差10%有差异;5%的认为也许有差异,需进一步实验。二、成组比较实验设计实验材料随机的分成两组,每组各进行一种处理。往往其中一组就是做对照。三、配比照较实验设计配对的处理可以得到配对的数据。与成组设计相比,实验个体的差异受到了控制,因此实验误差得到了进一步的控制。三、完全随机分组的实验设计当处理水平在3个或3个以上时,将实验材
13、料随机分到各个组,每个组对应一个处理。第三节 随机区组设计 为了控制实验误差,实验材料必须具备同质性。如果一次实验需要的实验材料较多,要求实验材料具备同质性就比较困难。为了解决这个问题,可以将性质相同或接近的实验材料具有同质性组成一个区组(block)。然后,区组内的各个实验材料随机安排给各个处理水平。随机区组设计一般都是指随机完全区组设计,“完全指的是,在任意一个区组内都包含所有的处理。一般进行实验设计时,在一个区组内,每个处理出现一次。 优点:由于在数据处理上,是将“区组也作为一个处理因素区组间存在差异,因此,方差分析中,计算误差平方和SSe时,就将区组平方和SSr别离出去了。这种方法比完
14、全随机法要灵敏,误差也要小。缺点:因素的水平组合处理不能太多,不能超过20个,最好不要超过10个。否那么,区组内的实验个体数目需要太多,很难保证同质性。 一、单因素的随机区组设计结果的方差分析实际上,就是将“区组也作为一个因素,做两因素的方差分析,当然,不必考虑“区组“处理之间的交互作用。如果实验有k个处理,分n个区组,有以下关系:看作是A因素有k个水平,B因素有n个水平,无重复的两因素方差分析 【例10.1】有8个小麦品种,采用随机区组设计,分3个区组,产量如下:(kg/40m2),试作方差分析。区组I品种BFAEHGCD产量10.810.110.911.89.310.011.19.1区组I
15、I品种CEGHBADF产量12.513.911.510.412.39.110.710.6区组III品种ACEGDHFB产量12.210.516.814.110.114.411.814.01、将数据作一下整理,如表:区组IIIIIITt平均值品种ABCDEFGH10.910.811.19.111.810.110.09.39.112.312.510.713.910.611.510.412.214.010.510.116.811.814.114.432.237.134.129.942.532.535.634.110.712.411.410.014.210.811.911.4Tr83.191.0103
16、.9278.02、按以下公式计算平方和:3、作方差分析,如下表:变异来源SSdfs2FF0.05F0.01品种间区组间误差34.0827.5622.9772144.8713.781.642.97*8.40*2.763.744.286.51总变异84.61234、在品种间有显著差异,作多重比较SSR法如下:dfeMSSR0.05SSR0.01LSR0.05LSR0.011423.034.211.371.9133.184.391.441.9943.274.511.482.0453.334.591.512.0863.374.651.532.1173.404.701.542.1383.434.741.
17、552.15品种平均数-D-A-F-H-C-G-BE14.24.2*3.5*3.4*2.8*2.8*2.3*1.8*B12.42.4*1.7*1.6*1.01.00.5G11.91.9*1.21.10.50.5C11.41.40.70.60.0H11.41.40.70.6F10.80.80.1A10.70.7D10.0小麦品种A、C、D、F、H无显著差异;E产量最高,与B有显著差异,与其它品种有极显著差异;B次之,与D有极显著差异,与A、F有显著差异;再次,那么是G,它与D有显著差异。二、两因素的随机区组设计结果的方差分析实验有A、B两因素,两因素有ab种处理水平组合,分r个区组,有以下关系:
18、 【例10.2】探讨三种微肥对小麦的增产效应,采用两种施肥方式,作随机区组实验,分三个区组,同时以清水作对照,结果如下:kg/亩。试作方差分析。处理组合B1(硫酸锌)B2(稀土)B3(翠绿)B4(清水)A1(拌种)A1B1A1B2A1B3A1B4A2(喷施)A2B1A2B2A2B3A2B4区组IIIIII处理A1B1A2B1A1B2A2B2A1B3A2B3A1B4A2B4418.7407.2430.4396.4434.6402.4376.4372.3425.3411.3438.7403.7440.1405.3381.2378.6416.7408.3428.4398.3436.7403.2378
19、.3376.71、先将数据整理如下:区组IIIIIITAB处理A1B1A2B1A1B2A2B2A1B3A2B3A1B4A2B4418.7407.2430.4396.4434.6402.4376.4372.3425.3411.3438.7403.7440.1405.3381.2378.6416.7408.3428.4398.3436.7403.2378.3376.71260.71226.81297.51198.41311.41210.91135.91127.6Tr3238.43284.23246.69769.22、然后将AB组合的TAB按A、B因素分拆为TA、TB,如下:处理组合B1(硫酸锌)B
20、2(稀土)B3(翠绿)B4(清水)TAA1(拌种)1260.71297.51311.41135.95005.5A2(喷施)1226.81198.41210.91127.64763.7TB2487.52495.92522.32263.59769.23、计算各项平方和,如下:4、作方差分析,如下表:变异来源SSdfs2FF0.05F0.01ABAB区组间误差2436.147214.241087.05149.1141.221332142436.142404.75362.3574.562.94827.41*816.75*123.07*25.32*4.603.343.343.748.865.565.56
21、6.51总变异10927.76235、作多重比较课后自习注意:因为已经设定清水组为对照,在肥料品种间只要与对照进行比较即可。上节的主要内容:目的:获得、比较平均值1、比照设计; 与相邻的标准区块比照2、成组比较的实验设计; 实验个体随机安排到两个组中3、配比照较的实验设计; 成对的实验个体或一个个体进行两次实验得到一对实验数据目的:对实验处理效应进行比较4、完全随机分组的实验设计; 实验个体随机安排到某个组中,每组进行一个实验处理5、随机区组的实验设计; 将同质的实验个体分成一个区组,区组内的实验个体随机地安排进行一个实验处理,在区组内,所有要作的处理都进行、并且只进行一次,区组数=处理的重复
22、数第四节 拉丁方设计随机区组设计,之所以比完全随机分组设计更精密,就因为它从误差平方和中别离出区组平方和,使得误差减小。随机区组设计要求在区组内部的条件是一致的,这在有些情况下很难满足。比方,实验动物在年龄上有差异的同时,在体重上也有差异,很难在一个区组内凑够足够的实验动物。再比方,实验使用的田地,北方肥沃南部贫瘠,同时,东部肥沃而西部贫瘠,这样也很难划分区组。我们有一个改进的方法解决这个问题:设计一个两维的区组,在行的方向上解决一个差异问题,比方动物年龄、田地东西走向;在另一维,列的方向上解决另一个差异问题,比方动物体重、田地南北走向。这样的方法就是拉丁方设计。拉丁方Latin square
23、名字来源于最初是用拉丁字母表示一个小区。拉丁方设计是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成区组的设计。在拉丁方设计中,每一行或每一列都成为一个完全区组,而每一处理在每一行或每一列都只出现一次,也就是说,在拉丁方设计中,实验处理数=横行区组数=直列区组数=实验处理的重复数。这是一个5阶的拉丁方的例子:A B C D EB C D E AC D E A BD E A B CE A B C D其中,ABCDE各字母在每一行、每一列都出现一次。这各例子中,第一行和第一列的字母是顺序排列的,又被称为标准拉丁方。 在对拉丁方设计实验结果进行统计分析时,由于能将横行、直列二个区组间的变
24、异从实验误差中别离出来,因而拉丁方设计的实验误差比随机区组设计小,实验精确性比随机区组设计高。 在进行拉丁方设计时,可从上述多种拉丁方中随机选择一种;或选择一种标准型,随机改变其行列顺序后再使用。常用拉丁方 拉丁方设计方法 下面结合具体例子说明拉丁方设计方法。 【例10.3】 为了研究5种不同温度对蛋鸡产蛋量的影响,将5栋鸡舍的温度设为A、B、C、D、E,把各栋鸡舍的鸡群的产蛋期分为5期,由于各鸡群和产蛋期的不同对产蛋量有较大的影响,因此采用拉丁方设计,把鸡群和产蛋期作为区组设置,以便控制这两个方面的系统误差。 拉丁方设计步骤如下: 一选择拉丁方 选择拉丁方时应根据实验的处理数即横行、直列区组
25、数先确定采用几阶拉丁方,再选择标准型拉丁方或非标准型拉丁方。 此例因实验因素为温度,处理数为5;将鸡群作为直列区组因素,直列区组数为5;将产蛋期作为横行区组因素,横行区组数亦为5,即实验处理数、直列区组数、横行区组数均为5,那么应选取55阶拉丁方。本例选取前面列出的第2个5 5标准型拉丁方,即:A B C D EB A D E CC E B A DD C E B AE D A C B 二随机排列 在选定拉丁方之后,假设是非标准型,那么可直接由拉丁方中的字母获得实验设计。假设是标准型拉丁方,还应按以下要求对直列、横行和实验处理的顺序进行随机排列。 33标准型拉丁方: 直列随机排列,再将第二和第三
26、横行随机排列。 44标准型拉丁方: 先随机选择4个标准型拉丁方中的一个;然 后 将 所 有的直列和第二、三、四横行随机排列,或 者 将 所 有的直列、横行随机排列;最后将处理随机排列。 55标准型拉丁方:先随机选择4个标准型拉丁方中的一个;然后将所有的直列、横行及处理都随机排列。 下面对选定的55标准型拉丁方进行随机排列。先屡次从随机函数得到15的数,并组成3个5位数,如:13542,41523,34521。然后将上面选定的55拉丁方的直列、横行及处理按这3个五位数的顺序重新随机排列。 1、直列随机 将拉丁方的各直列顺序按13542顺序重排。 2、横行随机 再 将直列重排后的拉丁方的各横行按4
27、1523顺序重排。 选择拉丁方直列随机横行随机1234513542ABCDEBAECDCDBEADEABCECDABABCDECDBEAECDABDEABCBAECD41523DAEBCECADBAEBCDBDCEACBDAE3、把5种不同温度与字母ABCDE对应。由表可以看出,第一鸡群在第个产蛋期用D温度,第二鸡群在第个产蛋期用A温度,等等。实验应严格按设计实施。三、实验结果的统计分析 拉丁方设计实验结果的分析,是 将两个区组因素与实验因素一起,按 三因素实验单独观测值的方差分析法进行,但应假定3个因素之间不存在交互作用。对拉丁方实验结果进行方差分析的数学模型为: i=j=k=1,2,r 式
28、中: m 为总平均数; ai 为第i横行区组效应; 为第j直列区组效应, 为第k处理效应。 区组效应ai、 通常是随机的,处理效应 通常是固定的,且有 ; 为随机误差,相互独立,且都服从N0,2。注意: k不是独立的下标,因为i、j一经确定,k亦随之确定。 平方和与自由度划分式为: SST = SS行+SS列+SSt+SSe dfT = df 行+ df列+ dft+dfe 例10.4】实验结果如表所示。整理的资料: 产蛋期鸡群T行一二三四五IIIIIIIVVD(23)A(22)E(30)B(25)C(19)E(21)C(20)A(25)D(22)B(20)A(24)E(20)B(26)C(2
29、5)D(22)B(21)D(21)C(22)E(21)A(19)C(18)B(22)D(23)A(23)E(19)108105116116104T列109108119107106549温度ABCDETt平均值11623.211422.810521.011322.610120.2进行方差分析: 1、计算各项平方和与自由度 矫正数 C=T2/r2=5492/52=12056.04 总平方和 SST =x 2ij-C=232+212+192 -12056.04= 12157-12056.04 =100.96 横行平方和 SS 行 =T 2行 /r- C =(1082+1052+1042)/5-120
30、56.04 =27.36 直列平方和 SS 列 =T 2列 / r C =(1092+1082+1062)/5-12056.04 =22.16 处理平方和 SSt =T 2t / r - C =(1162+1142+1012)/5-12056.04 =33.36总自由度 dfT= r 2-1=52-1=24横行自由度 df行= r-1=5-1=4直列自由度 df列= r-1=5-1=4误差平方和 SS e= SS T- SS 行- SS 列- SS t = = 18.08处理自由度 dft= r-1=5-1=4误差自由度 dfe=dfT-df行-df列-dft =(r-1)( r-2)=(5-
31、1)(5-2)=12 2、列出方差分析表,进行F检验变异来源SSdfs2FF0.05F0.01横行间直列间温度间误差27.3622.1633.3618.08444126.845.548.341.504.556*3.69*5.56*3.263.263.265.415.415.41总变异100.9624 经F检验,产蛋期间和鸡群间差异显著,温度间差异极显著。因在拉丁方设计中,横行、直列区组因素是为了控制和降低实验误差而设置的非实验因素,即使显著一般也不对区组间进行多重比较。下面对不同温度平均产蛋量间作进行多重比较。 3、多重比较 标准误为: 由dfe=12和k=2,3,4,5从q值表查得临界q值:
32、q0.05和q0.01,并与 相乘得 值,列于表。dfeMq0.05q0.01LSR0.05LSR0.011223453.083.774.204.514.325.045.505.841.692.072.312.482.382.783.033.21列出多重比较表 多重比较结果说明:温度A、B、D平均产蛋量显著地高于E,其余之间差异不显著。温度-20.2-21.0-22.6-22.8ABDCE23.222.822.621.020.23.0*2.6*2.4*0.82.21.81.60.60.20.4拉丁方设计的优缺点 一拉丁方设计的主要优点 1、精确性高 拉丁方设计在不增加实验单位的情况下,比随机区
33、组设计多设置了一个区组因素,能将横行和直列两个区组间的变异从实验误差中别离出来,因而实验误差比随机区组设计小,实验的精确性比随机区组设计高。 2、实验结果的分析简便 二拉丁方设计的主要缺点 因为在拉丁设计中,横行区组数、直列区组数、实验处理数与实验处理的重复数必须相等,所以处理数受到一定限制。假设处理数少,那么重复数也少,估计实验误差的自由度就小,影响检验的灵敏度;假设处理数多,那么重复数也多,横行、直列区组数也多,导致实验工作量大,且同一区组内实验动物的初始条件亦难控制一致。因此,拉丁方设计一般用于5-8个处理的实验。在采用4个以下处理的拉丁方设计时,为了使估计误差的自由度不少于12,可采用
34、“复拉丁方设计,即同一个拉丁方实验重复进行数次,并将实验数据合并分析,以增加误差项的自由度。 应当注意,在进行拉丁方实验 时,某些区组因素,如奶牛的泌乳阶段,实验因素的各处理要逐个地在不同阶段实施,如果前一阶段有残效,在后一阶段的实验中,就会产生系统误差而影响实验的准确性。此时应根据实际情况,安排适当的实验间歇期以消除残效。另外,还要注意,横行、直列区组因素与实验因素间不存在交互作用 ,否 那么 不能采用拉丁方设计。 拉丁方设计重复实验次数的估计 假设要求dfe=(k-1) (k-2)12,那么重复数(此时等于处理数)5。 所以,为了使误差自由度不小于12 ,那么应进行处理数(即重复数)5的拉
35、丁方实验,即进行55以上的拉丁方实验。当进行处理数为3 、4的拉丁方实验时可将33拉丁方实验重复6次,44拉丁方实验重复2次,以保证dfe=12。 第五节 希腊-拉丁方设计拉丁方只适用于单因素的实验设计,横行效应、直列效应我们一般不感兴趣,这本来就是进行局部控制的依据。如果是两个因素的处理,可以先用拉丁字母设计一个拉丁方,再用希腊字母设计一个拉丁方,然后将它们组成一个由复合字母组成的希腊-拉丁方。当然,能够组成复合拉丁方的拉丁方是有些特别要求的。A B C a b gB C A g a bC A B b g aAa Bb CgBg Ca AbCb Ag Ba在新的拉丁方中,复合字母Aa、Bg等
36、只出现一次,而单个字母A、B、C、a、b、g却出现了3次。希腊-拉丁方的概念可以进一步扩展,pp阶的拉丁方可以有p-1个进行重叠。这些可以重叠的拉丁方必须是互为正交的,p329附表12有12阶以下的正交拉丁方的完全系。6阶的无正交拉丁方同样的,希腊-拉丁方仍然不能处理行、列、拉丁字母、希腊字母之间的交互作用。第六节 裂区设计(选讲)拉丁方设计是由随机区组设计方法由一维向二维扩展变化出来的。随机区组设计法还可以有其它的变化。【例10.7】用3种方法从植物中提取有效成分,按4种浓度添加到培养基中,观察提取物对真菌生长的抑制作用。按两因素交叉进行分组实验,需要作3412种处理,假设每种处理作3次重复
37、,需进行36次实验。无论采用随机分组的方法,还是采用随机区组的方法,都需要在36批植物上作36次提取,作36次培养。有没有可能减小工作量呢?根据实验要求以及以前的实验经验,知道,我们更需要精密考虑的是浓度之间的差异,而对提取方法的要求不是那么严格。因此,可以这样做实验:分3个区组,对应有3次重复,在一个区组内,3种提取方法且只各提取一次,然后将提取物配制成4种浓度,从而得到12种处理。这样,根据提取方法的不同,形成了3各主区整区,主区内,根据浓度的不同,又形成4个次区副区,裂区。这样的实验设计被称为裂区设计,在裂区设计中,随机化受到了限制,只能分步随机化,首先在次区层次上随机化,然后,把主区当
38、作一个小的区组,在主区的层次上随机化。裂区设计的数学模型:其中g、a、ag落在主区中,后五项落在次区中,AR交互作用效应作为主区的误差,ABR交互作用效应作为次区的误差用R表示区组因素,因为区组内无重复, 无法估计。方差分析:F检验:假设实验结果如下:区组IIIIII提取方法123123123浓度5%10%15%20%495048435551544249463942545345415355494453454344535450445752534858524745将数据累计一下,分割成A、B、R三个表:提取方法A123584618563浓度B5%10%15%20%481458428398区组RII
39、IIII573579613计算各项平方和:作方差分析表:变异来源SSdfs2F区组(R)提取方法(A)AR交互作用77.56128.3936.2822438.7864.199.077.08*浓度(B)AB交互作用BR交互作用ABR交互作用434.0875.1720.6750.8336612144.6912.533.444.2442.06*2.96总和822.9835F2,4,0.05=6.94 F3,6,0.05=4.76 F6,12,0.05=3.00F2,4,0.01=18.00 F3,6,0.01=9.78 F6,12,0.01=4.82多重比较:LSD/SSR/q法作多重比较,略裂区设
40、计的应用场合:1、某因素的主效更重要,对精度的要求更高,这个因素的处理可以设为次处理;2、根据积累的实验经验,某因素产生的效用更大,可以将这个因素的处理设为主处理。第七节 正交设计Aa Bb CgBg Ca AbCb Ag Ba B1 B2 B3A1A2A3C1D1 C2D2 C3D3C2D3 C3D1 C1D2C3D2 C1D3 C2D1把A、B、C、D各因素的下标即各因素的各个处理水平列成一个表:因素ABCD123456789111222333123123123123231312123312231 在实验研究中,对于单因素或两因素实验,因其因素少 ,实验的设计 、实施与分析都比较简单 。但
41、在实际工作中 ,常常需要同时考察 3个或3个以上的实验因素 ,假设进行全面实验 ,那么实验的规模将很大 ,往往因实验条件的限制而难于实施 。正 交设计就是安排多因素实验 、寻求最优水平组合 的一种高效率实验设计方法。 一、正交设计的概念及原理 (一) 正交设计的根本概念 正交设计是利用正交表来安排与分析多因素实验的一种设计方法。它利用从实验的全部水平组合中,挑选局部有代表性的水平组合进行实验,通过对这局部实验结果的分析了解全面实验的情况,找出最优的水平组合。 例如,影响某品种鸡的生产性能有3个因素: A因素是饲料配方,设A1、A2、A3 3个水平;B因素是光照,设B1、B2、B3 3个水平;C
42、因素是温度,设C1、C2、C3 3个水平。这是一个3因素3水平的实验 ,各因素的水平之间全部可能的组合有27种 。 如果实验方案包含各因素的全部水平组合 ,即进行全面实验,可以分析各因素的效应 ,交互作用,也可选出最优水平组合。这是全面实验的优点 。但全面实验包含的水平组合数较多,工作量大 ,由于受实验场地、实验个体、经费等限制而难于实施 。 假设实验的主要目的是 寻 求 最 优水平组合 ,那么 可利用正交 设 计来安排实验。 正交设计的根本特点是:用局部实验来代替全面实验,通过对局部实验结果的分析,了解全面实验的情况。 正因为正交实验是用局部实验来代替全面实验,它 不 可 能像全面实验那样对
43、各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。虽然正交设计有上述缺乏,但它能通过局部实验找到最优水平组合 ,因 而 很 受实际工作者青睐。 如对于上述3因素3水平实验,假设不考虑交互作用,可利用正交表L9(34)安排,实验方案仅包含9个水平组合,就能反映实验方案包含27个水平组合的全面实验的情况,找出最正确的生产条件。 (二) 正交设计的根本原理 在实验安排中 ,每个因素在研究的范围内选几个水平,就好比在选优区内打上网格 ,如果网上的每个点都做实验,就是全面实验。如上例中,3个因素的选优区可以用一个立方体表示,3个因素各取 3个水平,把立方体划分成27个格点,反映在
44、 图上就是立方体内的27个“.。假设27个网格点都实验,就是全面实验。 3 因 素 3 水 平 的 全 面实验水平组合数为33=27,4 因素3水平的全面实验水平组合数为34=81 ,5因素3水平的全面实验水平组合数为35=243,这在实验中是不太可能做到的。 正交设计就是从选优区全面实验点水平组合中挑选出有代表性的局部实验点水平组合来进行实验。图中标有实验号的九个“(),就是利用正交表L9(34)从27个实验点中挑选出来的9个实验点。即:(1)A1B1C1 (2)A2B1C2 (3)A3B1C3(4)A1B2C2 (5)A2B2C3 (6)A3B2C1(7)A1B3C3 (8)A2B3C1
45、(9)A3B3C2 上述选择 ,保证了A因素的每个水平与B因素、C因素的各个水平在实验中各搭配一次。对于A、B、C 3个因素来说 , 是在27个全面实验点中选择9个实验点 ,仅 是全面实验的 三分之一。从图中可以看到,9个实验点在选优区中分布是均衡的,在立方体的每个平面上 ,都恰是3个实验点;在立方体的每条线上也恰有一个实验点。9个实验点均衡地分布于整个立方体内 ,有很强的代表性 ,能够比较全面地反映选优区内的根本情况。 二、正交表及其特性 (一) 正交表 由于正交设计安排实验和分析实验结果都要 用 正交表,因此,我们先对正交表作一介绍。 p271/p330表是一张正交表,记号为L8(27),
46、其中“L代表正交表;L右下角的数字“8表示有8行 ,用这张正交表安排实验包含8个处理(水平组合) ;括号内的底数“2 表示因素的水平数,括号内2的指数“7表示有7列 ,用这张正交表最多可以安排7个2水平因素。(8对应正交实验要进行的实验次数,27对应完全实验要进行的实验次数 常用的正交表已由数学工作者制定出来,供进行正交设计时选用。2水平正交表除L8(27)外,还有L4(23)、L16(215)等;3水平正交表有L9(34)、L27(213)等详见附表9/附表13。 (二) 正交表的特性 任何一张正交表都有如下两个特性: 1、任一列中,不同数字出现的次数相等 例如L8(27)中不同数字只有1和
47、2,它们各出现4次;L9(34)中不同数字有1、2和3,它们各出现3次 。 2、任两列中,同一横行所组成的数字对出现的次数相等 例如 L8(27)中(1, 1), (1, 2), (2, 1), (2, 2)各出现两次;L9(34) 中 (1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)各出现1次。即每个因素的一个水平与另一因素的各个水平互碰次数相等,说明任意两列各个数字之间的搭配是均匀的。 根据以上两个特性,我们用正交表安排的实验,具有均衡分散和整齐可比的特点。 所谓均衡分散,是指用正交表挑选出来的各因
48、素水平组合在全部水平组合中的分布是均匀的 。 由 图可以看出,在立方体中 ,任一平面内都包含 3 个“(), 任一直线上都包含1个“() ,因此 ,这些点代表性强 ,能够较好地反映全面实验的情况。 整齐可比是指 每 一个因素的各水平间 具 有可 比性。因为正交表中每一因素的任一水平下都均衡地包含着另外因素的各个水平 ,当比较某因素不 同 水平时,其它 因素 的 效 应都彼此抵消。如在A、B、C 3个因素中,A因素的3个水平 A1、A2、A3 条件下各有 B、C 的 3 个不同水平,即: 在这9个水平组合中,A因素各水平下包括了B、C因素的3个水平,虽然搭配方式不同,但B、C皆处于同等地位,当比
49、较A因素不同水平时,B因素不同水平的效应相互抵消,C因素不同水平的效应也相互抵消。所以A因素3个水平间具有可比性。同样,B、C因素3个水平间亦具有可比性。A1B1C1B2C2B3C3A2B1C2B2C3B3C1A3B1C3B2C1B3C2 (三) 正交表的类别 1、相同水平正交表 各列中出现的最大数字相同的正交表称为相同水平正交表。如L4(23)、L8(27)、L12(211)等各列中最大数字为2,称为两水平正交表;L9(34)、L27(313)等各列中最大数字为3,称为3水平正交表。 2、混合水平正交表 各列中出现的最大数字不完全相同的正交表称为混合水平正交表。如L8(424)表中有一列最大
50、数字为4,有4列最大数字为2。也就是说该表可以安排一个4水平因素和4个2水平因素。再如L16(4423),L16(4212)等都混合水平正交表。三、正交设计方法 【例10.8】 在进行矿物质元素对架子猪补饲实验中,考察补饲配方、用量、食盐3个因素,每个因素都有3个水平。试安排一个正交实验方案。 正交设计一般有以下几个步骤: (一) 确定因素和水平 影响实验结果的因素很多,我们不可能把所有影响因素通过一次实验都予以研究,只能根据以往的经验,挑选和确定假设干对实验指标影响最大、有较大经济意义而又了解不够清楚的因素来研究。同时还应根据实际经验和专业知识,定出各因素适宜的水平,列出因素水平表。【例8.
51、7】的因素水平表如表所示。 处理水平因素矿物质配方A用量(g)B食盐(g)C123IIIIII152520048 (二) 选用适宜的正交表 确定了因素及其水平后,根据因素、水平及需要考察的交互作用的多少来选择适宜的正交表。选用正交表的原那么是:既要能安排下实验的全部因素,又要使局部水平组合数处理数尽可能地少。一般情况下,实验因素的水平数应恰好等于正交表记号中括号内的底数;因素的个数包括交互作用应不大于正交表记号中括号内的指数;各因素及交互作用的自由度之和要小于所选正交表的总自由度,以便估计实验误差。假设各因素及交互作用的自由度之和等于所选正交表总自由度,那么可采用有重复正交实验来估计实验误差。
52、 此例有3个3水平因素,假设不考察交互作用,那么各因素自由度之和为因素数个数(水平数-1)=3(3-1)=6,小于L9(34)总自由度9-1=8,故可以选用L9(34);假设要考察交互作用,那么应选用L27(313),此时所安排的实验方案实际上是全面实验方案。 (三) 表头设计 所谓表头设计,就是把挑选出的因素和要考察的交互作用分别排入正交表的表头适当的列上。 在不考察交互作用时,各因素可随机安排在各列上;假设考察交互作用,就应按该正交表的交互作用列表安排 各 因 素与交互作用。 此例不考察交互作用,可将矿物质元素补饲配方(A)、用量(B)和食盐 (C)依次安排在L9(34)的第1、2、3列上
53、,第 4 列 为空列,见表。 (四) 列出实验方案 把正交表中安排各因素的每个列(不包含欲考察的交互作用列)中的每个数字依次换成该因素的实际水平,就得到一个正交实验方案。表头设计列号1234因素ABC空 根据上表,1 号实验处理是 A1B1C1,即配 方I、用量15g、食盐为0;2号实验处理是A1B2C2,即配方II 、 用 量 25g 、食 盐 为 4g, ;9号实验处理为A3B3C2,即配方III、用量20g、食盐4g。 正交实验方案实验号因素ABC1234567891(I)1(I)1(I)2(II)2(II)2(II)3(III)3(III)3(III)1(15)2(25)3(20)1(
54、15)2(25)3(20)1(15)2(25)3(20)1(0)2(4)3(8)2(4)3(8)1(0)3(8)1(0)2(4)四、正交实验结果的统计分析 假设各号实验处理都只有一个观测值,那么称之为单独观测值正交实验;假设各号实验处理都有两个或两个以上观测值,那么称之为有重复观测值正交实验。 下面分别介绍单独观测值和有重复观测正交实验结果的方差分析。 (一) 单独观测值正交实验结果的方差分析 用L9(34)安排实验方案后,各号实验只进行一次,实验结果(增重)列于下表。试对其进行方差分析。 该次实验的9个观测值总变异由A因素、B因素、C因素及误差变异四局部组成,因而进行方差分析时平方和与自由度
55、的划分式为: SST = SSA+SSB+SSC+SSe dfT = dfA + dfB + dfC + dfe 实验号因素增重(kg)xABC12345678911122233312312312312323131263.468.964.964.370.265.871.469.573.7T1T2T3197.2200.3214.6199.1208.6204.4198.7206.9206.5平均值 表中,Ti为各因素同一水平实验指标增重之和。 如 A因素第1水平 T1=x1+x2+x3=63.4+68.9+64.9=197.2, A因素第2水平 T2=x4+x5+x6=64.3+70.2+65.8
56、=200.3, A因素第3水平 T3=x7+x8+x9=71.4+69.5+73.7=214.6;B因素第1水平 T1=x1+x4+x7=63.4+64.3+71.4=199.1,B因素第3水平T3=x3+x6+x9=64.9+65.8+73.7=204.4。同理可求得C因素各水平实验指标之和。 为各因素同一水平实验指标的平均数。 如A因素第1水平 =197.2/3=65.7333, A因素第2水平 =200.3/3=66.7667, A因素第3水平 =214.6/3=71.5333。 同理可求得B、C因素各水平实验指标的平均数。 1、计算各项平方和与自由度 矫正数 C = T2/n = 61
57、2.12/9 = 41629.6011 总平方和 =63.42+68.92+73.72 - 41629.6011 =101.2489 A因素平方和 =(197.22+200.32+214.62)/3 41629.6011=57.4289 B因素平方和 =(199.12+208.62+204.42)/3 -41629.6011 =15.1089 C因素平方和 =(198.72+206.92+206.52)/3 误差平方和 SSe=SST-SSA-SSB-SSC =101.2489-57.4289-15.1089 -41629.6011 =14.248914.2489 =14.4622 总自由度
58、dfT =n-1=9-1=8 A因素自由度 dfA =ka-1=3-1=2 B因素自由度 dfB =kb-1=3-1=2 C因素自由度 dfC =kc-1=3-1=2 误差自由度 dfe = dfT-dfA-dfB-dfC = 8-2-2-2 = 2 2、列出方差分析表,进行F检验变异来源SSdfs2FF0.05,2,2配方(A)用量(B)食盐(C)误差57.4315.1114.2514.46222228.717.557.127.233.971.05119.00总变异101.258 F 检验结果说明,三个因素对增重的影响都不显著。究其原因可能是本例实验误差大且误差自由度小(仅为2),使检验的灵
59、敏度低,从而掩盖了考察因素的显著性。由于各因素对增重影响都不显著,不必再进行各因素水平间的多重比较。此时,可直观地从表中选择平均数大的水平A3、B3、C2组合成最优水平组合A3B3C2。 上述无重复正交实验结果的方差分析,其误差是由“空列来估计的。然而“空列并不空,实际上是被未考察的交互作用所占据。这种误差既包含实验误差,也包含交互作用,称为模型误差。假设交互作用不存在,用模型误差估计实验误差是可行的;假设因素间存在交互作用,那么模型误差会夸大实验误差,有可能掩盖考察因素的显著性。这时,实验误差应通过重复实验值来估计。所以,进行正交实验最好能有二次以上的重复。正交实验的重复,可采用完全随机或随
60、机区组设计。 (二) 有重复观测值正交实验结果的方差分析 【例10.9】实验重复了两次,且重复采用随机区组设计,实验结果列于表。试对其进行方差分析。 用n表示实验(处理)号数,r表示实验处理的重复数。a、b、c、ka、kb、kc的意义同上。此例n=9、r=2、a=b=c=3、ka=kb=dc=3。实验号因素增重(kg)xABC空区组1区组2Tt1234567891112223312312312312323131212331223163.468.964.964.370.265.871.469.573.767.487.266.386.388.566.689.091.292.8130.8156.11
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生物发酵工程技术在生物发酵产业产业链优化升级中的应用前景报告
- 2024年9月计算机四级网络工程师笔试试题
- 基于大数据的互联网医疗美容服务模式创新研究评估报告
- 绿色建筑认证体系在绿色住宅社区的推广与应用分析报告
- 2023年职业技能学历双提升工程实施方案
- 绿色消费理念在2025年绿色家居窗帘品牌推广中的传播与消费者引导报告
- 2023年监理工程师的工作考试答案
- 2023幼儿园食品安全工作计划
- 2023年继续教育八大员安全员考试+答案
- 2023年造价工程师安装工程真题加参考答案及解析
- 第12章一次函数 单元测试 数学八年级上册 沪科版
- 2025平面设计合同范本
- 养老服务投标文件(技术方案)
- 宁夏中卫人文介绍
- 湖南省英语高考试题与参考答案(2025年)
- 行政执法资格证法律知识考试复习题及答案
- 广西壮族自治区2025年普通高校招生考生报名登记表(样表)
- 统编版语文三年级上册第6单元大单元教学设计
- 精神分裂症合并糖尿病患者护理查房课件
- GB/T 44230-2024政务信息系统基本要求
- 宫腔镜技术诊断子宫内膜癌的临床应用
评论
0/150
提交评论