




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多元统计分析方法The Methods of Multivariate Statistical Analysis第三章 多因子方差分析 无交互效应的二因子方差分析 有交互效应的二因子方差分析 三因子方差分析 其他多因子方差分析方差分析的分类单反应变量 (y)多反应变量(y1,y2yk)单效应因子(A)双效应因子(A,B)多效应因子(A,B,C)无交互效应有交互效应2)根据效应因子的随机性: 固定模型(fixed model):效应因子是专门指定的。 随机模型(random model):效应因子是从很多因子中随机抽取出来的。 混合模型(mixed model):效应因子包含两种类型因子。1)根
2、据变量的个数:第一节 无交互效应的二因子方差分析数据: 每个交叉点上一个观测值SST = SSA + SSB + SSE总变异=因子A+ 因子B + 随机误差方差分析原理-变异分解:无交互效应的双因子方差分析表:统计假设:【例3-1】用四种不同方法治疗8名患者,其血浆凝固时间的资料列在表3-2中。试分析治疗方法对血浆凝固时间的影响。表3-2 治疗方法与浆凝固时间的资料【SAS 程序】data eg3_1 ; do b=1 to 8; do a =1 to 4 ; input x ; output ; end ; end ; cards; 8.4 9.4 9.8 12.2 7.9 8.1 8.2
3、 10.0run ;proc anova; class a b ; model x = a b; means a / snk;run;模型包含b因子-校正个体差异的影响【SAS 输出结果】Analysis of Variance ProcedureDependent Variable: X Sum of MeanSource DF Squares Square F Value Pr FModel 10 92.00500000 9.20050000 14.03 0.0001Error 21 13.77375000 0.65589286Corrected Total 31 105.77875000
4、 R-Square C.V. Root MSE X Mean 0.869787 8.103786 0.8098721 9.9937500Source DF Anova SS Mean Square F Value Pr FA 3 13.01625000 4.33875000 6.62 0.0025B 7 78.98875000 11.28410714 17.20 0.0001 Student-Newman-Keuls test for variable: XNOTE: This test controls the type I experimentwise error rate under t
5、he complete null hypothesis but not under partial null hypotheses.Alpha= 0.05 df= 21 MSE= 0.655893Number of Means 2 3 4Critical Range 0.8421113 1.0206699 1.1286903Means with the same letter are not significantly different.SNK Grouping Mean N A A 11.0250 8 4 B 9.9375 8 3 B 9.7125 8 2 B 9.3000 8 1Sour
6、ce DF Anova SS Mean Square F Value Pr FA 3 13.01625000 4.33875000 6.62 0.0025B 7 78.98875000 11.28410714 17.20 0.0001Model 10 92.00500000 9.20050000 14.03 0.0001Error 21 13.77375000 0.65589286Corrected Total 31 105.77875000无交互效应的双因子方差分析表:【SAS 程序】data eg3_1 ; do b=1 to 8; do a =1 to 4 ; input x ; out
7、put ; end ; end ; cards; 8.4 9.4 9.8 12.2 7.9 8.1 8.2 10.0run ;proc anova; class a ; model x = a ; means a / snk;run;模型不包含b因子-不校正个体差异的影响Analysis of Variance ProcedureDependent Variable: XSource DF Sum of Squares F Value Pr FModel 3 13.01625000 1.31 0.2909Error 28 92.76250000Corrected Total 31 105.77
8、875000 R-Square C.V. X Mean 0.123052 18.21288 9.99375000Source DF Anova SS F Value Pr FA 3 13.01625000 1.31 0.2909Source DF Sum of Squares Mean Square F Value Pr FA 3 13.01625000 4.33875000 1.31 0.2909Error 28 92.76250000 3.31294643Corrected Total 31 105.77875000完全随机设计的单因素方差分析结果:Source DF Anova SS M
9、ean Square F Value Pr FA 3 13.01625000 4.33875000 6.62 0.0025B 7 78.98875000 11.28410714 17.20 0.0001Error 21 13.77375000 0.65589286Corrected Total 31 105.77875000随机区组设计的双因素方差分析结果:第二节 有交互效应的二因子方差分析数据:每个交叉点上有r (1) 个重复观测值SST = SSA + SSB + SSAB + SSE总变异=因子A+ 因子B + 交互效应AB + 随机误差方差分析原理-变异分解:(1) H0: 1 =a
10、H1: i j (A效应)(2) H0: 1 =b H1: i j (B效应) H0: 所有ij 都相同 H1: 所有ij 不完全相同 (交互效应)统计假设:有交互效应的双因子方差分析表:什么是交互效应? Y Y例如: Y= 舒张压 A=药物: A=1 (对照药), A=2 (试验药) B=性别: B=1 (男性) , B=2 (女性)无交互效应模型: Y=A+B有交互效应模型: Y=A+B+AB交互效应的阶数二因子:A, B, A*B 主效应: A, B 一阶交互效应: A*B 三因子:A, B, C, A*B, A*C, B*C, A*B*C 主效应: A, B, C 一阶交互效应: A*
11、B, A*C, B*C 二阶交互效应: A*B*C:【例3-2】某药物研究所作抗哮喘病药物实验,目的是比较两种剂量的抗哮喘病药物和一个对照药物在三个临床研究地点的效能差异。研究设计是在每一个地点用每一种处理方法处理8个病人,因变量采用的是哮喘病人体能测试得分的增加量。测试结果列在表3-4中。表3-4 哮喘病人体能测试得分增加量数据【SAS程序】data eg3_2; do place=1 to 3;do treat=1 to 3;do id=1 to 8; input x ; output; end; end;end; cards;4.0 2.3 6.3 10.22.4 5.4 6.4 9.0
12、1.0 1.3 6.8 5.2run;proc glm; class place treat; model x=place | treat; lsmeans place | treat / pdiff adjust=bon;run;【SAS输出结果】General Linear Models ProcedureClass Level InformationClass Levels ValuesPLACE 3 1 2 3TREAT 3 1 2 3Number of observations in data set = 72 Dependent Variable: X Sum of MeanSou
13、rce DF Squares Square F Value Pr FModel 8 297.97000000 37.24625000 11.62 0.0001Error 63 201.98500000 3.20611111Corrected Total 71 499.95500000 R-Square C.V. Root MSE X Mean 0.595994 34.71202 1.7905617 5.1583333 模型总体检验结果:p=0.0001,R2=0.596。说明模型有统计意义。Source DF Type I SS Mean Square F Value Pr FPLACE 2
14、21.31750000 10.65875000 3.32 0.0424TREAT 2 185.85583333 92.92791667 28.98 0.0001PLACE*TREAT 4 90.79666667 22.69916667 7.08 0.0001Source DF Type III SS Mean Square F Value Pr FPLACE 2 21.31750000 10.65875000 3.32 0.0424TREAT 2 185.85583333 92.92791667 28.98 0.0001PLACE*TREAT 4 90.79666667 22.69916667
15、 7.08 0.0001 因子的主效应和交互效应检验结果:地点p=0.0424,处理方法p=0.0001,交互效应p=0.0001。说明所有因子效应以及交互效应都具有显著性意义。Least Squares MeansAdjustment for multiple comparisons: BonferroniPLACE X Pr |T| H0: LSMEAN(i)=LSMEAN(j) LSMEAN i/j 1 2 31 4.53750000 1 . 0.0383 0.90712 5.86250000 2 0.0383 . 0.39793 5.07500000 3 0.9071 0.3979 .
16、TREAT X Pr |T| H0: LSMEAN(i)=LSMEAN(j) LSMEAN i/j 1 2 31 2.90000000 1 . 0.0001 0.00012 6.50416667 2 0.0001 . 1.00003 6.07083333 3 0.0001 1.0000 . 三个地点上因变量均值差异的检验结果:仅地点I和II有显著性差异(p=0.0383),均值分别为4.54和5.86。 三种处理方法的因变量均值差异的检验结果:低剂量药物与其它两种药物均有显著性差异(p=0.0001),高剂量药物与对照药物没有显著性差异(p=1.0000),三种药物的均值分别为2.90、6.5
17、0和6.07。PLACE TREAT X LSMEAN LSMEAN Number1 1 3.47500000 11 2 3.67500000 21 3 6.46250000 32 1 3.12500000 42 2 7.97500000 52 3 6.48750000 63 1 2.10000000 73 2 7.86250000 83 3 5.26250000 9 交叉处理组上均值的成对比较结果。读这部分结果,首先搞清楚排列序号1-9的意义,它表示33=9个不同的处理方式。例如,序号1表示place=1,treat=1;序号2表示place=1,treat=2;序号4表示place=2,t
18、reat=1;序号5表示place=2,treat=2。Pr |T| H0: LSMEAN(i)=LSMEAN(j) i/j 1 2 3 4 5 6 7 8 9 1 . 1.0000 0.0513 1.0000 0.0002 0.0471 1.0000 0.0003 1.0000 2 1.0000 . 0.1001 1.0000 0.0004 0.0922 1.0000 0.0006 1.0000 3 0.0513 0.1001 . 0.0150 1.0000 1.0000 0.0003 1.0000 1.0000 4 1.0000 1.0000 0.0150 . 0.0001 0.0137
19、1.0000 0.0001 0.7191 5 0.0002 0.0004 1.0000 0.0001 . 1.0000 0.0001 1.0000 0.1277 6 0.0471 0.0922 1.0000 0.0137 1.0000 . 0.0003 1.0000 1.0000 7 1.0000 1.0000 0.0003 1.0000 0.0001 0.0003 . 0.0001 0.0280 8 0.0003 0.0006 1.0000 0.0001 1.0000 1.0000 0.0001 . 0.1826 9 1.0000 1.0000 1.0000 0.7191 0.1277 1.
20、0000 0.0280 0.1826 .序号1和序号2的比较结果是p=1.0000,表示在第一个地点上,低剂量药物与高剂量药物没有显著性差异,它们的差异是d1=3.475-3.675= - 0.2。序号4和序号5的比较结果是p=0.0001,表示在第二个地点上,低剂量药物与高剂量药物有非常显著的差异,它们的差异是d2=3.125-7.975= - 4.85。结果说明:在I 和II两个不同的地点上,低剂量药物与高剂量药物对因变量影响的效果是完全不同的:一个无显著性差异,一个有显著性差异。该问题如果不分析交互效应,得到的结论是,低剂量药物与高剂量药物有显著性差异。显然这个结论是不十分准确的。第三节
21、 三因子方差分析SST = SSA + SSB + SSC + SSAB + SSAC + SSBC + SSABC + SSE方差分析原理-变异分解:三因子方差分析表:多因子方差分析 = 析因分析【例3-3】某研究组用小鼠做实验,研究性别,种类和体重对皮下移植SRS瘤细胞生长特性影响的结果。共选用了28只小鼠,实验设计采用的是有重复的三因子析因设计。接种后第8天测得肿瘤体积列在表3-7中。试对该实验作出统计分析结论。表3-7 皮下移植SRS瘤细胞肿瘤体积观测数据【SAS程序】data eg3_3; do a=1;do id=1 to 3;do b=1 to 2;do c=1 to 2; in
22、put x ;output;end;end;end;end; do a=2;do id=1 to 4;do b=1 to 2;do c=1 to 2; input x ;output;end;end;end;end; cards; 0.7069 1.0838 0.0628 0.4712 0.2503 0.8514 0.0125 0.1327run;proc glm; class a b c; model x=a b c a*b a*c b*c a*b*c;run;【SAS输出结果】General Linear Models ProcedureClass Level InformationCla
23、ss Levels ValuesA 2 1 2B 2 1 2C 2 1 2Number of observations in data set = 28Dependent Variable: X Sum of MeanSource DF Squares Square F Value Pr FModel 7 2.46341682 0.35191669 10.09 0.0001Error 20 0.69723090 0.03486155Corrected Total 27 3.16064772 R-Square C.V. Root MSE X Mean 0.779403 50.95467 0.18
24、67125 0.3664286Source DF Type III SS Mean Square F Value Pr FA 1 0.08232839 0.08232839 2.36 0.1400B 1 1.47768123 1.47768123 42.39 0.0001C 1 0.58870397 0.58870397 16.89 0.0005A*B 1 0.04510319 0.04510319 1.29 0.2688A*C 1 0.09834212 0.09834212 2.82 0.1086B*C 1 0.05372962 0.05372962 1.54 0.2288A*B*C 1 0
25、.05799944 0.05799944 1.66 0.2118General Linear Models ProcedureDependent Variable: X Sum of MeanSource DF Squares Square F Value Pr FModel 3 2.18963285 0.72987762 18.04 0.0001Error 24 0.97101487 0.04045895Corrected Total 27 3.16064772 R-Square C.V. Root MSE X Mean 0.692780 54.89313 0.2011441 0.36642
26、86Source DF Type III SS Mean Square F Value Pr FA 1 0.08232839 0.08232839 2.03 0.1666B 1 1.43410837 1.43410837 35.45 0.0001C 1 0.67319609 0.67319609 16.64 0.0004可以有效控制或消除其它混杂因素对反应变量的干扰,使得分析结果更准确;可以同时研究几个因素之间的交互作用,使得分析结果更可靠和稳定。析因分析的优点: 它需要的样本较多,或者需要实验的次数较多,特别是因子的水平较多时更是如此。析因分析的缺点:拉丁方设计 (Latin square
27、design):是一种特殊的三因子设计。它要求:1)三个因子的水平数 r 相同;2)三个因子的一阶交互效应不存在。对于rr 拉丁方,仅需要n= r r 个样本。一、拉丁方设计的概念数据:将n=33=9个样本随机地分配到每一个格子里,进行相应的试验。例如第一行第一列的样本对应的试验条件是A=1,B=1,C=b。统计假设:(1) H0: 1 =2 H1: 1 2 (A效应)(2) H0: 1 =2 H1: 1 2 (B效应)H0: 1 = 2 H1: 1 2 (C效应)方差分析表:【例3-4】为了了解喂养时间、地区温度和食物配方对某种动物体重的影响,某研究所设计了一个33拉丁设计,其中,因子A表示
28、喂养时间,水平记为1、2、3;因子B表示地区温度,水平记为1、2、3;因子C表示食品配方,水平记为a、b、c。经过一段时间喂养后,体重的增加量记录在下表中。试用拉丁方分析法作出结论。data eg3_4; input a b c $ x ; cards;1 1 b 20 1 2 c 30 1 3 a 60 2 1 c 25 2 2 a 70 2 3 b 25 3 1 a 55 3 2 b 30 3 3 c 25run;proc anova ; class a b c; model x=a b c; means a b c/ lsd; run;SAS 程序Analysis of Variance
29、 ProcedureDependent Variable: XSource DF Sum of Squares F Value Pr FModel 6 2750.00000000 165.00 0.0060Error 2 5.55555556Corrected Total 8 2755.55555556 R-Square C.V. X Mean 0.997984 4.411765 37.7777778Source DF Anova SS F Value Pr FA 2 22.22222222 4.00 0.2000B 2 155.55555556 28.00 0.0345C 2 2572.22
30、222222 463.00 0.0022T tests (LSD) for variable: XNOTE: This test controls the type I comparisonwise error rate not the experimentwise error rate.Means with the same letter are not significantly different. T Grouping Mean N A A 40.000 3 2 A 36.667 3 1 A 36.667 3 3 T Grouping Mean N B A 43.333 3 2 B 3
31、6.667 3 3 B 33.333 3 1 T Grouping Mean N C A 61.667 3 a B 26.667 3 c B 25.000 3 b统计结果:因子A的三个水平间没有显著性差异;因子B的三个水平中,第二个水平与其它两个水平有显著性差异;因子C的三个水平中,水平a与其它两个有显著性差异。专业结论:地区温度和食物配方对动物体重有显著性影响;喂养时间对动物体重无显著性影响。尤其第一种食物配方使得体重增加最快。二、嵌套设计资料的方差分析因子Aa1a2因子Bb1 b2 b3 b1 b2 例如如果因素B的水平在因素A的每一个水平之内,则称因素B嵌套在因素A之内,记为B(A)。并
32、称A为主因子,B为A的嵌套因子。这种设计称为嵌套设计(nested design)。特点:1)效应因子可以是随机因子; 2)主因子的变异大于嵌套因子的变异; 3)嵌套因子在主因子各水平下可以取不同水平 值或不同个数的水平。使用方法:1)实验因素对反应变量的影响有主次之分 时,将主要因素作为主因子; 2)不能分析因素之间的交互作用。因子Aa1a2因子Bb1 b2 b3 b1 b2 嵌套设计的应用实例1为研究不同品种的萝卜叶子中钙的含量,从四种萝卜中各随机抽取了一个萝卜(因素A),每个萝卜上随机抽取了3片叶子(因素B),每个叶子上取2个样本(重100mg),进行测定,结果列在下表中。特点:1)萝卜
33、和叶子都是随机抽取的; 2)萝卜(因子A)的变异大于叶子(因子B)的变异; 3)嵌套因子在主因子各水平下可以取不同个数的水平。萝卜叶子中钙含量测定结果data turnip; do sample=1 to 2; do plant=1 to 4; do leaf=1 to 3; input calcium ; output; end; end; end; cards;3.28 3.52 2.88 2.46 1.87 2.19 2.77 3.74 2.55 3.78 4.07 3.313.09 3.48 2.80 2.44 1.92 2.19 2.66 3.44 2.55 3.87 4.12 3.
34、31run;proc sort; by plant leaf sample; run;proc nested; class plant leaf; var calcium;run;SAS程序Nested Random Effects Analysis of Variance for Variable CALCIUM DegreesVariance of Sum of ErrorSource Freedom Squares F Value Pr F TermTOTAL 23 10.270396PLANT 3 7.560346 7.665 0.0097 LEAFLEAF 8 2.630200 49
35、.409 0.0000 ERRORERROR 12 0.079850Variance Variance PercentSource Mean Square Component of TotalTOTAL 0.446539 0.532938 100.0000PLANT 2.520115 0.365223 68.5302LEAF 0.328775 0.161060 30.2212ERROR 0.006654 0.006654 1.2486Mean 3.01208333Standard error of mean 0.32404445在某项化合物转化率的实验研究中,涉及到催化剂的种类(因素A)和温度
36、(因素B)。根据专业知识,催化剂对该化合物转化率的影响作用大于温度,而且在不同催化剂条件下所用的温度不完全相同。实验批次为2。转化率观测结果列在下表中。试分析催化剂和温度对该化合物转化率的作用。特点:1)催化剂(因子A)的变异大于温度(因子B)的变异; 2)嵌套因子B在主因子A各水平下取值不同。不同催化剂在不同温度下对某化合物转化率的观测结果嵌套设计的应用实例2data act; do sample=1 to 2; do act=1 to 3; do temp=1 to 3; input pct ; y=arsin(sqrt(pct/100); output; end; end; end; c
37、ards;82 91 85 65 62 56 71 75 8584 88 83 61 59 60 67 78 89run;proc sort; by act temp sample; run;proc nested; class act temp; var y;run;Nested Random Effects Analysis of Variance for Variable Y DegreesVariance of Sum of ErrorSource Freedom Squares F Value Pr F TermTOTAL 17 0.333622ACT 2 0.262434 12.3
38、47 0.0075 TEMPTEMP 6 0.063767 12.889 0.0006 ERRORERROR 9 0.007421Variance Variance PercentSource Mean Square Component of TotalTOTAL 0.019625 0.025824 100.0000ACT 0.131217 0.020098 77.8263TEMP 0.010628 0.004902 18.9806ERROR 0.000825 0.000825 3.1931Mean 1.05215146Standard error of mean 0.08538045三、裂区设计资料的方差分析例如,二级裂区设计资料是:裂区设计(split plot design):是一个多级的随机区组设计。特点:1)效应因子是固定因子,区组配置是随机的; 2)效应因子分先后顺序,如AB C。使用方法:1)先将实验对象分成区组,再将每个区 组里的实验对象按第一因子分组,再 按第二因子分组。 2)可以分析因素之间的交
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电缆桥架国标10216-2013
- 2025年亚叶酸钙项目合作计划书
- 山西省平遥县高中数学 第三章 函数的应用 3.2 函数模型及其应用(1)教学实录 新人教A版必修1
- 班主任的工作职责与发展计划
- 主管工作总结的计划编制
- 持续学习与发展计划
- 四年级下册数学教案-7.7 平行四边形的面积 丨苏教版
- 四川省雅安市雨城区中里镇中学九年级化学下册 9.2 溶解度教学实录 (新版)新人教版
- 2024-2025年高中化学 第2章 第1节 课时2 一种重要的混合物-胶体教学实录 鲁科版必修1
- 二年级语文上册 课文7 22《狐狸分奶酪》同步教学实录 新人教版五四制
- DB61∕T 1165-2018 高速公路服务区服务规范
- 2024人民医院医疗场所安保项目服务合同
- 2023年浙江宁波交投公路营运管理有限公司招聘考试真题
- 数字化井控技术研究现状及发展趋势
- 护理中断事件的风险及预防
- 农商行抵押合同范本
- 急性皮肤衰竭与压力性损伤鉴别
- 武汉市光谷实验中学2023-2024学年七年级下学期月考数学试题【带答案】
- 放射性元素的半衰期
- 2024-2029年中国金融服务外包行业发展分析及发展战略研究报告
- 殡葬行业风险分析报告
评论
0/150
提交评论