数据分析补充_第1页
数据分析补充_第2页
数据分析补充_第3页
数据分析补充_第4页
数据分析补充_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分析主讲:黄剑补充:方差分析2023年2月3日数据分析(主讲:黄剑)2一、方差分析概念方差分析(analysisofvariance)又称变异数分析,可简记为ANOVA,主要用于检验计量资料中的两个或两个以上均值间差别显著性的方法。根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分成相应的各个部分,各部分的离均差平方除以相应部分的自由度得出各部分的均方,然后列出方差分析表算出值,作出统计推断。2023年2月3日数据分析(主讲:黄剑)3变异来源source离差平方和SS自由度df均方MSF统计量FP效应S1SS1df1MS1=SS1/df1F1(df1,dfe)=MS1/MSeP1效应S2SS2df2MS2=SS2/df2F2(df2,dfe)=MS2/MSeP2…………………………效应SmSSmdfmMSm=SSm/dfmFm(dfm,dfe)=MSm/MSePm误差SeSSedfeMSe=SSe/dfe总变异STSST=SS1+SS2+…+SSm+SSedfT=df1+df2+…+dfm+dfeMST=SST/dfTFT(dfT,dfe)=MST/MSePT单因素方差分析2023年2月3日数据分析(主讲:黄剑)4设因素A有k个水平A1,A2,…Ak,在每一个水平下考察的指标可以看成一个总体,现有k个总体,并假定:1、每一个总体均服从正态分布;2、每一个总体的方差相同;3、从每一个总体中抽取的样本相互独立。我们要比较各个总体的均值是否一致,就是要检验各总体的均值是否相同,设第i个总体的均值为μi,那么就是要检验如下原假设:统计量统计量检验的

值为对给出的

,若

,则拒绝,各水平的效应有显著差异;否则,不能拒绝,认为各水平的效应无显著差异.SAS中的procanova用于单因素的方差分析.例3.1幼鼠对三种食谱的体重增加量的数据如下,试分析营养效果是否明显差异.dataexamp3_1;inputrecipe$weight@@;cards;a1164a1190a1203a1205a1206a1214a1228a1257a2185a2197a2201a2231a3187a3212a3215a3220a3248a3265a3281;run;proc

anova

data=examp3_1;classrecipe;modelweight=recipe;run;

例3.2分析四个实验室试制的纸张光滑度有无差异dataexamp3_2;inputlab$smooth@@;cards;a138.7a141.5a143.8a144.5a145.5a146.0a147.7a158.0a239.2a239.3a239.7a241.4a241.8a242.9a243.3a245.8a334.0a335.0a339.0a340.0a343.0a343.0a344.0a345.0a434.0a434.8a434.8a435.4a437.2a437.8a441.2a442.8;run

各对均值差异的置信区间proc

anovadata=examp3_3;classlab;modelsmooth=lab;meanslab;meanslab/clmalpha=0.05;meanslab/tcldiffalpha=0.05;run;双因素方差分析研究饮食和健美操对减肥的作用。我们认为饮食对减肥肯定有一定作用,适当的健美操对减肥也有效果。如果饮食加上健美操作为减肥的手段,就存在哪一种饮食配上哪一样健美操最为有效的问题,因为饮食与饮食这两种减肥手段之间存在着交互作为,会强化减肥的作用。现有三套饮食方案称为a、b、c,五种不同的健美操标记为1、2、3、4、5。构成成了3×5=15种水平组合,选择了情况基本相同的90个肥胖人进行试验,将他们随机地指派到这15个组中且每组6人。经过一段时间后,体重的下降结果见表所示proc

glmdata=fatness;classfoodtrain;modely=foodtrainfood*train;lsmeansfoodtrainfood*train;lsmeansfood*train/slice=foodslice=train;Contrast't1vst4inf1‘train1

0

0-1

0food*train

1

0

0-1

0;Contrast't2vst4inf1‘train0

1

0-1

0food*train

0

1

0-1

0;Contrast't3vst4inf1‘train0

0

1-1

0food*train

0

0

1-1

0;Contrast't4vst5inf1‘train0

0

0

1-1food*train

0

0

0

1-1;Contrast't2vst5inf3‘train0

1

0

0-1food*train

0

0

0

0

0

0

0

0

0

0

0

1

0

0-1;run;程序说明:本例中有两个因素food和train,因此在class语句中要有这两个分组变量名。由于除了要考察这两个因素的主效应外,还要考察这两个因素的交互效应,表示为food*train,所以需要在model语句的后面加上这个交互效应。用lsmeans语句替代means语句的主要原因是,对于非均衡的试验数据需要计算最小二乘均值,它是一种调整后的均值。第二条lsmeans语句的作用,考虑到交叉项food*train是显著情况时,通过Slice选项规定的food效应和train效应来分开交叉的food*train效应。Contrast语句是作更进一步的对比,前四条Contrast语句是把因素food固定在第一个水平a上,然后对food因素有显著交互作用的train因素的某两个水平之间进行比较,最后一条contrast语句是把因素food固定在第三个水平c上,对train因素的第二个水平均值和第五个水平均值进行比较。要注意food*train交叉效应的参数化形式的规则为,交叉组合下标里最右边的变量水平比最左边的变量水平变化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论