第五章 方差分析_第1页
第五章 方差分析_第2页
第五章 方差分析_第3页
第五章 方差分析_第4页
第五章 方差分析_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章方差分析第1页,共99页,2023年,2月20日,星期三5.1方差分析中的有关概念5.1.1单因素方差分析问题与模型5.1.2双因素方差分析问题与模型5.1.3方差分析中的基本假定第2页,共99页,2023年,2月20日,星期三在现实的生产和经营管理中,经常要分析各种因素对研究对象某些特征值的影响.方差分析(analysisofvariance)就是采用数理统计方法对数据进行分析,以鉴别各种因素对研究对象的某些特征值影响大小的一种有效方法.研究对象的特征值,即所考察的试验(其涵义包括调查,收集等)结果(如产品质量、数量、销量、成本等)称为试验指标,简称指标,常用x表示.在试验中对所关心的“指标”有影响的、要加以考察而改变状态的原因称为因素,用A,B,C等大写英文字母表示.方差分析的基本思想第3页,共99页,2023年,2月20日,星期三5.1.1单因素方差分析问题与模型1.数学模型进行单因素方差分析时,需要得到如图5-1所示的数据结构。设xij表示第i个总体的第j个观测值(i=1,2,…,m,j=1,2,…,ni),希望由此对不同水平下总体的均值进行比较。观测值(j)A因素(i)A1A2…Am1x11x21…xm12x12x22…xm2……………ni…第4页,共99页,2023年,2月20日,星期三对此,观察到的xij常用以下的模型表示:xij=i+ij

,1≤j≤ni,1≤i≤m其中i表示第i个总体的均值,ij为随机误差,在方差分析中为了得到有效的检验法还常假定ij满足:●ij为相互独立的;●ij都服从正态分布,且ij的均值都为0,方差都相同。第5页,共99页,2023年,2月20日,星期三2.方差分析的过程为了方便起见,可将i记为:i=+i其中称为总均值,i=i–,i=1,2,…,m称为因素A的第i个水平的附加效应,这样比较不同水平下均值是否相同。问题的检验假设:

H0:1=2=…=m,H1:1,2,…,m不全相等;就可以表示为:

H0:1=2=…=m=0,H1:1,2,…,m不全为零。第6页,共99页,2023年,2月20日,星期三在H0成立下检验用统计量:其中、称为组间、组内(变差)平方和;这里称为组内平均;称为总平均,n=n1+n2+…+nm;另外称为全部(变差)平方和;可以证明SST=SSMA+SSE。第7页,共99页,2023年,2月20日,星期三当原假设成立时,各总体均值相等,各样本均值间的差异应该较小,模型平方和也应较小,F统计量取很大值应该是稀有的情形。所以对给定显著性水平α(0,1),若p=P{F

F0}<α,则拒绝原假设H0(F0为F统计量的观测值),可以认为所考虑的因素对响应变量有显著影响;否则不能拒绝H0,认为所考虑的因素对响应变量无显著影响。第8页,共99页,2023年,2月20日,星期三3.方差分析表通常将上述计算结果表示为表5-1所示的方差分析表。表5-1单因素方差分析表其中,MSA=SSMA/(m–1),MSE=SSE/(n–m)。利用方差分析表中的信息,就可以对因素各水平间的差异是否显著做出判断。来源Source自由度DF平方和SunofSquare平均平方和MeanSquareF统计量Fvaluep值Pr>F组间m–1SSMASSMA/(m–1)MSA/MSEp组内n–mSSESSE/(n–m)全部(C-tatol)n–1SSA+SSE第9页,共99页,2023年,2月20日,星期三例2.1.1某公司为了研究三种内容的广告宣传对某种无季节性的大型机械销售量的影响进行了调查统计.经广告广泛宣传后,按寄回的广告上的订购数计算,一年四个季度的销售量(单位:台)为:广告类型 第一季度 第二季度 第三季度 第四季度A1 163 176170185 A2 184198179190 A3 206

191

218

224 A1是强调运输方便性的广告,A2是强调节省燃料的经济性的广告,A3是强调噪音低的优良性的广告.试判断:新闻广告的类型对该种机械的销售量是否有显著影响?若影响显著,哪一种广告内容为好?第10页,共99页,2023年,2月20日,星期三所以拒绝H0,即认为广告内容不同对销售量的影响是显著分析结果如下:第11页,共99页,2023年,2月20日,星期三例2.设有三台机器,用来生产规格相同的铝合金薄板.取样,测量薄板的厚度精确至千分之一厘米.得结果如表所示.问不同机器对生产的铝合金板的厚度有无影响,请看分别用菜单系统和程序进行讨论.程序名datalb给出了单因素方差分析的典型解法,进行了方差分析同时又在各水平组间进行了均值的比较,作了直方图,菜单系统和程序中均有选项”Dunnett”进行某一水平和其余水平的均值差异比较和检验,选项”snk”则进行所有水平间均值差异的比较和检验.第12页,共99页,2023年,2月20日,星期三例.设有三台机器,用来生产规格相同的铝合金薄板.取样,测量薄板的厚度精确至千分之一厘米.得结果如表所示.问不同机器对生产的铝合金板的厚度有无影响?第13页,共99页,2023年,2月20日,星期三1.编程输入数据:DataE411;inputc$y@@;cards;10.23620.25730.25810.23820.25330.26410.24820.25530.25910.24520.25430.26710.24320.26130.262;procprint;RUN;第14页,共99页,2023年,2月20日,星期三Solution→Analysis→Analyst(分析员系统)(出现空白数据表)→File→OpenBySasName…

(在Makeoneselection窗口中)work选中数据名E411→(OK)→Statistics→ANOVA→One-WayANOVA…

Independent填分类变量c→Dependent因变量yPlots—可选择分水平的盒形图(Box-&-WhiskerPlot),条形图(BarChart)及均值、标准差图Means—ComparisonsMethods给出了10种多重比较的方法

α为选择的显著性水平,Breakdown可按水平分组出描述性统计量→OK(点击运行后的结果树标签则会打开相应图.第15页,共99页,2023年,2月20日,星期三因,故在水平0.05下拒绝H0,认为各台机器生产的薄板厚度有显著的差异.

SumofSourceDFSquaresMeanSquareFValuePr>FModel20.000580670.0002903319.950.0022Error60.000087330.00001456CorrectedTotal80.00066800第16页,共99页,2023年,2月20日,星期三5.1.2双因素方差分析问题与模型1.无交互作用的双因素方差分析对于多因素问题,通常考虑有重复观测的情形,其数据结构如图5-2所示。 图5-2双因素方差分析中数据结构观测值A因素(i)平均值A1A2…AlB因素(j)B1x111…x11nx211…x21n…xl11…xl1nB2x121…x12nx221…x22n…xl21…xl1n……………Bmx1m1…x1mnx2m1…x2mn…xlm1…xlmn平均值第17页,共99页,2023年,2月20日,星期三若第一个因素A有l个水平,第二个因素B有m个水平。在因素A的第i个水平和因素B的第j个水平下进行了多次观测,记为{xijk,1≤k≤n}。对xijk考虑以下模型:xijk=+i

+j+ijk,1≤i≤l,1≤j≤m,1≤k≤n

其中表示平均的效应,i和j分别表示因素A的第i个水平和因素B的第j个水平的附加效应,ijk为随机误差,同样这里的随机误差也假定它是独立的并且服从等方差的正态分布。第18页,共99页,2023年,2月20日,星期三要说明因素A有无显著影响,就是要检验如下假设:

H0A:1=2=…=l,H1A:1,2,…,l不全相等;要说明因素B有无显著影响,就是要检验如下假设:

H0B:1=2=…=m,H1B:1,2,…,m不全相等;而模型无显著效果是指以上两个假设的原假设同时成立。第19页,共99页,2023年,2月20日,星期三在H0A、H0B成立时,检验用统计量:对于给定的显著性水平α当值p=P{FA>FA0}<α时拒绝H0A;当值p=P{FB>FB0}<α时拒绝H0B。其中,FA0为FA统计量的观测值,FB0为FB统计量的观测值。第20页,共99页,2023年,2月20日,星期三2.有交互作用的多因素方差分析对于有交互作用的观测{xijk},采用以下的模型:xijk=+i

+j+ij+ijk,1≤i≤l,1≤j≤m,1≤k≤n

其中表示平均的效应,i和j分别表示因素A的第i个水平和因素B的第j个水平的附加效应,ij表示因素A的第i个水平和因素B的第j个水平交互作用的附加效应。ijk为随机误差,这里也假定它是独立的并且服从等方差的正态分布。注意,其中n必须大于1,即为了检验交互作用,必须有重复观测。第21页,共99页,2023年,2月20日,星期三要说明交互作用有无显著影响,就是要检验如下假设:

H0(A*B):ij=0(1≤i≤l,1≤j≤m),

Hl(A*B):ij不全为零(1≤i≤l,1≤j≤m)所以在多因素方差分析中,须在无交互作用所作检验的基础上,加上交互作用的检验。第22页,共99页,2023年,2月20日,星期三构造H0A,H0B,H0(A*B)的检验统计量分别为对于给定的显著性水平α

当值p=P{FA≥FA0}<α时拒绝H0A,否则不能拒绝H0A;当值p=P{FB≥FB0}<α时拒绝H0B,否则不能拒绝H0B;当值p=P{F(A*B)≥F(A*B)0}<α时拒绝H0(A*B),否则不能拒绝H0(A*B)。第23页,共99页,2023年,2月20日,星期三3.方差分析表无交互作用的双因素方差分析表见表5-2。表5-2无交互作用的双因素方差分析表其中MSA=SSMA/(l–1),MSB=SSMB/(m–1),MSE=SSE/(lmn–l–m+l)。利用方差分析表中的信息,就可以对每个因素各水平间的差异是否显著做出判断。来源Source自由度DF平方和SunofSquare平均平方和MeanSquareF统计量Fvaluep值Pr>F因素Al–1SSMASSMA/(l–1)MSA/MSEp(A)因素Bm–1SSMBSSMB/(m–1)MSB/MSEp(B)随机误差lmn–l–m+lSSESSE/(lmn–l–m+l)全部lmn–1SSA+SSB+SSE第24页,共99页,2023年,2月20日,星期三有交互作用的双因素方差分析表见表5-3。表5-3有交互作用的双因素方差分析表

其中MSA=SSMA/(l–1),MSB=SSMB/(m–1),MS(A*B)=SSM(A*B)/(l–1)(m–1),MSE=SSE/lm(n–l)。利用表中的信息,就可以对各个因素间交互作用是否显著和每个因素各水平间的差异是否显著做出判断。来源Source自由度DF平方和SunofSquare平均平方和MeanSquareF统计量Fvaluep值Pr>F因素Al–1SSMASSMA/(l–1)MSA/MSEpA因素Bm–1SSMBSSMB/(m–1)MSB/MSEpBA*B(l–1)(m–1)SSM(A*B)SSM(A*B)/(l–1)(m–1)MS(A*B)/MSEp(A*B)随机误差lm(n–1)SSESSE/lm(n–l)全部lmn–1SSMA+SSMB+SSM(A*B)+SSE第25页,共99页,2023年,2月20日,星期三5.1.3方差分析中的基本假定方差分析中常用的基本假定是:●正态性:每个总体均服从正态分布,也就是说,对于每一个水平,其观测值是来自正态分布的简单随机样本。●方差齐性:各总体的方差相同。●独立性:从每一总体中抽取的样本是相互独立的。在SAS中,正态性可用第3章介绍的方法来验证,也可通过本章介绍的“残差的正态性检验”来验证,方差齐性可以在方差分析的过程进行验证,而独立性可由试验的随机化确定。第26页,共99页,2023年,2月20日,星期三5.2单因素方差分析5.2.1用INSIGHT作单因素方差分析5.2.2用“分析家”作单因素方差分析5.2.3用过程进行单因素方差分析第27页,共99页,2023年,2月20日,星期三5.2.1用INSIGHT作单因素方差分析1.实例【例5-1】消费者与产品生产者、销售者或服务的提供者之间经常发生纠纷。当发生纠纷后,消费者常常会向消费者协会投诉。为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同的企业作为样本。每个行业各抽取5家企业,所抽取的这些企业在服务对象、服务内容、企业规模等方面基本上是相同的。然后统计出最近一年中消费者对总共20家企业投诉的次数,结果如表5-4。第28页,共99页,2023年,2月20日,星期三表5-4消费者对四个行业的投诉次数通常,受到投诉的次数越多,说明服务的质量越差。消费者协会想知道这几个行业之间的服务质量是否有显著差异,即在方差分析中检验原假设:四个行业被投诉次数的均值相等。零售业旅游业航空公司家电制造业5768314466394951492921654045347744564058第29页,共99页,2023年,2月20日,星期三2.分析步骤

1)将表5-4中数据整理成如图左所示结构的数据集,存放在Mylib.xfzts中;

2)在INSIGHT模块中打开数据集Mylib.xfzts;

3)选择菜单“Analyze(分析)”→“Fit(拟合)”,在打开的“Fit(XY)”对话框中按图(右)选择分析变量;

4)单击“OK”按钮,得到分析结果。

第30页,共99页,2023年,2月20日,星期三第31页,共99页,2023年,2月20日,星期三3.结果分析第一张表提供拟合模型的一般信息:

第二张表为列名型变量信息,即HANGYE为列名型的,有4个水平;第三张表提供参数信息,并且约定,P_2、P_3、P_4、P_5分别为航空、家电、零售和旅游4个行业的标识变量(也称哑变量)。如下图所示。

第32页,共99页,2023年,2月20日,星期三第四张表给出响应变量均值关于自变量不同水平的模型方程,如图5-6所示。其中,标识变量取值:第33页,共99页,2023年,2月20日,星期三第五张表(图5-7)给出模型拟合的汇总信息,其中:R-Square(R2)是判定系数(coefficientofdetermination),阐明了自变量所能描述的变化(模型平方和)在全部变差平方和中的比例,它的值总在0和1之间,其值越大,说明自变量的信息对说明因变量信息的贡献越大,即分类变量取不同的值对因变量的影响越显著。AajR-Sq(校正R2)是类似于R2的,但它随模型中的参数的个数而修正。第34页,共99页,2023年,2月20日,星期三第六张为方差分析表,如图5-8所示,其中各项含义可参见表5-1的说明。从方差分析表可以看出,p值小于0.05(显著水平),所以拒绝原假设,即不同行业的消费者投诉次数有显著差异。第七张表提供III型检验,它是方差分析表的细化,给出了各因素的平方和及F统计量,因为本例是单因素的,所以这一行与图5-8的“Model”一行相同。如图5-9所示。第35页,共99页,2023年,2月20日,星期三第八张为参数估计表,其中有关于不同行业下投诉次数差异的估计和检验:

1)根据标识变量的定义,Intercept后的估计47.4是对应于旅游业投诉次数的均值,其后的t检验是检验这一均值是否为0。这里p值<0.0001<0.05=α,故显著非0。

2)航空后的估计-12.4是航空业与旅游业投诉次数均值之差的估计值,其后的t检验也是检验这两个投诉次数均值之差是否为0。由于p值的绝对值为0.1313>0.05,所以航空业与旅游业的被投诉次数没有显著差异的。其它分析类似。第36页,共99页,2023年,2月20日,星期三4.检验模型假定为了验证残差为正态分布的假定,回到数据窗口。可以看到R_TOUSU(残差)和P_TOUSU(预测值)已加到数据集之中,下面用Distribufion(Y)来验证残差的正态性。

1)选择菜单“Analyze”→“Distribution(Y)”;

2)在打开的“Distribution(Y)”对话框中选定分析变量:R_TOUSU;单击“OK”按钮;第37页,共99页,2023年,2月20日,星期三

3)选择菜单“Curves”→“TestforDistribution”;在打开的“TestforDistribution”对话框中直接单击“OK”按钮。在检验结果的“TestforDistribution”表中看到,p值大于0.05,不能拒绝原假设,表明可以认为残差是正态分布的(图5-12)。第38页,共99页,2023年,2月20日,星期三5.2.2用“分析家”作单因素方差分析1.分析步骤

1)在“分析家”中,打开数据集Mylib.xfzts;

2)选择菜单“Statistics(统计)”→“ANOVA(方差分析)”→“One-WayANOVA(单因素方差分析)”,打开“One-WayANOVA”对话框;第39页,共99页,2023年,2月20日,星期三

3)选中分类变量HANGYE,单击“Independent”按钮,将其移到“Independent(自变量)”框中;选中数值变量TOUSU,单击按钮“Dependent”,将其移到“Dependent(因变量)”框中,如图5-13所示;第40页,共99页,2023年,2月20日,星期三

4)为了检验方差分析中关于方差齐性的假定,单击“Tests”按钮,打开“One-WayANOVA:Tests”对话框,选中“Testsforequalvariance”栏下的“levene'stest”复选框(常用),如图左,单击“OK”按钮返回;

第41页,共99页,2023年,2月20日,星期三5)单击“Plots”按钮,打开“One-WayANOVA:Plots”对话框,可以选择图形类型,如选中“Typesofplots”栏下的“Box-&-whiskerplot”复选框,如图右,单击“OK”按钮返回;再次单击“OK”按钮。第42页,共99页,2023年,2月20日,星期三2.结果分析在显示的结果中,提供了自变量的各个水平和单因素方差分析表。

结果分为五个部分,第一部分(下图左)是因素水平的信息,可以看到只有一个因素HANGYE,它的4个水平分别是航空、家电、零售、旅游,共有20个观测。第43页,共99页,2023年,2月20日,星期三第二部分就是经典的方差分析表。由于这里p值小于0.05(显著水平),所以模型是显著的,即因素对指标有显著影响。第三部分是一些与模型有关的简单统计量,第一个是复相关系数平方R2,代表总变差中能被模型解释的比例,第二个是指标的变异系数,第三个是根均方误差,第四个是均值。第四部分是方差分析表的细化,给出了各因素的平方和及F统计量,因为是单因素所以这一行与上面的“Model(模型)”一行相同。第44页,共99页,2023年,2月20日,星期三第五部分是对方差齐性的假定检验的结果,如图5-16所示。结果表明使用Levene's检验法的p值为0.6357,所以不同水平下观测结果的方差无显著差异。第45页,共99页,2023年,2月20日,星期三在分析家窗口的项目管理器中双击“BoxplotofTOUSYbyHANGYE”选项,得到响应变量关于自变量各水平的盒形图如图5-17所示。图中从左到右依次为航空、家电、零售、旅游等水平的盒形图,可以从中对不同水平下均值的差异以及方差的差异有一个直观的了解。第46页,共99页,2023年,2月20日,星期三5.2.3用过程进行单因素方差分析1.ANOVA过程和GLM过程的简介

(1)ANOVA过程

ANOVA过程的一般格式包含许多选项,其中最为常用的为如下格式:PROCANOVADATA=<数据集>;CLASS<自变量列表>;

MODEL<因变量名>=<自变量表达式>[/<选项列表>];

MEANS<自变量表达式>[/<选项>];RUN;第47页,共99页,2023年,2月20日,星期三其中CLASS语句用来指定样本分组的分类变量,CLASS语句是必需的,而且必需位于MODEL语句之前;

MODEL语句给出模型表达式,可以用来表示三种不同的效应模型:

1)主效应模型:y=abc2)交互效应模型:y=abca*ba*cb*ca*b*c3)嵌套效应模型:y=abc(ab)

同一MODEL语句中三种效应可以混合使用。

MEANS语句指定ANOVA过程计算自变量各水平下因变量的均值、标准差,并进行组间的多重比较。第48页,共99页,2023年,2月20日,星期三(2)GLM过程PROCGLMDATA=<数据集>[ALPHA=<p>];CLASS<自变量列表>;

MODEL<因变量名>=<自变量表达式>[/<选项列表>];

MEANS<自变量表达式>[/<选项>];RUN;

一般地,ANOVA过程中涉及的所有语句都包含在GLM过程所涉及的语句中,其用法和功能也都是基本相同的。第49页,共99页,2023年,2月20日,星期三2.使用ANOVA过程作单因素方差分析使用ANOVA过程对例5-1作方差分析的方法:procanovadata=Mylib.xfzts;

classhangye;modeltousu=hangye;run;分析结果与“分析家”相同。第50页,共99页,2023年,2月20日,星期三3.使用GLM过程作单因素方差分析使用GLM过程对例5-1作方差分析的方法:procGLMdata=Mylib.xfzts;classhangye;modeltousu=hangye;run;

分析结果与“分析家”相同。第51页,共99页,2023年,2月20日,星期三编程进行单因素方差分析(注意Roman字型)DataE411;inputcy@@;cards;10.23620.25730.25810.23820.25330.26410.24820.25530.25910.24520.25430.26710.24320.26130.262;procglm

data=E411;/*glm为方差分析*/classc;/*分类变量c*/modely=c;/*模型因变量=自变量*/lsmeansc;/*最小误差法*/meansc;/*求c的均值*/RUN;第52页,共99页,2023年,2月20日,星期三5.3双因素方差分析5.3.1用INSIGHT作双因素方差分析5.3.2用“分析家”作双因素方差分析5.3.3用GLM过程进行双因素方差分析第53页,共99页,2023年,2月20日,星期三5.3.1用INSIGHT作双因素方差分析1.不存在交互作用的双因素方差分析【例5-2】为了提高一种橡胶的定强,考虑三种不同的促进剂(因素A)、四种不同分量的氧化锌(因素B)对定强的影响,对配方的每种组合重复试验两次,总共试验了24次,得到表5-5的结果。表5-5橡胶配方试验数据A:促进剂B:氧化锌1234131,3334,3635,3639,38233,3436,3737,3938,41335,3737,3839,4042,44第54页,共99页,2023年,2月20日,星期三要用方差分析将不同促进剂和不同份量氧化锌的影响区分开来。即检验:

H0A:不同促进剂对定强无影响,H1A:不同促进剂对定强有显著影响

H0B:氧化锌的不同分量对定强无影响,H1B:氧化剂的不同分量对定强有显著影响第55页,共99页,2023年,2月20日,星期三(1)分析设置

1)将表5-5中数据整理成如图5-18左所示结构的数据集,存放在Mylib.xjpf中;

第56页,共99页,2023年,2月20日,星期三

2)在INSIGHT模块中打开数据集Mylib.xjpf。由于在Insight中,要求方差分析中的自变量必须是列名型的,故先把变量a和b的测量水平由区间型改为列名型;3)选择菜单“Analyze(分析)”→“Fit(拟合)”,在打开的“Fit(XY)”对话框中选择数值型变量作因变量,分类型变量作自变量:选择变量stren,单击“Y”按钮,选择变量a和b,单击“X”按钮,分别将变量移到列表框中,如图5-18右所示;单击“OK”,得到分析结果。第57页,共99页,2023年,2月20日,星期三(2)分析结果

1)第一张表提供了模型的一般信息;第二张表列举了作为分类变量的a和b的水平的信息;第三张参数信息表给出了标识变量P_i的定义;

其中,标识变量取值:

第58页,共99页,2023年,2月20日,星期三

2)第四张表给出了方差分析模型,利用参数信息表中标识变量的定义可以推算出在各个因素不同水平下变量stren均值的信息;第五张拟合汇总表中给出变量stren的均值为37.0417,判定系数R2为0.8945等,如图5-20;图5-20多因素方差分析第4、5张表第59页,共99页,2023年,2月20日,星期三

3)在第六张方差分析表中,检验模型显著性的F统计量为30.53,相应的p值小于0.05=,所以拒绝a和b对分析变量stren无显著影响的假设,即模型是显著的;

在模型显著的情况下常需要进一步分析两个因素是否都有显著影响或者只有一个因素是显著的,这时就需要用到第七张表提供的信息。在III型检验表中,进一步将模型平方和分解为属于a和b的平方和。在这里两个因素的p值都小于0.05,再一次说明了这两个因素对分析变量stren都有显著影响,如图5-21。

第60页,共99页,2023年,2月20日,星期三第61页,共99页,2023年,2月20日,星期三

4)第八张是模型的参数估计表(图5-22),参数估计表也是根据标识变量的定义,对参数或对各因素不同水平下的参数之差进行估计和检验。可以根据t统计量的p值来检验不同水平下均值是否有显著差异。图5-22多因素方差分析第8张表第62页,共99页,2023年,2月20日,星期三模型方程提供了各个因素不同水平下变量stren均值的信息,利用参数信息表中标识变量P_j的定义可以推算出:参数估计表根据标识变量的定义,对参数或不同水平下参数之差进行估计和检验。如第一行是对a=3,b=4水平下均值的估计和检验,第二行是a=1,b=4水平下的均值与a=3,b=4水平下均值之差的估计与检验。结果表明两个因素的各水平下的均值都有显著差异。第63页,共99页,2023年,2月20日,星期三

5)考察模型假定:在显示窗的底部有一个残差和预测值的散点图(如图5-23所示),可以像单因素分析一样考察残差分布的正态性假定。第64页,共99页,2023年,2月20日,星期三2.存在交互作用的双因素方差分析【例5-3】考虑合成纤维收缩率(因素A)和总拉伸倍数(因素B)对纤维弹性y的影响。收缩率取4个水平:A1=0,A2=4,A3=8,A4=12;因素B也取4个水平:B1=460,B2=520,B3=580,B4=640。在每个组合AiBj下重复做二次试验,弹性数据如表5-6所示。表5-6合成纤维收缩率和总拉伸倍数对纤维弹性的影响A:收缩率B:拉伸倍数460520580640071,7372,7375,7377,75473,7576,7478,7774,74876,7379,7774,7574,731275,7373,7270,7169,69第65页,共99页,2023年,2月20日,星期三考虑如下问题:

1)收缩率(因素A)、拉伸倍数(因素B)对弹性y有无显著性影响?2)因素A和因素B是否有交互作用?3)使纤维弹性达到最大的生产条件是什么?要用方差分析将不同收缩率和不同拉伸倍数的影响区分开来。即检验:H0A:不同收缩率对弹性无影响,H1A:不同收缩率对弹性有显著影响H0B:不同拉伸倍数对弹性无影响,H1B:不同拉伸倍数对弹性有显著影响第66页,共99页,2023年,2月20日,星期三(1)分析设置

1)将表5-6中数据整理成如图所示结构的数据集,存放在Mylib.xwtx中;

2)在INSIGHT模块中打开数据集Mylib.xwtx。由于在Insight中,要求方差分析中的自变量必须是列名型的,故先把变量a和b的测量水平由区间型改为列名型;第67页,共99页,2023年,2月20日,星期三

3)选择菜单“Analyze(分析)”→“Fit(拟合)”,在打开的“Fit(XY)”对话框中选择数值型变量作因变量,分类型变量作自变量,如图所示。

图5-24数据集xwtx与分析变量的选择为了考虑变量a和b的交互作用,同时选上a、b,然后单击“Cross”按钮,注意到在右框中多了a*b一行,如图5-24右所示。

4)单击“OK”按钮,得到分析结果。第68页,共99页,2023年,2月20日,星期三(2)分析结果

1)在参数信息表中较无交互作用的情形多了表示两个因素各个水平组合下的标识变量,而在模型方程表中也就多了许多的参数,如图5-25所示;图5-25多因素方差分析的前5张表

第69页,共99页,2023年,2月20日,星期三

2)在方差分析表中,检验模型显著性的F统计量为7.87,相应的p值为0.0001<0.05,所以模型的效应是显著的;

3)在Ⅲ型检验表中,将模型平方和分解为两个因素和它们的交互作用,表中看出,检验b变量效应的p值为0.1363>0.05,所以从总体上看b变量的效应不显著;检验a变量效应的p值为<0.0001<0.05,所以变量a的效应是显著的;检验两者交互作用的p值为0.0006<0.05,所以交互作用的影响也是显著的,如图5-27。第70页,共99页,2023年,2月20日,星期三

4)在模型方程(图5-25中)和参数估计表(图5-28)中也提供了双因素不同水平组合下因变量y均值的估计和比较的信息。因为这里是考虑存在交互作用的情形,所以较为复杂一些。第71页,共99页,2023年,2月20日,星期三5.3.2用“分析家”作双因素方差分析1.不存在交互作用的双因素方差分析下面介绍在“分析家”中对例5-2作方差分析:

1)在“分析家”中,打开数据集Mylib.xjpf;

2)选择菜单“Statistics(统计)”→“ANOVA(方差分析)”→“FactorialANOVA(因素方差分析)”,打开“FactorialANOVA”对话框(如图5-29);第72页,共99页,2023年,2月20日,星期三

若要得到用图形表示的两个因素不同水平下均值和标准差的信息,可以单击“Plots”按钮,在打开的“FactorialANOVA:Plots”对话框中,选中“Meansplots”栏下的“PlotsDependentMeansforMainEffects(作主效应响应均值图)”。

第73页,共99页,2023年,2月20日,星期三

4)分析结果如图5-30所示,其中内容前面已讲,这里不再赘述。图5-30无交互作用的多因素方差分析第74页,共99页,2023年,2月20日,星期三

5)在分析家窗口的项目管理器中依次双击“MeansPlots”下的两个选项,得到响应变量关于自变量a、b的均值图如图5-31所示。

图5-31响应变量关于自变量a、b的均值图图中描述了变量a、b不同水平下的均值和标准差的图形,从中可以对不同水平下均值的差异有一个直观的了解。

第75页,共99页,2023年,2月20日,星期三2.存在交互作用的双因素方差分析下面介绍在“分析家”中对例5-3合成纤维的试验数据作方差分析。分析步骤如下:

1)在“分析家”中,打开数据集Mylib.xwtx;

2)选择菜单“Statistics”→“ANOVA”→“FactorialANOVA”,打开“FactorialANOVA”对话框,按图选择参数与图形;第76页,共99页,2023年,2月20日,星期三输出的方差分析表给出双因素考虑交互作用的方差分析模型是显著的(F=7.87,p=0.0001),最下面一张表给出两个因素和交互作用的检验结果。由最后一列“Pr>F”的三个p值可以看出因素A及因素A与B的交互作用(A*B)对指标y的影响是高度显著的,而因素B在

=0.05的水平上对指标y的影响是不显著(p=0.1363>0.05)。第77页,共99页,2023年,2月20日,星期三在分析家窗口的项目管理器中依次双击选项“MeansPlotofybyaandb”,得到双因素不同水平下因变量均值差异的连线图如图5-35所示。直观地可以看出使纤维弹性达最大的最佳生产条件是A3和B2;其次是A2和B3。第78页,共99页,2023年,2月20日,星期三5.3.3用GLM过程进行双因素方差分析1.不考虑交互作用过程GLM也可用于多因素方差分析,其用法与单因素方差分析是相同的,只需要在class语句和model语句中分别填入表示因素的多个自变量。以数据集Mylib.xjpf为例,为了比较变量a和b不同水平下因变量stren均值的差异,可使用以下程序:procglmdata=Mylib.xjpf;classab;modelstren=ab;run;第79页,共99页,2023年,2月20日,星期三提交上述程序后得到与上一节使用“分析家”有相似的结果,如图5-36所示。有关的说明请参见上节的解释。第80页,共99页,2023年,2月20日,星期三2.考虑交互作用使用过程GLM于多因素方差分析时,若要考虑交互作用只需要在model语句中增加相应的交互作用项即可。以数据集Mylib.xjpf为例,为了比较变量a和b不同水平组合下变量stren均值的差异,可使用以下的程序:procglmdata=Mylib.xjpf;classab;modelstren=aba*b;run;

这里model语句中a*b就是指明要考虑交互作用。第81页,共99页,2023年,2月20日,星期三提交这一程序后的输出如图5-37所示。图5-37使用GLM过程作有交互作用的多因素方差分析第82页,共99页,2023年,2月20日,星期三5.4均值估计与多重比较5.4.1概述5.4.2用“分析家”进行均值比较第83页,共99页,2023年,2月20日,星期三5.4.1概述在方差分析中,不论是单因素或多因素的实验结果,都是检验关于参数的一个整体的假设。若原假设被拒绝,表明某个因素各个水平下的响应有显著差异或因素间存在交互影响,但并不了解某两个水平下响应是否有差异。所以在方差分析后,还常需要对各水平下响应变量的均值进行估计和比较。第84页,共99页,2023年,2月20日,星期三5.4.2用“分析家”进行均值比较1.对于单因素方差分析的均值比较下面介绍在“分析家”中对例5-1作均值比较。(1)分析设置

1)在“分析家”中,打开数据集Mylib.xfzts;2)选择菜单“Statistics”→“ANOVA”→“One-WayANOVA”,打开“One-WayANOVA”对话框,按图所示设置;第85页,共99页,2023年,2月20日,星期三

3)单击“Means(均值)”按钮,在打开的“One-WayANOVA:Means”对话框中选中“Comparisons(比较)”选项卡。按图设置。第86页,共99页,2023年,2月20日,星期三(2)分析结果

1)使用Tukey'sHSD检验法的结果,如图5-39所示。图5-39Duncan'sMultipleRange检验法它先提示这一检验法是控制整体的第一类错误的,但它的第二类错误一般比REGWQ方法要高。第87页,共99

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论