




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、均值差异性假设检验(二)方差分析均值差异性假设检验(二)方差分析方差分析的基本概念方差分析的基本概念影响事物发展的最终结果的原因谓之因素。影响事物发展的最终结果的原因谓之因素。因素的不同水平构成了影响事物发展的条件,而对不同因因素的不同水平构成了影响事物发展的条件,而对不同因素或因素的不同水平造成不同结果的研究通常采用方差分素或因素的不同水平造成不同结果的研究通常采用方差分析的方法。析的方法。一、方差分析的常用术语一、方差分析的常用术语因变量(因变量(DependentDependent):某试验结果。):某试验结果。因素(因素(FactorFactor):影响试验结果的(自)变量。):影响试
2、验结果的(自)变量。水平:因素划分类别,即自变量取值类别。例:水平:因素划分类别,即自变量取值类别。例:5 5个班个班级、四种工艺、不同年龄段。级、四种工艺、不同年龄段。可控因素:因素的不同水平会导致不同试验结果。可控因素:因素的不同水平会导致不同试验结果。不可控因素:因素的水平与试验结果的关系是随机的,不可控因素:因素的水平与试验结果的关系是随机的,即:不确定因素。即:不确定因素。方差分析:可控因素不同水平对试验结果影响有无差异。方差分析:可控因素不同水平对试验结果影响有无差异。二、方差分析过程二、方差分析过程首先需要确定因素首先需要确定因素(Factors)(Factors)和因变量和因变
3、量(Dependent)(Dependent)。例:单因素情况:经过一次考试,统计四个班级的学生的例:单因素情况:经过一次考试,统计四个班级的学生的考试成绩,因变量为考试成绩,因变量为“成绩成绩”,因素,因素( (自变量自变量) )为为 “ “班班级级”。解释:对于研究四个班级考试成绩的差异的时候,解释:对于研究四个班级考试成绩的差异的时候,“成绩成绩”是因变量,是因变量,“班级班级” ” 是因素,即:自变量。因素的不同是因素,即:自变量。因素的不同水平对应不同自变量值。水平对应不同自变量值。例:双因素情况:经过一次考试,统计两个班级的不同性例:双因素情况:经过一次考试,统计两个班级的不同性别
4、的学生考试成绩,别的学生考试成绩,因变量因变量“成绩成绩”: 8787、7979、92 .92 .因素因素1(1(自变量自变量1) “1) “班级班级”: 1 1班、班、2 2班、班、3 3班和班和4 4班班因素因素2(2(自变量自变量2) “2) “性别性别”: 男生、女生男生、女生解释:对于研究四个班级的学生考试成绩差异的时候,解释:对于研究四个班级的学生考试成绩差异的时候,“成绩成绩”是因变量,是因变量,“班级班级”是区分不同样本的一个因素,是区分不同样本的一个因素,称为称为“因素因素1”1”或或“自变量自变量1”1”。对于研究不同性别的学生。对于研究不同性别的学生考试成绩差异的时候。考
5、试成绩差异的时候。“性别性别” ” 是区分不同样本的因素,是区分不同样本的因素,称为称为称为称为“因素因素2”2”或或“自变量自变量2” 2” 。 两种因素的不同水两种因素的不同水平对应不同的自变量值和因变量值。平对应不同的自变量值和因变量值。方差分析就是比较不同水平下,因变量的均值差异,即检方差分析就是比较不同水平下,因变量的均值差异,即检验各因素各水平作用下样本均值的差异验各因素各水平作用下样本均值的差异三、三、T T检验与方差分析所研究的问题检验与方差分析所研究的问题在前面已经学习过了的在前面已经学习过了的T T检验是关于均值差异性的检验,检验是关于均值差异性的检验,方差分析也是关于均值
6、差异性的检验。其不同点在于所面方差分析也是关于均值差异性的检验。其不同点在于所面对的问题:对的问题:T T检验:检验: 关于单因素双水平的问题关于单因素双水平的问题单因素方差分析:关于单因素多水平的问题单因素方差分析:关于单因素多水平的问题多因素方差分析:关于多因素多水平的问题多因素方差分析:关于多因素多水平的问题协方差分析:协方差分析: 关于含不可控因素的问题关于含不可控因素的问题单因素方差分析单因素方差分析一、单因素方差分析的假设一、单因素方差分析的假设单一因素影响试验结果,该因素各水平:单一因素影响试验结果,该因素各水平:i=1,2,.Ki=1,2,.K各水平下样本均值为:各水平下样本均
7、值为: , ., .方差为:方差为: , .前提条件:样本正态分布,前提条件:样本正态分布,方差差异不显著,方差差异不显著, . .零假设:均值差异不显著,零假设:均值差异不显著, . .备择假设:至少有,备择假设:至少有, i j i j方差分析的实质:相同方差下,正态分布样本的方差分析的实质:相同方差下,正态分布样本的K K种水平种水平均值差异的检验。均值差异的检验。1x2xkx1222k212221x2xixjx二、检验方法二、检验方法假定某单因素影响下的试验数据如下:假定某单因素影响下的试验数据如下:表格中所有表格中所有n nk k个数据的总平均值为:个数据的总平均值为:N-N-同一水
8、平下个案个数同一水平下个案个数, , K-K-因素水平数。因素水平数。 -i-i水平均值。水平均值。-总个案均值。总个案均值。 水平数样本数12k1X11X21Xk12X12X22Xk2NX1nX2nXkn各水平均值X1X2Xkix计算组间离差平方和(计算组间离差平方和(Between Group Sum of Between Group Sum of SquaresSquares):): i=1,2.ki=1,2.k组间离差平方和组间离差平方和S SA A,反映各水平均值差异。,反映各水平均值差异。计算组内离差平方和(计算组内离差平方和(Within Group Sum of Within
9、Group Sum of SquaresSquares)x xijij为为i i水平下的第水平下的第j j次测量次测量总离差平方和总离差平方和 TotalTotal S ST T = S= SA A+S+SE E21kiiAxNSnjkiiijExxS121组间自由度:组间自由度:K-1K-1组内自由度:组内自由度:K K(N-1N-1)=KN-K=M-K =KN-K=M-K (M-M-总个案数)总个案数)组间方差:组间方差:组内方差:组内方差: 检验值检验值F F比率(比率(F RatioF Ratio) 差异不显著差异不显著 = P = P = 1m1), ,即每组都要有即每组都要有m1m
10、1H H0 0假设:假设: H HA A-A-A因素各水平对结果影响无明显差异因素各水平对结果影响无明显差异 H HB B-B-B因素各水平对结果影响无明显差异因素各水平对结果影响无明显差异 H HABAB-AB-AB交互作用对结果影响无明显差异交互作用对结果影响无明显差异二、操作步骤二、操作步骤执行执行AnalyzeGeneral linear ModelUnivariateAnalyzeGeneral linear ModelUnivariate 选择因变量到选择因变量到“Dependent”Dependent”中中选择固定因素选择固定因素“Fixed Factor(s)”Fixed Fa
11、ctor(s)”:选择随机因素选择随机因素“Ramdem Factor(s)”Ramdem Factor(s)”:选择协变因素选择协变因素“Covariate(s)”Covariate(s)”:其中:其中:固定因素是以可以明确区分的不同水平来影响过程变化的固定因素是以可以明确区分的不同水平来影响过程变化的因素,例如:不同方案、不同设备、不同地区、不同年龄。因素,例如:不同方案、不同设备、不同地区、不同年龄。而随机因素是通过各种各样的大量取值来影响过程的变化,而随机因素是通过各种各样的大量取值来影响过程的变化,例如:化学成分含量、地区财经收入等。协变量是影响过例如:化学成分含量、地区财经收入等。
12、协变量是影响过程变化的不可控因素,例如:初始值等。程变化的不可控因素,例如:初始值等。“Model”“Model”建立分析模型建立分析模型分析模型是定义分析的效应级别。有两个选择:分析模型是定义分析的效应级别。有两个选择:“Full Factor”Full Factor” 为系统缺省模型,包括主效应分析以为系统缺省模型,包括主效应分析以及所有可能的交互效应的分析。及所有可能的交互效应的分析。“Custom”Custom”为用户自定义模型,为用户自定义模型,只分析模型中的主效应只分析模型中的主效应单击某一个单个的因素变量名,箭头将该变量设置到单击某一个单个的因素变量名,箭头将该变量设置到Mode
13、lModel框中。框中。分析模型中的双交互或多交互效应分析模型中的双交互或多交互效应可以同时送两个或多个到可以同时送两个或多个到ModelModel框中。框中。选择交互效应类型选择交互效应类型Build Term(s)Build Term(s)中的:中的:InteractionInteraction项指定任意交互效应,即:项指定任意交互效应,即:“Full Factor” Full Factor” Main effectsMain effects选项指定主效应。选项指定主效应。All 2-wayAll 2-way项指定双交互效应。项指定双交互效应。All 3-wayAll 3-way项指定项指
14、定3 3交互及其以下的效应。交互及其以下的效应。All 4-wayAll 4-way项指定项指定4 4交互及其以下的效应。交互及其以下的效应。All 5-wayAll 5-way项指定项指定5 5交互及其以下的效应。交互及其以下的效应。选择离差平方和类型选择离差平方和类型在在“Sum of”Sum of”后面选择离差平方和类型。共有四种类型:后面选择离差平方和类型。共有四种类型:TYPE ITYPE I:分层处理平方和法。即仅对模型主效应之前的每:分层处理平方和法。即仅对模型主效应之前的每项进行调整。适用于平衡的方差分析模型,在这个模型中项进行调整。适用于平衡的方差分析模型,在这个模型中一阶交
15、互效应前指定主效应,二阶交互效应前指定一阶交一阶交互效应前指定主效应,二阶交互效应前指定一阶交互效应,依次类推。互效应,依次类推。TYPE IITYPE II:对其他所有效应都进行调整。一般适用于平衡:对其他所有效应都进行调整。一般适用于平衡的方差分析模型、主因子效应模型、回归模型和嵌套设计。的方差分析模型、主因子效应模型、回归模型和嵌套设计。TYPE IIITYPE III:是系统默认的处理方法。对其它任何效应都将:是系统默认的处理方法。对其它任何效应都将进行调整。它可以将所计算的残差代入单元频数计算中。进行调整。它可以将所计算的残差代入单元频数计算中。此处理方法对没有缺失单元格的不平衡模型
16、也适用。此处理方法对没有缺失单元格的不平衡模型也适用。TYPE IVTYPE IV:对于没有缺失单元格的情况往往使用此方法。:对于没有缺失单元格的情况往往使用此方法。此处理方法可以对任何效应的此处理方法可以对任何效应的F F值计算平方和。值计算平方和。选中选中Include intercept in modelInclude intercept in model复选项,即在模型复选项,即在模型中考虑了截距。如果能够假设数据通过原点,可以不包括中考虑了截距。如果能够假设数据通过原点,可以不包括截距,即不选择此项。缺省为选定,即系统默认为包括截截距,即不选择此项。缺省为选定,即系统默认为包括截距。
17、距。三、例题:三、例题:在研究农作物产量时,考虑到不同种籽、不同肥料以及不在研究农作物产量时,考虑到不同种籽、不同肥料以及不同地块作为影响因素,因变量为产量同地块作为影响因素,因变量为产量produceproduce。研究多个。研究多个因素的各个水平对试验结果的主效应影响,以及各因素相因素的各个水平对试验结果的主效应影响,以及各因素相互作用对试验结果的影响。互作用对试验结果的影响。作为因素的三个变量种籽作为因素的三个变量种籽seedseed、肥料、肥料fertilizefertilize和地块和地块groundground单独作用的影响:种籽单独作用的影响:种籽seedseed为为.000.0
18、00,肥料,肥料fertilizefertilize为为.225.225,地块,地块groundground为为.000.000。肥料的作用影响。肥料的作用影响不显著。双交互作用种籽与肥料为不显著。双交互作用种籽与肥料为.039.039,种籽与地块,种籽与地块为为.000, .000, 肥料与地块肥料与地块.636.636,可见双交互作用中肥料与地块,可见双交互作用中肥料与地块的交互作用不显著。的交互作用不显著。四、语句四、语句UNIANOVAUNIANOVA produce BY seed fertiliz ground produce BY seed fertiliz ground /ME
19、THOD = SSTYPE(3) /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /INTERCEPT = INCLUDE /PLOT = PROFILE( seed /PLOT = PROFILE( seed* *fertilizfertiliz* *ground )ground ) /CRITERIA = ALPHA(.05) /CRITERIA = ALPHA(.05) /DESIGN = fertiliz /DESIGN = fertiliz* *seed groundseed ground* *seed seed fertilizfertiliz*
20、*ground seed fertiliz ground.ground seed fertiliz ground.协方差分析协方差分析一、协方差概念一、协方差概念方差分析中,各因素水平有明显的区分度,可以控制,即可方差分析中,各因素水平有明显的区分度,可以控制,即可以出于研究的需要剔除某些水平。但在一些实验中,某因素以出于研究的需要剔除某些水平。但在一些实验中,某因素的影响确实存在,但其影响造成因变量变化是不确定的。的影响确实存在,但其影响造成因变量变化是不确定的。协方差分析是通过回归手段使不可控因素的作用被消除,从协方差分析是通过回归手段使不可控因素的作用被消除,从而使可控因素的影响得以表现
21、。而使可控因素的影响得以表现。例如,某技术培训班,培训前、后分别测试了一下学员的生例如,某技术培训班,培训前、后分别测试了一下学员的生产工作能力产工作能力P0和和Pt,培训班结业后进行了一次考试。,培训班结业后进行了一次考试。此间,考试成绩此间,考试成绩Mark,能力提高,能力提高P=Pt-P0,培训前能力,培训前能力P0。显然,显然,Mark 的水平可以控制,的水平可以控制,P0的水平不可控制,即的水平不可控制,即P0的高的高低对低对P的高低的影响是混杂的。协方差分析要消除除掉的高低的影响是混杂的。协方差分析要消除除掉P0的的随机影响,即令随机影响,即令P0与与P呈线性关系:呈线性关系:再分
22、析再分析Mark对对P*的影响。的影响。P0称为协变量称为协变量Covariable。 0*pp二、操作步骤二、操作步骤在其它命令都与多元方差分析相同情况下,增加:在其它命令都与多元方差分析相同情况下,增加:选择协变量到选择协变量到Covariable(s)中中在在“Options”中中选择选择“Parameter estimates”,以便了解回归方程的系数。,以便了解回归方程的系数。在在“Display Means for”中选择因素变量,以计算各个因素水中选择因素变量,以计算各个因素水平下因变量的平均值。平下因变量的平均值。“Compare main effects”用于不同因素水平的多
23、重比较。用于不同因素水平的多重比较。三、例题三、例题初产量为初产量为“Initial” ,使用化肥,使用化肥“Fertilize”后增产量为后增产量为“Increase”。以。以“Initial”为协变量,进行协方差分析。为协变量,进行协方差分析。在因变量与协变量的回归方程中,协变量的回归系数(斜在因变量与协变量的回归方程中,协变量的回归系数(斜率)率),即:即:increase = .310 * initial - 12.618修正后的因变量与自变量的关系中将不再包含协变量的影响修正后的因变量与自变量的关系中将不再包含协变量的影响了。了。四、语句四、语句UNIANOVA 因变量因变量 BY 自变量自变量1 自变量自变量2 . WITH 协变量协变量1 协变量协变量2 . /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /PRINT = PARAMETER /CRITERIA
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论