张厚粲第九章方差分析_第1页
张厚粲第九章方差分析_第2页
张厚粲第九章方差分析_第3页
张厚粲第九章方差分析_第4页
张厚粲第九章方差分析_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章方差分析(ANOVA)方差分析又称为变异分析(analysisofvariance,ANOVA),是由斯内德克(GeorgeWaddelSnedecor)提出的一种方法。方差分析通过对多组平均数的差异进行显著性检验,分析实验数据中不同来源的变异对总变异影响的大小。

t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数间的差异显著性检验(K≥3)。这时,若仍采用t检验法就不适宜了。这是因为:

1、检验过程烦琐例如,一试验包含5个处理,采用t检验法要进行10次两两平均数的差异显著性检验;若有k个处理,则要作k(k-1)/2次类似的检验。2、无统一的试验误差,误差估计的精确性和检验的灵敏性低对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。若用t检验法作两两比较,由于每次比较需计算一个s,故使得各次比较误差的估计不统一,同时没有充分利用资料所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。

例如,试验有5个处理,每个处理重复6次,共有30个观测值。进行t检验时,每次只能利用两个处理共12个观测值估计试验误差,误差自由度为2(6-1)=10;若利用整个试验的30个观测值估计试验误差,显然估计的精确性高,且误差自由度为5(6-1)=25。可见,在用t检法进行检验时,由于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。

3、这种两两比较会随着样本组数的增加而加大犯Ⅰ型错误的概率用t检验法进行4个处理平均数间的差异显著性检验,若两两比较推断正确的概率为95%,则所有比较都正确的概率为0.956=0.74,则降低了推断的可靠性。

几个常用术语:1、试验指标(experimentalindex)为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。2、试验因素(experimentalfactor)试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。试验因素常用大写字母A、B、C、…等表示。

3、因素水平(leveloffactor)试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。4、试验处理(treatment)事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。进行单因素试验时,试验因素的一个水平就是一个处理。在多因素试验时,试验因素的一个水平组合就是一个处理。5、重复(repetition)在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理的重复数。第一节方差分析的基本原理及步骤一、方差分析的基本原理:综合的F检验(一)综合的虚无假设与部分虚无假设1.综合的虚无假设样本所归属的总体的平均数相等,即

H0:μ1=μ2=μ32.此为部分虚无假设

组间的虚无假设(二)方差的可分解性(可加性)1.可加性方差分析作为一种统计方法,是把实验数据的总变异分解为若干个不同来源的分量。因而它所依据的基本原理是变异的可加性。即每一个数据与数据的总体平均数差的平方和,可以分解为每一组数据各自的离差平方和与由各组数据的平均数组成的一组数据的离差平方和两部分。前者表达的是组内差异,即每组数据中各个数据之间的差异,也就是个体差异,表达的是抽样误差或随机误差程度;后者表达的是组间差异,即各组平均数之间的差异,表达的是实验操纵的差异程度,实验操纵即指自变量的操纵,这两部分差异之间相互独立。可用公式表示为:SST=SSB+SSw如:欲观察某因素的三个水平对被试是否产生相同的影响:组一:A、A、A、A、A—水平一组二:B、B、B、B、B—水平二组三:C、C、C、C、C—水平三总组:A、A、A、A、A、B、B、B、B、B、C、C、C、C、C2.总体变异的构成总体变异组间变异:组内变异:组内变异理论上要求齐性,实际计算取其均值3.方差的基本公式一般总体方差称方差,样本方差称均方能使变量发生变异的原因很多,这些原因我们都将其称为变异因素或变异来源。方差分析就是发现各类变异因素相对重要性的一种方法方差分析的思路就是:把整个试验(设有k个总体)的样本资料作为一个整体来考虑。把整个试验的总变异按照变异的来源分解成不同因素的变异。由于方差等于平方和除以自由度,因此总方差分解成各因素的方差,就是将形成总方差的平方和和自由度分解为各因素的平方和和自由度。然后对各个因素的方差作出数量上的估计,从而发现各个因素的方差的相对重要程度。从总方差中除去各可控因素所引起的方差后,剩余方差又可以准确地估计试验误差,作为统计假设检验的依据因此,方差分析可以帮助我们抓住试验的主要矛盾和技术关键,发现主要的变异来源,从而抓住主要的、实质性的东西。4.平方和的剖分SS(sumofsquares)表示平方和SST(thesumofsquarestotal)总平方和,一个试验中的总变异。SSB(sumofsquaresbetweengroups)组间平方和,表示由于不同的实验处理而造成的变异。(主试)SSW(sumofsquareswithingroup)试验误差造成的变异。(被试)

SST=SSB+SSW总变异=组间变异+组内变异总变异(SST)是将所有被试的数值作为一个整体考虑到的结果,是用所有被试的因变量的值计算出来的。组间变异(SSB

)主要是因为接受不同的实验处理而造成的各组之间的变异。用两个平均数的离差表示。组内变异(SSW)指组内各被试因变量的差异范围。5.组间方差(组间均方)与组内方差(组内均方)6.自由度的分解在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间自由度为处理数减1,即k-1。处理间自由度记为dfB,即dfB=k-1。在计算处理内平方和时,每组自由度为n-1,共有k组,故处理内自由度k(n-1),

处理内自由度记为dfW,即dfW=k(n-1)=kn-k。7、方差分析方差之间的差异分析用F检验,因此,组间与组内方差的分析也用F检验。方差分析关注的是组间均方是否显著大于组内均方。因此,常用作单侧检验。kj表明数据的总变异基本上是有不同的实验处理造成的(不同的实验处理间存在显著差异)表明数据的总变异基本上是有实验误差和个体误差造成的,与不同的实验处理关系不大(不同的实验处理间不存在显著差异)。二、方差分析的基本假设1.总体正态分布2.各实验处理是随机的且相互独立(一般情况下都能满足)3.各实验处理内方差一致(需要进行检验)最为重要的假定三、方差齐性检验1.哈特莱最大F比率法找出要比较的组内方差的最大值与最小值。最大方差与最小方差无显著差异即为方差齐性。四、方差分析的基本步骤(一).提出假设(二).选择检验统计量并计算

1.分解平方和总平方和SST

组间平方和SSB

组内平方和SSW

2.分解自由度df总自由度:dfT=nk-1组间自由度:dfB=k-1组内自由度:dfW=nk-k组内自由度的计算(1)不同实验处理人数相同时每组自由度n1-1,n2-1,n3-1…nk-1组内自由度n1-1+n2-1+n3-1+…nk-1,因为n1=n2=n3=…nk,所以为K(n-1)(2)不同实验处理人数不相同时每组自由度n1-1,n2-1,n3-1…nk-1组内自由度n1-1+n2-1+n3-1+…nk-1

3.计算方差MSMSB=SSB/dfB和MSW=SSW/dfW4.计算F值F=MSB/MSW(三).作出统计结论1.显著性水平2.临界水平F值3.比较推论(四)陈列方差分析表变异(差异)来源平方和(SS)自由度(df)

均方(MS) Fp组间SSBdfB=k-1MSBFp组内SSWdfW=nk-kMSW总变异SSTdfT=nk-1MST例:研究人员采用四种不同的心理治疗方案,对每个志愿参加治疗的患者进行心理治疗。他们用录音机记录了每个被试在一段时间中所讲的词数。由于录音的困难每种方案记录的人数各不相同,原始数据见表1。问这几种方案是否有差异?序号治疗方案X1X2X3X41309005025001832488774427454763814445631367860843462116664356341156603600458336462384424576765776562384444193666435663814445833645227047806400计算表11.提出假设H0:μ1=μ2=μ3=μ4H1:至少有两个总体平均数不等2.选择检验统计量并计算假定四组记录数据是从四个正态总体中抽出的独立样本,对多个独立样本平均数的差异进行显著性检验,应采用完全随机设计的方差分析。(1).计算平方和:组间平方和组内平方和总平方和(2).计算自由度组间自由度组内自由度总自由度(3).计算方差组间方差

组内方差(4).计算F值

3.做统计决断,列方差分析表变异来源平方和自由度方差F值概率组间变异2850.43950.13.77*P<0.05组内变异4786.519251.9总变异7636.922表9-3四组记录数据的完全随机设计方差分析表第二节完全随机设计的方差分析单因素完全随机设计的方差分析(completerandomizeddesign)把从同一个总体中随机抽取的被试随机地分配为几个实验组,每个实验组分别接受某一因素的不同水平的操纵,检验这几个独立样本平均数之间是否存在显著差异一、各实验处理组样本容量相同例题:从五所中学同一个年级随机抽取3名学生进行统一数学测验,结果如下,问五所学校数学成绩之间有无显著差异?

ABCDE176788683732738184827437081858778实验分析:自变量:学校类型自变量的不同水平:不同类型的学校因变量:数学成绩实验目的及预学校类型对数学成绩有无影响?重点中学应该好于一般中学1.提出假设:虚无假设:u1=u2……=u5;备选假设:至少两个总体的平均数不相等;2.选择并计算统计量(1)计算平方和容量平均数总和平方和均方组一3732191600515987组二380240920619200组三3852552166721168组四3842522118216899组五3752252116816875合计1511919495994905组间平方和:SSB=94905-11912/3*5=339.6组内平方和:SSW=94959-94905=54(2)计算自由度:组间自由度:dfB=k-1=-5-1=4组内自由度:dfW

=k(n-1)=5×2=10(3)计算方差组间方差:MSB=SSB/(k-1)=339.6/4=84.9组内方差:MSW

=SSW

/(nk-n)=54/10=5.4(4)计算F值F=MSB/MSW=84.9/5.4=15.723.查F值表做出统计推断F0.05(dfB,dfW

)=F0.05(4,10)

=3.48统计推断:F=15.72>F0.05(dfB,dfW)=3.48,p<0.05。存在显著差异。4.列出方差分析表二、各实验处理组样本容量不同例:研究人员采用四种不同的心理治疗方案,对每个志愿参加治疗的患者进行心理治疗。他们用录音机记录了每个被试在一段时间中所讲的词数。由于录音的困难每种方案记录的人数各不相同,原始数据见表1。问这几种方案是否有差异?1.提出假设H0:μ1=μ2=μ3=μ4H1:至少有两个总体平均数不等2.选择检验统计量并计算假定四组记录数据是从四个正态总体中抽出的独立样本,对多个独立样本平均数的差异进行显著性检验,应采用完全随机设计的方差分析。(1).计算平方和:组间平方和组内平方和总平方和(2).计算自由度组间自由度组内自由度总自由度(3).计算方差组间方差

组内方差(4).计算F值

3.做统计决断,列方差分析表变异来源平方和自由度方差F值概率组间变异2850.43950.13.77*P<0.05组内变异4786.519251.9总变异7636.922表9-3四组记录数据的完全随机设计方差分析表三、利用样本统计量进行方差分析适用范围:分析资料没有原始数据,只有si2、ni,平均数等。适用原始公式求解第三节随机区组设计的方差分析含义:所谓区组是指把从同一总体中随机抽取的被试按条件相同的原则区分成各个组,使每个组内的被试尽量保持同质,让每个组均接受所有的各种实验处理,每种实验处理在各个区组中重复的次数相等,这种设计也称为被试内设计。对这样获得的多个相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论