06第六章方差分析.ppt_第1页
06第六章方差分析.ppt_第2页
06第六章方差分析.ppt_第3页
06第六章方差分析.ppt_第4页
06第六章方差分析.ppt_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、贵州财经学院数学与统计学院,第六章 方差分析,第一节 方差分析的基本问题,第二节 单因素方差分析,第一节 方差分析的基本问题,方差分析能够解决多个总体均值是否相等的检验问题。节省时间是这种方法明显的优点,它的另外一个好处是:由于进行分析时是将所有样本资料结合在一起,因而增加了稳定性。例如,30个样本,每一个样本包括10个观察单位。如果用z或t检验法,一次只能研究二个样本,即20个观察单位.而使用方差分析则可以把300个观察单位结合在一起进行研究。所以说,方差分析是一种实用、有效的分析方法。,是能一次性地对多个总体均值是否相等这一假设进行检验的方法。,例:某饮料生产企业研制出一种新型饮料。饮料的

2、颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。随机从五家超级市场上收集了前一期该种饮料的销售量.,方差分析,一、方差分析的内容,为了对方差分析的内容有一个直观认识,不妨通过下面的例子说明。,问该饮料的颜色是否对销售量产生影响。,分析:这是一个方差分析的问题。即对四种饮料销售量均值是否相等进行检验。由于饮料是同一厂家生产的,它们的营养含量、味道、价格、包装等可能影响销售量的因素全部相同,如果检验结果为1、2、3、4不存在显著影响,则可以认为饮料的颜色对销售量没有影响,它们来自于相同的总体。,绿色、粉色、无色、橘黄色,如果相等,可以认为它们来自于相同的总体。(即颜色对销量没有影响),分析:反之

3、,如果检验结果为 1、2、3、4不相等,则意味着它们来自于不同的总体,表明饮料颜色对销售量产生影响。,方差分析就是一次性地对多个总体均值是否相等这一 假设进行检验的方法。,二、方差分析的基本概念,在方差分析中,常常用到一些术语。,因素,水平,交互影响,又称因子,是在实验中或在抽样中的发生的量, 它是一个独立的变量,也是方差分析研究的对象。,因素的状态称为水平。,如果因子间存在相互作用,称之为“交互影响”;如果因子间是相互独立的,则称为无交互影响。,如上例中饮料的颜色,如上例中水平有四个,即饮料的四种不同的颜色。,在实验中变化的因素不只有一个,单因素方差分析,多因素方差分析,在实验中变化的因素只

4、有一个,上例中只分析饮料的颜色对销售量是否有影响.,假如上例中除了颜色以外,还分析饮料的营养含量、味道、价格、装潢等因素对销售量是否有影响.,三、方差分析的原理,从方差分析的目的看,是要检验各个水平的均值u1,u2, ur是否相等,而实现这个目的的手段是通过方差的比较。 所以方差分析的原理就是通过不同方差的比较,作出接受原假设或拒绝原假设的判断。 1、方差的分解:,观察值的差异,系统性差异,指不同水平之间的方差.既包括系统性差异,又包括随机性差异。,是同一水平内部的方差,只包括随机性差异,如销售量的不同,颜色不同引起销量不同,相同颜色的饮料在不同商场销售量也不同,如果不同的水平对结果没有影响,

5、则没有系统性差异,组间方差与组内方差的比值就会接近于1, 即:,如果不同的水平对结果产生影响,包括了系统性差异,则组间方差与组内方差的比值就会显著地大于1许多。,当这个比值大到某个程度,或者说达到某临界点,就可以作出判断,说不同的水平之间存在着显著性差异。,即:,即:,如饮料的颜色对销售量不产生影响,如饮料的颜色对销售量有显著影响,2、检验统计量 我们把组间方差和组内方差之比称为检验统计量。数理统计证明,这个统计量服从F分布。又叫F统计量:即,F分布为正偏态分布, F是大于0的正数。许多类型的假设检验需要利用F分布,方差分析是其中的一种。,颜色对销售量没有影响,第二节 单因素方差分析,为便于叙

6、述,也便于理解,可以将单因素方差分析按其过程划为几步。,不完全相等。,一、提出原假设和备选假设,颜色对销售量有显著影响,二、随机抽样,计算样本的水平均值和总均值,表示第j种水平的样本均值,式中 是第j种水平下的第i个观察值, 是第j种水平下的观察值的个数。,水平均值,总均值,上例中,计算总均值的 一般表达式为:,(一)、计算总离差平方和(SST),三、计算离差平方和,不论是总方差、组间方差和组内方差,实质上都是离差平方和除以观察值的个数。所以要计算总方差、组间方差和组内方差,首先应计算离差平方和。在单因素方差分析中,与以上方差对应,离差平方和也有三个,它们分别是总离差平方和,组内离差平方和及组

7、间离差平方和。,它是所有观察值与总均值的离差平方和,反映了样本数据总的波动情况。,计算公式为:,=(26.5-28.695)2+(28.7-28.695)2+(32.8-28.695)2=115.9295,上例中可以计算出:,(二)、计算组内离差平方和(SSE),计算公式:,观察值与水平(组内)均值的离差平方和,反映的是水平内部,或组内样本数值的离散程度。实质上它反映了随机因素带来的影响。,=(26.5-27.32)2+(28.7.5-27.32)2 +(27.2-27.32)2= 10.688,上例中可以计算出:,水平1,类似地,其他三个水平计算:8.572,13.22,6.632,,=10

8、.688+8.572+13.22+6.632 =39.084,可以把单因素方差分析中的因素称为A,于是组间离差平方和用SSA表示。 计算公式为:,它是水平(组内)均值与总均值的离差平方和,所表现的是组间差异。其中包括随机因素差异,也包括系统性差异。,(三)计算组间离差平方和(SSA),SST、SSE、SSA之间存在一定的联系。表现在:,上例中,SSA=SST-SSE=115.9295-39.084=76.8455,(四)计算方差,离差平方和还要受到的观察值个数的影响,观察值个数越多,离差平方和就有可能越大;观察值个数越少,离差平方和就有可能越小。为了消除观察值个数对离差平方和大小的影响,我们用

9、离差平方和除以观察值个数,得到方差.,自由度,SSA除以它的自由度叫组间方差MSA,SSE除以它的自由度叫组内方差MSE,SST除以它的自由度叫总方差MST,SSA反映的是组间(水平)的差异,对SSA来说,其自由度为r-1,这里r表示水平的个数。如前例,有四个水平,即四种不同颜色,故r=4。它也有一个约束条件,即,对SST来说,其观察值个数为nr,因为它有一个约束条件 ,失去一个自由度,即为nr-1,,总方差MST =MST /(nr-1),组间方差MSA=SSA/(r-1),n为每一种水平的观察值个数,假设相等,上例中,MSA=SSA/(r-1)=76.8455/(4-1)=25.6152

10、上例中,MSE=SSE/(nr-r)=39.0840/(20-4)=2.4428,对SSE来说,其自由度为nr-r,因为对每一种水平而言,其观察值个数为n,该种水平下的自由度为n -1,共有r个水平,因此拥有的自由度个数为r(n -1)=nr-r。,组内方差MSE=SSE/(nr-r),与离差平方和一样,SST、SSA、SSE之间的自由度也存在一定的联系。即: nr-1=(r-1)+(nr-r),r-1,nr-r,F分布表的v1,F分布表的v2,于是,查F分布表得临界值F=3.24,(五)判断 根据显著性水平和统计量的F分布,可以找出接受域和拒绝域的临界点,用计算出的F检验统计量的值与临界值F

11、相比较,就可以作出接受原假设或拒绝原假设的判断。,若 接受H0 若 拒绝H0接受H1,F,F,接受H0,拒绝H0接受H1,已知,查F分布表得临界值F,如上例,H0:u1= u2=u3=u4 颜色对销售量没有影响 H1:u1、u2、u3、u4 不全相等 颜色对销售量有影响 由前所知,F值=10.486。若=0.05,查表得 F(r-1,nr-r)=F0.05(3 . 16)=3.24,由于F F故拒绝原假设,接受备选假设。即通过检验知, u1、u2、u3、u4不全相等;说明饮料的颜色对销售量有显著影响。,F=10.5,三、单因素方差分析中的几个问题,1、方差分析需满足的假设条件: (1)样本是独立的随机样本 (2)各样本皆来自正态总体; (3)总体方差具有齐性,即各总体方差相等。 2、各总体的样本容量可以相等也可以不相等。 3、方差分析将所有样本结合在一起,使数据数量增

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论