管理统计学(第2版)课件:方差分析_第1页
管理统计学(第2版)课件:方差分析_第2页
管理统计学(第2版)课件:方差分析_第3页
管理统计学(第2版)课件:方差分析_第4页
管理统计学(第2版)课件:方差分析_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

管理统计学

方差分析

方差分析本章重难点:(1)了解方差分析的基本思想和原理(2)掌握方差分析检验统计量的构建方法(3)掌握利用SPSS软件进行方差分析的程序、步骤和结果报告分析6.1方差分析(ANOVA)(analysisofvariance)的基本问题方差分析的基本原理是在20世纪20年代由英国统计学家RonaldA.Fisher在进行实验设计时为解释实验数据而首先引入的检验多个总体均值是否相等通过分析数据的误差判断各总体均值是否相等研究分类型自变量对数值型因变量的影响

一个或多个分类型自变量两个或多个(k个)处理水平或分类一个数值型因变量有单因子方差分析和双因子方差分析单因子方差分析:涉及一个分类的自变量双因子方差分析:涉及两个分类的自变量基本术语方差分析是分析各个自变量对因变量影响的一种方法。这里的自变量是定性变量,称为因素或因子。因素:是一个独立的变量,也是方差分析的研究对象。例如,市场上饮料的颜色很多,要研究饮料的颜色是否对销售量产生影响,颜色就是我们要研究的对象,既是一个因素。又如,影响小麦亩产量的因素有土地、施肥量、种子品种等因素。水平:因素中的内容称为水平。如假设市场上饮料的颜色有无色透明、绿色、黄色三种,则称颜色该因素以三种水平。土地有水地和旱地,则称土地因素有两种水平。单因素方差分析:只针对一个因素进行的分析。如饮料的颜色对销售量的影响的分析问题。多因素方差分析:同时针对几个因素进行的方差分析。方差分析类型One-WayANOVA

单因素的简单方差分析过程。(要求因变量属于正态分布总体)GeneralLinearModel(GLM)过程简单的多因素方差分析和协方差分析,不但可以分析各因素的主效应,还能分析个因素间的交互效应

GLM-Unianova单因变量多因素方差分析

GLMMultivariate

多因变量方差分析,因变量是连续性变量(尺度变量),固定因素变量是分类变量,协变量必须是连续变量

2方差分析的基本原理

1、方差分析关心的主要问题是检验因素的显著性,即检验各均值是否相等。2、判断原假设是否成立,就是判断组间方差与组内方差是否有显著差异2008年8月根据方差分析的原理可以构造如下F统计量3、原假设成立,组间均方与组内均方的数值就应该很接近,它们的比值就会接近14、若原假设不成立,组间均方会大于组内均方,它们之间的比值就会大于11.2方差分析的基本原理

2008年8月方差分析的基本原理

总平方和(sumofsquaresfortotal)记为SST反映全部数据总误差大小的平方和抽取的全部超市销售额之间的误差平方和组内平方和(within-groupsumofsquares)记为SS组内反映组内误差大小的平方和比如,同一种促销方法销售额的误差平方和只包含随机误差组间平方和(between-groupsumofsquares)记为SS组间反映组间误差大小的平方和比如,不同促销方法销售额之间的误差平方和既包括随机误差,也包括系统误差误差的大小用均方(meansquare)来表示,也称为方差(variance)平方和除以相应的自由度总平方和(SST)的自由度为n-1;组内平方和(SS组内)的自由度为n-k;组间平方和(SS组间)的自由度为k-1组内平方和除以相应的自由度结果称为组内方差(within-groupvariance);组间平方和除以相应的自由度结果称为组间方差(between-groupvariance)

单因素方差分析数据结构表

12……k水平均值

A1X11X12……X1k

A2X21X22……X2k

…………………………

ArXr1Xr2……Xrk水平样本2单因素方差分析

设因素A有r个水平,假设不同水平下的试验观察值均服从方差相同的正态分布。用表示第i种水平下的第j个观察值1、1.提出假设一般提法 H0:m1=m2=…=mk(因素有k个水平) H1:m1

,m2

,…,mk不全相等2计算各组平均值、总平均值、三个离差平方和:总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系单因素方差分析的步骤

四种颜色饮料的销售量及均值超市(j)水平A(i)无色(A1)粉色(A2)橘黄色(A3)绿色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8合计136.6147.8132.2157.3573.9水平均值观察值个数

x1=27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5总均值x=28.695单因素方差分析3、根据F分布的定义我们可构造检验统计量:根据方差分析的原理,当不成立时,F统计量有大于1的趋势,因此当成立时,小概率事件取在F大的一侧,于是在显著性水平α条件下,假设检验:μ1=μ2=……=μr的检验规则为:

若,则拒绝单因素方差分析表(基本结构)方差来源平方和SS自由度df均方MSF值组间(因素影响)

组内(误差)

总和SSASSESSTk-1n-kn-1MSAMSEMSAMSE

单因素方差分析(例题)

例6.2对五种不同操作方案生产某种产品作节约原材料试验,在其他条件相同的情况下,就4批试样测的原材料节约额如下表。问:操作法对原材料节约额的影响差异是否显著?操作法ⅠⅡⅢⅤⅥ14.36.16.59.39.527.87.38.38.78.833.24.28.67.211.446.54.18.210.17.8

因此认为操作方法对原材料节约额有影响。3双因素方差分析双因素方差分析及其类型分析两个因素(因素A和因素B)对试验结果的影响同时对两个因素进行检验,分析是一个因素在起作用,还是两个因素都起作用,还是两个因素都不起作用如果A和B对试验结果的影响是相互独立的,分别判断因素A和因素B对试验指标的影响,这时的双因素方差分析称为无交互作用的双因素方差分析如果除了A和B对试验结果的单独影响外,因素A和因素B的搭配还会对销售量产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析

对于无交互作用的双因素方差分析,其结果与对每个因素分别进行单因素方差分析的结果相同无交互作用的双因素方差分析因素A(i)因素(B)j平均值

B1B2…BrA1A2::Ak

x11x12…x1kx21x22…x2k::::::::xr1

xr2…

xrk

::平均值…双因素方差分析的数据结构

2.分析步骤(1)提出假设对因素A提出的假设为H0:μ1=μ2=…=μi=…=μkμi为第i个水平的均值)

H1:μi

(i=1,2,…,k)不全相等对因素B提出的假设为H0:μ1=μ2=…=μj=…=μr(μj为第j个水平的均值)

H1:μj

(j=1,2,…,r)不全相等(2)构造检验统计量为检验H0是否成立,需确定检验的统计量

构造统计量需要计算总离差平方和水平项平方和误差项平方和均方

SST=SSA+SSB+SSE

无交互作用的双因素方差分析2、由离差平方和与自由度,可计算出它们各自的平均平方。无交互作用的双因素方差分析3、计算因素A和B的F统计量的值,并列出方差分析表:方差来源平方和SS自由度df均方MSF值

因素A

因素B误差总和SSASSBSSESSTk-1r-1(k-1)(r-1)kr-1MSRMSCMSEFAFB4、作出统计推断:对于A因素:若,则拒绝原假认为因素A有显著影响。对于B因素:若,则拒绝原假设,认为因素B有显著影响。无交互作用的双因素方差分析例6.3某次试验将土质基本相同的一块耕地均等分为5个地块,每个地块又均等分成4小块,将4个品种的小麦随机分种在每一地块内的4小块上,每一小块地种同样多种子的任一种小麦,今测得其收获量如表6-10所示,试以显著性水平α=0.05和α=0.01,判断地块和品种各对小麦收获量有无显著影响.

地块A1A2A3A4A5品种BB1B2B3B432.333.230.829.534.033.634.426.234.736.832.328.136.034.335.828.535.536.132.829.434.5034.8033.2228.3431.4532.0532.9833.6533.4532.72无交互作用的双因素方差分析误差来源离差平方和自由度平均平方F因素A因素B误差总计SSA=14.098SSB=134.6455SSE=26.282SST=175.02554312193.524544.88182.1902——FA=1.61FB=20.49————因此不能拒绝原假设,表明地块的不同对小麦收获量没有显著影响。拒绝原假设,表明小麦品种的不同对小麦收获量有极显著的影响有交互作用的双因素方差分析方差来源平方和SS自由度df均方MSF值行因素ASSAk-1MSRFA

列因素BSSBr-1MSCFB交互作用SSAB(k-1)

(r-1)MSRCFAB误差SSEKr(m-1)MSE总和SSTn-16.4应用案例及软件操作程序步骤:第一步,建立假设。第二步,输入数据。第三步,点击分析(Analyze)——比较均值(CompareMean)—单因素ANOVA(OneWayANOVA)展开单因素方差分析。6.4应用案例及软件操作程序例6.5某公司根据广告的曝光程度,将消费市场分为非常高(VH)、高(H)、中(M)和低(L)四个细分市场,该公司打算研究广告曝光率是否会影响其产品的市场份额。该公司确定了24个暴露于广告中的消费者样本群体,每一个暴露水平有6组,然后该公司确定每个组的产品市场份额如表6.13所示。试问该公司的市场份额是否因广告曝光率不同而不同?市场份额曝光市场份额曝光9.10L11.20H9.30L11.10H9.00L10.80H9.30L11.60H9.20L10.90H9.50L11.90H9.60M9.70VH10.00M9.80VH10.20M10.00VH9.90M9.50VH9.80M9.80VH10.00M9.60VH解:第一步,建立假设。设

、、、分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论