应用统计学 第7章 -方差分析_第1页
应用统计学 第7章 -方差分析_第2页
应用统计学 第7章 -方差分析_第3页
应用统计学 第7章 -方差分析_第4页
应用统计学 第7章 -方差分析_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《应用统计学》方差分析CONTENTS目录第一节方差分析的基本原理第二节单因素方差分析的过程第三节双因素方差分析CONTENTS目录第一节方差分析的基本原理应用统计学应用统计学例:消费者常会因产品或服务质量问题向消费者协会投诉。为了对交通货运4个部门的服务质量进行评价,消费者协会在航空货运、铁路货运、公路货运及水路货运分别抽取了不同的企业作为样本,不同的部门投诉均值是否存在差异?航空货运铁路货运公路货运水路货运324448444137295534643964355251735348455845

6860

56

应用统计学方差分析的基本原理因素(A)i

水平A1

水平A2

…水平Ak

x11

x21…

xk1

x12

x22…

xk2

:

:

:

:

:

:

:

:

应用统计学方差分析的基本原理设因素有k个水平,每个水平的均值分别用

1,

2,,

k

表示H0:

1

2

k

H1:

1,

2,,

k

不全相等方差分析:(AnalysisofVariances,简记为:ANOVA)研究一种或多种因素对某一结果的是否有显著影响的模型因素:一个或多个分类型自变量结果:一个数值型因变量

应用统计学方差分析的基本原理组间方差

因素的不同水平之间数据误差的平方和

比如,不同行业之间的被投诉次数之间的差异

这种差异可能是由于行业本身所造成的,所形成的误差

是由系统性因素造成的,称为系统误差组内平方和因素的同一水平下数据误差的平方和。比如,同一行业下不同企业被投诉次数之间的差异。这种差异可以看成是随机因素的影响,称为随机误差。

方差分析核心:利用组间方差与组内方差的比较来判断因素水平对试验结果的影响。条件和结果:1.若因素水平无显著影响:组间方差类似组内方差,主要由随机差异组成,比值约为1。

2.若因素水平有显著影响:组间方差包含系统差异,超过组内方差,比值显著大于1。显著性判定:方差比值超过特定临界点时,表明因素水平间存在显著差异。方差分析的基本原理

应用统计学方差分析的基本假定(1)每个总体都应服从正态分布:对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。比如,每个行业被投诉的次数必须服从正态分布。(2)各个总体的方差必须相同:各组观察数据是从具有相同方差的总体中抽取的。比如,4个行业被投诉次数的方差都相等。(3)观测值是独立的。不同观测结果之间不会相互影响。方差分析的基本原理第二节单因素方差分析的过程应用统计学

应用统计学1.提出假设例:设

1为航空货运被投诉次数的均值,

2为铁路货运被投诉次数的均值,

3为公路货运被投诉次数的均值,

4为水路货运被投诉次数的均值,提出的假设为:H0:

1

2

3

4

H1:

1,

2,

3,

4不全相等

应用统计学2.计算总体误差平方和

全部观察值与总平均值的离差平方和反映全部观察值的离散状况其计算公式为:其中,

应用统计学3.计算组间误差平方和各组平均值与总平均值

的离差平方和反映各总体的样本均值之间的差异程度计算公式为

应用统计学

4.计算组内误差平方和各组样本数据与其组平均值的离差平方和反映各组样本观察值离散状况计算公式为

应用统计学

总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系:SST=SSA

+SSE

应用统计学5.计算均方差各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方,也称为方差由误差平方和除以相应的自由度求得三个平方和对应的自由度分别是SST的自由度为n-1,其中n为全部观察值的个数SSA的自由度为k-1,其中k为因素水平(总体)的个数SSE的自由度为n-k

应用统计学组间方差MSA,计算公式为:组内方差MSE,计算公式为:5.计算均方差

应用统计学6.计算检验统计量

应用统计学方差分析的基本原理

应用统计学将MSA和MSE进行对比,即得到所需要的检验统计量F。当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为n-k的F分布,即:

6.计算检验统计量

应用统计学7.进行统计检验

F检验统计量值与给定显著性水平

下的临界值F

进行比较,作出决策:若F>F

拒绝原假设H0

,各总体均值不全相等若F<F

不拒绝原假设H0

,各总体均值无显著统计差异

F

(k-1,n-k)0拒绝H0不能拒绝H0F

应用统计学方差分析表方差来源平方和自由度均方F统计量组间误差SSAk-1MSAMSA/MSE组内误差SSEn-kMSE总误差SST=SSA+SSEn-1---

应用统计学方差分析表

方差来源平方和自由度均方F统计量组间误差1092.958333364.319443.45>3.1=F0.05(3,20)拒绝原假设组内误差211220105.6总误差3204.9583323

应用统计学

若方差分析的结果为因子A各水平之间有显著差异,需要进行各水平均值的两两比较,进一步检验到底哪些均值之间存在差异。单因素方差分析中的多重比较

应用统计学通过对总体均值之间的配对比较来可采用Fisher提出的最小显著差异方法,简写为LSD。LSD方法是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正(用MSE来代替)而得到。单因素方差分析中的多重比较单因素方差分析中的多重比较

应用统计学1.提出假设H0:

i

=

j(第i个总体的均值等于第j个总体的均值)H1:

i

j(第i个总体的均值不等于第j个总体的均值)2.计算检验的统计量:3.计算,自由度df=n-k4.决策:若

,拒绝H0;第三节双因素方差分析应用统计学

应用统计学双因素方差分析的类型无交互作用的双因素方差分析(无重复双因素分析)

有交互作用的双因素方差分析(重复双因素分析)假定因素A和因素B的效应之间是相互独立的,不存在相互关系假定因素A和因素B的结合会产生出一种新的效应

双因素方差分析无重复双因素方差分析

应用统计学

某商品有五种不同的包装方式(因素A),在五个不同地区销售(因素B),现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售资料如下表.

包装方式(A)A1A2A3A4A5销售地区(B)B12012201014B2221020126B32414181810B41648618B52622162010

应用统计学因素AA1A2…Ar因素BB1X11X12…X1rB2X21X22…X2r………………BkXk1Xk2…Xkr…无重复双因素方差分析

应用统计学每个总体都服从正态分布:对于因子的每一个水平,其观察值是来自正态分布总体的简单随机样本。各个总体的方差必须相同:对于各组观察数据,是从具有相同方差的总体中抽取的。观察值是独立的。无重复双因素方差分析

应用统计学无重复双因素方差分析

应用统计学由离差平方和与自由度可以计算均方差:

对因素A而言:

对因素B而言:

对误差而言:无重复双因素方差分析

应用统计学误差来源离差平方和自由度均方差F值A因素SSAr-1MSA=SSA/(r-1)FA=MSA/MSEB因素SSBk-1MSB=SSB/(k-1)FB=MSB/MSE误差SSE(r-1)(k-1)MSE=SSE/(r-1)(k-1)---合计SSTn-1------无重复双因素方差分析

应用统计学建立假设 对因素A: H0:,包装方式之间无差别。 H1:,不全相等,包装方式之间有差别。 对因素B: H0:,地区之间无差别。 H1:,不全相等,地区之间有差别。无重复双因素方差分析

应用统计学接下来:因此无重复双因素方差分析

应用统计学

对于因素A,因为

FA=3.87>F0.05(4,16)=3.01故拒绝H0接受H1,说明不同的包装方式对该商品的销售产生影响。对于因素B,因为

FB=2.30<F0.05(4,16)=3.01故接受H0说明不同地区该商品的销售没有显著差异。无重复双因素方差分析

应用统计学

提出假设对行因子提出的假设为H0:m1=m2=…=mi=…=mk(mi为第i个水平的均值)H1:mi

(i=1,2,…,k)不全相等对列因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论