管理统计学-第七章 方差分析_06~07ppt课件_第1页
管理统计学-第七章 方差分析_06~07ppt课件_第2页
管理统计学-第七章 方差分析_06~07ppt课件_第3页
管理统计学-第七章 方差分析_06~07ppt课件_第4页
管理统计学-第七章 方差分析_06~07ppt课件_第5页
已阅读5页,还剩146页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、10-1第七章 方差分析10-27.1 方差分析的引论方差分析的引论 7.2 单因素方差分析单因素方差分析7.3 *方差分析中的多重比较方差分析中的多重比较7.4 双因素方差分析双因素方差分析7.5 *实验设计初步实验设计初步第七章 方差分析10-3学习目标解释方差分析的概念解释方差分析的概念解释方差分析的基本思想和原理解释方差分析的基本思想和原理掌握单因素方差分析的方法及应用掌握单因素方差分析的方法及应用*理解多重比较的意义理解多重比较的意义掌握双因素方差分析的方法及应用掌握双因素方差分析的方法及应用*掌握正交实验设计的基本原理和方法掌握正交实验设计的基本原理和方法10-4案例与背景 目的:

2、某产品开发工程师正在考虑能使一种新的合成纤维的抗拉强度增大的方案,这种合成纤维织出的布是用来缝制男士衬衫的。 掌握的信息: 抗拉强度受棉花在纤维中的比重的影响,因而,他推测增加棉花含量会增大强度。 成品布须具有其他所希望的质量特性(比如承受恒压加工处理的能力)的话,棉花含量应该在10%到40%之间。 处理方法: 检验棉花含量五个水平的样品:15%、20%、25%、30%和35%。 对每个棉花含量水平试验5个样品 要达到的目的:推测“棉花含量对抗拉强度有影响的正确性。 10-5 分析: 要解决的问题:棉花含量对抗拉强度是否有影响。 结论的形式:各棉花含量下的抗拉强度平均水平总体均值都是相等的。

3、变量构成: 因变量:抗拉强度数值型变量; 自变量:棉花含量分类变量。 可供选择的方法: 均值的两两比较:不是100%确定两两相等,会出错的。 方差分析:检验分类变量下,多均值是否全相等。案例与背景10-67.1 方差分析引论方差分析及其有关术语方差分析及其有关术语方差分析的基本思想和原理方差分析的基本思想和原理方差分析的基本假定方差分析的基本假定问题的一般提法问题的一般提法10-7方差分析及其有关术语10-8什么是方差分析(ANOVA)?(analysis of variance) 检验多个总体均值是否相等检验多个总体均值是否相等通过分析察数据的误差判断各总体均值是否通过分析察数据的误差判断各

4、总体均值是否相等相等研究分类型自变量对数值型因变量的影响研究分类型自变量对数值型因变量的影响 一个或多个分类尺度的自变量一个或多个分类尺度的自变量2个或多个个或多个 (k 个个) 处理水平或分类处理水平或分类一个间隔或比率尺度的因变量一个间隔或比率尺度的因变量有单因素方差分析和双因素方差分析有单因素方差分析和双因素方差分析单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量双因素方差分析:涉及两个分类的自变量双因素方差分析:涉及两个分类的自变量10-9什么是方差分析? (例题分析)消费者对四个行业的投诉次数消费者对四个行业的投诉次数 行业行业观测值观测值零售业零售业旅游业旅

5、游业航空公司航空公司家电制造业家电制造业12345675766494034534468392945565131492134404451657758【例【例7.1】为了对几个行业的服务质量进行评价,消费者协】为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共消费者对总共23家企业投诉的次数如下表家企业投诉的次数如下表10-10什么是方差分析? (例题分析)分析四个行业之间的服务质量是否有显著差分析四个行业之间的服务质量是否有显著差异,也就是要判断异,也就是要判断“行业对行业对“投诉次数投诉

6、次数是否有显著影响是否有显著影响作出这种判断最终被归结为检验这四个行业作出这种判断最终被归结为检验这四个行业被投诉次数的均值是否相等被投诉次数的均值是否相等如果它们的均值相等,就意味着如果它们的均值相等,就意味着“行业对行业对投诉次数是没有影响的,即它们之间的服务投诉次数是没有影响的,即它们之间的服务质量没有显著差异;如果均值不全相等,则质量没有显著差异;如果均值不全相等,则意味着意味着“行业对投诉次数是有影响的,它行业对投诉次数是有影响的,它们之间的服务质量有显著差异们之间的服务质量有显著差异10-11为什么不同T检验进行两两比较 两两比较是建立在统计概率的基础上的。两两比较是建立在统计概率

7、的基础上的。 在统计上,由于检验是可能出错误的,因而,在统计上,由于检验是可能出错误的,因而,不能得到不能得到A=B且且B=C,故,故A=B=C的结论。的结论。 比如:一次两两比较不犯第一类错误的概率比如:一次两两比较不犯第一类错误的概率为为1-0.05。如果有。如果有k个样本要进行两两比较,个样本要进行两两比较,共需比较共需比较 次。这时犯第一类错误次。这时犯第一类错误的概率就是:的概率就是: 这显然大于这显然大于0.05。如果有五个样本作两两。如果有五个样本作两两比较,则犯错误的概率为比较,则犯错误的概率为0.4013!! 2!2 !kk ! 2!2 !1 0.95kk10-12方差分析中

8、的有关术语因素或因子因素或因子(factor)所要检验的对象所要检验的对象要分析行业对投诉次数是否有影响,行业是要检要分析行业对投诉次数是否有影响,行业是要检验的因素或因子验的因素或因子水平或处理水平或处理(treatment)因子的不同表现因子的不同表现零售业、旅游业、航空公司、家电制造业就是因零售业、旅游业、航空公司、家电制造业就是因子的水平子的水平观察值观察值在每个因素水平下得到的样本值在每个因素水平下得到的样本值每个行业被投诉的次数就是观察值每个行业被投诉的次数就是观察值10-13方差分析中的有关术语试验试验这里只涉及一个因素,因此称为单因素四水这里只涉及一个因素,因此称为单因素四水平

9、的试验平的试验总体总体因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体比如零售业、旅游业、航空公司、家电制造比如零售业、旅游业、航空公司、家电制造业可以看作是四个总体业可以看作是四个总体样本数据样本数据被投诉次数可以看作是从这四个总体中抽取被投诉次数可以看作是从这四个总体中抽取的样本数据的样本数据10-14方差分析的基本思想和原理10-15方差分析的基本思想和原理(图形分析)不同行业被投诉次数的散点图不同行业被投诉次数的散点图020406080012345行业被投诉次数 零售业零售业 旅游业旅游业 航空公司航空公司 家电制造家电制造10-16 从散点图上可以看出从散点图上可

10、以看出 不同行业被投诉的次数是有明显差异的不同行业被投诉的次数是有明显差异的 即使是在同一个行业,不同企业被投诉的次数即使是在同一个行业,不同企业被投诉的次数也明显不同也明显不同 家电制造也被投诉的次数较高,航空公司被投家电制造也被投诉的次数较高,航空公司被投诉的次数较低诉的次数较低 行业与被投诉次数之间有一定的关系行业与被投诉次数之间有一定的关系 如果行业与被投诉次数之间没有关系,那么它如果行业与被投诉次数之间没有关系,那么它们被投诉的次数应该差不多相同,在散点图上们被投诉的次数应该差不多相同,在散点图上所呈现的模式也就应该很接近所呈现的模式也就应该很接近方差分析的基本思想和原理(图形分析)

11、10-17 仅从散点图上观察还不能提供充分的证据证明不仅从散点图上观察还不能提供充分的证据证明不同行业被投诉的次数之间有显著差异同行业被投诉的次数之间有显著差异 这种差异也可能是由于抽样的随机性所造成的这种差异也可能是由于抽样的随机性所造成的 需要有更准确的方法来检验这种差异是否显著,需要有更准确的方法来检验这种差异是否显著,也就是进行方差分析也就是进行方差分析 所以叫方差分析,因为虽然我们感兴趣的是均值,所以叫方差分析,因为虽然我们感兴趣的是均值,但在判断均值之间是否有差异时则需要借助于方但在判断均值之间是否有差异时则需要借助于方差差 这个名字也表示:它是通过对数据误差来源的分这个名字也表示

12、:它是通过对数据误差来源的分析判断不同总体的均值是否相等。因而,进行方析判断不同总体的均值是否相等。因而,进行方差分析时,需要考察数据误差的来源。差分析时,需要考察数据误差的来源。方差分析的基本思想和原理10-181.比较两类误差,以检验均值是否相等比较两类误差,以检验均值是否相等2.比较的基础是方差比比较的基础是方差比3.如果系统如果系统(处置处置)误差显著地不同于随机误差,误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等则均值就是不相等的;反之,均值就是相等的的4.误差是由各部分的误差占总误差的比例来测误差是由各部分的误差占总误差的比例来测度的度的方差分析的基本思想和原理1

13、0-19方差分析的基本思想和原理(两类误差)随机误差随机误差因素的同一水平因素的同一水平(总体总体)下,样本各观察值之间的下,样本各观察值之间的差异差异比如,同一行业下不同企业被投诉次数是不同的比如,同一行业下不同企业被投诉次数是不同的这种差异可以看成是随机因素的影响,称为随机这种差异可以看成是随机因素的影响,称为随机误差误差 系统误差系统误差因素的不同水平因素的不同水平(不同总体不同总体)下,各观察值之间的下,各观察值之间的差异差异比如,不同行业之间的被投诉次数之间的差异比如,不同行业之间的被投诉次数之间的差异这种差异可能是由于抽样的随机性所造成的,也这种差异可能是由于抽样的随机性所造成的,

14、也可能是由于行业本身所造成的,后者所形成的误可能是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差差是由系统性因素造成的,称为系统误差10-20方差分析的基本思想和原理(两类方差)数据的误差用平方和数据的误差用平方和(sum of squares)表示,称表示,称为方差为方差组内方差组内方差(within groups)因素的同一水平因素的同一水平(同一个总体同一个总体)下样本数据的方差下样本数据的方差比如,零售业被投诉次数的方差比如,零售业被投诉次数的方差组内方差只包含随机误差组内方差只包含随机误差组间方差组间方差(between groups)因素的不同水平因素的不

15、同水平(不同总体不同总体)下各样本之间的方差下各样本之间的方差比如,四个行业被投诉次数之间的方差比如,四个行业被投诉次数之间的方差组间方差既包括随机误差,也包括系统误差组间方差既包括随机误差,也包括系统误差10-21方差分析的基本思想和原理(方差的比较)若不同不同行业对投诉次数没有影响,则组间误差中只包若不同不同行业对投诉次数没有影响,则组间误差中只包含随机误差,没有系统误差。这时,组间误差与组内误差含随机误差,没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近经过平均后的数值就应该很接近,它们的比值就会接近1若不同行业对投诉次数有影响,在组间误差中除了包含

16、随若不同行业对投诉次数有影响,在组间误差中除了包含随机误差外,还会包含有系统误差,这时组间误差平均后的机误差外,还会包含有系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就数值就会大于组内误差平均后的数值,它们之间的比值就会大于会大于1当这个比值大到某种程度时,就可以说不同水平之间存在当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响着显著差异,也就是自变量对因变量有影响判断行业对投诉次数是否有显著影响,实际上也就是检验判断行业对投诉次数是否有显著影响,实际上也就是检验被投诉次数的差异主要是由于什么原因所引起的。如果这被投诉次

17、数的差异主要是由于什么原因所引起的。如果这种差异主要是系统误差,说明不同行业对投诉次数有显著种差异主要是系统误差,说明不同行业对投诉次数有显著影响影响10-22方差分析的基本假定10-23方差分析的基本假定每个总体都应服从正态分布每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本态分布总体的简单随机样本比如,每个行业被投诉的次数必需服从正态分布比如,每个行业被投诉的次数必需服从正态分布各个总体的方差必须相同各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的各组观察数据是从具有相同方差的总体中抽取的比

18、如,四个行业被投诉次数的方差都相等比如,四个行业被投诉次数的方差都相等观察值是独立的观察值是独立的比如,每个行业被投诉的次数与其他行业被投诉比如,每个行业被投诉的次数与其他行业被投诉的次数独立的次数独立10-24方差分析中的基本假定在上述假定条件下,判断行业对投诉次数是否在上述假定条件下,判断行业对投诉次数是否有显著影响,实际上也就是检验具有同方差的有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等四个正态总体的均值是否相等如果四个总体的均值相等,可以期望四个样本如果四个总体的均值相等,可以期望四个样本的均值也会很接近的均值也会很接近四个样本的均值越接近,推断四个总体均值相四个

19、样本的均值越接近,推断四个总体均值相等的证据也就越充分等的证据也就越充分样本均值越不同,推断总体均值不同的证据就样本均值越不同,推断总体均值不同的证据就越充分越充分 10-25方差分析中基本假定 如果原假设成立,即如果原假设成立,即H0: m1 = m2 = m3 = m4四个行业被投诉次数的均值都相等四个行业被投诉次数的均值都相等意味着每个样本都来自均值为意味着每个样本都来自均值为、差为、差为2的同的同一正态总体一正态总体 Xf(X) 1 2 3 4 10-26方差分析中基本假定若备择假设成立,即若备择假设成立,即H1: mi (i=1,2,3,4)不全相不全相等等至少有一个总体的均值是不同

20、的至少有一个总体的均值是不同的四个样本分别来自均值不同的四个正态总体四个样本分别来自均值不同的四个正态总体 Xf(X) 3 1 2 4 10-27问题的一般提法10-28问题的一般提法设因素有设因素有k个水平,每个水平的均值分别用个水平,每个水平的均值分别用1、2、k 表示表示要检验要检验k个水平个水平(总体总体)的均值是否相等,需要提出如的均值是否相等,需要提出如下假设:下假设: H0: 1 2 k H1: 1 , 2 , ,k 不全相等不全相等设设1为零售业被投诉次数的均值,为零售业被投诉次数的均值,2为旅游业被为旅游业被投诉次数的均值,投诉次数的均值,3为航空公司被投诉次数的均值,为航空

21、公司被投诉次数的均值,4为家电制造业被投诉次数的均值,提出的假设为为家电制造业被投诉次数的均值,提出的假设为H0: 1 2 3 4 H1: 1 , 2 , 3 , 4 不全相等不全相等10-297.2 单因素方差分析数据结构数据结构分析步骤分析步骤*关系强度的测量关系强度的测量*用用SPSS进行方差分析进行方差分析10-30单因素方差分析的数据结构(one-way analysis of variance) 观察值观察值 ( j )因素因素(A) i 水平水平A1 水平水平A2 水平水平Ak12:n x11 x21 xk1 x12 x22 xk2 : : : : : : : : x1n x2n

22、 xkn10-31分析步骤分析步骤提出假设提出假设构造检验统计量构造检验统计量统计决策统计决策10-32提出假设一般提法一般提法H0: m1 = m2 = mk 自变量对因变量没有显著影响自变量对因变量没有显著影响 H1: m1 ,m2 , ,mk不全相等不全相等自变量对因变量有显著影响自变量对因变量有显著影响 注意:拒绝原假设,只表明至少有两个总注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值体的均值不相等,并不意味着所有的均值都不相等都不相等 10-33构造检验的统计量n构造统计量需要计算构造统计量需要计算n水平的均值水平的均值n全部观察值的总均值全部观察值的总均值

23、n误差平方和误差平方和n均方均方(MS) 10-34构造检验的统计量(计算水平的均值)假定从第假定从第i个总体中抽取一个容量为个总体中抽取一个容量为ni的简单的简单随机样本,第随机样本,第i个总体的样本均值为该样本的个总体的样本均值为该样本的全部观察值总和除以观察值的个数全部观察值总和除以观察值的个数计算公式为计算公式为 ), 2 , 1(1kinxxinjijii式中:式中: ni为第为第 i 个总体的样本观察值个数个总体的样本观察值个数 xij 为第为第 i 个总体的第个总体的第 j 个观察值个观察值 10-35构造检验的统计量(计算全部观察值的总均值)全部观察值的总和除以观察值的总个数全

24、部观察值的总和除以观察值的总个数计算公式为计算公式为 kkiiikinjijnnnnnxnnxxi21111式中:10-36构造检验的统计量(例题分析)10-37构造检验的统计量(计算总误差平方和 SST)全部观察值全部观察值 与总平均值与总平均值 的离差平方和的离差平方和反映全部观察值的离散状况反映全部观察值的离散状况其计算公式为其计算公式为ijxxkinjijixxSST112 前例的计算结果:前例的计算结果: SST = (57-47.869565)2+(58-47.869565)2 =115.929510-38构造检验的统计量(计算水平项平方和 SSA)各组平均值各组平均值 与总平均值

25、与总平均值 的离的离差平方和差平方和反映各总体的样本均值之间的差异程度,又称组反映各总体的样本均值之间的差异程度,又称组间平方和间平方和该平方和既包括随机误差,也包括系统误差该平方和既包括随机误差,也包括系统误差计算公式为计算公式为 kiiikinjixxnxxSSAi12112 前例的计算结果:前例的计算结果:SSA = 1456.608696), 2 , 1(kixix10-39构造检验的统计量(计算误差项平方和 SSE)每个水平或组的各样本数据与其组平均值的离差每个水平或组的各样本数据与其组平均值的离差平方和平方和反映每个样本各观察值的离散状况,又称组内平反映每个样本各观察值的离散状况,

26、又称组内平方和方和该平方和反映的是随机误差的大小该平方和反映的是随机误差的大小计算公式为计算公式为 kinjiijixxSSE112 前例的计算结果:前例的计算结果:SSE = 270810-40构造检验的统计量(三个平方和的关系)总离差平方和总离差平方和(SST)、误差项离差平方和、误差项离差平方和(SSE)、水平项离差平方和、水平项离差平方和 (SSA) 之间的之间的关系关系kinjijkiiikinjijiixxxxnxx11212112SST = SSA + SSE 前例的计算结果:前例的计算结果: 4164.608696=1456.608696+2708 10-41构造检验的统计量(

27、三个平方和的作用) SST反映全部数据总的误差程度;反映全部数据总的误差程度;SSE反映随机反映随机误差的大小;误差的大小;SSA反映随机误差和系统误差的大反映随机误差和系统误差的大小小如果原假设成立,则表明没有系统误差,组间平如果原假设成立,则表明没有系统误差,组间平方和方和SSA除以自由度后的均方与组内平方和除以自由度后的均方与组内平方和SSE和除以自由度后的均方差异就不会太大;如果组和除以自由度后的均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平间均方显著地大于组内均方,说明各水平(总体总体)之间的差异不仅有随机误差,还有系统误差之间的差异不仅有随机误差,还有系统误差判断因

28、素的水平是否对其观察值有影响,实际上判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小就是比较组间方差与组内方差之间差异的大小10-42构造检验的统计量(计算均方MS)各误差平方和的大小与观察值的多少有关,为各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方,也称为方差要将其平均,这就是均方,也称为方差计算方法是用误差平方和除以相应的自由度计算方法是用误差平方和除以相应的自由度三个平方和对应的自由度分别是三个平方和对应的自由度分别是SST 的自由度为的自由度为n-1,其中

29、,其中n为全部观察值的为全部观察值的个数个数SSA的自由度为的自由度为k-1,其中,其中k为因素水平为因素水平(总体总体)的个数的个数SSE 的自由度为的自由度为n-k10-43构造检验的统计量(计算均方 MS) 组间方差:组间方差:SSA的均方,记为的均方,记为MSA,计算,计算公式为公式为1kSSAMSA 组内方差:组内方差:SSE的均方,记为的均方,记为MSE,计算公,计算公式为式为knSSEMSE536232.48514608696.1456MSA前例计算结果:526316.1424232708MSE前例计算结果:10-44构造检验的统计量(计算检验统计量 F )将将MSA和和MSE进

30、行对比,即得到所需要的检进行对比,即得到所需要的检验统计量验统计量F当当H0为真时,二者的比值服从分子自由度为为真时,二者的比值服从分子自由度为k-1、分母自由度为、分母自由度为 n-k 的的 F 分布,即分布,即 ), 1(knkFMSEMSAF406643. 3526316.142536232.485F前例计算结果:10-45构造检验的统计量(F分布与拒绝域)如果均值相等,如果均值相等,F=MSA/MSE1a a F 分布分布F(k-1,n-k)0拒绝拒绝H0不能拒绝不能拒绝H0H0F10-46统计决策 将统计量的值将统计量的值F与给定的显著性水平与给定的显著性水平的临界的临界值值F进行比

31、较,作出对原假设进行比较,作出对原假设H0的决策的决策根据给定的显著性水平根据给定的显著性水平,在,在F分布表中查找与分布表中查找与第一自由度第一自由度df1k-1、第二自由度、第二自由度df2=n-k 相相应的临界值应的临界值 F 若若FF ,则拒绝原假设,则拒绝原假设H0 ,表明均值之间的,表明均值之间的差异是显著的,所检验的因素对观察值有显差异是显著的,所检验的因素对观察值有显著影响著影响若若FF ,则拒绝原假设,则拒绝原假设H0 ,表明均值之间,表明均值之间的差异是显著的,即所检验的行因素对观察的差异是显著的,即所检验的行因素对观察值有显著影响值有显著影响若若FC F ,则拒绝原假设,

32、则拒绝原假设H0 ,表明均值之间,表明均值之间有显著差异,即所检验的列因素对观察值有有显著差异,即所检验的列因素对观察值有显著影响显著影响 10-84双因素方差分析表(基本结构)10-85双因素方差分析(例题分析)提出假设提出假设对品牌因素提出的假设为对品牌因素提出的假设为H0: m1=m2=m3=m4 (品牌对品牌对销售量没有影响销售量没有影响)H1: mi (i =1,2, , 4) 不全相等不全相等 (品牌对销售量有品牌对销售量有影响影响)对地区因素提出的假设为对地区因素提出的假设为H0: m1=m2=m3=m4=m5 (地区对销售量地区对销售量没有影响没有影响)H1: mj (j =1

33、,2,5) 不全相等不全相等 (地区对销售量有地区对销售量有影响影响)用用SPSS进行无重复双因素分析进行无重复双因素分析10-86双因素方差分析(例题分析) 结论:结论: FR18.10777F3.4903,拒绝原假设,拒绝原假设H0,说明彩电,说明彩电的品牌对销售量有显著影响的品牌对销售量有显著影响 FC2.100846 F3.2592,不能拒绝原假设,不能拒绝原假设H0,说明,说明销售地区对彩电的销售量没有显著影响销售地区对彩电的销售量没有显著影响10-87双因素方差分析SPSS(例题分析)Tests of Between-Subjects EffectsTests of Between

34、-Subjects EffectsDependent Variable: 销售量15016.250a72145.1798.961.0012157588.05012157588.0509012.795.0002011.7004502.9252.101.14413004.55034334.85018.108.0002872.70012239.3922175477.0002017888.95019SourceCorrected ModelInterceptAreaBrandErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig

35、.R Squared = .839 (Adjusted R Squared = .746)a. 方差分析结果:因素显著性判断方差分析结果:因素显著性判断10-88双因素方差分析SPSS(例题分析)方差齐次性判断方差齐次性判断水平显著性分析的准备水平显著性分析的准备L Le ev ve en ne e s s T Te es st t o of f E Eq qu ua al li it ty y o of f E Er rr ro or r V Va ar ri ia an nc ce es sa aDependent Variable: 销售量.190.Fdf1df2Sig.Tests th

36、e null hypothesis that the error variance ofthe dependent variable is equal across groups.Design: Intercept+Area+Branda. 本例中样本总数是本例中样本总数是20,因素向量,因素向量4520个,所以误差项的自由度个,所以误差项的自由度ns12120,因而,因而,F统计量的分母误差项的方差误差项的变差统计量的分母误差项的方差误差项的变差/自由度),就不存自由度),就不存在,在,F统计量无法显示。统计量无法显示。实际上,对于无重复的多因素方差分析,不必要作方差齐次性检验。实际上,对于

37、无重复的多因素方差分析,不必要作方差齐次性检验。10-89双因素方差分析SPSS(例题分析)因素的水平显著性判断因素的水平显著性判断LSD方差齐次时方差齐次时或或Tamhane T2方差非齐次时)方差非齐次时)Multiple ComparisonsMultiple ComparisonsDependent Variable: 销售量8.750010.94056.439-15.087432.5874-.250010.94056.982-24.087423.587420.750010.94056.082-3.087444.587423.500010.94056.053-.337447.3374-

38、8.750010.94056.439-32.587415.0874-9.000010.94056.427-32.837414.837412.000010.94056.294-11.837435.837414.750010.94056.202-9.087438.5874.250010.94056.982-23.587424.08749.000010.94056.427-14.837432.837421.000010.94056.079-2.837444.837423.750010.94056.051-.087447.5874-20.750010.94056.082-44.58743.0874-1

39、2.000010.94056.294-35.837411.8374-21.000010.94056.079-44.83742.83742.750010.94056.806-21.087426.5874-23.500010.94056.053-47.3374.3374-14.750010.94056.202-38.58749.0874-23.750010.94056.051-47.5874.0874-2.750010.94056.806-26.587421.08748.750025.927381.000-103.0621120.5621-.250022.625121.000-99.295898.

40、795820.750026.28490.998-92.8811134.381123.500019.14637.965-80.1169127.1169-8.750025.927381.000-120.5621103.0621-9.000023.912171.000-115.780497.780412.000027.400581.000-105.7432129.743214.750020.65137.999-100.9715130.4715.250022.625121.000-98.795899.29589.000023.912171.000-97.7804115.780421.000024.29

41、935.996-88.2294130.229423.750016.31398.905-57.7275105.2275-20.750026.28490.998-134.381192.8811-12.000027.400581.000-129.7432105.7432-21.000024.29935.996-130.229488.22942.750021.098481.000-116.5916122.0916-23.500019.14637.965-127.116980.1169-14.750020.65137.999-130.4715100.9715-23.750016.31398.905-10

42、5.227557.7275-2.750021.098481.000-122.0916116.5916(J) 地区地区2地区3地区4地区5地区1地区3地区4地区5地区1地区2地区4地区5地区1地区2地区3地区5地区1地区2地区3地区4地区2地区3地区4地区5地区1地区3地区4地区5地区1地区2地区4地区5地区1地区2地区3地区5地区1地区2地区3地区4(I) 地区地区1地区2地区3地区4地区5地区1地区2地区3地区4地区5LSDTamhaneMeanDifference(I-J)Std. ErrorSig.Lower BoundUpper Bound95% Confidence Interval

43、Based on observed means.Multiple ComparisonsMultiple ComparisonsDependent Variable: 销售量-3.60009.78553.719-24.920817.72087.20009.78553.476-14.120828.520859.4000*9.78553.00038.079280.72083.60009.78553.719-17.720824.920810.80009.78553.291-10.520832.120863.0000*9.78553.00041.679284.3208-7.20009.78553.47

44、6-28.520814.1208-10.80009.78553.291-32.120810.520852.2000*9.78553.00030.879273.5208-59.4000*9.78553.000-80.7208-38.0792-63.0000*9.78553.000-84.3208-41.6792-52.2000*9.78553.000-73.5208-30.8792-3.600010.289801.000-39.396832.19687.200011.62927.992-34.280648.680659.4000*9.82751.00225.342993.45713.600010

45、.289801.000-32.196839.396810.800012.15072.954-31.804653.404663.0000*10.43935.00226.753999.2461-7.200011.62927.992-48.680634.2806-10.800012.15072.954-53.404631.804652.2000*11.76180.01610.469093.9310-59.4000*9.82751.002-93.4571-25.3429-63.0000*10.43935.002-99.2461-26.7539-52.2000*11.76180.016-93.9310-

46、10.4690(J) 商标品牌2品牌3品牌4品牌1品牌3品牌4品牌1品牌2品牌4品牌1品牌2品牌3品牌2品牌3品牌4品牌1品牌3品牌4品牌1品牌2品牌4品牌1品牌2品牌3(I) 商标品牌1品牌2品牌3品牌4品牌1品牌2品牌3品牌4LSDTamhaneMeanDifference(I-J)Std. ErrorSig.Lower BoundUpper Bound95% Confidence IntervalBased on observed means.The mean difference is significant at the .05 level.*. 结论:地区间的水平无明显差异;品牌结

47、论:地区间的水平无明显差异;品牌4同其他品牌有明显差异。同其他品牌有明显差异。10-90双因素方差分析SPSS(例题分析)最有效因素水平判断:最有效因素水平判断:t统计量估计统计量估计2,(1)(1)iierrorijijerrorerrorxttdfMSE knkndfdfkra某因素的水平数,可视为在该因素下,其他因素的数量。各因素的特定水平下所作实验的次数。误差平方和的自由度 即估计统计量无重复):估计统计量无重复):20.02533912239.3924 1339 16.856= 322.144,355.856ierrorijxtdfMSE knta置信区间:置信区间:10-91双因素

48、方差分析SPSS(例题分析)1 1. . 地地 区区Dependent Variable: 销售量339.0007.736322.144355.856330.2507.736313.394347.106339.2507.736322.394356.106318.2507.736301.394335.106315.5007.736298.644332.356地区地区1地区2地区3地区4地区5MeanStd. ErrorLower BoundUpper Bound95% Confidence Interval2. 商标2. 商标Dependent Variable: 销售量344.2006.919

49、329.124359.276347.8006.919332.724362.876337.0006.919321.924352.076284.8006.919269.724299.876商标品牌1品牌2品牌3品牌4MeanStd. ErrorLower BoundUpper Bound95% Confidence Interval由于地区无差异,因由于地区无差异,因此销售量不受地区影此销售量不受地区影响,选择哪个地区都响,选择哪个地区都可以。可以。由于品牌由于品牌4同其他品同其他品牌有明显差异,而牌有明显差异,而其他品牌间没有差其他品牌间没有差异,所以,品牌异,所以,品牌4效效果较差,而其他品果

50、较差,而其他品牌差不多。牌差不多。10-92双因素方差分析(关系强度的测量)行平方和行平方和(行行SS)度量了品牌这个自变量对因变量度量了品牌这个自变量对因变量(销售量销售量)的影响效应的影响效应列平方和列平方和(列列SS)度量了地区这个自变量对因变量度量了地区这个自变量对因变量(销售量销售量)的影响效应的影响效应这两个平方和加在一起则度量了两个自变量对因变量的联这两个平方和加在一起则度量了两个自变量对因变量的联合效应合效应联合效应与总平方和的比值定义为联合效应与总平方和的比值定义为R2其平方根其平方根R反映了这两个自变量合起来与因变量之间的关反映了这两个自变量合起来与因变量之间的关系强度系强

51、度 SSTSSCSSRR总效应联合效应210-93双因素方差分析(关系强度的测量)例题分析例题分析品牌因素和地区因素合起来总共解释了销售量品牌因素和地区因素合起来总共解释了销售量差异的差异的83.94%其他因素其他因素(残差变量残差变量)只解释了销售量差异的只解释了销售量差异的16.06%R=0.9162,表明品牌和地区两个因素合起来,表明品牌和地区两个因素合起来与销售量之间有较强的关系与销售量之间有较强的关系 %94.838394. 095.1788870.201155.130042SSTSSCSSRR10-94例题SPSS分析【例【例7.4】生产某种化工产品,要比较四种不同配方对生产率的】

52、生产某种化工产品,要比较四种不同配方对生产率的影响考虑到生产率随生产日不同而变动较大,所以把实验日期影响考虑到生产率随生产日不同而变动较大,所以把实验日期也选为因子。实验分四天进行。配方因素和日期因子分别用也选为因子。实验分四天进行。配方因素和日期因子分别用A、B表示,实验数据如下表:表示,实验数据如下表:B1B1B2B2B3B3B4B4A1A164.964.962.662.661.161.159.259.2A2A269.169.170.170.166.866.863.663.6A3A376.176.1747471.371.367.267.2A4A482.982.98080767672.372

53、.310-95例题SPSS分析 见表见表双因素无重复双因素无重复-方差分析例题方差分析例题1(7.3.4-2)_结果结果_0110-96有交互作用的双因素方差分析(可重复双因素分析)10-97可重复双因素分析(例题)【例【例7.5】城市道路交通管理部门为研究不同的路段和不】城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间的影响,让一名交通警察分别在两同的时间段对行车时间的影响,让一名交通警察分别在两个路段和高峰期与非高峰期亲自驾车进行试验,通过试验个路段和高峰期与非高峰期亲自驾车进行试验,通过试验取得共获得取得共获得20个行车时间个行车时间(分钟分钟)的数据,如下表。试分析的数据,

54、如下表。试分析路段、时段以及路段和时段的交互作用对行车时间的影响路段、时段以及路段和时段的交互作用对行车时间的影响 10-98交互作用的图示路段与时段对行车时间的影响路段与时段对行车时间的影响交互作用交互作用无交互作用无交互作用行车时间行车时间路段路段1路段路段2高峰期高峰期非高峰期非高峰期行车时间行车时间路段路段1路段路段2高峰期高峰期非高峰期非高峰期10-99可重复双因素分析(方差分析表的结构)10-100可重复双因素分析(平方和的计算)设: 为对应于行因素的第i个水平和列因素的第j个 水平的第l行的观察值 为行因素的第i个水平的样本均值 为列因素的第j个水平的样本均值 对应于行因素的第i

55、个水平和列因素的第j个水 平组合的样本均值 为全部n个观察值的总均值 ijlx.ix. . jx.ijxx10-101可重复双因素分析(平方和的计算)总平方和:总平方和:行变量平方和:行变量平方和:列变量平方和:列变量平方和:交互作用平方和:交互作用平方和:误差项平方和:误差项平方和:kirjmlijlxxSST1112)(2.1()kiiSSRrmxx2. .1()rjjSSCkmxx2. .11()krijijijSSRCmxxxxSSRCSSCSSRSSTSSE10-102可重复双因素分析(SPSS计算结果)见表见表双因素有重复双因素有重复-方差分析例题方差分析例题1(城市道路交通城市道

56、路交通)_结果结果10-103例题【例【例7.6】在某化学工程中,为了提高原材料利用率,选定辅料】在某化学工程中,为了提高原材料利用率,选定辅料的供给速度的供给速度A及其浓度及其浓度B进行实验。各因子的水平如进行实验。各因子的水平如下所示:下所示: A:A15kg/h) A215kg/h) A325kg/h) B: B1(5%) B2(10%) B3(15%) B4(20%)各水平组合均重复实验两次,测得数据如下表:各水平组合均重复实验两次,测得数据如下表:B1B1B2B2B3B3B4B4A1A160.7 61.160.7 61.1 61.5 61.361.5 61.3 61.6 62.061

57、.6 62.0 61.7 61.161.7 61.1A2A261.5 60.861.5 60.8 61.7 61.261.7 61.2 62.2 62.862.2 62.8 62.1 61.762.1 61.7A3A360.6 60.360.6 60.3 60.6 61.060.6 61.0 61.4 61.561.4 61.5 60.7 60.960.7 60.910-104SPSS(例题分析)方差分析结果:因素显著性判断方差分析结果:因素显著性判断Tests of Between-Subjects EffectsTests of Between-Subjects EffectsDepend

58、ent Variable: 实验数据7.013a11.6386.711.00190282.667190282.667950343.9.0003.08321.54216.228.0003.63031.21012.737.000.3006.050.526.7781.14012.09590290.820248.15323SourceCorrected ModelInterceptABA * BErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig.R Squared = .860 (Adjusted R Squared = .

59、732)a. 10-105双因素方差分析SPSS(例题分析)方差齐次性判断方差齐次性判断水平显著性分析的准备水平显著性分析的准备L Le ev ve en ne e s s T Te es st t o of f E Eq qu ua al li it ty y o of f E Er rr ro or r V Va ar ri ia an nc ce es sa aDependent Variable: 实验数据.1112.Fdf1df2Sig.Tests the null hypothesis that the error variance ofthe dependent variable

60、 is equal across groups.Design: Intercept+A+B+A * Ba. 10-106双因素方差分析SPSS(例题分析)因素的水平显著性判断因素的水平显著性判断LSD方差齐次时方差齐次时或或Tamhane T2方差非齐次时)方差非齐次时)结论:结论:A3与与A1、A2差异显著;差异显著;A1与与A2差异不显著。差异不显著。Multiple ComparisonsMultiple ComparisonsDependent Variable: 实验数据-.3750*.15411.032-.7108-.0392.5000*.15411.007.1642.8358.3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论