




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十一章
方差分析科学法则并不是由权威的原理所引导的,也不会由信仰或中世纪哲学来辩明的;统计学是诉诸新知识的惟一法庭。----
马哈拉诺比斯我们国家的药厂,都喜欢白色的药丸和制剂,自认为白色有清洁感,并未从细节处考虑药片的颜色与销售有何关系。德国人对白色的药片缺乏信心,觉得药性不强,而且白色没有深浅之分,连医生自己也容易搞错。美国人都知道柠檬和橙子最富维生素C,所以黄色药片最为好销,橙色次之,白色再次之。----
汪中求4/3/20241Jinlong第十一章方差分析科学法则并不是由权威的原理所引导的,也不会本章主要内容一、方差分析概述二、单因素方差分析三、双因素方差分析4/3/20242Jinlong本章主要内容一、方差分析概述4/2/20242Jinlong方差分析举例超市无色(A1)粉色(A2)橘色(A3)绿色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8颜色对药片销量有否影响?颜色对饮料销量有否影响?某厂研制出一种新型饮料,其颜色有橘色、粉色、绿色和无色四种。假设这些饮料的营养含量、味道、价格、包装等影响销量的因素全部相同,试分析饮料的颜色是否影响饮料的销量。(有关数据见右表)表中数据是从地理位置相似、经营规模相仿的五家超级市场上,收集的前一时期该饮料的销量。4/3/20243Jinlong方差分析举例超市无色粉色橘色绿色126.531.227.93上例分析检验饮料的颜色对销量是否有影响,也就是检验四种颜色饮料的平均销量是否相同。设
1为无色饮料的平均销量,
2为粉色饮料的平均销量,
3为橘色饮料的平均销量,
4为绿色饮料的平均销量。
本题就是检验下面的假设:
H0:1
2
3
4;H1:1,2,3,4不全相等。
方差分析就是检验上述假设所采用的一种方法。4/3/20244Jinlong上例分析检验饮料的颜色对销量是否有影响,也就是检验四种颜一、方差分析概述概念:检验多个总体均值是否相等,用于分析完全随机化试验设计。假定:每个总体都服从正态分布;各个总体的方差相同;观察值是独立的。术语:下页。原理:比较两类误差,以检验均值是否相等。(后述)4/3/20245Jinlong一、方差分析概述概念:检验多个总体均值是否相等,用于分析完全方差分析的基本术语
因素或因子:要分析饮料的颜色对销量是否有影响,颜色A就是要检验的因素或因子。
水平:因素的具体表现称为水平,四种颜色A1、A2、A3、A4就是因素A的四个水平。
试验:这里只涉及一个因素,故称为单因素四水平的试验。
总体:因素的每一个水平可以看作是一个总体,四种颜色可以看作是四个总体A1、A2、A3、A4。
样本数据:也称观察值,在每个因素水平下得到的观察值,每种颜色饮料的销量就是从四个总体中抽取的样本数据。4/3/20246Jinlong方差分析的基本术语因素或因子:要分析饮料的颜色对销量是否比较两类误差,以检验均值是否相等。如果系统误差(处理误差)显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等的。误差是由各部分的误差占总误差的比例来测度的。比较的基础是方差比。方差分析原理4/3/20247Jinlong比较两类误差,以检验均值是否相等。方差分析原理4/2/202系统误差与随机误差
系统误差:在因素的不同水平(不同总体)下,各观察值之间的差异。比如,同一家超市,不同颜色饮料的销量是不同的,这种差异可能是由于抽样的随机性所造成的,也可能是由于颜色本身所造成的,后者所形成的误差是由系统性因素造成的系统误差。
随机误差:在因素的同一水平(同一个总体)下,样本的各观察值之间的差异。比如,同一种颜色的饮料在不同超市上的销量是不同的,不同超市销量的差异可以看成是随机因素的影响的随机误差。4/3/20248Jinlong系统误差与随机误差系统误差:在因素的不同水平(不同总体)组间方差与组内方差
组间方差:因素的不同水平(不同总体)下各样本之间的方差。比如,A1、A2、A3、A4四种颜色饮料销量之间的方差。组间方差既包括随机误差,也包括系统误差
组内方差:因素的同一水平(同一个总体)下样本数据的方差。比如,无色饮料A1在5家超市销售数量的方差。组内方差只包含随机误差。4/3/20249Jinlong组间方差与组内方差组间方差:因素的不同水平(不同总体)下方差的比较如果不同颜色(水平)对销量(结果)没有影响,那么在组间方差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近1。如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1。当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异。4/3/202410Jinlong方差的比较如果不同颜色(水平)对销量(结果)没有影响,那么如果原假设成立如果原假设成立:H0:
1
2
3
4,也即四种颜色饮料销量的平均数都相等,也即没有系统误差。这意味着每个样本都来自平均数为
、方差为
2的同一正态总体。Xf(X)
1=
2=
3=
4
4/3/202411Jinlong如果原假设成立如果原假设成立:H0:12如果备择假设成立如果备择假设成立:H1:
mi(i=1,2,3,4)不全相等,即四种颜色饮料销量的平均数不全相等,也即存在系统误差。这意味着四个样本分别来自平均数不同的四个正态总体。
Xf(X)
3
1
2
4
4/3/202412Jinlong如果备择假设成立如果备择假设成立:H1:mi(i=二、单因素方差分析数据结构:见下表。基本步骤:提出假设;构造检验统计量;做出决策。多重比较:对总体平均数进行配对比较,进一步检验到底哪些平均数之间存在差异。(选讲)4/3/202413Jinlong二、单因素方差分析数据结构:见下表。4/2/202413J单因素方差分析的数据结构
观察值(
j)因素A(
i
)水平A1水平A2
…水平Ak12::n
x11x12…x1kx21x22…x2k::::::::xn1
xn2…xnk4/3/202414Jinlong单因素方差分析的数据结构观察值(j)因素A(i)水提出假设一般提法H0:
1
2
3…=k
(因素有k个水平)H1:
1、2、3、…k不全相等对于前例H0:
1
2
3
4
颜色对销量无影响H1:
1、2、3、4不全相等
颜色对销量有影响4/3/202415Jinlong提出假设一般提法4/2/202415Jinlong构造检验统计量为检验H0(
m1=m2=…=mk)是否成立,需确定检验的统计量:
构造统计量需要计算各水平的平均数全部观察值的总平均数三个离差平方和两个方差4/3/202416Jinlong构造检验统计量为检验H0(m1=m2=…=mk)是否成立水平平均数与总平均数
四种颜色饮料的销量及平均数超市(j)水平A(i)无色(A1)粉色(A2)橘色(A3)绿色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8合计136.6147.8132.2157.3573.9水平平均数观察值个数
x1=27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5总平均数x=28.6954/3/202417Jinlong水平平均数与总平均数四种颜色饮料的销量及平均数超市水平A三个离差平方和总离差平方和(SST)总平方和误差项离差平方和(SSE)组内平方和水平项离差平方和
(SSA)
组间平方和4/3/202418Jinlong三个离差平方和总离差平方和(SST)三个平方和的关系SST反映了全部数据总的误差程度;SSE反映了随机误差的大小;SSA反映了随机误差和系统误差的大小。SST=SSE+SSA前例:115.925=39.084+76.844/3/202419Jinlong三个平方和的关系SST反映了全部数据总的误差程度;4/2/2两个方差如果原假设成立,则表明没有系统误差,组间平方和SSA除以自由度后的方差与组内平方和SSE除以自由度后的方差的差异就不会太大;如果组间方差显著地大于组内方差,就说明各水平(总体)之间的差异不仅有随机误差,还有系统误差。三个平方和的自由度分别是SST:N-1[N为全部观察值个数]SSA:k-1[k为因素水平(总体)个数]SSE:N-k[k(n-1)=N-k]4/3/202420Jinlong两个方差如果原假设成立,则表明没有系统误差,组间平方和SS计算检验统计量
FSSA/k-1=MSA,SSE/N-k=MSE将MSA和MSE进行对比,得到所需要的检验统计量F。当H0为真,二者的比值服从分子自由度为k-1、分母自由度为N-k的F分布,即
前例:F4/3/202421Jinlong计算检验统计量FSSA/k-1=MSA,SSE/F分布与拒绝域如果均值相等,F=MSA/MSE1a
F
(k-1,N-k)0拒绝H0接受H0FF分布4/3/202422JinlongF分布与拒绝域如果均值相等,F=MSA/MSE1aF做出决策
将统计量的值F与给定的显著性水平
的临界值F
进行比较,做出接受或拒绝原假设H0的决策。若F>F
,则拒绝原假设H0,表明平均数值之间的差异是显著的,所检验的因素(A)对观察值有显著影响。若F
F
,则不能拒绝原假设H0,表明所检验的因素(A)对观察值没有显著影响。前例,F=10.486;而F0.05(3,16)=3.24,F0.01(3,16)=5.29因为F>F
,所以拒绝原假设,表明饮料颜色对饮料销量有显著影响。4/3/202423Jinlong做出决策将统计量的值F与给定的显著性水平的临界值F进行多重比较*多重比较是通过对总体平均数之间的配对比较来进一步检验到底哪些均值之间存在差异。Fisher提出的最小显著差异方法(LSD)可用于判断到底哪些均值之间有差异。LSD方法是对检验两个总体平均数是否相等的t检验方法的总体方差估计加以修正(用MSE来代替)而得到的。*选讲4/3/202424Jinlong多重比较*多重比较是通过对总体平均数之间的配对比较来进一步检多重比较的步骤提出假设:H0:
mi=mj(第i个总体的平均数等于第j个总体的平均数)H1:
mi
mj(第i个总体的平均数不等于第j个总体的平均数)计算检验统计量:做出决策:若|t|
t
,拒绝H0;若|t|<t
,接受H04/3/202425Jinlong多重比较的步骤提出假设:4/2/202425Jinlong二、双因素方差分析概念要点:分别对两个因素(A、B)进行检验,分析是一个因素在起作用、两个因素都起作用、还是两个因素都不起作用。双因素方差分析分为:无交互作用的双因素方差分析
有交互作用的双因素方差分析数据结构:见下表。基本步骤:提出假设,构造检验统计量,做出决策。4/3/202426Jinlong二、双因素方差分析概念要点:分别对两个因素(A、B)进行检验双因素方差分析数据结构
因素A(
i)
因素B(
j)
平均数
B1B2…BrA1A2::Ak
x11x12…x1kx21x22…x2k::::::::xr1
xr2…
xrk
::平均数…4/3/202427Jinlong双因素方差分析数据结构因素A因素B(j)平均数提出假设对因素A提出的假设为H0:m1=m2=…=mi=…=mk
H1:mi
(i=1,2,…,k)不全相等
(mi为第i个水平的平均数)对因素B提出的假设为H0:m1=m2=…=mj=…=mr
H1:mj(j=1,2,…,r)不全相等
(mj为第j个水平的平均数)4/3/202428Jinlong提出假设对因素A提出的假设为4/2/202428Jinlon构造检验统计量为检验H0是否成立,需构建检验的统计量(后述)为构造统计量,需要计算总离差平方和:SST水平项平方和:SSA、SSB误差项平方和:SSE方差:MSA、MSB、MSE
SST=SSA+SSB+SSE4/3/202429Jinlong构造检验统计量为检验H0是否成立,需构建检验的统计量(后述)计算方差因素A的方差,记为MSA,计算公式为因素B的方差,记为MSB,计算公式为随机误差项的方差,记为MSE,计算公式为4/3/202430Jinlong计算方差因素A的方差,记为MSA,计算公式为4/2/2024计算检验统计量
F为检验因素A的影响是否显著,采用统计量
为检验因素B的影响是否显著,采用统计量4/3/202431Jinlong计算检验统计量F为检验因素A的影响是否显著,采用统计量4做出决策
将统计量的值F与给定的显著性水平
的临界值F
进行比较,作出接受或拒绝原假设H0的决策。若FA
F
,则拒绝原假设H0,表明均值之间的差异是显著的,即所检验的因素A对观察值有显著影响。和若FB
F
,则拒绝原假设H0,表明均值之间有显著差异,即所检验的因素B对观察值有显著影响。4/3/202432Jinlong做出决策将统计量的值F与给定的显著性水平的临界值F进行双因素方差分析举例有四个品牌的彩电在五个地区销售,为分析品牌(因素A)和销售地区(因素B)对销量是否有影响,对每个品牌在各地区的销量取得以下数据(下页)。试分析品牌和销售地区对彩电的销量是否有显著影响?4/3/202433Jinlong双因素方差分析举例有四个品牌的彩电在五个地区销售,为分析不同品牌的彩电在各地区的销售量品牌(因素A)销售地区(因素B)B1B2B3B4B5A1A2A3A436534535828835036832328034336335329834033034
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 逐项解析的Msoffice试题及答案
- 财务成本管理的逻辑思维发展试题及答案
- 计算机二级Python关键考点试题及答案
- 冬季备考宝典计算机二级C++试题及答案
- 二级计算机公共基础知识试题及答案征集
- 二级Web考试知识扩展试题及答案
- 语言的象征与文学表达试题及答案
- 数据分析与Python结合试题及答案
- 轻松掌握2025年计算机二级MySQL试题及答案
- 设计思路的计算机二级Python考试试题及答案
- 隧道工程隧道洞口临建施工方案
- 心理咨询的面谈技术
- DBJ∕T13-374-2021 福建省钢筋桁架叠合楼板技术标准
- 事故池管理的有关规定
- (word完整版)污水处理厂安全评价报告
- DB50∕T 867.6-2019 安全生产技术规范 第6部分:黑色金属冶炼企业
- 新产品开发流程课件
- 高中语文部编版选择性必修下册第四单元 单元学习导航 课件 (8张PPT)
- 化妆品原料-PPT课件
- 重庆市参加企业职工基本养老保险人员退休审批表
- 混凝土结构课程设计244
评论
0/150
提交评论