




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学第十章 方差分析;2 解释方差分析的概念 解释方差分析的根本思想和原理 掌握单要素方差分析的方法及运用 了解多重比较的意义 掌握双要素方差分析的方法及运用学习目的本章学习目的;310.1方差分析引论 ;4方差分析及其有关术语方差分析的根本假定方差分析的根本思想和原理问题的普通提法1234方差分析引论 ;51.检验多个总体均值能否相等2.经过分析数据的误差判别各总体均值能否相等3.研讨分类型自变量对数值型因变量的影响 4.一个或多个分类型自变量5.两个或多个 (k 个) 处置程度或分类6.一个数值型因变量7.有单要素方差分析和双要素方差分析8.单要素方差分析:涉及一个分类的自变量9.双要素
2、方差分析:涉及两个分类的自变量方差分析引论 ;6行业行业观测值观测值零售业零售业旅游业旅游业航空公司航空公司家电制造业家电制造业12345675766494034534468392945565131492134404451657758方差分析;71.分析4个行业之间的效力质量能否有显著差别,也就是要判别“行业对“赞扬次数能否有显著影响2.作出这种判别最终被归结为检验这四个行业被赞扬次数的均值能否相等3.假设它们的均值相等,那么意味着“行业对赞扬次数是没有影响的,即它们之间的效力质量没有显著差别;假设均值不全相等,那么意味着“行业对赞扬次数是有影响的,它们之间的效力质量有显著差别什么是方差分析?
3、(例题分析);81.要素或因子(factor)2.所要检验的对象3.分析行业对赞扬次数的影响,行业是要检验的因子4.程度或处置(treatment)5.因子的不同表现6.零售业、旅游业、航空公司、家电制造业7.察看值8.在每个要素程度下得到的样本数据9.每个行业被赞扬的次数方差分析中的有关术语;91.实验2.这里只涉及一个要素,因此称为单要素4程度的实验3.总体4.要素的每一个程度可以看作是一个总体5.零售业、旅游业、航空公司、家电制造业是4个总体6.样本数据7.被赞扬次数可以看作是从这4个总体中抽取的样本数据方差分析中的有关术语;10方差分析及其有关术语方差分析的根本假定方差分析的根本思想和
4、原理问题的普通提法1234方差分析引论 ;11不同行业被投诉次数的散点图不同行业被投诉次数的散点图020406080012345行业被投诉次数 零售业 旅游业 航空公司 家电制造方差分析的根本思想和原理(图形分析散点图);12方差分析的根本思想和原理(图形分析散点图)1.从散点图上可以看出2.不同行业被赞扬的次数有明显差别3.同一个行业,不同企业被赞扬的次数也明显不同4.家电制造被赞扬的次数较高,航空公司被赞扬的次数较低5.行业与被赞扬次数之间有一定的关系6.假设行业与被赞扬次数之间没有关系,那么它们被赞扬的次数应该差不多一样,在散点图上所呈现的方式也就应该很接近;131.散点图察看不能提供充
5、分的证据证明不同行业被赞扬的次数之间有显著差别2.这种差别能够是由于抽样的随机性所呵斥的3.需求有更准确的方法来检验这种差别能否显著,也就是进展方差分析4.所以叫方差分析,由于虽然我们感兴趣的是均值,但在判别均值之间能否有差别时那么需求借助于方差5.这个名字也表示:它是经过对数据误差来源的分析判别不同总体的均值能否相等。因此,进展方差分析时,需求调查数据误差的来源方差分析的根本思想和原理;141.随机误差2.要素的同一程度(总体)下,样本各察看值之间的差别3.比如,同一行业下不同企业被赞扬次数之间的差别4.这种差别可以看成是随机要素的影响,称为随机误差 5.系统误差6.要素的不同程度(不同总体
6、)之间察看值的差别7.比如,不同行业之间的被赞扬次数之间的差别8.这种差别能够是由于抽样的随机性所呵斥的,也能够是由于行业本身所呵斥的,后者所构成的误差是由系统性要素呵斥的,称为系统误差方差分析的根本思想和原理(两类误差);151.数据的误差用平方和(sum of squares)表示2.组内平方和(within groups)3.要素的同一程度下数据误差的平方和4.比如,零售业被赞扬次数的误差平方和5.只包含随机误差6.组间平方和(between groups)7.要素的不同程度之间数据误差的平方和8.比如,4个行业被赞扬次数之间的误差平方和9.既包括随机误差,也包括系统误差方差分析的根本思
7、想和原理(误差平方和SS);161. 平方和除以相应的自在度2. 假设原假设成立,组间均方与组内均方的数值就应该很接近,它们的比值就会接近13. 假设原假设不成立,组间均方会大于组内均方,它们之间的比值就会大于14. 当这个比值大到某种程度时,就可以说不同程度之间存在着显著差别,即自变量对因变量有影响5. 判别行业对赞扬次数能否有显著影响,也就是检验被赞扬次数的差别主要是由于什么缘由所引起的。假设这种差别主要是系统误差,阐明不同行业对赞扬次数有显著影响方差分析的根本思想和原理(均方MS);17方差分析及其有关术语方差分析的根本假定方差分析的根本思想和原理问题的普通提法1234方差分析引论 ;1
8、81. 每个总体都应服从正态分布2. 对于要素的每一个程度,其察看值是来自服从正态分布总体的简单随机样本3. 比如,每个行业被赞扬的次数必需服从正态分布4. 各个总体的方差必需一样5. 各组察看数据是从具有一样方差的总体中抽取的6. 比如,4个行业被赞扬次数的方差都相等7. 察看值是独立的8. 比如,每个行业被赞扬的次数与其他行业被赞扬的次数独立方差分析的根本假定;191.在上述假定条件下,判别行业对赞扬次数能否有显著影响,实践上也就是检验具有同方差的4个正态总体的均值能否相等2.假设4个总体的均值相等,可以期望4个样本的均值也会很接近3.4个样本的均值越接近,推断4个总体均值相等的证据也就越
9、充分4.样本均值越不同,推断总体均值不同的证据就越充分 方差分析的根本假定;201. 假设原假设成立,即H0 : m1 = m2 = m3 = m42.4个行业被赞扬次数的均值都相等3.意味着每个样本都来自均值为、方差为 2的同一正态总体 方差分析的根本假定;21假设备择假设成立,即H1 : mi (i=1,2,3,4)不全相等至少有一个总体的均值是不同的4个样本分别来自均值不同的4个正态总体 方差分析的根本假定;22方差分析及其有关术语方差分析的根本假定方差分析的根本思想和原理问题的普通提法1234方差分析引论 ;231.设要素有k个程度,每个程度的均值分别用1 , 2, , k 表示2.要
10、检验k个程度(总体)的均值能否相等,需求提出如下假设: 3.H0 : 1 2 k 4.H1 : 1 , 2 , ,k 不全相等5.设1为零售业被赞扬次数的均值,2为旅游业被赞扬次数的均值,3为航空公司被赞扬次数的均值,4为家电制造业被赞扬次数的均值,提出的假设为6.H0 : 1 2 3 4 7.H1 : 1 , 2 , 3 , 4 不全相等问题的普通提法;2410.2单要素方差分析;25问题的普通提法;26分析步骤提出假设构造检验统计量统计决策分析步骤;27提出假设1. 普通提法2. H0 :m1 = m2 = mk 3. 自变量对因变量没有显著影响 4. H1 :m1 ,m2 , ,mk不全
11、相等5. 自变量对因变量有显著影响 6. 留意:回绝原假设,只阐明至少有两个总体的均值不相等,并不意味着一切的均值都不相等 ;28构造统计量需求计算程度的均值全部察看值的总均值误差平方和均方(MS) 构造检验的统计量;291. 假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部察看值总和除以察看值的个数2. 计算公式为 构造检验的统计量(计算程度的均值);301. 全部察看值的总和除以察看值的总个数2. 计算公式为 构造检验的统计量(计算全部察看值的总均值);31构造检验的统计量(例题分析);321. 全部察看值 与总平均值 的离差平方和2. 反映全部察看值
12、的离散情况3. 其计算公式为前例的计算结果SST = (57-47.869565)2+(58-47.869565)2=115.9295构造检验的统计量(计算总误差平方和 SST);33构造检验的统计量(计算组间平方和 SSA)1. 各组平均值 与总平均值 的离差平方和2. 反映各总体的样本均值之间的差别程度3. 该平方和既包括随机误差,也包括系统误差4. 计算公式为 前例的计算结果 SSA = 1456.608696;34构造检验的统计量(计算组内平方和 SSE )1. 每个程度或组的各样本数据与其组平均值的离差平方和2. 反映每个样本各察看值的离散情况3. 该平方和反映的是随机误差的大小4.
13、 计算公式为 ;35构造检验的统计量(三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、程度项离差平方和 (SSA) 之间的关系;36构造检验的统计量(计算均方MS)1. 各误差平方和的大小与察看值的多少有关,为消除察看值多少对误差平方和大小的影响,需求将其平均,这就是均方,也称为方差2. 由误差平方和除以相应的自在度求得3. 三个平方和对应的自在度分别是4. SST 的自在度为n-1,其中n为全部察看值的个数5. SSA的自在度为k-1,其中k为要素程度(总体)的个数6. SSE 的自在度为n-k;37构造检验的统计量(计算均方 MS)1. 组间方差:组间方差:SSA的均
14、方,记为的均方,记为MSA,计算公,计算公式为式为;38构造检验的统计量(计算检验统计量 F )1. 将MSA和MSE进展对比,即得到所需求的检验统计量F2. 当H0为真时,二者的比值服从分子自在度为k-1、分母自在度为 n-k 的 F 分布,即 ;39构造检验的统计量(F分布与回绝域);40统计决策 将统计量的值F与给定的显著性程度的临界值F进展比较,作出对原假设H0的决策根据给定的显著性程度,在F分布表中查找与第一自在度df1k-1、第二自在度df2=n-k 相应的临界值 F 假设FF ,那么回绝原假设H0 ,阐明均值之间的差别是显著的,所检验的要素对察看值有显著影响假设FF ,回绝原假设
15、H0 ,阐明均值之间的差别是显著的,即所检验的行要素对察看值有显著影响假设FC F ,回绝原假设H0 ,阐明均值之间有显著差别,即所检验的列要素对察看值有显著影响 ;70双要素方差分析表(根本构造)误差来源误差来源平方和平方和(SS)自由度自由度(df)均方均方(MS)F值值P值值F临界值临界值行因素行因素列因素列因素误差误差总和总和;71双要素方差分析(例题分析)提出假设对品牌要素提出的假设为H0:m1=m2=m3=m4 (品牌对销售量无显著影响)H1:mi (i =1,2, , 4) 不全相等 (有显著影响)对地域要素提出的假设为H0:m1=m2=m3=m4=m5 (地域对销售量无显著影响
16、)H1:mj (j =1,2,5) 不全相等 (有显著影响) ;72差异源差异源SSdfMSFP-valueF crit 行行(品牌品牌)13004.634334.8518.10789.46E-053.4903 列列(地区地区)2011.74502.9252.100850.143673.2592 误差误差2872.712239.392 总和总和1788919双要素方差分析(例题分析);73双要素方差分析(关系强度的丈量)1.行平方和(SSR)度量了品牌这个自变量对因变量(销售量)的影响效应2.列平方和(SSC)度量了地域这个自变量对因变量(销售量)的影响效应3.这两个平方和加在一同那么度量了两
17、个自变量对因变量的结合效应4.结合效应与总平方和的比值定义为R25.其平方根R反映了这两个自变量合起来与因变量之间的关系强度 ;74例题分析品牌要素和地域要素合起来总共解释了销售量差别的83.94%其他要素(残差变量)只解释了销售量差别的16.06%R=0.9162,阐明品牌和地域两个要素合起来与销售量之间有较强的关系 双要素方差分析(关系强度的丈量);75有交互作用的双要素方差分析(可反复双要素分析);76可反复双要素分析(例题)【例】城市道路交通管理部门为研讨不同的路段和不同的【例】城市道路交通管理部门为研讨不同的路段和不同的时间段对行车时间的影响,让一名交通警察分别在两个路时间段对行车时
18、间的影响,让一名交通警察分别在两个路段和顶峰期与非顶峰期亲身驾车进展实验,经过实验共获段和顶峰期与非顶峰期亲身驾车进展实验,经过实验共获得得20个行车时间个行车时间(单位:单位:min)的数据,如下表。试分析路的数据,如下表。试分析路段、时段以及路段和时段的交互作用对行车时间的影响段、时段以及路段和时段的交互作用对行车时间的影响 ;77可反复双要素方差分析表(根本构造)误差来源误差来源平方和平方和(SS)自由度自由度(df)均方均方(MS)F值值P值值F临界值临界值行因素行因素列因素列因素交互作用交互作用误差误差总和总和m为样本的行数;78可反复双要素分析(平方和的计算)设: 为对应于行要素的第i个程度和列要素的第j个 程度的第l行的察看值 为行要素的第i个程度的样本均值 为列要素的第j个程度的样本均值 对应于行要素的第i个程度和列要素的第j个水 平组合的样本均值 为全部n个察看值的总均值 ;79可反复双要素分析(平方和的计算)1.总平方和:2.行变量平方和:3.列变量平方和:4.交互作用平方和:5.误差项平方和:;80可反复双要素分析(平方和的计算)1.总平方和:2.行变量平方和:3.列变量平方和:4.交互作用平方和:5.误差项平方和:;81可反复双要素分析(Excel检验步骤)第第1步:选择步:选
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年数控超精密磨床项目申请报告
- 2025年炔烃项目立项申请报告
- 教育行业教学经历证明书(6篇)
- 品牌宣传推广合同协议
- 巧克力包装机设计-课程设计
- 食品加工工艺与设备案例分析题
- 2025年电商数据分析与电商运营管理专业电子商务师(初级)职业技能鉴定试卷
- 快乐读书读后感作文5篇
- 个人实习证明书标题实习经历证明书(8篇)
- 2025年初中化学九年级上册期中测试卷:化学与环境问题探究试题
- 液氨的管理及应急救援处置
- 工程质量验收报告和竣工验收报告
- 2022-2023学年内蒙古赤峰市数学高一下期末统考模拟试题含解析
- 江西省建筑工程竣工备案表
- 幼儿园三年发展规划第一年实施绩效自评报告
- 中医医院中医师带徒协议模板范文
- GB/T 9081-2008机动车燃油加油机
- GB/T 17626.27-2006电磁兼容试验和测量技术三相电压不平衡抗扰度试验
- GB/T 1185-2006光学零件表面疵病
- 2023年人社所半年工作总结
- 工业管道工程工程量清单项目设置及计价
评论
0/150
提交评论