




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方差分析与试验设计第1页,共78页,2023年,2月20日,星期五10.1方差分析引论一.方差分析及其有关术语二.方差分析的基本思想和原理三.方差分析中的基本假定四.问题的一般提法第2页,共78页,2023年,2月20日,星期五一.方差分析及其有关术语(1)检验多个总体均值是否相等(2)研究定性的自变量(条件)对数值型因变量(结果)的影响(3)有单因素方差分析和双因素方差分析
•单因素方差分析:涉及一个分类的自变量(条件)
•双因素方差分析:涉及两个分类的自变量(条件)第3页,共78页,2023年,2月20日,星期五例10.1为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了23家不同的企业作为样本.得最近一年中消费者对企业投诉的次数如下表.表10-1消费者对四个行业的投诉次数行业观测值零售业旅游业航空公司家电制造业12345675766494034534468392945565131492134404451657758第4页,共78页,2023年,2月20日,星期五续(1)分析四个行业之间的服务质量是否有显著差异,也就是要判断不同“行业”的“投诉次数”是否有显著差异.可归结为检验这四个行业被投诉次数的均值是否相等.(2)如果它们的均值相等,就意味着它们之间的服务质量没有显著差异;如果均值不全相等,则表示它们之间的服务质量有显著差异.第5页,共78页,2023年,2月20日,星期五几个基本概念1.对投诉次数是否有影响的那些(可以控制的)条件称为因素.2.为了考察一个因素的影响,一般把他严格控制在几个不同的状态或等级上,把因素的每一个状态或等级称为一个水平.3.只考察一个因素的方差分析,称为单因素方差分析.4.同时考察两个或两个以上因素的方差分析,称为多因素方差分析.5.假定各水平的数据是来自正态分布总体的随机样本,各水平的样本互相独立,且方差相等.第6页,共78页,2023年,2月20日,星期五二.方差分析的基本思想和原理
1.两类误差及两类方差(1)每个水平为一个总体(2)每个水平的一组观察值为总体的一个随机样本,同一水平下样本观察值之间的差异称为随机误差,用组内方差来表示.(3)不同水平下样本观察值之间的差异可能是由于不同水平引起的,这种误差称为系统误差,但也包含随机误差.不同水平样本观察值之间差异用组间方差来表示,即组间方差包括随机误差,也包括系统误差.第7页,共78页,2023年,2月20日,星期五2.方差的比较(1)如果不同水平对试验结果没有不同影响,那么组间方差中只包括随机误差.这时,组间方差与组内方差应该相近,组间方差与组内方差之比接近1.(2)如果不同水平对试验结果有不同影响,那么组间方差除了随机误差之外还包括系统误差.这时,组间方差就会大于组内方差,组间方差与组内方差之比就会大于1.(3)方差分析就是通过这种方差的比较,作出判断.第8页,共78页,2023年,2月20日,星期五三.方差分析中的基本假定(1)每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本.(2)各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的(3)样本是独立的即每个行业的样本是独立抽取的第9页,共78页,2023年,2月20日,星期五四.问题的一般提法(1)
要检验k个水平(总体)的均值是否相等,需要提出如下假设:不全相等对例10.1,设为零售业被投诉次数的均值,为旅游业被投诉次数的均值,为航空公司被投诉次数的均值,为家电制造业被投诉次数的均值,则提出的假设为不全相等第10页,共78页,2023年,2月20日,星期五10.2单因素方差分析
(one-wayanalysisofvariance)
一.数据结构二.分析步骤三.关系强度的测量四.用Excel进行方差分析第11页,共78页,2023年,2月20日,星期五一.数据结构观察值
xij水平Ai
A1A2
…Ak12::ni
x11x21…xk1x12x22…xk2::::::::x1n1
x2n2
…xknk表10-2单因素方差分析的数据结构第12页,共78页,2023年,2月20日,星期五二.分析步骤
(一)提出假设对于k个水平的单因素方差分析,原假设和备择假设为不全相等第13页,共78页,2023年,2月20日,星期五(二)构造检验的统计量1.水平的样本均值:设第i水平有个观察值,则第i个水平的样本均值2.样本的总均值其中(10.1)(10.2)第14页,共78页,2023年,2月20日,星期五消费者对四个行业的投诉次数及均值表10-3第15页,共78页,2023年,2月20日,星期五3.计算误差平方和
(1)总误差平方和(sumofsquaresfortotal)用SST表示总误差平均和,反映全部数据的离散情况,即(10.3)例10.1的总误差平方和为第16页,共78页,2023年,2月20日,星期五(2)水平项误差平方和(sumofsquaresforfactorA)用SSA表示水平项误差平方和,反映各水平样本数据之间的异差程度,即对于例10.1有(10.4)第17页,共78页,2023年,2月20日,星期五(3)误差项平方和(sumofsquaresforerror)用SSE表示误差项平方和,反映各水平数据的离散情况,即对例10.1,零售业的误差项平方和(10.5)第18页,共78页,2023年,2月20日,星期五续类似可得从而第19页,共78页,2023年,2月20日,星期五三个平方和的关系总误差平方和SST、误差项平方和SSE及水平项误差平方和SSA之间的关系
SST=SSA+SSE即(10.6)第20页,共78页,2023年,2月20日,星期五续(三个平方和的关系)由于从而在实际计算时,一般先计算SST和SSA,而
SSE=SST-SSA对于例10.1有4164.6087=1456.6087+2708第21页,共78页,2023年,2月20日,星期五4.计算统计量(1)各个误差平方和的大小与数据的多少有关,各个误差平方和的平均称为平均平方,也称均方或方差,用MS表示.(2)平均平方是离差平方和除以相应的自由度(3)三个平方和的自由度分别为
SST的自由度为n-1
SSA的自由度为k-1
SSE的自由度为第22页,共78页,2023年,2月20日,星期五续(计算统计量)(4)SSA的平均平方记为MSA,即(5)SSE的平均平方记为MSE,即(10.7)关于自由度,存在如下的关系式(10.8)对于例10.1第23页,共78页,2023年,2月20日,星期五续(计算统计量)如果成立,那么(10.9)对于例10.1,求得第24页,共78页,2023年,2月20日,星期五(三)统计决策对于规定的显著性水平,由于成立时根据小概率原理,若则拒绝.认为各水平均值不全相等.称所考察因素的各水平间差异显著,或各水平均值间有显著差异.而当则不能拒绝.这时称各水平之间无显著差异,即认为成立,各水平的均值都相等.第25页,共78页,2023年,2月20日,星期五续(统计决策)对于例10.1,若取,则由于从而拒绝.认为四个不同行业的平均投诉次数有显著差异,即不同行业的平均投诉次数是不同的.第26页,共78页,2023年,2月20日,星期五图10-4统计量F的抽样分布F(k-1,n-k)0F第27页,共78页,2023年,2月20日,星期五(四)方差分析表(analysisofvariancetable)前面这些计算结果可以列成表格的形式,称为方差分析表.误差来源平方和自由度均方F值FαSS
dfMS组间SSAk-1MSAMSA/MSE组内SSEn-kMSE-总差异SSTn-1
--表10-4方差分析表第28页,共78页,2023年,2月20日,星期五例10.1的方差分析表表10-5第29页,共78页,2023年,2月20日,星期五三.关系强度的测量拒绝原假设则表明因素(自变量)与观测值之间有关系,而组间平方和(SSA)则度量了自变量(行业)对因变量(投诉次数)的影响大小.因此变量间关系的强度用用自变量平方和(SSA)总平方和(SST)的比例大小来反映,其平方根R就可以用来测量两个变量之间的关系强度.(10.10)对于例10.1,得第30页,共78页,2023年,2月20日,星期五四.用Excel进行单因素方差分析第1步:选择【工具】下拉菜单第2步:选择【数据分析】选项第3步:在数据分析工具中选择【单因素方差分析】,然后选择【确定】第4步:当对话框出现时在【输入区域】方框内键入数据单元格区域在【】方框内键入0.05(也可根据需要确定)在【输出区域】中选择输出位置第31页,共78页,2023年,2月20日,星期五表10-6用Excel进行方差分析的步骤第32页,共78页,2023年,2月20日,星期五表10-7Excel输出的方差分析结果第33页,共78页,2023年,2月20日,星期五10.3方差分析中的多重比较
(multiplecomparisonprocedures)当方差分析拒绝,从而接受时,认为各水平均值不全相等.多重比较是通过对各均值之间的配对比较来进一步检验到底那些均值之间有显著差异.多重比较的方法有多种,这里介绍最小显著差异法.第34页,共78页,2023年,2月20日,星期五最小显著差异法(LSD)
LSD方法是一种检验两个总体均值是否相等的t检验方法,由(8.8)式其中是由两个样本的数据求得.当对多个总体进行比较时,由于MSE是把k个水平的全部样本数据求得,从而用
MSE代替.于是统计量t为第35页,共78页,2023年,2月20日,星期五多重比较的步骤(1)提出原假设和备择假设(3)若则拒绝,称和有显著差异,否则不能拒绝.即接受,称和没有显著差异.(2)检验统计量第36页,共78页,2023年,2月20日,星期五LSD
方法
LSD方法通常并不按t值作检验,而是基于作检验.(1)提出和(3)若则拒绝,否则接受.(2)计算LSD(10.11)第37页,共78页,2023年,2月20日,星期五例10.1的LSD方法已知取,则,从而多重比较的结果可以列成表格形式,称为多重比较表.第38页,共78页,2023年,2月20日,星期五例10.1的多重比较表(LSD法)
24*1110
14*1
13
表中差值右上角标者表示相应的第39页,共78页,2023年,2月20日,星期五10.4双因素方差分析
一、双因素方差分析及其类型(1)同时分析两个因素(因素A和因素B)对试验结果的影响.(2)分别对两个因素进行检验,考察各自的作用.(3)如果因素A和因素B对试验结果的影响是相互独立的,则可以分别考察各自的影响,这种双因素方差分析称为无交互作用的双因素方差分析.(4)如果因素A和因素B除了各自对试验结果的影响外,还产生额外的新影响,这种额外的影响称为交互作用,这时的双因素方差分析则称为有交互作用的双因素方差分析.(5)无交互作用的双因素方差分析,相当于对每个因素分别进行单因素方差分析.第40页,共78页,2023年,2月20日,星期五例10.3品牌地区地区1地区2地区3地区4地区5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298表10-8不同品牌的彩电在各地区的销售量数据有四个品牌的彩电在五个地区销售,为分析彩电的品牌(品牌因素)和销售地区(地区因素)对销售量是否有影响,对每个品牌在各地区的销售量取得以下数据.试分析品牌和销售地区对彩电的销售量是否有显著影响?(=0.05)第41页,共78页,2023年,2月20日,星期五二、无交互作用的双因素方差分析
(一)数据结构双因素方差分析的基本假定(1)每个水平组合的观察值,是来自正态总体的简单随机样本.(2)各正态总体的方差都相等.(3)各随机样本相互独立.第42页,共78页,2023年,2月20日,星期五表10-9双因素方差分析数据结构
第43页,共78页,2023年,2月20日,星期五各水平样本均值与样本总均值(1)A(行)因素第i水平的样本均值(2)B(列)因素第j水平的样本均值(3)样本总平均(10.12)(10.13)(10.14)第44页,共78页,2023年,2月20日,星期五(二)分析步骤
1.提出假设(1)对A(行)因素
提出的假设为不全相等(2)对B(列)因素B提出的假设为不全相等第45页,共78页,2023年,2月20日,星期五2.构造检验统计量
(1)计算误差平方和总误差平方和反映全部数据的离散情况(10.15)第46页,共78页,2023年,2月20日,星期五续(计算误差平方和)(10.16)SSR反映A(行)因素误差平方和(10.17)SSC反映B(列)因素误差平方和(10.18)SSE反映随机误差平方和即
SST=SSR+SSC+SSE(10.19)第47页,共78页,2023年,2月20日,星期五续(计算均方)各个误差平方和的大小与数据的多少有关,各个误差平方和的平均称为均方(平均平方).均方是离差平方和除以相应的自由度.各个平方和的自由度分别为
SST的自由度为n-1
SSR的自由度为k-1
SSC的自由度为r-1
SSE的自由度为且第48页,共78页,2023年,2月20日,星期五续(计算均方)SSR的均方记为MSR,即SSC的均方记为MSC,即SSE的均方记为MSE,即(10.20)(10.21)(10.22)第49页,共78页,2023年,2月20日,星期五构造检验统计量检验A(行)因素的各水平对试验结果有无显著影响,采用统计量检验B(列)因素的各水平对试验结果有无显著影响,采用统计量(10.23)(10.24)第50页,共78页,2023年,2月20日,星期五3.统计决策对规定的显著性水平
,由于则拒绝,认为A(行)因素的各水平间有显著差异.对规定的
,由于根据小概率原理,若从而,若则拒绝,认为B(列)因素的各水平间有显著差异.第51页,共78页,2023年,2月20日,星期五方差分析表表10-10双因素方差分析表误差来源误差平方和自由度均方F值A(行)因素SSR
k-1MSR=SSR/(k-1)FR=MSR/MSEB(列)因素SSCr-1MSC=SSC/(r-1)FC=MSC/MSE误差SSE(k-1)(r-1)MSE=
SSE/(k-1)(r-1)-合计SSTn-1--第52页,共78页,2023年,2月20日,星期五例10.4
有四个品牌的彩电在五个地区销售,为分析彩电的品牌(品牌因素)和销售地区(地区因素)对销售量是否有影响,对每个品牌在各地区的销售量取得以下数据。试分析品牌和销售地区对彩电的销售量是否有显著影响?(=0.05)解:先建立假设.对于A(行)因素(品牌)不全相等对于B(列)因素(地区)不全相等直接利用Excel进行双因素方差分析结果见表10-11.第53页,共78页,2023年,2月20日,星期五用Excel进行双因素方差分析第1步:选择【工具】下拉菜单第2步:选择【数据分析】选项第3步:在数据分析工具中选择【无重复双因素方差分析】,然后选择【确定】第4步:当对话框出现时在【输入区域】方框内键入数据单元格区域在【】方框内键入0.05(也可根据需要确定)在【输出选项】中选择输出区域第54页,共78页,2023年,2月20日,星期五用Excel进行双因素方差分析的步骤第55页,共78页,2023年,2月20日,星期五表10-11Excel输出的方差分析结果第56页,共78页,2023年,2月20日,星期五统计决策从而拒绝,接受,即不同的品牌对销售产生了不同的影响.又由于由于所以接受,即不同地区对销售没有产生不同的影响.第57页,共78页,2023年,2月20日,星期五(三)关系强度的测量
把A(行)因素的平方和SSR和B(列)因素的平方和SSC加在一起,与总平方和的比值定义为R2,即(10-25)对于例10.4,得第58页,共78页,2023年,2月20日,星期五三、有交互作用的双因素方差分析
例10.5城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间的影响,让一名交通警察分别在两个路段和高峰期与非高峰期亲自驾车进行试验,通过试验取得共获得20个行车时间(分钟)的数据如下.试分析路段、时段以及路段和时段的交互作用对行车时间的影响.表10-14不同时段和不同路段的行车时间单位:分钟第59页,共78页,2023年,2月20日,星期五各水平样本均值与样本总均值(1)A(行)因素第i水平的样本均值(2)B(列)因素第j水平的样本均值第60页,共78页,2023年,2月20日,星期五续(4)样本总平均(3)A(行)因素第i水平与B(列)因素第j水平组合的样本均值第61页,共78页,2023年,2月20日,星期五计算误差平方和SST代表总误差平方和(10.26)(10.27)SSR代表A(行)因素平方和(10.28)SSC代表B(列)因素平方和第62页,共78页,2023年,2月20日,星期五续(10.29)SSE代表误差平方和即
SST=SSR+SSC+SSRC+SSE(10.30)SSRC代表交互作用平方和第63页,共78页,2023年,2月20日,星期五表10-15有交互作用的双因素方差分析表第64页,共78页,2023年,2月20日,星期五用Excel进行有交互作用的双因素方差分析第1步:选择【工具】下拉菜单第2步:选择【数据分析】选项第3步:在数据分析工具中选择【可重复双因素方差分析】,然后选择【确定】第4步:当对话框出现时在【输入区域】方框内键入数据单元格区域在【】方框内键入0.05(也可根据需要确定)
在【每一样本的行数】方框内键入5在【输出区域】中选择输出位置第65页,共78页,2023年,2月20日,星期五表10-16用Excel进行双因素方差分析的步骤第66页,共78页,2023年,2月20日,星期五表10-17Excel输出的方差分析结果第67页,共78页,2023年,2月20日,星期五10.5试验设计初步一、完全随机化设计二、随机化区组设计三、因子设计第68页,共78页,2023年,2月20日,星期五一、完全随机化设计
(completelyrandomizeddesign)完全随机化设计是指因素的水平或水平组合采用随机方法安排到试验单元的一种试验设计.“处理”是指因素的各个水平或水平组合“试验单元(experimentunit)”是安排“处理”的对象或材料
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农村瓜果买卖合同范例
- 中药师聘用合同样本
- 出口原料合同标准文本
- 农牧用地出租合同样本
- 2025年海南建筑安全员A证考试题库及答案
- 不用设计合同标准文本
- 会议合同样本样本
- 2025海南建筑安全员知识题库及答案
- 书店购买书籍合同样本
- 公司服装采购合同样本
- 全民国家安全教育日培训课件模板(可编辑)
- 精神疾病患者自杀风险评估与预防措施
- 山西省太原市2023-2024学年七年级下学期期中数学试题
- XF-T 3004-2020 汽车加油加气站消防安全管理
- 江苏省盐城市建湖县2023-2024学年七年级下学期期中语文试题
- 印刷厂常用生产工艺、设备作业指导书一整套
- 小班语言《轻轻地》课件
- 甘肃省农垦集团有限责任公司人才招聘考试试题及答案
- 湿式电除尘施工方案(完整常用版)
- 彩色多普勒血流成像讲解
- 电力配网安全培训课件
评论
0/150
提交评论