版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、方差分析概述一、问题的提出 最优方案的设计l如何获得最佳的产品销售量l哪些因素是影响销售量的主要因素l哪些因素的那种情况更利于提高销售量l哪些因素的组合更利于提高销售量l可以利用方差分析的方法来实现二、方差分析l目的:方差分析从分析数据的差异入手,分析哪些因素是影响数据差异的众多因素中的主要因素.l相关概念:(1)观测变量:作为观测的对象(如:亩产量、推销量等).(2)控制因素:人为可以控制的因素(如:施肥量、品种、推销策略、价格、包装方式等),在方差分析中称为控制因素.将控制变量的不同情况称为控制变量的不同水平.(3)随机因素:人为很难控制的因素(如:气候、推销人员的形象、抽样误差等),方差
2、分析中主要指抽样误差。亩产量 施肥量 xxx,xxx,xxx,xxx xxx,xxx,xxx,xxx 10 公斤 xxx,xxx,xxx xxx,xxx,xxx,xxx 15 公斤 xxx,xxx,xxx,xxx xxx,xxx 20 公斤 控制因素观测变量三个水平三、核心问题l从数据差异角度看:观测变量的数据差异=控制因素造成+随机因素造成当控制因素对实验结果有显著影响时,和随机因素共同作用必然使观测变量产生显著变动;反之,观测变量的变动较小,将归结为随机性造成的(这里指抽样误差造成的).观察以下三组数据:500 500 500 10公斤600 600 600 15公斤700 700 700
3、 20公斤501 502 503 10公斤 608 510 521 10公斤503 501 502 15公斤 510 601 524 15公斤502 503 501 20公斤 604 501 530 20公斤 方差分析正是要分析观测变量的变动主要是由控制因素机造成的还是由随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的.四、方差分析的类型l 单因素方差分析:只考虑一个控制因素的影响l多因素方差分析:考虑两个以上的控制因素和它们的交互作用对观测变量的影响l协方差分析:在尽量排除其他因素的影响下,分析单个或多个控制因素对观测变量的影响.(引入协变量)(一)目的检验某一个一个控制因素
4、的改变是否会给观察变量带来显著影响.例如:应用面很广(科学试验,社会经济问题)考察不同肥料对某农作物亩产量是否有显著差异.考察不同温度下某化工产品的获得率考察妇女生育率在不同地区是否有显著差异.考察不同学历是否对工资收入产生显著影响.(二)基本思路(1)入手点:检验控制变量的不同水平下,各总体的分布是否存在显著差异,进而判断控制变量是否对观测变量产生了显著影响.(2)前提: 不同水平下各总体服从方差相等方差相等的正态分布正态分布.(3) h0:不同水平下,各总体均值无显著差异.即:不同水平下控制因素的影响不显著.(二)基本思路(4) 构造f统计量因为:总变差=组间差异+组内差异可证明:sst=
5、 ssa+sse(设:k个水平,每个水平有ni个数据)考察平均的组间差异与平均的组内差异的比值,于是: kiiixxnssa12)(kiinjjiijxxsse12)(msemsaknssekssaf)/() 1/(kinjjijxxsst112)(f(k-1,n-k)(二)基本思路(5)结论:f值较大,f值的概率p值小于或等于用户给定的显著性水平a,则拒绝h0,认为不同水平下各总体均值有显著差异;f值较小,f值的概率p值大于用户给定的显著性水平a,则不能拒绝h0,可以认为不同水平下各总体均值无显著差异.单因素方差分析(三)数学模型设控制变量a有k个水平,每个水平均有ni个数据,在水平ai下第
6、j个数据xij可以分解为: xij=i+iji为水平ai下的理论指标值,ij为误差,服从正态分布(0,2)kiik11kiaii,.2 , 1, kiiijiijaax10且i为水平ai对试验结果产生的影响,称为水平ai的效应。如果a对观测变量没有影响,则各水平的效应全为0,否则不全为0。于是有:h0:1= 2= 3= k=0的无偏估计作为的无偏估计作为iixxx,(四)基本操作步骤(1)菜单选项:analyze-compare means-one-way anova(2)选择一个或多个变量作为观察变量到dependent list 框(3)选择一个变量作为控制变量到factor框(4) op
7、tion中的statistics项:descriptive:输出观察变量不同水平下的描述统计量(五)进一步的分析l前提的检验:各水平下方差齐性检验l实现方法:loption中的statistics:homogeneity-of-variance,检验各水平下各总体方差是否齐性.h0:各水平下各总体方差无显著差异.(一)目的 如果各总体均值存在差异,f检验不能说明哪个水平造成了观察变量的显著差异. 多重比较将对每个水平的均值逐对进行比较检验.(二)几种常用的多重比较方法lsd(least significant difference)最小显著性差异法t(tukey)方法单因素方差分析中的多重比较
8、(二)几种常用的多重比较方法llsd(least significant difference)最小显著性差异法特点:l利用了全部样本数据,而不仅是所比较的两组的数据,且认为各水平均是等方差的l与其他方法相比,其检验敏感度最高l在一定程度上克服了放大犯一类错误的问题为总样本数其中nkntnnmsexxtjiji)()11(为各水平下的样本数其中rkntrmsexxtji)(2单因素方差分析中的多重比较(二)几种常用的多重比较方法lt(tukey)法l特点:l利用了全部样本数据,而不仅是所比较的两组的数据,且认为各水平均是等方差的lq分布平缓些,克服了扩大犯错的可能性,但不如lsd方法敏感l适合
9、各水平下样本数均相同的情况(三)实现方式 post hoc选项为各水平下的样本数其中 rknkqrmsexxtji:),(一)目的先凭经验确定各水平均值之间的对比系数,然后判定这两组均值的线性组合是否存在显著差异.如: 1/3 (k1+k2+k3)=1/2 (k4+k5) h0:两组均值的线性组合无显著差异. (二)实现方式 contrasts选项,在coefficients框中输入每个水平均值的系数值和正负符号.注意:输入系数的顺序与控制变量水平值的升序一一对应系数的和为0(一)目的 将组间平方和分解成线性、二次、三次或更高次的多项式,检验观测变量是否随控制变量呈不同次幂变化。(二)实现方式
10、 contrasts选项, polynomial框小 城 市中 等 城市大 城 市特 大 城市小 型 广告x x ,x x ,x x ,x xx x ,x x ,x x ,x xx x ,x xx x ,x xx x ,x x中 型 广告x x ,x x ,x x ,x xx x ,x x ,x x ,x xx x ,x x ,x x ,x xx x ,x x大 型 广告x x ,x xx x ,x x ,x x ,x xx x ,x x ,x xx x ,x x ,x x ,x x(一)目的 测试若干个控制因素的不同水平的交叉变化是否给观察变量带来了显著影响.例如:(二)基本思路认为观测变量
11、的变动是由各控制变量独立作用、它们的交互作用、以及随机因素造成的。以两个控制变量的方差分析为例: sst=ssa+ssb+ssab+sse(main effects) (n-way 交互) (residual)(explained)其中:sab表示两个控制变量交互影响带来的变差多因素方差分析(二)基本思路sst=ssa+ssb+ssab+ssea有p个水平,b有q个水平,每组有r个样本piqjrkijkxxsst1112)(piaixxqrssa12)(qjbjxxprssb12)(piqjrkijijkxxsse1112)(ssessbssasstssab多因素方差分析(二)基本思路检验方法
12、统计量(f检验)固定效应模型:) 1(/) 1/(rpqssepssafa) 1(/) 1/(rpqsseqssbfb) 1(/) 1)(1/(rpqsseqpssabfab(二)基本思路l结论依次查看各f值的概率p值.如果其相伴概率大于a,则不能拒绝h0,可以认为相应不同水平的控制变量或交互影响没有造成均值的显著差异;相反多因素方差分析(三)说明多因素方差分析中因素的划分固定效应因素:人为能够准确控制其各个不同的水平值;如:施肥量、品种、温度。-固定效应模型随机效应因素:人为无法对其水平值进行准确控制,只是能够直观观测到。如:城市规模、教育水平等。-随机效应模型-混合效应模型固定效应和随机效
13、应通常较难区分多因素方差分析(三)说明交互作用,即:两个或多个控制变量各水平之间搭配时对观察变量的影响.交互作用的理解举例:饮食习惯、适量运动对减肥的作用;排球对的二传手和主攻手对赢球的作用交互作用的图形观察: a1 a2 a1 a2b1 2 5 b1 2 5 b2 7 10 b2 7 3当a从a1变化到a2时, a对观测变量值的影响与b取什么观测变量值均增加且幅度相同, 水平有关与b1或b2无关;同理b(三)说明l多因素方差分析的核心内容:检验在不同控制变量的不同交叉水平下,各交叉分组下样本数据所来自的总体均值,有无显著差异。 进而判断多个因素是否对观测变量产生了显著影响,但等方差一般不再非
14、常强调lh0:各交叉水平下的总体均值均无显著差异.l数学模型:以双因素为例lh0: ai=0;bi=0;(ab)ij=0ijkijiiijkabbax)(的无偏估计作为的无偏估计作为的无偏估计作为的无偏估计作为ijbiaiabiibiiaiabxxxxbxxxxx)(,(四)基本操作步骤a.菜单选项:analyze-general linear model-univariateb.选择观察变量到dependent框c.选择固定效应因素fix factor框d.选择随机效应因素random factor框e.模型的定义model选项(饱和模型和非饱和模型)多因素方差分析(五)进一步分析:cont
15、rast:单样本均值检验,检验值为:deviation:观测变量的均值simple:第一(最后)个水平的观测变量均值difference:前一水平的观测变量的均值helmert:后一水平的观测变量的均值体 重 增 量 饲 料 初 始 体 重 xxx,xxx,xxx xxx,xxx 1 xxx,xxx,xxx xxx,xxx xxx,xxx, xxx,xxx,xxx 2 xxx,xxx, xxx,xxx,xxx xxx,xxx,xxx xxx,xxx,xxx 3 xxx,xxx,xxx xxx,xxx,xxx xxxx (一)目的 将无法或很难控制的因素作为协变量,在排除协变量影响的条件下更精确地分析控制变量对观察变量的影响.例如:协方差分析(二)基本思路l观测变量总变差:l协变量、控制变量、交互作用、随机因素lh0:协变量对观测变量没有显著影响;在剔除协变量影响的条件下,各交叉分组下的总体均值无显著差异.l单因素协方差分析的数学模型ijijiijzy(二)基本思路对协变量的要求l协变量是数值型的;l协变量与观测变量的线性关系在各水平均成立,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二四年度放心签工程车租赁合同示范4篇
- 二零二四年环境监测设备购销合同2篇
- 二零二四年度房地产开发商与合作方之间的土地开发合同
- 2024年度股权转让合同标的及受让方的权利与义务3篇
- 租赁合同解除通知书
- 二零二四年度融资租赁合同范本出租方权益保障2篇
- 2024版5G网络覆盖优化服务合同3篇
- 商铺租赁合同利于承租方2024年度权益实现3篇
- 二零二四年度物流服务合同标的及服务标准具体规定3篇
- 农村生活垃圾清运合同
- 人工智能技术应用专业调研报告
- 《中华民族共同体概论》考试复习题库(含答案)
- 初中生数学探究性学习能力培养略谈
- 控制点复测方案
- 色彩构成—明度九调作业要求
- 北京四中网校四重五步学习法
- 不锈钢栏杆施工方案
- 液压管道施工方案(完整版)
- 皮肤生理学及皮肤问题
- 翰伯特的分裂人格—对电影《洛丽塔》(1997)的分析(英文)
- 人教部编版二年级数学上册《总复习(全章)》PPT教学课件
评论
0/150
提交评论