




已阅读5页,还剩29页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,协方差分析,Analysis of Covariance ALBERT R.WLDT OLLI AHT 报告人:白寅,Mslab TianjinUniv,我们先来看一个问题:,芬兰由几十个小的自治区组成。在芬兰,白酒的批发和零售是国家垄断的。几个世纪以来,法律规定白酒只能在城市自治区中销售。 但是去年这条法律要做修改了,该国的相关部门尝试性地在农村自治区销售白酒,进而研究白酒的销售方式是否会影响当地的交通事故量 在去年夏天,他们任选12个农业自治区,在其中4个开设了白酒专卖店;另外4个授权饭店销售白酒;余下的4个保持原来的状态,即禁止销售白酒。,开设白酒专卖店,授权饭店销售,保持禁销白酒,12个实验自治区,为比较销售白酒对交通事故是否有影响,我们搜集到三组实验区域一年后的交通事故发生数:,销售白酒对当地的交通事故有影响吗?,认为白酒的销售没有影响交通事故率。真的是这样吗?,我们用学过的方差分析来比较一下各组均值,他们是:186.25,206.50,214.50,F=2.0793434.256495,接受原假设, 即H0:u1=u2=u3,实验前后,同一地区的交通事故量应该有某种联系!回归关系 销售白酒后交通事故多的地区有可能是因为其原来交通事故就比其他地区多!,稍加分析我们就会发现,我们的分析有问题,直接收集统计资料的有两种方式:实验式和非实验式。 如果条件可以完全控制的话(只一个因素变化,其他因素统一)实验式收集数据进行方差分析理论上是可以保证精度的。 但是实验条件不能完全控制的时候就要采取统计控制,即用统计的方法排除数据中的干扰因素从而提高精度。我们知道,就算12个地区白酒的销售方式是随机指定的,由于每组仅仅有四个地区,很难保证三组地区的交通事故只与白酒的销售有关而其他因素统一水平。 协方差分析可以解决这类问题。,各地的交通事故仅仅与饮酒有关吗?,各组数据可比吗?,比如人口多的地区,车辆多的地区,雨雪多的地区交通事故就会多,协方差分析是如何解决这个问题的呢?,第i组第j个观测值,随机误差,第i组的组效应,一般均值,方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变量,对于芬兰白酒专卖的问题,交通事故显然不是仅仅与销售方式有关,而把其他变量都归为随机误差又太过粗糙这样。我们就想到了引入其他变量在协方差分析的模型中,我们称之为协变量,下面我们再看协方差分析数据结构:,首先,我们看看方差分析数据结构:,“遗传”效应,观测值=一般均值+水平影响+协变量影响+随机误差,协变量,回归系数,协变量效应,可见,协方差分析将方差分析与回归分析结合了起来.,方差分析,回归分析,从离差分解的角度我们来解释协方差分析,对于方差分析: 总离差=分组变量离差+随机误差(组内离差) 对于协方差分析: 总离差=分组变量离差+协变量离差+随机误差,在方差分析中,协变量离差包含在了随机误差中. 在协方差分析中,单独将其分离出来.,于是,我们用协变量对观测值进行修正,去掉“遗传”因素,下面的问题是,如何计算回归系数,协变量修正后的观测值,去除遗传效应,总思路,在观测值中去除协变量的影响之后,应用方差分析,我们把回归系数的计算分为两种情况,计算总离差平方和时: 我们最终要检验的是分组自变量对因变量有无显著作用.原假设是无显著作用.假设检验以原命题为真为基础进行的.因此,这里我们认为ti=0,即,用回归模型计算回归系数.其最小二乘无偏估计值为,由此我们可以计算总离差平方和的修正值:,总离差平方和修正值的定义和计算式如下:,Y的回归线,与回归线的离差平方和,回归平方和,如果X对Y无作用 ,b=0,该项则为0,为了简化表示,我们定义,当计算组内离差平方和时,我们使用组内回归系数 它的计算如下:,组内离差平方和的修正值计算如下:,在这里我们实际上是假设各组内的回归系数相等(协方差分析基本假设)因而求出了一个统一的组内回归系数.,Yi的回归线,与回归线的残差平方和,组内总离差平方和,回归平方和,同样为了简化表示,我们定义,组内总离差平方和,从回归角度看,组内残差平方和,组内回归平方和,接着就要计算组间平方和了。它反映的是各个水平之间的差异,有了这三个修正的平方和,我们就可以进行组间无差异的检验了。,回头从离差分解的角度我们来解释协方差分析,总离差=分组变量离差+协变量离差+随机误差,分组变量离差 =总离差 - 协变量离差 - 随机误差,可解释部分,不可解释部分,我们回头看协方差分析的模型,使用该方法进行分析的前提是每组的回归系数相等,且不为零。回归系数反映的是协变量对观测值的影响。只有这种影响的作用形式相同,才能用该模型。 当然,如果回归系数为零的话,用协方差分析也没有意义了。因此我们在做协方差分析前要做两个假设检验 协变量对因变量的影响对与个组来说都是相同的,即各组回归系数相等: 这些相等的回归系数不为零:,检验各组的回归系数相等时要先按回归系数不相等表示模型:,然后我们比较按照回归系数相等和回归系数不等计算出的误差平方和是否有显著差异,如果F值小于临界值则说明 之间无显著差异。,在进行协方差分析时,这个检验是最先进行的,构造回归系数非零的假设检验时我们回顾一下一元线性回归显著性检验:,到这里我们把单因素的协方差分析的方法模型介绍完了。 回头看芬兰白酒专卖的例子。,为了更具体地进行协方差分析,我们回过头来看芬兰白酒专卖的例子:,我们当时的观测数据来自12个不同的自治区,同一个自治区应该有其一定的特殊性,这样就使得个地区观测值的可比性降低了。那么,怎么样去除这种特殊性呢?这种地区的特殊性在统计上表现为观测前一年的数据()和观测年的数据具有回归关系。这里面就是协变量,在协方差分析中可以分离出协变量效应,从而提高分析结果的精度为此我们收集到前一年,也就是各个自治区都没有销售白酒的那一年交通事故的数据,并把他们整理在下表中:,要进行协方差分析,我们要先进行两个前提假设:,回归系数一致性检验:,先计算各组内,的交叉作用平方和,再计算各组内作用的平方和,用这些值我们就可以分别求出各组的回归系数:,最后计算总的组内离差平方和,有了这些项就可以计算了:,最后计算值:,得到这个值,我们没有理由拒绝等回归系数的假设条件 第二个需要检验的假设是这个相等的回归系数不等于:,为此我们计算以下项目:,得到这个值,回归系数为的假设被拒绝了,我们继续分析白酒的销售对交通事故是否有影响,为了得到F统计量,我们要求出组间离差平方和的修正值和组内离差平方和的修正值。为此我们要求出,总离差平方和,它表示没有X的影响,单纯考察数据中Y的变动情况。,表示各 的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个人租冰柜合同标准文本
- 入股合同样本写
- 个人房产代销合同标准文本
- 业务销售合同样本
- 债权书收购合同标准文本
- ups维修合同样本
- 业主 工程 合同标准文本
- 公司组团烧烤合同样本
- 公司合作关系合同标准文本
- 临租合同标准文本
- 2023年广东省中学生生物学联赛试题解析(word)及答案(扫描版)
- 基于STM32的自动灌溉系统
- 质量管理体系电子线路板PCBA生产质量控制计划表
- 2002版《测绘工程产品价格》和《测绘工程产品困难类别细则全》
- 110kV盘古变电站土建的施工方案设计
- 高中信息技术 粤教版 必修1《运用选择结构描述问题求解过程》教学设计
- 每周安全安全检查记录表
- 《这是我的家》-完整版PPT
- 浙美版六年级下册美术全册教案
- 《云南省食品安全地方标准 天麻》编制说明
- 基于语音信号去噪处理的FIR低通滤波器设计要点
评论
0/150
提交评论