版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3.3异方差性
引子:更为接近真实的结论是什么?
根据四川省2000年21个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对模型估计的结果如下:
式中表示卫生医疗机构数(个),表示人口数量(万人)。模型显示的结果和问题●人口数量对应参数的标准误差较小;●t统计量远大于临界值,可决系数和修正的可决系数结果较好,F检验结果明显显著;
表明该模型的估计效果不错,可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735个。然而,这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?
本章讨论四个问题:●异方差的实质和产生的原因●异方差产生的后果●异方差的检测方法●异方差的补救3.2异方差性图1:我国税收和GDP图2:1998年我国制造工业和利润X-GDPY-税收X-销售收入Y-销售利润
两个散点图有共同的特征,随着自变量增加,因变量也增加,但是图2中,当X比较小时,数据点相对集中,随着X增大,数据点变得相对分散。而图1中数据分布却没有出现这一特征。经典线形回归模型的一个重要假定是同方差性:PRF的干扰项是同方差的(homoscedastic)
异方差的性质异方差性是指,的条件方差(=的条件方差)随着X的变化而变化,用符号表示为:7模型函数形式存在设定误差模型中遗漏了一些重要的解释变量随机因素本身的影响异方差较之同方差更为常见异方差产生的主要原因异方差的具体理由按照边错边改学习模型(error—learningmodels),人们的行为误差随时间而减少。随着收入的增长,人们在支出和储蓄中有更大的灵活性。在做储蓄对收入的回归中,与收入俱增随着数据采集技术的改进,可能减小异常值(outliers)的出现可能导致异方差性回归模型的设定偏误:比如忽略了重要的解释变量做商品的需求量对价格的回归时,没有将互补品或替代品的价格包括近来,会引起异方差问题
比如我们在研究居民储蓄问题时:
对于低收入家庭,他们满足基本消费以后,所剩无几,因此各个家庭之间的储蓄不会有很大差异;
而对于高收入家庭,他们满足基本消费后,收入剩余较多,由于各个家庭在消费习惯、消费心理、家庭成员构成不同,有的家庭可能储蓄较多,有的家庭可能储蓄少,各个家庭之间的储蓄就会出现较大差异。此时用线性模型来居民储蓄问题时就有可能会出现异方差问题10研究居民家庭储蓄行为如政策的变动,自然灾害的发生、金融危机的爆发等。这些偶然因素本身均会造成随机误差项的异方差性。11研究居民家庭储蓄行为第i个家庭的储蓄额第i个家庭的可支配收入×12时间年利率每万元年收益比重年收益额同年人均可支配收入1993.72002.22007.122008.121.98%4.14%2.25%储蓄热情极高10.98%1098元198元414元225元42.6%2.57%3.00%1.43%储蓄热情极低寻求其他投资
第二节异方差性的后果
本节基本内容:
●对参数估计统计特性的影响●对参数显著性检验的影响●对预测的影响
14OLS估计量线性性异方差对OLS估计量的主要影响存在异方差满足同方差假定无偏性最具有效性线性性无偏性最具有效性
1.最小二乘估计量仍旧是线性无偏的因为此时随机误差项仍旧满足零均值假定可以证明线性:无偏性2.普通最小二乘估计量不再是有效的前面推导斜率参数的方差时,我们得到下面的公式当模型满足同方差假定时但当模型中出现异方差时17
由此可见模型中出现异方差时,斜率系数方差公式中多出了一个因子
此时如果仍采用计算斜率参数的方差,将会产生估计偏误,偏误的大小取决与因子值的大小。183.t检验的可靠性降低由于异方差的存在,无法正确估计参数的方差和标志误差,因此也影响到t检验的效果4.模型的预测误差增大模型的预测区间和随机误差项的方差有着紧密联系,随着随机误差项方差的增大,模型的预测区间也随之增大,模型的预测误差也会相应增加。19此时采用普通最小二乘法估计模型所得到的结果,其准确性难以保证!!简而言之:20估计模型的数学方法普通最小二乘法(OLS法)
OLS法
WLS法
GLS法……估计模型的数学方法加权最小二乘法(WLS法)估计模型的数学方法广义最小二乘法(GLS法)估计模型的数学方法广义最小二乘法(GLS)GLS(generalizedleastsquares)比OLS更多地利用了样本数据所提供的信息即,转换后模型的干扰项满足同方差性假定,再用OLS方法,就可以得到BLUE估计量——这就是GLS方法,得到的是GLS估计量OLS和GLS的区别
因此,这里的GLS也被称为WLS(weightedleastsquares)。其实,GLS是更一般的方法,包括工具变量法等。OLS的精神实质是最小化:GLS的精神实质是最小化:异方差性的判断非正式方法问题的性质在涉及不均匀(heterogeneous)单元(国家、省份、企业、家庭)的横截面数据中,异方差性可能是一种常规,而不是例外图解法在缺乏先验信息或经验的情况下,可对做检验,看看是否存在系统模式Eviews提供了查看残差判断是否存在异方差性的功能27图示法(1)绘制Y-X散点图由于因变量和随机误差项的方差相同,因此通过观察因变量和自变量的散点图,可以分析因变量的分散程度与自变量之间是否存在关系,如果因变量的分散程度随着自变量的增加呈现增大(减小)的趋势,那么就说明模型中出现了递增(递减)型的异方差现象。(2)绘制残差分布图e-x
建立线性回归模型后,以残差平方作为纵坐标,自变量X作为横坐标,绘制残差分布图,如果残差平方随着自变量的变化而出现系统变化趋势,也可以判断模型中存在异方差问题。28
从Y-X散点图可以看出,随着自变量的增加,因变量随着增加,但是其分散程度也逐渐增大;同样,从残差分布图中也可以发现残差的分散程度也随着自变量的增加而加大。
★需要指出的是,图示检验法是判断异方差是否存在比较粗略的一种方法,要精确地检验模型中是否存在异方差,还要采用其他一些方法。★292.戈德菲尔德-匡特检验法
基本原理:这种方法又称G-Q检验法,它首先将样本按照升序排列,然后将样本分成两个部分,再对这两个子样本分别建立回归模型,并求出各自的残差平方和RSS1和RSS2。如果这两个部分随机误差项的分散程度相同,那么RSS1和RSS2应该相差不大;如果RSS1和RSS2相差较大,在表明两个部分随机误差项的分散程度存在较大差异,模型中存在异方差。样本1样本2C个数据样本1样本2C个数据XYXY同方差异方差(2)将序列中间观测值剔除,剩下的两个子样本容量为30具体步骤:
(1)将n对样本观测值按照自变量的大小进行升序排列;
(3)对这两个子样本分别作回归,并求出各自的残差平方和设:对应自变量较小值的子样本的残差平方和对应自变量较大值的子样本的残差平方和31(4)提出假设(5)构造统计量(6)给定显著性水平α,查F分布表,得临界值323.帕克(Park)检验和格里奇(Gleiser)检验
基本原理:这两种检验方法的都是通过建立残差对自变量的回归模型,判断随机误差项的方差和自变量之间是否存在着较强的相关关系。帕克检验的模型形式为:格里奇检验的模型形式为:常用的是其对数形式33
如果经过检验,模型的斜率参数通过显著性检验,则表明随机误差项的方差(用残差平方和或残差绝对值来近似估计)随着自变量的取值不同而发生变化,模型中存在着异方差。★特点:这两种方法不仅能检验出异方差,而且可以探测异方差的具体形式,有助于进一步研究如何消除异方差(1)Park检验具体方法
如果显著,则有异方差性;如果它不显著,则接受同方差性假设35(2)格里奇检验的具体步骤1)对原模型作最小二乘估计,得残差3)如果斜率参数通过显著性检验,同样也表明随机误差项的方差和自变量之间也存在函数关系,原模型中存在异方差;反之原模型中不存在异方差问题2)用残差绝对值对作回归如Glejser检验
Glejser建议,从OLS回归得到残差之后,用的绝对值对被认为与密切相关的X变量做回归:Glejser检验可能存在下述问题:非零的期望值序列相关异方差性Glejser本人发现:前四个模型,在大样本条件下,一般能够给出满意的结果在小样本情形下,Glejser检验只能作为一种摸索异方差性的定性的技巧383.怀特(White)检验
基本原理:利用残差平方和,建立残差平方和与自变量的辅助方程来判断模型中是否存在异方差
具体步骤:(1)对原模型作最小二乘估计,得残差平方;(2)估计辅助回归方程39辅助回归方程就是将残差平方和对所有自变量的一次项、二次项和交叉乘积项进行回归;当然一元线性回归模型对应的辅助回归方程没有交叉乘积项,多元回归模型的辅助回归方程可以选择是否包含交叉乘积项。403)计算辅助回归方程的拟合系数,可以证明,在同方差假定下,渐近地有,其中,自由度q为辅助回归模型中的自变量个数4)在给定的显著性水平下,查开方分布表,得临界值41异方差的修正如果模型经过检验存在异方差问题,首先应该分析模型中是否遗漏了一些重要的自变量,或者考虑模型的函数形式设置的是否适当,然后可以采取一些措施来消除异方差所带来的不利影响。
在实际的处理过程中,主要有加权最小二乘法和模型转换法421.加权最小二乘法(WeightedLeastSquare)加权最小二乘法的前提条件:随机误差项的方差已知以一元线性回归模型为例为了分析方便,将其写成43
因此模型转换为同方差模型,可以使用最小二乘法估计模型,并且得到最优线性无偏估计量44根据最小二乘法估计转换后的模型时,应该有
从上面的分析过程中可以看出,在极小化的过程中,在通常的残差平方和加上了权数,因此这种方法就称作加权最小二乘法,对于异方差模型,加权最小二乘估计量才是最佳估计量。452.模型转换法前提条件:总体随机误差项方差未知,但是可以判断出异方差的具体形式,这是通过对具体问题的经验分析,或者用帕克检验和格里奇检验提供的信息来确定。仍以一元线性回归模型为例,
此时模型转换为同方差模型,可以用最小二乘法估计参数46此时模型也转换为同方差模型,可以用最小二乘法估计参数47此时模型也转换为同方差模型,可以用最小二乘法估计参数总结:补救措施本章练习题使用戈德菲尔德—匡特检验法检验该模型是否存在异方差,已知样本数据为20,去除6个样本数据后,将原样本分为两个容量相等的子样本,对这两个子样本分别做回归,自变量较小的子样本回归方程的残差平方和为0.3,自变量较大的子样本回归方程的残差平方和为2.204,给定显著性水平为0.05,试判断该模型中是否存在异方差.54
解:利用G-Q检验原理
所以模型中存在异方差。5556转换后,模型的随机误差项方差为:为常数,所以经此处理已消除了异方差573.根据我国1976-2001城镇居民人均可支配收入X和人均消费支出Y的资料,按照凯恩斯绝对收入假说建立的消费函数线性模型为:且线性回归模型残差平方和与自变量之间存在如下关系:(1)试解释模型中137.422和0.722的意义.(2)试判断该模型是否存在异方差性.(3)若模型中存在异方差,试写出消除异方差的方法和步骤.58(2)由题,前的系数的显著性检验统计量通过参数显著性检验,可以看出残差和自变量之间存在明显的函数关系,因此原模型存在异方差;59(3)由帕克检验可知,随机误差项的方差,将原模型两边同除则原模型转变为新模型随机误差项的方差已消除了原模型中的异方差第五节案例分析一、问题的提出和模型设定为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。假定医疗机构数与人口数之间满足线性约束,则理论模型设定为:其中表示卫生医疗机构数,表示人口数。
四川省2000年各地区医疗机构数与人口数
地区人口数(万人)医疗机构数(个)地区人口数(万人)医疗机构数(个)
成都1013.36304眉山339.9827自贡315911宜宾508.51530攀枝花103934广安438.61589泸州463.71297达州620.12403德阳379.31085雅安149.8866绵阳518.41616巴中346.71223广元302.61021资阳488.41361遂宁3711375阿坝82.9536内江419.91212甘孜88.9594乐山345.91132凉山402.41471南充709.24064
二、参数估计
估计结果为:三、检验模型的异方差(一)图形法
1.EViews软件操作
由路径:Quick/QstimateEquation,进入EquationSpecification窗口,键入,点“ok”,得样本回归估计结果。
(1)生成残差平方序列。在得到估计结果后,用生成命令生成序列,记为。生成过程如下,先按路径:Procs/GenerateSeries,进入GenerateSeriesbyEquation对话框,键入下式并点“OK”即可:生成序列图示(2)绘制对的散点图。选择变量名与。(注意选择变量的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴),进入数据列表,再按路径view/graph/scatter,可得散点图,见右图:2.判断由图可以看出,残差平方对解释变量的散点图主要分布在图形中的下三角部分,大致看出残差平方随的变动呈增大的趋势,因此,模型很可能存在异方差。但是否确实存在异方差还应通过更进一步的检验。(二)Goldfeld-Quanadt检验1.EViews软件操作(1)对变量取值排序(按递增或递减)。在Procs菜单里选SortCurrentPage/SortWorkfileSeries命令,出现排序对话框,键入,如果以递增型排序,选“Ascenging”,如果以递减型排序,则应选“Descending”,点ok。本例选递增型排序,这时变量与将以按递增型排序。(2)构造子样本区间,建立回归模型。在本例中,样本容量,删除中间1/4的观测值,即大约5个观测值,余下部分平分得两个样本区间:1—8和14—21,它们的样本个数均是8个,即
在Sample菜单里,将区间定义为1—8,然后用OLS方法求得如下结果(表1)在Sample菜单里,将区间定义为14—21,再用OLS方法求得如下结果(表2)(3)求F统计量值。基于表1和表2中残差平方和的数据,即Sumsquaredresid的值。由表1计算得到的残差平方和为,由表2计算得到的残差平方和为。根据Goldfeld-Quanadt检验,F统计量为
(4)判断在下,式中分子、分母的自由度均为6,查F分布表得临界值为:因为,所以拒绝原假设,表明模型确实存在异方差。(三)Wh
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 44973-2024冰上运动赛事活动要求及评估规范
- 2024年度高空作业吊装作业安全协议3篇
- 2024年度奥运会游泳运动员参赛合同协议3篇
- 2024年度车辆私人抵押贷款合同范本下载3篇
- 2024年度烟酒电商渠道总代理合作协议2篇
- 2024年度消防设备销售与技术培训服务合同3篇
- 2024与会计事务所签订财务报表制作保密协议3篇
- 2024年信用证业务结算流程优化合同范本3篇
- 2024年托盘研发与绿色制造技术转移合同3篇
- 2024中建劳务分包补充协议范本:材料设备采购与管理规范3篇
- 【MOOC】电工电子学-浙江大学 中国大学慕课MOOC答案
- 2024道路设计计算书
- 人教版八年级上册数学期末考试试题有答案
- 低空经济产业的市场化运营路径
- 《肿瘤与营养》课件
- 五年级上册英语期末必考易错题
- 2024年财会业务知识竞赛题库及答案(630题)
- 科研伦理与学术规范-期末考试答案
- 广告设计与创意作业指导书
- 北京奥林匹克公园规划设计方案
- 2024年医院全面质量管理方案
评论
0/150
提交评论