已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
精品文档第七章 多重共线性及其处理一、简答题1什么是变量之间的多重共线性?2什么是完全多重共线性?什么是不完全多重共线性?3多重共线性在多元线性回归模型中普遍存在的主要原因有哪些? 4多重共线性可能造成哪些不利后果?5多重共线性的检验有哪些适当的方法?6多重共线性的修正方法有哪些? 二、计算题分析题1某地区供水部门利用最近20年的用水年度数据得出如下估计模型:(-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)F=38.9式中,用水总量(百万立方米),住户总数(千户),总人口(千人),人均收入(元),价格(元/100立方米),降雨量(毫米)。(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量),为什么?观察符号与你的直觉相符吗?(2)在10%的显著性水平下,请进行变量的t检验与方程的F-检验。T检验与F检验结果有相矛盾的现象吗?(3)你认为估计值是(1)有偏的;(2)无效的;(3)不一致的吗?详细阐述理由。2下表是某地区1995年2004年食品需求量、可支配收入、食品类价格指数、物价总指数和流动资产拥有量的数据资料。食品需求函数有关统计资料年份食品需求量(亿元)可支配收入(亿元)食品类价格指数(1995年=100)物价总指数(1995年=100)流动资产拥有量(亿元)199584829 9294171 199696880 9396213 1997104999 9697251 19981141053 9497290 19991221177 100100340 20001421310 101101400 20011581482 105104440 20021791618 112109490 20031931742 112111510 20042081847 112111530 问题:(1)检验变量间的多重共线性。(2)利用法,建立适当的回归方程。 第四部分 习题答案一、简答题1多重共线性指两个或多个解释变量之间不再彼此独立,而是出现了相关性。2完全多重共线性指:在有多个解释变量模型中,其中一个变量可以表示为其他多个变量的完全线性函数,即,其中至少有一个,与等式右边线性组合的相关系数为1,则这种情况被称为完全多重共线性。在此情况下,不能估计解释变量各自对被解释变量的影响。 不完全多重共线性指:在实际经济活动中,多个解释变量之间存在多重共线性问题,但与等式右边线性组合的相关系数不为1。3多重共线性产生的原因多元线性回归模型产生多重共线性的原因很多,主要有:(1)经济变量的内在联系。这是产生多重共线性的根本原因;(2)解释变量中含有滞后变量;(3)经济变量变化趋势的“共向性”。4多重共线性会产生以下问题:(1)增大了OLS估计量的方差;(2)难以区分每个解释变量的单独影响;(3)回归模型缺乏稳定性;(4)检验的可靠性降低。5在应用多元回归模型中,人们总结了许多检验多重共线性的方法。(1)系数判定法(2)用解释变量之间所构成的回归方程的决定系数进行判别(3)逐步回归判别法以为被解释变量逐个引入解释变量,构成回归模型,进行参数估计,根据决定系数的变化决定新引入的变量是否能够加入模型之中。首先将对所有的解释变量分别作回归,得到所有的模型,取决定系数最大的模型中的解释变量加入模型,作为第一个引入模型的变量;其次,将再对剩余的解释变量分别加入模型,进行二元回归,再次,取决定系数最大的解释变量加入模型;依次做下去,直到模型的决定系数不再改善为止。(4)方差膨胀因子VIF判别法 对于多元线性回归模型,的方差可以表示成 一般当VIF10时(此时0.9),认为模型存在较严重的多重共线性。(5)修正的Frish判别法该方法不仅可以对多重共线性进行判别,同时也是处理多重共线性问题的一种有效方法。其步骤为:第一,用被解释变量分别对每个解释变量进行线性回归,根据经济理论和统计检验从中选择一个最合适的回归模型作为基本回归模型,通常选取决定系数最大的回归模型。第二,在基本回归模型中逐个增加其他解释变量,重新进行线性回归,如果新增加的这个解释变量提高了回归模型的决定系数,并且回归模型中的其他参数统计上仍然显著,就在模型中保留该解释变量;如果新增加的解释变量没有显著提高回归模型的拟合优度,则不在模型中保留该解释变量;如果新增加的解释变量提高了回归模型的决定系数,并且回归模型中某些参数的数值或符号等受到显著的影响,说明模型中存在多重共线性,对该解释变量同与之相关的其他解释变量进行比较,在模型中保留对被解释变量影响较大的,剔除影响较小的。6多重共线性的解决方法有:(1)剔除引起共线性的变量;在估计模型之前,找出引起多重共线性的变量,将它剔除出去,是最有效的克服多重共线性问题的方法。(2)变换模型的形式对原模型进行适当的变换,也可以消除或削弱原模型中解释变量之间的相关关系。具体有三种变换方式:一是变换模型的函数形式;二是变换模型的变量形式;三是改变变量的统计指标。(3)综合使用时序数据与横截面数据如果能同时获得变量的时序数据和横截面数据,则先利用某类数据估计出模型中的部分参数,再利用另一类数据估计模型的其余参数。(4)逐步回归分析法逐步回归选取变量时,是一个“由少到多”的过程,即从所有解释变量中间先选择影响最为显著的变量建立模型,然后再将模型之外的变量逐个引入模型;每引入一个变量,就对模型中的所有变量进行一次显著性检验,并从中剔除不显著的变量;逐步引入剔除引入,直到模型之外所有变量均不显著时为止。 (5)增加样本容量由于多重共线性是一个样本特性,如果理论上解释变量之间不存在多重共线性,则可以通过收集更多的观测值增加样本容量,来避免或减弱多重共线性。二、计算题分析题1(1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越高。所以可期望house和pop的符号为正;收入较高的个人可能用水较多,因此pcy的预期符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期price的系数为负。显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望rain的系数符号为负。从估计的模型看,除了pcy之外,所有符号都与预期相符。(2)t-统计量检验单个变量的显著性,F-统计值检验变量是否是联合显著的。这里t-检验的自由度为15-5-1=9,在10%的显著性水平下的临界值为1.833。可见,所有参数估计值的t值的绝对值都小于该值,所以即使在10%的水平下这些变量也不是显著的。这里,F-统计值的分子自由度为5,分母自由度为9。10%显著性水平下F分布的临界值为2.61。可见计算的F值大于该临界值,表明回归系数是联合显著的。T检验与F检验结果的矛盾可能是由于多重共线性造成的。house、pop、pcy都是高度相关的,这将使它们的t-值降低且表现为不显著。price和rain不显著另有原因。根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能够很好地被度量。可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影响很难度量。(3)多重共线性往往表现的是解释变量间的样本观察现象,在不存在完全共线性的情况下,近似共线并不意味着基本假定的任何改变,所以OLS估计量的无偏性、一致性和有效性仍然成立,即仍是BLUE估计量。但共线性往往导致参数估计值的方差大于不存在多重共线性的情况。2根据理论分析,食品需求量受四个因素的影响,建立回归方程:利用表7.5中数据,采用最小二乘法,得:给定显著水平,查分布表,得临界值为,故,回归方程线性关系显著。现用软件分别计算两两变量之间的相关系数,得表:需求量、收入、类指数、物价总指数和资产的相关系数矩阵YY 1.000000 0.997733 0.975480 0.988705 0.983359 0.997733 1.000000 0.980356 0.987666 0.988315 0.975480 0.980356 1.000000 0.991796 0.969962 0.988705 0.987666 0.991796 1.000000 0.969477 0.983359 0.988315 0.969962 0.969477 1.000000可见解释变量之间是高度相关的。为了检查和处理多重共线性,采用修正法。根据理论分析,可支配收入应该是食品需求最主要的影响因素,相关系数检验也表明,收入与食品需求的相关性最强。所以,首先建立以收入为解释变量的一元回归模型。 食品需求量与可支配收入的线性回归结果Dependent Variable: YMethod: Least SquaresSample: 1995 2004Included observations: 10VariableCoefficientStd. Errort-StatisticProb. C-12.455543.762734-3.3102380.01070.1178450.00281041.937010.0000R-squared0.995472 Mean dependent var140.0000Adjusted R-squared0.994906 S.D. dependent var43.01163S.E. of regression3.069899 Akaike info criterion5.258023Sum squared resid75.39426 Schwarz criterion5.318540Log likelihood-24.29012 F-statistic1758.713Durbin-Watson stat2.627059 Prob(F-statistic)0.000000依次将其余变量逐个引入模型,估计结果分别如表所示。食品需求量与可支配收入及食品类价格指数的线性回归结果VariableCoefficientStd. Errort-StatisticProb. C14.0470849.255430.2851880.78380.1257420.0149238.4259430.0001-0.3610550.668873-0.5397960.1061R-squared0.995653 Mean dependent var140.0000Durbin-Watson stat2.533515 Prob(F-statistic)0.000000食品需求量与收入、类价格指数及物价总指数的线性回归结果VariableCoefficientStd. Errort-StatisticProb. C-127.592665.15987-1.9581470.09790.1036060.0138817.4639720.0003-1.8817850.762063-2.4693290.04853.1856371.2164102.6188840.0396R-squared0.997972 Mean dependent var140.0000Durbin-Watson stat3.524120 Prob(F-statistic)0.000000需求量、收入、类指数、物价总指数和资产的线性回归结果VariableCoefficientStd. Errort-StatisticProb. C-135.335275.13155-1.8013100.13150.0969540.0264883.6602780.0146-1.9913430.901601-2.2086750.07823.4014051.4974882.2714070.07230.0150810.0493930.3053300.7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- excel培训课件教学
- 【白云区】21-22学年八年级上学期期末英语试卷(含答案)
- 《QPN培训手册》课件
- 2024-2025学年宁夏石嘴山市第二十六小学四年级(上)期中数学试卷(含答案)
- 考研《西医综合》近五年真题考试题库及答案(含名校题)
- 房屋转让协议书范本10篇
- 《百易招商政策》课件
- 林下养殖合同对树木的规定
- 江西省抚州市重点中学2025届高考冲刺押题(最后一卷)语文试卷含解析
- 离婚一年协议书
- 高中物理论文:谈高中物理错误资源课堂中的有效利用
- 最新建筑材料标准以及分类
- 产品质量控制流程图
- 民间疗法—敷脐
- 教科研基地汇报材料
- 调心滚子轴承参数表
- 质量等级说明
- 中国移动呼叫中心运营管理指标体系
- xx县锗矿产业发展方案(参考意见稿)
- Kappa计算公式及表格
- 汽车4S店客服月报工作总结计划ppt课件
评论
0/150
提交评论