版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章:多重共线性
二、简答题
1、导致多重共线性的原因有哪些?
2、多重共线性为什么会使得模型的预测功能失效?
3、如何利用辅回归模型来检验多重共线性?
4、判断以下说法正确、错误,还是不确定?并简要陈述你的理由。
⑴尽管存在完全的多重共线性,OLS估计量还是最优线性无偏估计量〔BLUE〕。
⑵在高度多重共线性的情况下,要评价一个或者多个偏回归系数的个别显著性是不可能的。
(3)如果某一辅回归显示出较高的值,那么必然会存在高度的多重共线性。
(4)变量之间的相关系数较高是存在多重共线性的充分必要条件。
(5)如果回归的目的仅仅是为了预测,那么变量之间存在多重共线性是无害的o
5、考虑下面的一组数据:
Y-10-8-6-4-202468:0
1234567891011
x2
13579111315171921
X3
如果我们用模型:
来对以上数据进展拟合回归。
(1)我们能得到这3个估计量吗?并说明理由。
(2)如果不能,那么我们能否估计得到这些参数的线性组合?可以的话,写出必要的计
算过程。
6、考虑以下模型:
由于X?和X,是X的函数,那么它们之间存在多重共线性。这种说法对吗?为什么?
7、在涉及时间序列数据的回归分析中,如果回归模型不仅含有解释变量的当前值,同时还
含有它们的滞后值,我们把这类模型称为分布滞后模型〔distributed-lagmodel]。我们考虑以
下模型:
其中丫——消费,X——收入,t——时间。该模型表示当期的消费是其现期的收入及其滞后
三期的收入的线性函数。
(1)在这一类模型中是否会存在多重共线性?为什么?
(2)如果存在多重共线性的话,应该如何解决这个问题?
8、设想在模型
中,X2和X3之间的相关系数电为零。如果我们做如下的回归:
〔1〕会不会存在且%=自?为什么?
〔2〕A会等于由或,।或两者的某个线性组合吗?
:3〕会不会有var(A)=var02)JLvar(%)=var(R)?
9、通过一些简单的计量软件〔比方EViews、SPSS],我们可以得到各变量之间的相关矩阵:
1r23「Ik'
R=0;:…勺。
«2…1>
怎样可以从相关矩阵看出完全多重共线性、近似多重共爱性或者不存在多重共线性?
三、计算题
1、考虑消费函数
其中,C、丫、曲依次表示消费、收入与财富。下面是假想数据。
CYW
7080810
651001009
901201273
951401425
1101601633
1151801876
1202002252
1402202201
1552402435
1502602686
⑴作C对丫和中'的普通最小二乘回归。
⑵这一回归方程是否存在着多重共线性?你的判断依据是什么?
(3)分别作C对Y和W的回归,这些回归结果说明了什么?
(4)作W.对Y的回归。这一回归结果说明了什么?
(5)如果存在严重的共线性,你是否会删除一个解释变量?为什么?
2、下表给出了美国1971;986年期间新客车出售的数据。
年份Y
X5乂6
%2X3兀
197110227112.0121.3776.84.8979367
197210872111.0125.3839.64.5582153
197311350111.1133.1949.87.3885064
19748775117.5147.71038.48.6186794
19758539127.6161.21142.86.1685846
19769994135.7170.51252.65.2288752
197711046142.9181.51379.35.5092021
197811164153.8195.31551.27.7896048
197910559166.0217.71729.310.2598824
19808979179.3247.01918.011.2899303
19818535190.2272.32127.613.73100397
19827980197.6286.62261.411.2099526
19839179202.6297.42428.18.69100834
198410394208.5307.62670.69.65105005
198511039215.2318.52841.17.75107150
198611450224.4323.43022.16.31109597
Y——新车出售量,未经季节调整数量;
X2——新车,消费者价格指数,1967年=100,未经季芍调整;
——消费者价格指数,1967年=100,未经季节调整;
x4——个人可支配收入,10亿美元,未经季节调整;
x5——利率,百分数,金融公司票据直接使用;
x6—民间就业劳动人数〔个人〕,未经季节调整。
(1)如果你决定使用表中全部回归元作为解释变量,可能会遇到多重共线性吗?为什
么?
(2)如果你这样认为的话,你准备怎样解决这个问题?明确你的假设并说明全部计算。
(3)制定适当的线性或者对数线性的模型,以估计美国对汽车的需求函数。
第二局部:参考答案
一、术语解释
1、多重共线性:对于经典线性回归模型[CLRM)
如果上式中某两个或多个解释变量之间出现了相关性,那么称为存在多重共线性。依据解释
变量之间共线性的程度不同,可以分为完全多重共线性和近似多重共线性。
2、完全多重共线性与近似多重共线性:所谓完全多重共线性,是指线性回归模型中的
假设干解释变量或全部解释变量之间具有严格的线性关系,也就是说,对于多元线性回归模
型,假设各解释变量X],*2,…,X上的之间存在如下的关系式:
式中4,4,…,4是不全为零的常数,那么称这些解释变量之间存在完全多重共线性。
当各解释变量X1,X2,…,X*的之间存在如下的近似的线性关系:
那么可以说上述解释变量之间存在近似多重共线性。还可以采用如下的方式,在近似
线性关系式中,假设400,那么可将此近似线性关系表示为:
其中%=4/4,匕为随机误差项。
3、辅回归:在变量之间存在多重共线性的情况下,有一个解释变量能由其它解释变量
近似的线性表示出来。为了找出哪个解释变量和其它变量有这种关系,我们可以将每个%对
其余变量进展回归,即
这种回归叫做辅回归,它是相对于Y对各个X的主回归而言的°
二、简答题
1、答:
经济数据中大量存在多重共线性这一现象,主要原因在于:经济领域很难象其它实险学
科那样从控制性试脸中获得数据;此外,可能有经济变量构造上的原因,也有数据收集与模
型设定方面的原因,具体的,有以下几种:
〔1〕所使用的数据收集方法。我们只能在一个有限的范围内得到观察值,无法进展重
发试脸。
〔2〕模型或从中取样的总体受到约束〔经济变量的共同趋势〕。
〔3〕模型设定的偏误。
〔4〕过度决定的模型。这种情况尤其容易发生在解释变量的个数大于观测值个数的情
形。
由于上述原因,实际应用中,解释变量之间总会存在一定程度的线性相关,因此,问题
不是多重线性有无,而是多重共线性的严重程度。
2、答:
多元线性回归模型的一个重要应用是经济预测。对于模型
如果给定样本以外的解释变量的观测值X。,就可以得到被解释变量的预测值
但是,这只是被解释变量的预测值的估计值而不是预测值。预测值仅以某一个置信水平位于
以该估计值为中心的一个区间中。对于预测的置信区间,我们利用的是构造,统计量,得到
在给定(1一a)的置信水平下为的置信区间为
显然,当解释变量之间存在多重共线性时,(X'X)7非常大,故而丫。的置信区间也很
大,因此,模型的预测功能失效。
3、答:
辅回归是相对于丫对各个X的主回归而言的。在变量之间存在多重共线性的情况下,
有一个解释变量能由其它解释变量近似的线性表示出来。为了找出哪个解释变量和其它变量
有这种关系,我们可以将每个X,对其余变量进展回归,即
Xj+a,.+1X/+l++4,
并计算相应的决定系数,分别记为R;。然后,我们在建立统计量:
它服从自由度为k-2和n-k+l的F分布。其中n为样本大小,k为包括常数项在内的解释变
量个数。如果计算出的片超过了相应自由度的临界值,邨么认为这个X,和其余的解释变量
存在共线性;如果”.未超过临界值,那么认为这个X,和其余的解释变量不存在共线性。这
种辅回归模型检脸不仅可以检验是否存在多重共线性,而且还可以得到多重共线性的具体形
式。
4、答:
〔1〕错。如果变量之间存在完全的线性关系时,我们甚至无法估计其系数或者标准误。
〔2〕错。在高度多重共线性的情况下,仍然可以得到一个或者多个显著的t值。
〔3〕错。OLS估计量的方差有下式给出:
从此式可以看出,一个很高的R;可被一个很低的或者很高的2片抵消掉。
〔4〕错。如果一个模型只有两个回归元,两两之间的高度相关系数便表示存在多重共
线性。但是在变量之间存在多重共线性的前提下,可能是几个变量之间的关系。变量之间的
相关系数较高是存在多重共线性的充分非必要条件。
〔5〕不确定。如果观测到共线性在后来的样本数据中继续存在,或许无害。但如果不
是这样,或者目的在于做出准确的估计的话,多重共线性便成为问题。如果仅仅要是预测的
话,预测有效的前提条件是模型构造的稳定。
5、答:
〔1〕不能。通过对和乂3的观察,我们可以知道它们存在以下的关系:
X3/=2X2/-1,所以可知变量X2和X3是完全线性相关的。
〔2〕把方程写成
其中%=氏、%=22+2月O
因此,我们可以唯一的估计出四和二?,但无法估计出原始的尸,因为两个方程无法
解出三个未知数。
6、答:
这种说法不正确。因为Y和火;都是X的非线性函数,把它们包括在回归模型中并不违
反经典性线性回归模型的根本假设。多重共线性的相关是指的变量之间的线性相关。
7、答:
〔1〕是的。经济时间序列数据有同向变动的趋势。在这里,收入的滞后变量一般也可
以一样的方向变动O
〔2〕在遇到时间序列数据存在线性相关性时,我们一般都是采用一阶或者高阶差分变
换来消除共线性。
8、答:
〔1〕是的。这是因为X2和X3之间的相关系数为0,所以夕系数的表达式
(Z丫也)(Z靖)-(Z丁再)(Z々也)
A=------------------------------------------、
(Z)(Z**)-(1>2/3广
中的穿插乘积项消失,从而变成与a和/系数同样的表示式。
12〕是它们的一个线性组合。证明如下:
因此有B1=«|+/)-Ko
〔3〕不是。原因如下:
32
var(d2)=
Z4
9、答:
我们可以利用相关矩阵的行列式来判断多重共线性与否,可以利用R的行列式大小来
判断多重共线性的强弱。
(1)假设R的行列式为0时,那么存在完全的共线性。
(2)假设R的行列式很小接近于。时,那么存在近似的共线性。
(3)假设R的行列式为1时,那么变量正交、不存在共线性。
三、计算题
1、解:
〔1〕使用EViews软件进展回归
DependentVariable:SER01
Method:LeastSquares
Date:07/02/06Time:19:32
Sample:110
Includedobservations:10
VariableCoefficientSrd.Errort-St£tisticProb.
C24.336986.2800513.8752840.0061
W-0.0349520.030120-1.1604330.2839
Y0.8716400.3143792.7725760.0276
R-squared0.968182Meandependentvar111.0000
AdjustedR-squarcd0.959092S.D.dependentvar31.42893
S.E.ofregression6.356758Akaikeinfbcriterion6.780239
Sumsquaredresid282.8586Schwarzcriterion6.871015
Ix)glikelihood-30.90120F-statistic106.5019
Durbin-Watsonstat2.941201Prob(F-statistic)0.000006
回归得到的方程为•
AAA
〔2〕有。R-squarcd的值为0.968182,但是系数W通过不过显著性检脸。
⑶
VariableCoefficientStd.Errort-StatisticProb.
C24.454556.4138173.8127910.0051
Y0.5090910.03574314.243170.0000
R-squarcd0.962062Meandependentvar111.0000
AdjustedR-squarcd0.957319S.D.dependentvar31.42893
S.E.ofregression6.493003Akaikeinfocriterion6.756184
Sumsquaredresid337.2727Schwarzcriterion6.816701
I^oglikelihood-31.78092F-statisric202.8679
Durbin-Watsonstat2.680127Prob(F-statistic)0.000001
VariableCoefficientStd.Errort-SutisticProb.
c26.451988.4461653.1318330.0140
w0.0480390.00454310.575190.0000
R-squared0.933241Meandependentvar111.0000
AdjustedR-squarcd0.924896S.D.dependentvar31.42893
S.E.ofregression8.613107Akaikeinfocriterion7.321304
Sumsquaredresid593.4849Schwarzcriterion7.381821
Loglikelihood-34.60652I7-statistic111.8346
Durbin-Watsonstat2.389869Prob(F-statistic)0.000006
在这两个回归中,系数是显著的,而在同时对两个变量进展回归时,却存在局部系数的
不显著,说明变量之间存在多重共线性。
⑷
VariableCoefficientStd.Errort-SutisticProb.
C336363673.70690-0.0456350.9647
Y10.372730.41075325.252990.0000
R-squarcd0.987611Meandependentvar1760.000
AdjustedR-squared0.986062S.D.dependentvar632.0272
S.E.ofregression74.61690Akaikeinfocriterion11.63947
Sumsquaredresid44541.45Schwarzcriterion11.69998
Ix)glikelihood-56.19734F-statistic637.7133
Durbin-Watsonstat2.366673Prob(F-statistic)0.0()0000
VariableCoefficientStd.Errort-SutisticProb.
Y10.354970.12399183.514000.0000
R-squarcd0.987607Meandependentvar1760.000
AdjustedR-squarcd0.987607S.D.dependentvar632.0272
S.E.ofregression70.35864Akaikeinfocriterion11.43973
Sumsquaredresid44553.05Schwarzcriterion11.46999
Ix)glikelihood-56.19864Durbin-Watsonstat2.366224
不管是否带上常数项,R-squared的值都非常大(>0.98],而且Y的系数都通过显著性
检脸,说明w.和丫存在高度的共线性。
〔5〕在满足模型的经济含义的前提下〔以免造成模型设置失误〕,我们还是可以通过
舍去W或者Y来消除共线性的
2、解:
〔1〕首先我们发现各个变量在数量级上存在较大差异,所以我们一般考虑对数线性回
归模型。如果我们的对数回归模型中包含了所有的解释变量,那么得到如下的结果:
DependentVariable:I.OG(Y)
Method:LeastSquares
Date:07/02/06Time:20:31
Sample:19711986
Includedobservations:16
VariableCoefficientStd.Errort-SutisticProb.
C3.25485919.116560.1702640.8682
LOG(X2)1.7901530.8732402.0500120.0675
LOG(X3)-4.1085181.599678-2.5683410.0280
LOG(X4)2.1271991.2578391.6911540.1217
LQG(X5)-0.0304480.121848-0.2498840.8077
LOG(X6)0.2777922.0369750.1363750.8942
R-squarcd0.854803Meandependentvar9.204273
AdjustedR-squarcd0.782205S.D.dependentvar0.119580
S.E.ofregression0.055806Akaikeinfocriterion-2.653874
Sumsquaredresid0.031143Schwarzcriterion-2.364153
Toglikelihood27.23099F-statistic11.77442
Durbin-Watsonstat1.793020Prob(F-statistic)0.000624
我们发现R-squared=0.854803>0.80,LOG(X4)、LOG(X5)、LOG(X6)都不能通过0.10
的显著性检脸。我们可以得出结论,各变量之间存在多重共线性。
〔2〕由于有5个解释变量,我们可以考虑消除局部解释变量重新对参数进展估计,以
得到正确的回归方程。
我们首先得到个解释变量之间的相关系数矩阵:
X2X3X4X5X6
X210.996864584320.991353674830.525829679620.97214455418
675
X30.9968645843210.991273632980.543312899970.96523922955
974
X40.991353674830.9912736329810.461436278030.97261537151
6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论