




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第
四
章
经
典
单
方
程
计
量
经
济
学
模
型
:
放
宽
基
本
假
定
的
模
型基
本
假
定
违
背
:
不满足基本假定的情况。主要包括:
(1)随机误差项序列存在异方差性;(2)随机误差项序列存在序列相关性;(3)解释变量之间存在多重共线性;(4)解释变量是随机变量且与随机误差项相关(
随
机
解
释
变
量
)
;此外
:(5)模型设定有偏误(6)解
释
变
量的方
差
不随
样
本容
量的增
而收
敛计量经济检验:
对模型基本假定的检验本章主要学习:前4类一
、异
方
差
的概
念二
、异方差的类型三、
实际经济问题中的异方差性四
、
异方差
性的后果五
、
异方差
性的检
验六、异方差的修正七
、
案
例§4.1
异
方
差
性对于模型Y;=β₀+β₁X;+β₂X₂i++βX+μ;如
果
出现Var(μ;)=o;²即对于不同的样本点,随机误差项的方差不再
是常数,而互不相同,则认为出现了异方差性(Heteroskedasticity)。一
、异
方
差
的概
念同方差性假定:σ²=常数≠f(X;)
异
方
差时
:
σ;²=f(X;)异方差一般可归结为三种类型:σ;2随X的增大而增大
o2随X的增大而减小σ;2与X的变化呈复杂形式二、异方差的类型(1)单调递增型:
(2)单调递减型:
(3)复
杂
型
:递
增
方
差X递
减
方
差同
方
差氛
杂
型X例4.1.1:截面资料下研究居民家庭的储蓄行为Y;=β₀+β₁X;+μ;Y;:第i个家庭的储蓄额
X;:第i个家庭的可支配收入高收入家庭:
储蓄的差异较大低收入家庭:储蓄则更有规律性,差异较小
μ₁的方差呈现单调递增型变化三
、实际经济问题中的异方差性例4.1,2,以绝对收入假设为理论假设、以截面
数据为样本建立居民消费函数:Ci=β₀+β₁Y;+μ₁将居民按照收入等距离分成n组,
取组平均数为样
本
观
测
值
。一般情况下,居民收入服从正态分布:中等收入
组人数多,
两端收入组人数少。而人数多的组平均
数的误差
小,人
数
少的
组
平
均
数的
误
差
大
。所以样本观测值的观测误差随着解释变量观测值
的不同而不同,往往引起异方差性。例4.1.3,
以某一行业的企业为样本建立企业生产
函
数模
型Y;=A₁β1K;β2L;β3eui被解
释
变
量:产出量Y解释变量:
资本K、劳动L
、技术A
,那么:
每个企业所处的外部环境对产出量的影响被
包含
在
随
机
误
差
项中
。每个企业所处的外部环境对产出量的影响程度不
同,造成了随机误差项的异方差性。这时
,
随机误差项的方差并不随某一个解释变量
观测值的
变
化
而
呈
规
律
性
变
化,
呈现复杂
型
。因为在有效性证明中利用了E(μμ⁷)=o²I一
,,
数估计量具有性参渐近有下,尽不具本情但仍在大致性而且计量经
济
学
模型
一
旦出
现
异
方
差
性,如果
仍
采
用OLS估计模型参数,会产生下列不良后果:四、
异方差性的后果1、参数估计量非有效OLS估计量仍然具有无偏性,但不具有有效性。它是建立在σ2不变而正确估计了参数方差
的基础之上的。如果出现了异方差性,估计的S出
现
偏
误
(偏大或偏小),
t检验失去意义。其
他
检
验也
是
如
此
。2、变量的
显著性检验失去意义变量的显著性检验中,构造了t
统计量一方面
,
由
于
上
述
后
果
,
使
得
模
型
不
具
有良好的统计
性质
;另一方面,在预测值的置信区间中也
包含有参数方差的估计量S
会。所
以
,
当模型出现异方差性
时
,参数OLS
估计值的变异程
度
增大,
从而造成对Y
的
预
测
误差变大,降低预测精度,
预测功能失效。3、模型的
预测失效●
检
验
思
路
:由
于异方差性就是相对于不同的解释变量
观测值,
随机误差项具有
不同的方差。那么:检验异方差性,也就是检验随机误差项的
方差与解释变量观测值之间的相关性及其相
关的“形式”。五、
异方差性的检验问题在于用什么来表示随机误差项的方差一般的处理方法:首先采用OLS
法估计模型,
以求得随机误差项的估计量(注意,该估计量是不严格的),我们称之为“近
似估计量”,用ē,表示。于是有Var(μ₁)=E(μ²)≈E²ē;=y;-(y;)os即用e²
来表示随机误差项的方差。几
种
异
方
差
的
检
验
方
法
:1、
图
示
法(
1
)
用X-Y
的
散
点
图
进
行
判
断看是否存在明显的散点扩大、缩小或复杂型
趋
势
(即不在
一
个固定的带型域中)(2)X-e²的散点图进行判断看是否形成一斜率为零的直线复杂型异方差递减异方差基
本
思
想
:
或
le;l=f(Xj)+ɛ;选择关于变量X的不同的函数形式,对方程进
行估计并进行显著性检验,
如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异
方
差
性
。如:
帕克检验常用的函数形式:f(Xj)=σ²Xe+
或ln(e²)=1no²+alnX,+ɛ;若α在统计上是显著的,表明存在异方差性。;:;)方X立ẽ偿2、
帕克(Park)
检验与戈里瑟(Gleiser)检验G-Q检验以F检验为基础,适用于样本容量较大、
异方差递增或递减的情况。G-Q
检
验
的
思
想
:先将样本一分为二,对子样①和子样②分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。由于该统计量服从F
分布
,
因此假如
存
在
递
增
的异方差,则F远大于1;反之就会等于1(同方
差)
、
或
小
于
1
(
递
减
方
差
)。3、
戈德菲尔
德-匡特(Goldfeld-Quandt)检验G-Q检验的步骤:①将n对样本观察值(X;,Y;)按观察值X;的大小排
队②将序列中间的c=n/4个观察值除去,
并将剩
下的观察值划分为较小与较大的相同的两个
子样本,每个子样样本容量均为(n-c)/2③对每个子样分别进行OLS回归,并计算各自
的残差平方和分别用Ze
与
Ze2
表示较小与较大的残差
平方和(自由度均为
⑤给定显著
性
水
平
α
,
确
定临
界
值Fg(v₁,v₂),若F>Fα(v₁,v₂),
则拒绝同方差性假设,表明存
在异
方
差
。当然,还
可
根
据
两
个
残
差
平
方
和
对
应的子
样的顺
序判
断
是
递
增
型
异
方
差
还
是
递
减
异
型
方
差
。④在同方差性
假
定
下,构
造
如
下
满
足F
分布
的
统
计
量先对该模型作OLS
回归,得到
e²然后做如下辅助回归e²=a₀+a₁Xi+Q₂X₂+Q₃Xì+Q₄X2+QsX₁X₂+E;可以证明,在同方差假设下:nR²=x²(h)R²为(*)的可决系数,
h为(*)式解释变量的个数,二
表示渐近服从某分布。怀特检验不需要排序,且适合任何形式的异方差
怀特检验的基本思想与步骤
(以二元为例):3、
怀
特
(
White)
检
验Y₁=β₀+β₁X₁+β₂X₂;+μ;(*)注意:辅助回归仍是检验与解释变量可能的组合的
显著性,因此,辅助回归方程中还可引入解释
变
量的更高
次
方
。如果存在异方差性,
则表明确与解释变量的
某种组合有显著的相关性,
这时往往显示出有
较高的可决系数以及某一参数的t检验值较大。当然,在多元回归中,
由于辅助回归方程中
可能有太多解释变量,
从而使
自
由度减少,有
时
可去
掉
交
叉
项
。模型检验出存在异方差性,可用加
权
最
小
二
乘
法(Weighted
Least
Squares,WLS)
进行估计。加权最小二乘法的基本思想:加权最小二乘法是对原模型加权,
使之变成一
个新的不存在异方差性的模型,然后采用OLS估计
其参
数
。ZWe²=ZW[X₁-(β₀+β;X₁+
…+β,X)]²在采用OLS方法时:对较小的残差平方e;?赋予较大的权数,对较大的残差平方e;2赋予较小的权数。六
、
异
方
差
的
修
正例如
,
如果对一多元模型,
经检验知:Var(μ₁)=E(μ₁)²=c²=f(Xj₁)c²可以用
√f(x)
去除该模型,得即满足同方差性,可用OLS
法估计。新模型中
,存在一
般
情
况
下
:对于模型Y=Xβ+μE(μ)=0Cov(μ)=E(μμ)=σ²即
存
在异
方
差
性。存
在WW
是
一
对
称
正
定
矩
阵
,
存
在
一
可
逆
矩
阵D
使
得W=DD’用
D-1左
乘
Y=Xβ+μ两边,得到一个新的模型:D-¹Y=D-¹Xβ+D-¹μY=X
β+μ该模型具有同方差性。因为E(μ,μ
。)=E(D-μμ/D¹)=D-E(uμ)D-
¹=D-¹o²ΩD-¹=D-¹o²DD'D'-¹=o²I用
OLS法估计新模型,记参数估计量为B.,则β
。=(X^X*)-¹X^Y*=(X'D-¹D-|X)-¹xD-¹D-ly=(X(W-|X)-¹xW-¹Y这就是原模型
Y=Xβ+μ的加权最小二乘估计量,是无偏、有效的估计量。这里权矩阵为D-1,它来自于原模型残差项μ的
方差
-
协
方
差
矩
阵σ2
W。如何得到σ2w
?从前面的推导过程
看,它来
自于原
模型
残
差项
μ
的方
差
-
协
方
差
矩阵。因此仍对原模型进行OLS
估计
,得到
随机误差项
的
近似估计量ě,
以此构成权矩阵的估计量,
即这时可直接以
D-¹=diag{1/le
l,1/le₂
l,…,1/lē,作为
权
矩阵
。注
意
:在实际操作中人们通常采用如下的经验
方
法
:不对
原
模型
进
行
异
方
差
性
检
验,
而
是
直
接
选择
加
权最
小
二
乘
法,
尤
其
是
采
用
截
面
数
据作
样
本
时
。如果
确实
存
在
异
方
差,
则
被
有
效
地
消除了;如果不
存
在
异
方
差
性,
则
加
权
最
小
二
乘
法
等价
于
普
通
最
小
二
乘
法例4.1.4
中国农村居民人均消费支出主要由人均纯收入来决定
。农村人均纯收入包括(1)从事农业经营的收入,(2)包括从事其他产业的经营性收入(3)工资性收入、
(4)财产收入(4)转移支付收入。考察从事农业经营的收入(X₁)
和其他收入(X₂)
对中国农村居民消费支出(Y)
增长的影响:InY=β
。+β₁lnX₁+β₂ln
X₂+μ七
、
案
例
-
-
中
国
农
村
居
民
人
均
消
费
函
数地区人均消费支出Y从事农业经营的
收
入X₁其他收入X₂地区人均消费支出Y从
事
农
业
经
营
其
他
收
入
的
收
入X₁
X₂北
京3552.1579.14446.
4湖北2703.361242.92526.9天
津2050.91314.62633.湖南1550.621068.8875.6河
北1429.8928.81674.8广东1357.431386.7839.8山
西1221.6609.81346.2广西1475.16883.21088.0内蒙古1554.61492.8480.5海南1497.52919.31067.7辽
宁1786.31254.31303.6重庆1098.39764.0647.8吉
林1661.71634.6547.6四川1336.25889.4644.3黑龙江1604.51684.1596.2贵州1123.71589.6814.4上
海4753.2652.55218.
4云南1331.03614.8876.0江
苏2374.71177.62607.2西藏1127.37621.6887.0浙
江3479.2985.83596.
6陕西1330.45803.8753.5安
徽1412.41013.11006.
9甘肃1388.79859.6963.4福
建2503.11053.02327.青海1350.231300.1410.3江
西1720.01027.81203.8宁夏2703.361242.92526.9山
东1905.01293.01511.6新疆1550.621068.8875.6河
南1375.6108381014.表4.1.1
中国2001年各地区农村居民家庭人均纯收入与消费支出相关数据(单位:元)ln=1.655+0.3166
ln
X,+0.5084
ln
X,(1.87)
(3.02)
(10.04)R²=0.7831
R²=0.7676DW=1.89
F=50.53RSS=0.8232普通
最
小
二
乘
法的
估
计
结
果
:异
方
差
检
验OLS回归的
残差平方项
ê²
与
lnX₂的散点图进
一
步
的
统
计
检
验(1)G-Q检验将原始数据按X₂排成升序,去掉中间的7个数据,得两个容量为12的子样本。对两个子样本分别作OLS回归,求各自的残差平
方和RSS₁和RSS₂:子样本1:
lnF=4.061+0.3431nX₁+0.119lnX₂(3.18)(4.13)
(0.94)R²=0.7068,
RSS₁=0.0648子样本2:
InF=0.791+0.138lnX₁+0.776lnX₂(0.43)(0.73)
(6.53)R2=0.8339,
RSS₂=0.2729计算F统计量:F=RSS₂/RSS₁=0.2792/0.0648=4.31查
表给定α=5%,查得临界值Foos(9,9)=2.97判
断F>Fo.os(9,9)否定两组子样方差相同的假设,
从而该总体随
机项存在递增异方差性。(
2
)
怀
特
检
验作
辅
助回
归
:ê²=-0.17+0.1021nX₁+0.015(lnX₁)²-0.0551nX₂+0.026(InX₂)²(-0.04)(0.10)
(0.21)
(-0.12)
(1.47)-0.0431n
X,ln
X₂(-1.11)R2=0.4638似乎没有哪个参数的t检验是显著的。但nR2=31*0.4638=14.38α=5%下,临界值x²oos(5)=11.07,
拒
绝同方差性去掉交叉项后的辅助回归结果e²=3.842-0.570lnX₁+0.042(lnX₁)²-0.5391nX₂+0.039(In
X₂)²
(1.36)(-0.64)
(064)
(-2.76)
(2.90)R2=0.4374X₂
项
与X₂的平方项的参数的t检验是显著的,且nR2=31×0.4374=13.56α=5%下,临界值x²o.os(4)=9.49拒绝同方差的原假设对原模型进行OLS估计,得到随机误差项的近
似估计量ě,以此构成权矩阵σ2W
的估计量;再以1/lèl为权重进行WLS
估计,得lnF=1.497+0.319InX,+0.527lnX₂(5.12)
(5.94)
(28.94)R²=0.9999R²=0.9999DW=2.49F=924432RSS=0.0706各项统计检验指标全面改善原模型的加权最小二乘回归§4.2
序列
相
关
性SerialCorrelation§4.2
序列相关
性一、序列相关性概念二、
实际经济问题中的序列相关性三、序列相关性的后果四、序列相关性的检验五、具有序列相关性模型的估计六、案例对于模型Y;=β+β₁X₁+B₂X₂₁+
…+βXki+i=1,2,...,n随机项互不相关的基本假设表现为Cov(μ;,μ;)=0
i≠j,ij=1,2,…,n如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性。一、序列相关性概念在
其
他
假
设
仍
成
立的
条
件下,
序
列
相
关即
意
味
着E(μ;μ;)≠02=O或T²IΩ如果仅存在E(μ;μ+i)≠0
i=1,2,...,n称为一阶列相关,或自相关(autocorrelation
)
自相关往往可写成如下形式:L=Pμj-1+Ei
-1<pk1其中:
p
被称为自协方差系数(
coefficient
ofautocovariance)
或一阶自相关系数(
first-order
coefficientofautocorrelation)ε是满足以下标准的OLS假定的随机干扰项:E(E;)=0,
var(ε₁)=o²,
cov(E;,E-)=0S≠0由于序列相关性经常出现在以时间序列为样本的模型
中,因此,本节将用下标t代表i。大多数经济时间数据都有一个明显的特点:惯
性,表现在时间序列不同时间的前后关联上。例如,
绝对收入假设下居民总消费函数模型:C=βo+β₁Y+μ
t=1,2,...,n由于消费习惯的影响被包含在随机误差项中,则
可能出现序列相关性(往往是正相关)。二、
实际经济问题中的序列相关性1、经济变量固有的惯性2、模型设定的偏误
所谓模型设定偏误
(Specification
error)是指
所设定的模型“不正确”。主要表现在模型中丢掉了
重要的解
释
变
量
或
模
型
函
数
形
式
有
偏
误
。例如,本来应该估计的模型为Y₁=βo+β₁X₁+β₂X₂t+β₃X₃t+μ₁但在模型设定中做了下述回归:Y=βo+β₁X₁+β₁X₂t+V₁因
此
,
v=β₃X₃t+μ,如果X₃确实影响Y,则出现
序
列
相
关
。又如:如果真实的边际成本回归模型应为:Y=β₀+β₁X+β₂X²+μ₁其中:
Y=边际成本,X=产出,但建模时设立了如下模型:Y=βo+β₁X+vt因此,由于v=β₂X₁²+μ,包含了产出的平方对随
机项的系统性影响,随机项也呈现序列相关性。在实际经济问题中,有些数据是通过已知数据
生成的。因此,新生成的数据与原数据间就有了内在的
联系,表现出序列相关性。例如:季度数据来自月度数据的简单平均,这
种平均的计算减弱了每月数据的波动性,从而使
随机干扰项出现序列相关。还有就是两个时间点之间的“内插”技术往往导
致随机项的序列相关性。
3、数据的“编造”
因为,在有效性证明中利用了E(NN’)=o2I即同方差性和互相独立性条件。而且,在大
样
本
情
况
下,
参
数
估
计
量虽
然
具
有一致性,但仍然不具有渐近有效性。计量经济学模型一旦出现序列相关性,如果仍
采用OLS法估计模型参数,会产生下列不良后果:二、序列相关性的后果1、参数估计量非有效在
变
量
的
显
著
性
检
验
中
,
统
计
量
是
建
立
在
参数
方
差
正
确
估
计
基
础
之
上
的
,
这
只
有
当
随
机
误
差
项
具
有
同
方
差
性
和
互
相
独
立
性
时
才
能
成
立
。如果存在序列相关,估计的参数方差
S出现偏
误
(
偏
大
或
偏
小
)
,
t检验就失去意义。其
他
检
验
也
是
如
此
。2、
变量的显著性检验失去意义区
间
预
测
与
参
数
估
计
量
的
方
差
有
关
,
在方
差
有
偏
误
的
情
况
下
,
使
得
预
测
估
计
不
准
确
,
预
测
精
度
降
低
。所以,
当模型出现序列相关性时,它的
预测功能失效。3、模型的预测失效三
、序列相关性的检验序列相关性检验方法有多种,
但基本思路相同:首先,采用
OLS法估计模型,以求得随机误差项的“近似估计量”,
用ē;表示:ẽ,=Y
-(Y)os然
后
,通过分析这些“近似估计量”之间的相关
性,
以判断随机误差项是否具有序列相关性。三、序
列相关
性的检验基
本
思
路
:1、
图
示
法用e;的变化图形来判断μ₁
的序列相关性:相
关(
负
自
相
关
)关
(
正
自
相
关
)正序列相负序列以,为被解释变量,以各种可能的相关量,诸如以e,-1、
ē,_2
、e,²等为解释变量,建立各种方程:e,=pē-i+E,e,=P₁e-₁+P₂e₁-2+E;如果存在某一种函数形式,
使得方程显著成
立,则说明原模型存在序列相关性。回归检验法的优点是:
(1)能够确定序列相关的形式,
(2)适用于任何类型序列相关性问
题的检
验
。
2、回归检验法
3、
杜
宾-
瓦
森
(Durbin-Watson)检
验
法D-W检
验
是
杜
宾
(J.Durbin
)和瓦
森
(G.S.Watson)于1
951
年
提出的一
种
检
验
序列自
相关的
方法,
该方法的假定条件是:(1)
解
释
变
量X非随
机
;(2)随机误差项μ;为一阶自回归形式:μ₁=pμi-1+Ei(3)回归模型中不应含有滞后应变量作为解释变
量,
即不应出现下列形式:Y;=βo+β₁X₁+…βXk+γY₁-₁+μ;(4)回归含有截距项该统计量的分布与出现在给定样本中的X
值有复杂
的关系,因此其精确的分布很难得到。但是,他
们成功地导出了临界值的下限d₁和释
变
量的
个
数k有
关,
而
与
解
释
变
量X的
取
值
无关
。杜宾和瓦森针对原假设:
H₀:p=0,
阶自回归,构如下造统计量:上限d,且这些上下限只与样本的容量n和解D.W.统
计
量
:即不存在一(
1
)
计
算DW
值(2)给定
α,
由
n和
k
的大小查DW分布表
,得临
界值d
和
du
(3
)
比
较
、
判
断存在正
自相关不
能确
定无
自
相
关不
能
确
定存在负
自相关若
0<D.W.<dLd₁<D.W.<dudu
<D.W.<4—du4—du<D.W.<4—d₁自
相
关2负相关不能确定D.W
检验
步
骤
:不能确定精关4—d₁<D.W.<4O
d₁
du无当
D.W.值在2左右时,
模型
不
存
在
一
阶自相关
。证
明
:展
开D.W.
统计
量
:(*)致相等,则
(*)可以简化为:当n
较大时,这里,
为
一
阶自回
归
模
型μ;=Pμ;-1+E;的参数估计
。如
果
存
在
完
全
一
阶
正
相
关,
即p=1,完
全
一阶
负
相
关
,即
p=-1,
完
全
不
相
关
,
即
p=0,D.W.≈0D.W.≈4
D.W.≈2则则
则拉格朗日乘数检验克服了DW
检验的缺陷,适合
于高阶序列相关以及模型中存在滞后被解释变量
的
情
形。它是由布劳殊(
Breusch)
与戈弗雷(Godfrey)
于1978年提出的,也被称为GB检验。对于模型Y;=β₀+β₁X₁+β₂X₂;+…+βX+μ;如果怀疑随机扰动项存在p阶序列相关:μ₁=P₁H-i+P₂H₁-2·+PpH₁-p+∈t4、拉格
朗日乘数
(
Lagrange
multiplier)检验GB检验可用来检验如下受约束回归方程Y,=β₀+β₁Xu+…+βXu+P₁μ-+…+PpL-p+∈;约
束
条
件为
:H₀:
P₁=p₂=…=pp=0约束条件H₀为真时,大样本下LM=(n-p)R²~x²(p)其中,
n
为样本容量,
R²为如下辅助回归的可决系数:e,=β₀+β₁Xi+…+βXμ+H,-₁+…+Ppe,-p+E,给定α,查临界值xa²(p),与LM
值比较,做出判断,实际
检
验中,可
从1
阶、
2
阶
、
.
.
逐
次向
更
高
阶
检
验
。如果
模
型
被
检
验
证明
存
在
序列
相
关
性
,
则需
要
发
展
新的
方
法
估
计
模型
。最常用的方法是广义最小二乘法(
GLS:
Generalized
least
squares)
和广义差分法
(Generalized
Difference)。四
、
序
列
相
关
的
补
救Ω是一对称正定矩阵,存在一可逆矩阵D
,
使得2=DD对于模型Y=Xβ+μ如果存在序列相关,
同时存1、广义最小二乘法干
异
方
差
,
即
有该模型具有同方差性和随机误差项互相独立性:E(LL)=E(D-'μμ'D¹)=D-'E(μμ)D-'=D-¹σ²QD-¹=D-¹g²DDD-=G²I(*)式的OLS估计:β.=(X/X)¹X:Y。=(X(D-D-X)-XD-¹D-ly=(X'&-|X)-'X'Q'Y变换原模型
:即
D-
这就是原模型的广义最小二乘估计量(GLS是无偏的、有效的估计量。estimators),(*)如
何
得到
矩
阵
Ω
?对Ω的形式进行特殊设定后,才可得到其估计值。如设定随机扰动项为
一
阶序列相关形式则广义
差
分
法是将原模型
变换
为
满足OLS
法
的
差分模型,再
进
行OLS估
计。如果原模
型Y;=β₀+β₁X₁+β₂X₂;+…+βX+μ;存
在L₁=P₁H-1+P₂L-2+…+P₁L₁-i+∈;可以将原
模
型
变
换
为
:Y,-p₁Y-₁-…-p,Y-,=β₀(1-p₁-…-P)+β(X-p₁Xu-1-…-P,Xn-)+
…+β(Xa-P₁X-1-…-P,X-i)+E;该模型
为
广
义
差
分
模
型,不
存
在
序
列
相
关问
题
。
可进
行OLS
估计。2、广
义
差
分
法注
意
:●广义差分法就是上述广义最
小
二
乘
法
,但是却损失了部分样本观测值
。如:一阶
序
列
相
关的
情
况
下,
广
义
差
分
是
估
计Y,-pY,_,=β₀(1-p)+β(X₁-pX,-)+…+β(X-PX-)+Et=2,3,…,n去掉第
一
行
后
左
乘
原
模
型Y=X
但第
一
次
观
测
值
被
排除了
。β+|
μ
。即
运
用了GLS
法
,这相
当
于应用广义最小二乘法或广义差分法,必须已知随
机误差项的相关系数p₁,Pz,…,pt
。实际上,人们并不知道它们的具体数值,所以必
须首先对它们进行估计。常
用
的
估
计
方
法
有
:·科克伦-奥科特(Cochrane-Orcutt)迭代法。·
杜
宾
(durbin)
两
步
法3、
随机误差项相关系数的估计(
1
)
科
克
伦
-
奥
科
特
迭
代
法
。以一元线性模型为例:首先,采用OLS法估计原模型Y;=β₀+β₁X;+μ;得到的μ的“近似估计值”,并以之作为观测值使用OLS法估计下式Li=P₁μi-1+P₂ui-2+...P₁H₁-L+E得到ô,
p₂,….p,,作
为随
机
误
差
项的
相
关
系数
p,p₂,…,p,的第
一
次
估
计
值。求出μ,新的“近拟估计值”,
并以之作为样本观测
值,再次估计Li=P₁Hi-1+P₂Hi-2+...Prui-L+Ei得到p₁:p,,…p
的第
次估计值贪户,…
贪其次,将P,p…,
代入
广
义差分模型Y-p₁Y-…-p₁Y-,=β₀1-p,-…-p)+β₁(X;-p,X--…-p,X-)+E进行OLS
估计,得到B,B再次,将,β₁代回原模型i=1+l,2+l,…,nY;-βo+β₁X;+类似地,
可进行第三次、第四次迭代。关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次p₁,p₂,.,p的
估
计
值
之
差
小
于
这
一
精
度
时
,
迭
代
终止
,实践中,有
时
只
要
迭
代
两
次,
就
可
得
到
较
满
意
的结果。两次迭代过程也被称为科克伦-奥科特两步法
。(
2)
杜
宾
(durbin)
两
步
法该方法仍是先估计P,p₂,…p,
再
对
差
分模型
进
行
估
计第
一
步,变换差分模型为
下
列形式Y;=p₁Y_₁+…+p,Y-+β₀1-p.-…-p,)+β₁(X;-p₁X--…-p,X-)+E;
i=1+l,2+l,…,n进行OLS估计,得各Y;(j=i-1,i-2,…,i-1)前的系数p,,p₂,…p
的估计值·p,P…,p第二步,将估计的p,p₂.….p,代入差分模型Y₁-p₁Y
.-
…-p,Y-=β₀(1-p₁-…-P₁)+β(X,-P₁X--…-P,X-)+Ei=1+1,2+l,…,n采
用
OLS法
估
计,
得
到
参
数β₀(1
-
p₁-…-p,),β₁的估计量,记为
,β。于
是:B
。=β。/(1-p₁-…-p,),β₁=β;●
应用软件中的广义差分法在Eview/TSP软件包下,广义差分采用了科克伦-奥
科
特
(Cochrane-Orcutt)
迭
代法估计p。在解释变量中引入AR(
1)
、AR(2)
、…,
即可得
到参数和
p₁
、Pz
、
…的估计值。其中AR(m)
表示随机误差项的m
阶自回归。在估
计过程中自动完成了
p
、p2
、…
的迭代。注意:·如果能够找到一种方法,求得Q或各序列相关
系数p;的估计量,使得GLS能够实现,则称为
可行的广义最小二乘法(FGLS,FeasibleGeneralized
Least
Squares)
。·FGLS
估计量,也称为可行的广义最小二乘估计
量
(feasible
general
least
squares
estimators)·
可行的广义最小二乘估计量不再是无偏的,但
却是一致的,而且在科克伦-奥科特迭代法下,
估计量也具有渐近有效性。●
前
面
提
出
的
方
法
,
就
是FGL
S由
于
随
机
项
的
序
列
相
关
往
往
是
在
模
型
设
定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序
列相关(false
autocorrelation)
,
应在模型
设
定
中
排
除
。避
免
产
生
虚
假
序
列
相
关
性
的
措
施
是
在
开始
时
建
立
一
个
“
一
般
”
的
模
型
,
然
后
逐
渐
剔
除确实不显著的变量。4、虚假序列相关问题经济理论指出,
商品进口主要由进口国的经
济发展水平,以及商品进口价格指数与国内价格
指数对比因素决定的。由于无法取得中国商品进口价格指数,我们
主要研究中国商品进口与国内生产总值的关系。(
下
表
)
。五
、
案例
:
中
国
商
品
进
口
模
型资料来源:《中国统计年鉴》(1995、2000、2002)。国内
生
产
总
值商品进口国内生产总值商品进口GDPMGDPM(亿
元)(
亿
美
元
)(
亿
元
)(
亿
美
元
)19783624.1108.9199018547.9533.519794038.2156.7199121617.8637.919804517.8200.2199226638.1805.919814862.4220.2199334634.41039.619825294.7192.9199446759.41156.119835934.5213.9199558478.11320.819847171.0274.1199667884.61388.319858964.4422.5199774462.61423.7198610202.2429.1199878345.21402.4198711962.5432.1199982067.461657198814928.3552.7200089442.22250.9198916909.2591.4200195933.32436.1表4.2.1
1978~2001年中国商品进口与国内生产总值M,=152.91+0.02GDP,(2.32)
(20.12)R²=0.948
R2=0.946SE=154.9DW=0.6281.通过OLS法建立如下中国商品进口方程:2.进行序列相关性检验。·
DW
检
验取α=5%
,由于n=24,k=2
(包含常数项),查表得:d₁=1.27,
d₁=1.45由
于
DW=0.628<d
,,
故:
存在正自相关。拉格朗日乘数检验2
阶
滞
后
:
ẽ,=6.593-0.0003GDP,+1.094ẽ,₁
-0.786e,,(0.23)
(-0.50)(6.23)
(-3.69)R2=0.6614于是,LM=22×0.6614=14.55取α=5%,
x²分布的临界值x²o.os(2)=5.991LM>x²o.os(2)故:
存在正自相关3
阶
滞
后
:e,=6.692-0.0003GDP+1.108e-1-0.819e-2+0.032E,-3(0.22)
(-0.497)
(4.541)
(-1.842)
(0.087)R2=0.6615于是,LM=21×0.6614=13.89取α=5%,
x²分布的临界值x²oos(3)=7.815LM>x²o.os(3)表明:存在正自相关;但ět-3的参数不显著,说明不存在3阶序列相关性。(1)采用杜宾两步法估计p第一
步,估
计
模型M,=β₀+P₁M,-₁+P₂M,-2+β₁GDP,+β₂GDP,-₁+β₃GDP,-2+E,M,=78.09+0.938M-0.469M,-2+0.055GDP-0.096GDP+0.054GDP₂(1.76)
(6.64)(-1.76)
(5.88)(-5.19)
(5.30)R2=0.9913.R2=0.9886
、D.W.=2.31第二
步,
作
差
分
变
换
:M,=M,-(0.938M,--0.469M,-2)GDP;=GDP,-(0.938GDP_,-0.469GDP-2)3、运用
广
义
差
分法
进
行自
相
关
的
处
理则M*关
于GDP*的
OLS
估
计
结
果
为
:M,=86.18+0.020GDP(2.76)(16.46)R2=0.9313
R2=0.9279
D.W.=1.583取α=5%,
DW>d,=1.43
(样本容量24
-
2=22)表明:
已
不
存
在自
相
关为了
与OLS估
计
结
果
对比
,
计
算
房
:β₀=β1(I-p-p₂)=86.18/(1-0.938+0.469)=162.30于
是
原
模
型
为
:,=162.30+0.020GDP,与OLS
估计结果的差别只在截距项:
M,=152.91+0.02GDP,(2)采用科克伦-奥科特迭代法估计p在Eviews软包下,2阶广义差分的结果为:M,=169.32+0.020GDP,+1.108AR[1]-0.801AR[2](3.81)
(18.45)
(6.11)
(-3.61)R2=0.982
R²=0.979D.W.=1.85取α=5%
,DW>d₂=1.66
(样本容量:22)表明:广义差分模型已不存在序列相关性。可以验证:仅采用1阶广义差分,变换后的模
型仍存在1阶自相关性;采用3阶广义差分,变换后的模型不再有自相
关性,但AR[3]的系数的t值不显著。§4.3
多重共线性Multi-Collinearity§4.3多重共线性·
一
、
多重共线性的概念·
二、实际经济问题中的多重共线性·
三、多重共线性的后果·四、多重共线性的检验·
五、克服多重共线性的方法
·
六
、
案
例·
*七、分部回归与多重共线性对
于模
型Y;=β₀+β₁X₁+β₂X₂+…+BXki+μ₁i=1,2,...,n其基本
假
设
之
一
是
解
释
变
量
是
互
相
独
立的
。如
果
某
两
个
或
多
个
解
释
变
量
之
间
出
现
了
相
关性,则称为多重共线性(Multicollinearity)。一、多重共线性的概念其中:
c;不全为0,则称为解释变量间存在完全共线
性(perfect
multicollinearity)。如
果
存
在c₁X₁+c₂X₂₁+…+ckXk+v=0
i=1,2,...,n其中c;不全为0,
v;为随机误差项,则称为近似共线
性
(approximate
multicollinearity)或
交互相关
(intercorrelated)。如果存在c₁X₁+c₂X₂₁+…+c₁Xki=0i=1,2,...,n中,至少有一列向量可由其他列向量
(不包括第
一列)线性表
出。如
:X₂=λX₁,则
X₂对Y
的
作
用
可由X₁代
替。在矩阵
表
示的线性回归
模型Y=Xβ+μ中,完全
共
线
性
指:秩
(X)<k+1,即注
意
:完
全
共
线
性
的
情
况
并
不
多
见
,
一
般
出
现
的是在一定程度上的共线性,
即近似共线
性
。一般地,产生多重共线性的主要原因有以下三个
方
面
:(1)经济变量相关的共同趋势时间序列样本:经济繁荣时期,各基本经济
变量(收入、消费、投资、价格)都趋于增长;
衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动
力投入往往出现高度相关情况,大企业二者都
大,小企
业
都
小
。二、
实际经济问题中的多重共线性(
2
)
滞
后
变
量
的
引
入在经济计量模型中,往往需要引入滞
后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。(
3
)
样
本
资
料
的
限
制由于完全符合理论模型所要求的样本数据较难
收集,特定样本可能存在某种程度的多重共线性。一
般经
验
:时间序列数据样本:简单线性模型,往往存在多
重
共
线
性
。截面数据样本:问题不那么严重,但多重共线性仍
然
是
存
在的
。β=(X'X)-¹X'Y如果存在完全共线性,则(X’X)-1不存在,无法得
到参数的估计量。二、多重共线性的后果1、完全共线性下参数估计量不存在Y=X估
计
量
为
:的
OLSβ+μ例:
对离差形式的二元回归模型y=β₁x₁+β₂x₂+μ如果两个解释变量完全相关,如x₂=λx₁
,则
y=(B+λB)x₁+μ这时,只能确定综合参数β₁+λB
的估计值:B+aB₂=Zx₁y₁/Zx近似共线性下,可以得到OLS参数估计量,但参数估计量方
差的表达式为Cov(β)=σ²(X^X)-1由于IX’Xl≈0,引
起(X’X)-1
主对角线元素较
大,使参数估计值的方差增大,
OLS参数估计量
非有效。2、
近
似共
线性
下OLS
估
计量非
有效
恰
为X₁与X₂的线性相关系数的平方r²由于
r²≤1,
故
1/(1-r²)≥1仍以二元线性模型y=β₁x₁+βx₂+μ
为例:多
重
共线
性
使
参
数
估
计
值的
方
差
增
大
,1/(1-r²)为方
差
膨
胀因子(VarianceInflationFactor,VIF)表4.3.1方差膨胀因子表相
关
系
数
平
方00.50.80.90.950.960.970.980.990.999方
差
膨
胀因
子12510202533501001000当
完
全
不
共
线
时
,r²=0当
近
似
共
线
时
,0
<r²<1当
完
全
共
线时
,
r²=1,var(β)=var(β)=o²/Zxi如果模型中两个解释变量具有线性相关性,例如
X₂=λX₁,这时,
X₁
和X₂前的参数β₁、β并不反映各自与被解释变
量
之间的结构关系,
而是反映它们对被
解释变量的共同影响。β₁
、B₂已经失去了应有的经济含义,于是经常
表现出似乎反常的现象:
例如β₁本来应该是正
的
,
结果恰
是负的
。3、参数估计量经济含义不合理4、变量的显著性检验失去意义存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界值,
误导作出参数为0的推断可能将重要的解释变量排除在模型之外变大的方差容易使区间预测的“区间”变大,使预
测失
去
意
义
。5、模型的预测功能失效注意:除非是完全共线性,多重共线性并不意味
着任何基本假设的违背;因此,
即使出现较高程
度的多重
共
线
性,
OLS估计量仍具有线性性等良好的统计性质。问题在于,
即
使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上
无法给出真正有用的信息。多重共线性检验的任务是:(1)检验多重共线性是否存在;(2)估计多重共线性的范围,
即判断哪些变量之
间
存
在
共
线
性
。多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计
方法:如判定系数检验法、逐步回归检验法等。三、
多重共线性的检验(1)对两个解释变量的模型,
采用简单相关系数法求出X₁与X₂的简单相关系数r,
若Irl接近1,则说明两变量存在较强的多重共线性。(2)对多个解释变量的模型,
采用综合统计检验法若
在OLS法下:R2与F值较大,但t
检验值较小,
说明各解释变量对Y的联合线性作用显著,但各解
释变量间存在共线性而使得它们对Y的独立作用不
能分辨,故t
检验不显著。1、检验多重共线性是否存在如果存
在多
重
共
线
性,
需进一步确定究竟由哪
些变量引起。(1)判定系数检验法使模型中每一
个
解
释
变
量
分
别以其
余
解
释
变
量
为解释变量进行回归,
并计算相应的拟合优度。如果某一种回归Xji=α₁X₁+a₂X₂i+…QLXLi的判定系数较大,说明X;与其他X
间存在共线性。2、判
明存在多
重共
线
性
的范
围式中:R;.?为第j个解释变量对其他解释变量的回归
方
程的决
定
系
数
,若存在较强的共线性,则R;.2较大且接近于1,这
时(1-Rj,²)
较小,从而F;的值较大。因此,给定显著
性
水
平
α,
计
算F值,并与相应的临界值比
较,来
判
定
是
否
存
在
相
关
性
。具体可进
一
步
对
上
述回归方程作F
检验
:构造如
下F
统
计
量另
一
等
价
的
检
验是
:在模型中排除
某一个解释变量X;,
估
计模
型;如果拟合优度与包含X;时十分接近,则说明X;与其它解释变量之间存在共线性。(2)逐步回归法以Y为被解释变量,逐个引入解释变量,
构
成回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否独
立
。如果拟合优度变化显著,
则说明新引入的变量是一个独立解释变量;如果拟合优度变化很不显著,则说明新引入
的变量与其它变量之间存在共线性关系。以逐步回归法得到最广泛的应用。注意:这时,剩余解释变量参数的经济含义和数值都找出引起多重共线性的解释变量,将它排除出去
。如果模型被检验证明存在多重共线性,
则需要
发展新的方法估计模型,最常用的方法有三类。四、
克服多重共线性的方法1、第一类方法:
排除引
起共线性的变量发生了变化
。时间序列数据、线性模型:
将原模型变
换
为
差
分
模
型
:△Y;=β₁△X₁+β₂△X,;+.+βx
△
X+
△
μ可以有效
地
消
除
原
模
型中的多
重
共
线
性
。一
般
讲
,
增
量
之
间
的
线
性
关
系
远
比
总
量
之间的线性关系弱得多。2、第二类方法:
差分法表4.3.2
中国GDP与居民消费C的总量与增量数据(亿元)年份CYC/Y△C△Y△C/△Y19781759.13605.60.48819792005.44074.00.492246.3468.40.52619802317.14551.30.509311.7477.30.65319812604.14901.40.531287.0350.10.82019822867.95489.20.522263.8587.80.44919833182.56076.30.524314.6587.10.53619843674.57164.40.513492.01088.10.45219854589.08792.10.522914.51627.70.56219865175.010132.80.511586.01340.70.43719875961.211784.70.506786.21651.90.47619887633.114704.00.5191671.92919.30.57319898523.516466.00.518890.41762.00.50519909113.218319.50.497589.71853.50.318199110315.921280.40.4851202.72960.90.406199212459.825863.70.4822143.94583.30.468199315682.434500.70.4553222.68637.00.373199420809.846690.70.4465127.412190.00.421199526944.558510.50.4616134.711819.80.519199632152.368330.40.4715207.8981990.530199734854.674894.20.4652702.36563.80.412199836921.179003.30.4672066.54109.10.503199939334.482673.10.4762413.33669.80.658200042911.989112.50.4823577.56439.40.556例
如由表中的比值可以直观地看到,
增量
的线性关系弱于总量之间的线性关系。进
一
步
分
析
:Y与C(-1)
之间的判定系数为0.9988,△Y
与△C(-1)之间的判定系数为0.9567多重共线性的主要后果是参数估计量具
有较大的方差,所
以采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 核子仪表在核燃料循环设施风险评价与控制中的贡献考核试卷
- 仁果类水果种植园种植技术培训考核试卷
- 果蔬销售中的农产品市场预测与决策考核试卷
- 危险废物处理与环保产业国际合作考核试卷
- 化工产品批发商国际贸易规则考核试卷
- 橡胶制品行业的市场服务体系考核试卷
- 机械加工中的振动与噪声控制考核试卷
- 第三章 第三节《海陆变迁》第一课时教学设计-2024-2025学年湘教版七年级地理上册
- 体育场地设施安装中的节能技术应用考核试卷
- 未来趋势专业知识培训考核试卷
- 常见岩性名称及符号
- 多图中华民族共同体概论课件第十一讲 中华一家与中华民族格局底定(清前中期)根据高等教育出版社教材制作
- 2024民主评议个人工作总结(5篇)
- 泵房稳定计算
- 项目维修维保方案
- (高清版)DZT 0289-2015 区域生态地球化学评价规范
- (高清版)TDT 1040-2013 土地整治项目制图规范
- 正大与养猪户合作合同
- 新媒体概论(第2版 慕课版) 课件 第5章 新媒体广告
- 【锦江酒店成本控制现状、问题及优化建议分析8400字(论文)】
- 慢性心力衰竭的护理查房
评论
0/150
提交评论