计量经济学 第2版 课件 第3、4章 多元线性模型、多重共线性_第1页
计量经济学 第2版 课件 第3、4章 多元线性模型、多重共线性_第2页
计量经济学 第2版 课件 第3、4章 多元线性模型、多重共线性_第3页
计量经济学 第2版 课件 第3、4章 多元线性模型、多重共线性_第4页
计量经济学 第2版 课件 第3、4章 多元线性模型、多重共线性_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ECONOMETRICS第三章多元线性回归模型教学目的和要求0105040302了解多元线性回归模型及古典假定掌握多元线性回归模型OLS法的基本原理了解高斯—马尔柯夫定理掌握多元线性回归模型统计检验的意义和方法掌握多元线性回归EVIEWS软件实现课程内容01040302多元线性回归模型及其经典假定多元线性回归模型的估计多元线性回归模型的统计检验多元线性回归模型预测引子:什么造就了中国高储蓄?中国是全球国家总储蓄水平最高的经济体之一。1990~2001年,国民储蓄率约为GDP的35%~40%,2010年达到历史峰值,约为GDP的50.7%。此后国民储蓄率出现下降,但相比国际平均水平,中国的储蓄率仍然高于全球大多数国家。2019-2022年,平均家庭储蓄率分别为29.9%、34.1%、31.4%、33.5%,疫情导致中国家庭储蓄率再度上升。是何种原因造就了中国的高储蓄率呢?传统的国民储蓄涉及三大块,一是家庭部门储蓄,二是企业部门储蓄,三是政府部门储蓄。每个储蓄部门均涉及多项原因,如家庭储蓄更依赖于人口结构变化、社会保障体系、房改等;企业及政府部门则依赖于进出口贸易、财政收入等。

因此,简单线性回归模型无法实现这类多因素问题研究,从而需要引入包含多个解释变量的回归分析方法。

3.1多元线性回归模型及其经典假定

多元总体回归函数

多元样本回归函数

多元线性回归模型的矩阵形式

B

矩阵形式

偏回归系数

3.1.2多元线性回归模型的经典假定

经典假定

经典假定

3.2多元线性回归模型的估计

普通最小二乘法

普通最小二乘估计表达式

OLS估计统计性质

3.2.2随机误差项方差的估计

3.3多元线性回归模型的统计检验

多重可决系数

修正的可决系数

修正的可决系数

赤池信息准则、施瓦茨准则和汉南-奎因准则3.3.2偏回归系数的显著性检验

t检验

t检验

t检验的p值

3.3.3回归模型的总体显著性检验

F检验

统计检验间的关系

3.4多元线性回归模型预测

3.4.1被解释变量点预测

3.5案例分析

模型估计

模型检验思考与练习

参考文献[1]汪伟.经济增长、人口结构变化与中国高储蓄[J].经济学(季刊),2010,9(01):29-52.[2]Kelley,A.,andR.Schmidt,“Saving,DependencyandDevelopment”,JournalofPopulationE-conomics,1996,9(4),365-386.[3]庞皓.计量经济学(第四版)[M].北京:科学出版社,2019.1[4]孙敬水.中级计量经济学[M].上海:上海财经大学出版社,2009.1ECONOMETRICS第四章教学目的和要求0304050102了解多重共线性的含义及其

产生的原因理解多重共线性产生的影响掌握多重共线性的检验方法掌握多重共线性的修正方法掌握多重共线性检验及修正的EVIEWS软件实现课程内容03040102多重共线性的含义及成因多重共线性产生的后果多重共线性的检验多重共线性的修正引子:工业增加值会阻碍公共预算收入增加吗?44财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上取决于财政收入的充裕状况。大多数相关研究文献中都把总税收、国内生产总值这两个指标作为影响财政收入的基本因素,还有一些文献中也提出了其他一些变量,比如其他收入、经济发展水平、就业人数等。为了分析各要素对国家财政收入对影响,建立一般公共预算收入(Y)为被解释变量,国内生产总值(X1)、税收收入(X2)、就业人员数(X3)和工业增长值(X4)作为解释变量的多元线性回归模型。建立回归结果发现,模型对可决系数为0.9995,修正的可决系数为0.9994,模型拟合效果好。F统计量为7414.819,表明在显著性水平为0.05条件下,回归方程整体显著。t检验发现,X1、X2、X4对Y的影响都是显著的,但是X4的回归系数为负值,表明工业增长值越大,财政收入越少,这与我们对经济的认识不符合。为什么会出现这个违反常理的结果呢?如果模型设定合理、数据证实,可能是什么原因导致的?4.1

多重共线性的含义及成因454.1.1多重共线性的含义对于多元线性回归模型:Yi

0

1X1i

k

X

ki

i如果模型的解释变量之间存在较强的线性相关关系,或者说,存在一组不全为零的常数,……,,使得

1

X1i

2

X

2i

......

k

X

ki

i

0其中是一个随机误差项,则称模型存在着多重共线性(Multi-collinearity)。它可分为两种情况:若

i

0 ,

模型存在完全多重共线性。若

i

0 ,模型存在不完全多重共线性。1.经济变量之间内在的联系。 这是模型产生多重共线性的主要原因。2.经济变量之间变化的共同趋势。3.样本数据的原因。4.引入滞后变量。464.1.2多重共线性的成因4.2.1完全多重共线性产生的后果1.参数的估计值不确定47对于k元线性回归模型设解释变量矩阵X为:X4.2 多重共线性产生的后果Yi

0

1

X1i

k

X

ki

i

1

1

1=

Xk1

X12

X

1

1 X

21X

12 X

22

X

1n X2

n

Xkn

2.参数估计值的方差无限大48494.2.2不完全多重共线性下产生的后果如果模型中存在不完全的多重共线性,可以得到参数的估计值,但是对计量经济分析可能会产生一系列的影响。1.参数估计值的方差增大当增大时也增大2502 2211ˆ=2i 232i 23σ

2Var(

β

2

)

=

σx (1-

r

)x (1-

r2)

23r^2Var(

)2.难以分析每个解释变量的单独影响3.检验的可靠性降低4.预测失去意义514.3 多重共线性的检验524.3.1简单相关系数法如果解释变量之间存在相关系数的绝对值大于0.8的现象,则模型中存在多重共线性的可能性则很大。此法只是判断有无共线性的充分条件,而非必要条件。在EViews软件中可以直接计算解释变量间的相关系数矩阵。1.命令方式COR解释变量1解释变量2…

解释变量2.菜单方式将所有解释变量设置成一个数组,并在数组窗口中点击View/Correlations.4.3.2辅助回归模型法53若多元性回归方程有k个解释变量,分别建立每一个解释变量对其它剩余解释变量的线性回归方程,可以获得k个辅助方程。X

f

X ,

X ,

,

X ,

,

X ,

i 1 2 j k i如果其中某些方程F检验显著,则表明存在多重共线性,所对应的原解释变量可以近似地用其它解释变量线性表示。4.3.3方差扩大因子法544.3.4经验判断法551.当增加或剔除一个解释变量时,若回归参数的估计值发生较大变化,则回归模型可能存在严重的多重共线性。2.定性分析认为某个或某些解释变量重要,但对其偏回归系数进行t检验不显著,此时可怀疑是由于模型存在多重共线性所引致。3.当所估计的解释变量系数的符号与经济理论分析设定不一致时,则模型可能存在多重共线性。4.4 多重共线性的修正56对于存在多重共线性的回归方程,为了能获得较好的分析结果,要设法消除或减弱共线性的不利影响。但并非所有的多重共线性都必须处理。对于下列情况,即使存在多重共线性问题也可不作处理:一是,多重共线性不严重,不会从根本上给模型估计带来非常严重的后果;二是如果应用模型进行预测,只要模型的拟合优度较高,并且解释变量的相关类型在预测期内保持不变,则可以忽略多重共线性的问题。4.4.1剔除次要变量57当回归方程中存在严重的多重共线性时,可以删除引起多重共线性不重要的解释变量。一般是直接剔除存在如下情况的解释变量:与被解释变量的相关系数数绝对值较小;偏回归参数t检验不显著;方差扩大因子(VIF)较大;估计的回归参数符号与经济理论或实际相背离。但在采用此法时要采取审慎态度,避免产生新的问题,如剔除这些变量后是否影响模型经济意义的相对完整性、是否会引发模型产生异方差性或自相关性。4.4.2利用先验信息先验信息是指从经济理论或实际资料中所获得的关于解释变量间的关系的信息。把这种先验信息作为约束条件对原模型进行变形,以间接减少解释变量个数,进而消除模型中的多重共线性。例如以Cobb-Dauglas

生产函数为基础建立计量模型Y

AL

K

e

其中劳动投入量L与资金投入量K之间往往是高度相关的,回归参数α+β的经济意义为规模报酬,如果假定规模报酬不变(即α+β=1),则可变形为

L记 y=Y/L,

k=K/L则C-D生产函数可以表示成:y=AkβA( ) eL

Y

K利用OLS法估计出 Aˆ

ˆ

,进而得到58

ˆ

1

ˆ由于 ,变量之间的线性相关性大大减弱,从而差分模型的多重共线性59问题将减轻甚至消除,此时可以估计差分方程。但差分变化会带来信息损失问题,特别是均值信息损失,另外,差分方程可能会存在自相关性问题,所以,在实际运用中需要谨慎处理。4.4.3变换模型形式1、差分变换法对二元回归方程Yt

0

1X1t

2X2t

t对各变量进行差分变化,得到差分模型

Yt

1

X1t

2

X2t

t

X1t

X2t用宏观经济数据建立模型时,可以对变量进行对数变换,建立双对数模型。对数变换后的新变量之间的相关性大大减弱,用新变量建立的回归模型的多重共线性程度会大大降低。此外,对数变换还可以降低模型异方差性问题,解决时间序列数据平稳性问题,是实际应用中效果比较好的一种数据处理方法602.对数变换处理4.4.4逐步回归法61逐步回归法的原理是:先选择与被释变量相关关系最为密切的解释变量建立一元模型,然后再将其它解释变量逐个引入模型,分别建立二元、三元、

四元模型。每引入一个变量,需对模型进行经济检验和统计显著性检验,并从中选择一个相对最优的模型,这样逐步引入—剔除—引入,直到模型之外所有变量均不显著时为止。4.4.5主成分回归法62主成分分析(PrincipalComponentAnalysis,PCA),

是一种统计方法。该方法通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。主成分回归法(principle

component

regression,PCR)是以主成分为自变量进行回归分析的一种参数估计方法,因为主成分之间没有线性相关性,可以解决多重共线性问题。主成分回归的具体步骤如下:63644.5 案例分析654.5.1样本选取财政收入是衡量一国政府财力的重要指标,

政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上取决于财政收入的充裕状况。大多数相关的研究文献中都把总税收、国内生产总值这两个指标作为影响财政收入的基本因素,还有一些文献中也提出了其它一些变量,比如其它收入、经济发展水平、就业人数等。现以国内生产总值、税收收入、工业增长值和就业人数作为影响财政收入的主要研究因素,建立我国财政收入计量经济模型,具体数据见表4-1。初步设定了如下形式的计量经济模型:Yi

0

1X1i

2X2i

3X3i

4X4i

i

利用EViews

软件,生成Y、X1、X2、X3、X4等数据,采用OLS

法估计模型参数,得到的回归结果如图所示。66初建模型分析=0.9994,可决系数很高,F检验值7414.819,模型显著。当显著性水平

α =0.05时,解释变量X1、X2、X4系数的t检验均显著,X3系数的t检验不显著。但是从经济意义上看,X4参数估计值的符号与预期相反,表明城工业增加值越多,一般公共预算收入将会越少,结果不合理。这表明模型很可能存在严重的多重共线性。该模型R2

=

0.9995

,R

2671.简单相关系数法为证实是否存在多重共线性,计算各解释变量相互之间的相关系数,在EViews

中选择X1、X2、X3、X4数据,单击view/covarianceAnalysis,在对话框中选correlation/ok,即得相关系数矩阵。68为了进一步了解多重共线性的性质,作辅助回归,即将每个X

变量分别作为被解释变量都对其余的X变量进行回归,分别建立各个解释变量的辅助模型,观察辅助回归模型及修正可决系数。建立的4个辅助回归模型。692、辅助回归模型法辅助回归模型X1X2X3X4F检验X1=f(X2,X3,X4)

3.7360(1.4458)***-31.9480(-3.0156)***1.6210(0.8778)**827.2328***X2=f(X1,X3,X4)0.0788(2.5841)***

1.0907(0.5717)0.2900(2.4113)***1234.836***X3=f(X1,X2,X4)-0.0113(-3.0156)***0.0184(0.5717)

0.0432(2.9477)***80.7664***X4=f(X1,X2,X3)0.1084(1.8468)**0.9192(2.4114)***8.1211(2.9477)***

1253.651***根据以上辅助回归模型的R2值和据VIF的计算公式,可以得到VIF1=156.1037、VIF2=232.5581、VIF3=16.1436、VIF4=236.0718,都远远大于10,解释变量X1、X2、X3、X4之间存在较为严重的多重共线性。在EViews

中,也可以直接计算解释变量的方差扩大因子,在Equation

回归结果中单击View/Coefficient

Diagnostics/Variance

Inflation

Factors

即可。3.方差膨胀因子法704.5.4多重共线性的修正1.利用逐步回归法(1)利用Eviews软件命令COR

Y X1 X2 X3 X4)得到观察被解释变量Y与解释变量的相关系数矩阵,发现X2是关系最密切的解释变量,以此建立一元回归方程。71(2)将X1、X3、X4分别引入一元回归方程,估计3个二元回归方程,估计结果。从表中可以看出,回归方程Y=f(X2,X4)中两个解释变量X2和X4的t检验都能显著通过,R2有所提高,此二元回归方程应该保留。72(3)以Y=f(X2,X4)

为基础回归方程,分别引入X1和X3建立2个三元回归方程,结果发现这两个三元回归方程都不能保证所有解释变量显著性检验通过。所以,建立的多元回归模型为:Yˆi=474.7738+1.4885X2i

0.1533X4i模型X1X2X3X4

R

2 R

2Y=f(X2)1.2145(133.8733)***0.99900.9989Y=f(X2,X1)0.0169(1.0628)1.1196(12.4726)***0.99900.9989Y=f(X2,X3)1.2406

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论