CHP3多元线性回归模型11课件_第1页
CHP3多元线性回归模型11课件_第2页
CHP3多元线性回归模型11课件_第3页
CHP3多元线性回归模型11课件_第4页
CHP3多元线性回归模型11课件_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第三章多元线性回归模型(2)一、

基本概念回顾二、基本假设三、检验四、自变量关系

2一,概念:1、偏回归系数:1、与双变量模型一样分为确定性成分和随机性成分。2、YXU也分别为被解释变量、解释变量随机扰动项。3不同的是回归系数我们称之为偏回归系数3偏回归系数讨论:经济学中的比较静态分析与偏回归系数的含义!问题:我们如何评价某一解释变量对被解释变量的真实影响?如:如何评价X2对Y变化的真实贡献?控制住X3影响!5步骤三6一般形式:对于有个解释变量的线性回归模型模型中参数是偏回归系数,样本容量为偏回归系数:控制其它解释量不变的条件下,第个解释变量的单位变动对应变量平均值的影响。7指对各个回归系数而言是“线性”的,对变量则可是线性的,也可是非线性的例如:生产函数取自然对数2、线性9

用矩阵表示10二、多元线性回归模型的基本假定

假设1,解释变量是非随机的或固定的,且各X之间互不相关(无多重共线性)。

假设2,随机误差项具有零均值、同方差及不序列相关性。11

假设3,解释变量与随机项不相关假设4,随机项满足正态分布

13假设4,向量

有一多维正态分布,即

假设3,E(X’)=0,即

转置假设5,回归模型的设定是正确的。141、修正的可决系数可决系数只涉及变差,没有考虑自由度。如果用自由度去校正所计算的变差,可纠正解释变量个数不同引起的对比困难。。三、多元回归检验152、F检验4、T检验17四、自变量关系1、筛选自变量,偏F。与FC1819判定系数比较的前提条件:被解释变量相同:不同解释变量的判定系数不可比样本容量相同矫正的判定系数可作为增减变量的依据2、判定系数21但是,如果约束条件为真,则受约束回归模型与无约束回归模型具有相同的解释能力,RSSR

与RSSU的差异变小。

可用RSSR

-RSSU的大小来检验约束的真实性于是:

讨论:如果约束条件无效,RSSR

与RSSU的差异较大,计算的F值也较大。

于是,可用计算的F统计量的值与所给定的显著性水平下的临界值作比较,对约束条件的真实性进行检验。注意,kU-kR恰为约束条件的个数。

利用约束条件判定对回归模型增加或减少解释变量考虑如下两个回归模型(*)(**)(*)式可看成是(**)式的受约束回归:H0:相应的F统计量为:

如果约束条件为真,即额外的变量Xk+1,…,Xk+q对Y没有解释能力,则F统计量较小;否则,约束条件为假,意味着额外的变量对Y有较强的解释能力,则F统计量较大。因此,可通过F的计算值与临界值的比较,来判断额外变量是否应包括在模型中。讨论:

F统计量的另一个等价式因此,检验的F统计量为:

记RSS1与RSS2为在两时间段上分别回归后所得的残差平方和,容易验证,于是参数稳定性的检验步骤:

(1)分别以两连续时间序列作为两个样本进行回归,得到相应的残差平方:RSS1与RSS2

(2)将两序列并为一个大样本后进行回归,得到大样本下的残差平方和RSSR

(3)计算F统计量的值,与临界值比较:

若F值大于临界值,则拒绝原假设,认为发生了结构变化,参数是非稳定的。

该检验也被称为邹氏参数稳定性检验(Chowtestforparameterstability)。

2、邹氏预测检验

上述参数稳定性检验要求n2>k。如果出现n2<k

,则往往进行如下的邹氏预测检验(Chowtestforpredictivefailure)。

邹氏预测检验的基本思想:

先用前一时间段n1个样本估计原模型,再用估计出的参数进行后一时间段n2个样本的预测。

如果预测误差较大,则说明参数发生了变化,否则说明参数是稳定的。分别以、表示第一与第二时间段的参数,则其中,

如果

=0,则=,表明参数在估计期与预测期相同(*)(*)的矩阵式:可见,用前n1个样本估计可得前k个参数的估计,而不外是用后n2个样本测算的预测误差X2(-)(**)如果参数没有发生变化,则=0,矩阵式简化为(***)(***)式与(**)式这里:KU-KR=n2RSSU=RSS1分别可看成受约束与无约束回归模型,于是有如下F检验:

第一步,在两时间段的合成大样本下做OLS回归,得受约束模型的残差平方和RSSR

第二步,对前一时间段的n1个子样做OLS回归,得残差平方和RSS1

第三步,计算检验的F统计量,做出判断:

邹氏预测检验步骤:

给定显著性水平,查F分布表,得临界值F(n2,n1-k-1)

如果F>F(n2,n1-k-1)

,则拒绝原假设,认为预测期发生了结构变化。

例3.6.2

中国城镇居民食品人均消费需求的邹氏检验。

1、参数稳定性检验1981~1994:RSS1=0.003240

1995~2001:

(9.96)(7.14)(-5.13)(1.81)1981~2001:

(14.83)(27.26)(-3.24)(-11.17)

给定=5%,查表得临界值F0.05(4,13)=3.18

判断:F值>临界值,拒绝参数稳定的原假设,表明中国城镇居民食品人均消费需求在1994年前后发生了显著变化。

2、邹氏预测检验给定=5%,查表得临界值F0.05(7,10)=3.18判断:F值>临界值,拒绝参数稳定的原假设*四、非线性约束

也可对模型参数施加非线性约束,如对模型施加非线性约束12=1,得到受约束回归模型:

该模型必需采用非线性最小二乘法(nonlinearleastsquares)进行估计。

非线性约束检验是建立在最大似然原理基础上的,有最大似然比检验、沃尔德检验与拉格朗日乘数检验.1、最大似然比检验

(likelihoodratiotest,LR)

估计:无约束回归模型与受约束回归模型,

方法:最大似然法,

检验:两个似然函数的值的差异是否“足够”大。

记L(,2)为一似然函数:无约束回归

:Max:受约束回归

:Max:或求极值:

g():以各约束条件为元素的列向量,’:以相应拉格朗日乘数为元素的行向量

约束:g()=0

受约束的函数值不会超过无约束的函数值,但如果约束条件为真,则两个函数值就非常“接近”。

由此,定义似然比(likelihoodratio):

如果比值很小,说明两似然函数值差距较大,则应拒绝约束条件为真的假设;

如果比值接近于1,说明两似然函数值很接近,应接受约束条件为真的假设。

具体检验时,由于大样本下:

h是约束条件的个数。因此:

通过LR统计量的2分布特性来进行判断。

在中国城镇居民人均食品消费需求例中,对零阶齐次性的检验:LR=-2(38.57-38.73)=0.32

给出=5%、查得临界值20.05(1)=3.84,

判断:LR<20.05(1),不拒绝原约束的假设,

表明:中国城镇居民对食品的人均消费需求函数满足零阶齐次性条件。

2、沃尔德检验(Waldtest,W)

沃尔德检验中,只须估计无约束模型。如对

在所有古典假设都成立的条件下,容易证明

因此,在1+2=1的约束条件下

可建立沃尔德统计量:

如果有h个约束条件,可得到h个统计量z1,z2,…,zh

约束条件为真时,可建立大样本下的服从自由度为h的渐近2

分布统计量

其中,Z为以zi为元素的列向量,C是Z的方差-协方差矩阵。因此,W从总体上测量了无约束回归不满足约束条件的程度。对非线性约束,沃尔德统计量W的算法描述要复杂得多。

3、拉格朗日乘数检验

拉格朗日乘数检验则只需估计受约束模型.

受约束回归是求最大似然法的极值问题:

’是拉格朗日乘数行向量,衡量各约束条件对最大似然函数值的影响程度。

如果某一约束为真,则该约束条件对最大似然函数值的影响很小,于是,相应的拉格朗日乘数的值应接近于零。因此,拉格朗日乘数检验就是检验某些拉格朗日乘数的值是否“足够大”,如果“足够大”,则拒绝约束条件为真的假设。

拉格朗日统计量LM本身是一个关于拉格朗日乘数的复杂的函数,在各约束条件为真的情况下,服从一自由度恰为约束条件个数的渐近2分布。

n为样本容量,R2为如下被称为辅助回归(auxiliaryregression)的可决系数:

如果约束是非线性的,辅助回归方程的估计比较复杂,但仍可按(*)式计算LM统计量的值。

最后,一般地有:LMLRW

同样地,如果为线性约束,LM服从一精确的2分布:(*)453、受约束的OLS一般的多元模型都是非受限(约束)模型。因此我们用OLS估计时,称为非受限最小二乘。经济理论有时会提出某一回归模型中的系数满足一些线性等式约束条件。当具备这个约束条件后,方程是否有效,要进行检验例如,考虑柯布一道格拉斯生产函数中的规模报酬不变每一同比例的投入变化有同比例的产出变化即检验中,有两种方法(t检验和F检验)46对模型施加约束得或(*)(**)如果对(**)式回归得出则由约束条件可得:47

但是,如果约束条件为真,则受约束回归模型与无约束回归模型具有相同的解释能力,RSSR

与RSSU的差异变小。如果约束条件无效,RSSR

与RSSU的差异较大,计算的F值也较大于是,可用计算的F统计量的值与所给定的显著性水平下的临界值作比较,对约束条件的真实性进行检验。48t检验49七、参数的置信区间

参数的置信区间用来考察:在一次抽样中所估计的参数值离参数的真实值有多“近”。在变量的显著性检验中已经知道:50容易推出:在(1-)的置信水平下j的置信区间是

其中,t/2为显著性水平为、自由度为n-k-1的临界值。

51如何才能缩小置信区间?

增大样本容量n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小;提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小,置信区间的就越窄。在实际应用中,我们希望置信度越高越好,置信区间越小越好。52第五节案例分析案例:中国税收增长的分析提出问题改革开放以来,随着经济体制改革的深化和经济的快速增长,中国的财政收支状况发生很大变化,为了研究影响中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济模型。53理论分析影响中国税收收入增长的主要因素可能有:(1)从宏观经济看,经济整体增长是税收增长的基本源泉。(2)社会经济的发展和社会保障等都对公共财政提出要求,公共财政的需求对当年的税收收入可能会有一定的影响。(3)物价水平。中国的税制结构以流转税为主,以现行价格计算的GDP和经营者的收入水平都与物价水平有关。(4)税收政策因素。54

以各项税收收入Y作为被解释变量以GDP表示经济整体增长水平以财政支出表示公共财政的需求以商品零售价格指数表示物价水平税收政策因素较难用数量表示,暂时不予考虑建立模型55模型设定为:其中:

各项税收收入(亿元)

国内生产总值(亿元)

财政支出(亿元)

商品零售价格指数(%)56数据来源:《中国统计年鉴》其中:

——各项税收收入(亿元)

——国内生产总值(亿元)

——财政支出(亿元)

——商品零售价格指数(%)数据收集57假定模型中随机项满足基本假定,可用OLS法估计其参数。具体操作:用EViews软件,估计结果为:参数估计58t检验:给定,查t分布表,在自由度为时临界值为,因为的参数对应的t统计量均大于2.080,这说明在5%的显著性水平下,斜率系数均显著不为零,表明国内生产总值、财政支出、商品零售价格指数对财政收入分别都有显著影响。59本模型中所估计的参数的符号与经济理论分析一致,说明在其他因素不变的情况下,国内

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论