计量经济学-多元线性回归(一)_第1页
计量经济学-多元线性回归(一)_第2页
计量经济学-多元线性回归(一)_第3页
计量经济学-多元线性回归(一)_第4页
计量经济学-多元线性回归(一)_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《计量经济学》

Econometrics

问题导入

1.影响消费支出的因素只有收入吗?

2.商品需求量只受价格影响吗?

3.工资由哪些变量引起?2关于模型中的趋势变量如果要考察消费与可支配收入的关系,可以引入时间趋势变量,目的是为模型能够描述消费与收入的真实关系(不受时间影响)因为个人消费与可支配收入这两个变量的共同特点是随时间而递增。在模型中引入时间变量,从而使消费与收入的关系为一种不依赖于时间的关系。3为什么要引入趋势变量?为了分析应变量与时间的关系趋势变量代替一个影响Y的基本变量(如技术进步、人口增长、经济发展等等)4第4章多元线性回归(一)

4.1多变量线性回归模型

4.2多元线性回归模型的若干假设

4.3多元线性回归模型的参数估计

4.4多元线性回归模型的拟合优度

4.5多元线性回归模型的参数检验

4.6多元线性回归模型的预测

4.7案例分析

54.1多变量线性回归模型总体回归模型:在线性回归模型中的解释变量有多个总体回归函数:6i=1,2…,n其中:k为解释变量的数目,j称为回归参数,也叫偏回归系数。表示在其他解释变量保持不变的情况下,Xj每变化1个单位时,Y的均值E(Y)的变化;即:j给出了Xj的单位变化对Y均值的“直接”(不含其他变量)影响。样本回归模型样本回归函数7kikiiiXXXYbbbbˆˆˆˆˆ22110++++=LikikiiieXXXY+++++=bbbbˆˆˆˆ22110L

ei称为残差或剩余项(residuals),可看成是总体回归函数中随机扰动项i的近似替代。8思考

假设要求建立一个计量经济学模型来说明在学院跑道上慢跑半个小时或半个小时以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者,你通过整个学年收集数据,得到两个可能的解释性方程:其中:Y为某天慢跑者的人数,X1为该天的降雨量,

X2为该天日照时间,

X3为该天的最高温度,

X4为第二天需交学期论文的班级数。请回答:(1)这两个方程你认为哪个更合理些?(2)为什么用相同的数据去估计相同变量的系数却得到不同的符号?4.2多元线性回归模型的若干假设关于X的假设X是确定性变量,不是随机变量各X之间不相关(无多重共线性)关于μ的假设零均值、同方差、不序列相关服从正态分布关于X与μ的假设X与μ不相关9零均值、同方差、不序列相关104.3多元线性回归模型的参数估计普通最小二乘估计11对于随机抽取的n组观测值如果样本函数的参数估计值已经得到,则有:i=1,2…n

根据最小二乘原理,参数估计值应该是右列方程组的解kikiiiXXXYbbbbˆˆˆˆˆ22110++++=L12于是得到关于待估参数估计值的正规方程组:即:解该(k+1)

个方程组成的线性代数方程组,即可得到(k+1)个待估参数的估计值随机误差项的方差的无偏估计

13

可以证明,随机误差项的方差的无偏估计量为:样本容量问题最小样本容量:样本最小容量必须不少于模型中解释变量的数目(包括常数项),即n≥k+1满足基本要求的样本容量:n30时,Z检验才能应用;

n-k≥8时,t分布较为稳定一般经验认为:当n≥30或者至少n≥3(k+1)时,才能说满足模型估计的基本要求。14多元回归模型参数估计实例人均消费水平、人均GDP、上一年度消费水平的关系(P23)建立模型Eviews实现(两种方法)直接在命令框中输入“lsYcXY(-1)”生成Y(-1),在打开一个新组,输入命令15请注意观察:此时的样本容量为多大?自由度为多大?16DependentVariable:XFMethod:LeastSquaresDate:03/22/13Time:08:54Sample:19782007Includedobservations:30VariableCoefficientStd.Errort-StatisticProb.C224.303555.648204.0307420.0004GDP0.3864340.00774449.901920.0000R-squared0.988881Meandependentvar2175.067AdjustedR-squared0.988484S.D.dependentvar2021.413S.E.ofregression216.9246Akaikeinfocriterion13.66132Sumsquaredresid1317576.Schwarzcriterion13.75473Loglikelihood-202.9198F-statistic2490.202Durbin-Watsonstat0.115833Prob(F-statistic)0.000000DependentVariable:XFMethod:LeastSquaresDate:03/22/13Time:08:56Sample(adjusted):19792007Includedobservations:29afteradjustingendpointsVariableCoefficientStd.Errort-StatisticProb.C89.4006927.310563.2734840.0030GDP0.1288270.0227855.6540610.0000XF(-1)0.7394490.06501811.372930.0000R-squared0.998127Meandependentvar2243.724AdjustedR-squared0.997983S.D.dependentvar2021.281S.E.ofregression90.77644Akaikeinfocriterion11.95237Sumsquaredresid214249.4Schwarzcriterion12.09382Loglikelihood-170.3094F-statistic6928.210Durbin-Watsonstat0.449287Prob(F-statistic)0.000000XF=C(1)+C(2)*GDPXF=C(1)+C(2)*GDP+C(3)*XF(-1)17XF=C(1)+C(2)*GDPXF=C(1)+C(2)*GDP+C(3)*XF(-1)多元回归的若干重要结论OLS估计量仍然是最佳线性无偏估计量线性性、无偏性、有效性样本回归线过均值点Y的估计的均值等于真实的Y的均值残差与X不相关残差与Y不相关184.4多元线性回归模型的拟合优度可决系数与调整的可决系数19记总离差平方和的分解自由度(n-1)=(n-k-1)+(k)20XiXSRFY21

可决系数该统计量越接近于1,模型的拟合优度越高。

问题:随着解释变量个数增加而减小,至少不会增加,所以R2是解释变量数目的增函数。

这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可——R2需调整,必须消除这种因素。22调整的可决系数调整的思路:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:其中:n-k-1为残差平方和的自由度

n-1为总体平方和的自由度k为回归平方和的自由度

23R2

与的性质调整的可决系数:使得具有不同样本容量和解释变量数目的回归方程可以进行拟合优度的比较。与的关系24赤池信息准则(AIC)与施瓦茨准则(SC)这两个准则均要求仅当所增加的解释变量能够减少AIC值或SC值时才在原模型中增加该解释变量。比较上例的输出结果中的AIC和SC,你的结论是什么?赤池信息准则和施瓦茨准则4.5多元线性回归模型的参数检验4.5.1参数显著性检验——t检验4.5.2参数的置信区间4.5.3方程显著性检验——F检验这部分与一元线性回归不同4.5.4R2与F统计量的关系254.5.3方程显著性检验——F检验26

模型的显著性检验就是检验模型的全体解释变量总体上对被解释变量是否存在明显的影响。即检验模型

中的参数j是否不全为0。即

可提出如下原假设与备择假设:H0:1=2==k=0H1:j不全为0i=1,2…,n27XiXSRFYF检验的思想来自于总离差平方和的分解式:

TSS=ESS+RSS28

如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。

因此,可通过该比值的大小对总体线性关系进行推断。由于回归平方和å=2ˆiyESS是解释变量X的联合体对被解释变量Y的线性作用的结果,考虑比值

29

根据数理统计学中的知识,在原假设H0成立的条件下,统计量

服从自由度为(k,n-k-1)的F分布。

给定显著性水平,可得到临界值F(k,n-k-1)

,由样本求出统计量F的数值,通过

来拒绝(或接受)原假设H0,以判定原方程总体上的线性关系是否显著成立。~F(k,n-k-1)4.5.1参数显著性检验——t检验必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。这一检验是由对变量的t检验完成的。3031

1、t统计量

32

2、t检验

原假设与备择假设:

给定显著性水平,可得到临界值t/2(n-k-1),由样本求出统计量t的数值,通过

t

t/2(n-k-1)或t≤-t/2(n-k-1)来拒绝或接受原假设H0,从而判定对应的解释变量是否应包括在模型中。如果显著性水平不太高,也不要简单地剔除变量,还要看它在模型及应用中的作用。H1:j0H0:j=0(i=1,2…k)注意:一元线性回归中,t检验与F检验一致

33检验步骤0,0,)()(4)(3)ˆ(ˆ205.0)1(00222不显著异于参数则不拒绝显著异于参数则拒绝,,若)判断:(

。分布表,找出)查()计算统计量:(。,如选择显著水平jjjiHHn-k-1ttn-k-1ttk-1nttStbbbbaaaaa<³-==34一个关于个人收入与物价水平及失业率的关系的回归方程如下(括号内为估计标准差):其中:W为第t年每位雇员的收入,P为第t年的物价水平,U为第t年的失业率。(1)对系数进行假设检验。(2)讨论Pt-1在理论上的正确性,是否可以从方程中删除?为什么?

4.5.2参数的置信区间35

参数的置信区间用来考察:在一次抽样中所估计的参数值离参数的真实值有多“近”。在(1-)的置信水平下i的置信区间是:

如何才能缩小置信区间?

增大样本容量n

提高模型的拟合优度提高样本观测值的分散度4.6多元线性回归模型的预测点预测区间预测364.7案例分析37生产函数是描述生产过程中投入的生产要素的某种组合与其最大的可能产出之间的数学依存关系的表达式。38取对数之后391.建立模型根据生产理论,建立模型:只有取对数后,才能将其变成线性模型估计模型直接在命令框中输入“lslog(Y)clog(k)log(L)”生成三个对数序列后再进行回归4041DependentVariable:LOG(Y)Method:LeastSquaresDate:03/22/13Time:11:20Sample:19872006Includedobservations:20VariableCoefficientStd.Errort-StatisticProb.LOG(K)0.8062760.02456532.821880.0000LOG(L)0.4026990.1420822.8342670.0114C-3.0082051.359114-2.2133580.0408R-squared0.997005Meandependentvar9.903467AdjustedR-squared0.996653S.D.dependentvar0.547656S.E.ofregression0.031686Akaikeinfocriterion-3.928423Sumsquaredresid0.017068Schwarzcriterion-3.779063Loglikelihood42.28423F-statistic2829.504Durbin-Watsonstat0.652073Prob(F-statistic)0.000000估计结果:(-2.21)(32.82)(2.83)2.模型检验(1)经济意义检验

(2)变量显著性检验p值均小于0.05,显著(3)方程显著性检验 F统计量的p值小于0.01,显著423.预测已知2007年固定资本存量为117908.2亿元,就业人数为76990.00万人。打开Workfile窗口,Procs/Structure/ResizeCurrent将k和l序列中录入2007年数据再次得到回归模型Equation/procs/forecast,将范围改为1987——2007打开yf序列,即可观测到1987-2007年度的所有预测值43课后练习:2、5、7、10、12、1344知识延伸:受约束回归我们对参数的显著性检验仅仅是对系数是否显著为0进行的检验,如果要对参数之间的关系进行检验,该如何做?——受约束回归45一、模型参数的线性约束46例如对模型:施加约束:得:或:(1)(2)如果对(2)式回归得出:则由约束条件可得:这些约束条件是否为真,需要进行检验常用F检验47XiXSRFY受约束与无约束模型都有相同的TSS受约束样本回归模型的残差平方和RSSR>=无约束RSSU48

这意味着,通常情况下,对模型施加约束条件会降低模型的解释能力。但是,如果约束条件为真,则受约束回归模型与无约束回归模型具有相同的解释能力,RSSR

与RSSU的差异变小。可用RSSR-RSSU的大小来检验约束的真实性

根据数理统计学的知识:于是:?注意,kU-kR恰为约束条件的个数。二、对回归模型增加或减少解释变量49考虑如下两个回归模型(1)(2)(1)式可看成是(2)式的受约束回归:H0:相应的F统计量为:50

如果约束条件为真,即额外的变量Xk+1,…,Xk+q对Y没有解释能力,则F统计量较小;否则,约束条件为假,意味着额外的变量对Y有较强的解释能力,则F统计量较大。因此,可通过F的计算值与临界值的比较,来判断额外变量是否应包括在模型中。应用:51下表列出了1960-1982美国家庭人均鸡肉年消费量Y与家庭月收入X,鸡肉价格P1、猪肉价格P2、牛肉价格P3、每磅鸡肉替代品的综合真实价格P23(猪肉与牛肉的零售价格的加权平均)的相关数据。综合练习YEARY人均鸡肉消费量X1人均真实可支配收入p1每磅鸡肉的真实零售价格p2每磅猪肉的真是零售价格p3:每磅牛肉的真实零售价格p23:每磅鸡肉替代品的综合真实价格196027.8397.542.250.778.365.8196129.9413.338.15279.266.9196229.8439.240.35479.267.8196330.8459.739.555.379.269.6196431.2492.937.354.777.468.7196533.3528.638.163.780.273.6196635.6560.339.369.880.476.3196736.4624.637.865.983.977.2196836.7666.438.464.585.578.1196938.4717.840.17093.784.7197040.4768.238.673.2106.193.3197140.3843.339.867.8104.889.7197241.8911.639.779.1114100.7197340.4931.152.195.4124.1113.5197440.71021.548.994.2127.6115.3197540.11165.958.3123.5142.9136.7197642.71349.657.9129.9143.6139.2197744.11449.456.5117.6139.2132197846.71575.563.7130.9165.5132.1197950.61759.161.6129.8203.3154.4198050.11994.258.9128219.6174.9198151.72258.166.4141221.6180.8198252.92478.770.4168.2232.6189.452现在考虑下面的需求函数,请回答以下问题:(1)你会选择哪个模型,为什么?(2)你怎样解释模型中X和P1的系数?(3)模型2和模型4的设定有何不同?(4)如果你采用第四个模型,可能会遇到什么问题?(5)因为模型5中包含牛肉和猪肉的综合价格,你认为函数5比和函数4更好吗?(6)猪肉和牛肉是鸡肉的竞争或替代品吗?你怎样知道?(7)假定函数5是正确的,估计此模型,解释你的结果(8)如果你使用了“错误”模型2,通过考察系数的关系,评估这个模设定错误的后果。53(1)模型5看起来最好,因为它包含了所有经济相关的变量,其中P3,还可以减少模型中变量的个数,减轻猪肉价格与牛肉价格之间可能存在的多重共线性。(2)lnX前的系数代表了收入弹性,lnP1系数代表了鸡肉价格弹性。(3)4同时考虑了牛肉和猪肉(4)如果采用模型4,则模型中猪肉和牛肉价格之间存在多重共线性(5)是的,因为有助于减轻多重共线性(6)应该是替代品(7)(8)54假如现在要考虑鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。系数分别代表收入弹性、自价格弹性、与猪肉的交叉价格弹性和与牛肉的交叉价格弹性,根据经济理论,我们预期:lnx前的系数>0;lnp1的系数<0;lnp2的系数>0,如果鸡肉和猪肉是替代品;<0,如果鸡肉和猪肉是互补品;=0,如果鸡肉和猪肉是无关产品看输出的模型,猪肉和牛肉的系数并不显著,于是我们认为,鸡肉和两者不相干,做出假设:55结论:?鸡肉的需求不依赖于猪肉和牛肉的价格。自价格弹性小于0,绝对值小于1,说明什么?56结论:?57第四章结束练习题为了研究投资率(投资占GDP的比例)与储蓄率(储蓄占GDP的比例)之间的关系,马丁和查尔斯得到21个国家的样本数据。每个国家的投资率是1960——1974年间的平均投资率,储蓄率是同期的平均储蓄率。变量INVERATE表示投资率,SAVRATE表示储蓄率。(1)将投资率对储蓄率描点(2)基于这个描点图,你认为如下模型对这些数据的拟合效果同样好吗?线性——

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论