多元线性回归模型计量经济学PPT学习教案_第1页
多元线性回归模型计量经济学PPT学习教案_第2页
多元线性回归模型计量经济学PPT学习教案_第3页
多元线性回归模型计量经济学PPT学习教案_第4页
多元线性回归模型计量经济学PPT学习教案_第5页
已阅读5页,还剩125页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1多元线性回归模型计量经济学多元线性回归模型计量经济学ikikiiiXXXY 22110i=1,2,n其中:k为解释变量的数目,j称为回归参数(regression coefficient)。第1页/共130页ikikiiiXXXY 22110也被称为总体回归函数的随机表达形式。它 的非随机表达式为:kikiikiiiiXXXXXXYE 2211021),|(表示:各变量X值固定时Y的平均响应。 习惯上:把常数项看成为一虚变量的系数,该虚变量的样本观测值始终取1。于是:模型中解释变量的数目为(k+1) 第2页/共130页总体回归模型n个随机方程的矩阵表达式为: XY其中: j也被称为偏回

2、归系数,表示在其他解释变量保持不变的情况下,X j每变化1个单位时,Y的均值E(Y)的变化(j=1,2, ,k); 或者说j给出了X j的单位变化对Y均值的“直接”或“净”(不含其他变量)影响。第3页/共130页)1(212221212111111knknnnkkXXXXXXXXXX1)1(210kk121nn用来估计总体回归函数的样本回归函数为:第4页/共130页kikiiiiXXXY22110其随机表示式: ikikiiiieXXXY22110 ei称为残差或剩余项(residuals),可看成是总体回归函数中随机扰动项i的近似替代。 样本回归函数的矩阵表达: XY或eXY其中:k10ne

3、ee21e第5页/共130页0)(iE22)()(iiEVar0)(),(jijiECovnjiji, 2 , 1,第6页/共130页0),(ijiXCovkj,2 , 1 假设4,随机项满足正态分布 ), 0(2Ni第7页/共130页上述假设的矩阵符号表示 式: 假设1,n(k+1)矩阵X是非随机的,且X的秩=k+1,即X满秩。 假设2, 0)()()(11nnEEEEnnEE11)( 21121nnnEI22211100)var(),cov(),cov()var(nnn第8页/共130页假设4,向量 有一多维正态分布,即 ),(2I0N 同一元回归一样,多元回归还具有如下两个重要假设: 假

4、设5,样本容量趋于无穷时,各解释变量的方差趋于有界常数,即n时, 假设3,E(X)=0,即 0)()()(11iKiiiiiKiiiiEXEXEXXE第9页/共130页knnkxxxx1111x假设6,回归模型的设定是正确的。 jjjijiQXXnxn22)(11Qxx n1或第10页/共130页 一、普通最小二乘估计 *二、最大或然估计 *三、矩估计 四、参数估计量的性质 五、样本容量问题 六、估计实例 第11页/共130页第12页/共130页kjniXYjii, 2 , 1 , 0, 2 , 1),(如果样本函数的参数估计值已经得到,则有: KikiiiiXXXY22110i=1,2n 根

5、据最小二乘原理,参数估计值应该是右列方程组的解 0000210QQQQk其中2112)(niiiniiYYeQ2122110)(nikikiiiXXXY第13页/共130页 于是得到关于待估参数估计值的正规方程组: kiikikikiiiiikikiiiiiikikiiikikiiXYXXXXXYXXXXXYXXXXYXXX)()()()(221102222110112211022110 解该(k+1) 个方程组成的线性代数方程组,即可得到(k+1) 个待估参数的估计值$, , ,jj 012。k第14页/共130页正规方程组的矩阵形式nknkknkkiikikikiiiikiiYYYXXXX

6、XXXXXXXXXXXXn212111211102112111111即YXX)X(由假设1,XX满秩,故有 YXXX1)(第15页/共130页 将上述过程用矩阵表示如下: 即求解方程组:0)()(XYXY0)(XXXYYXYY0)2(XXXYYY第16页/共130页0XXYX得到: YXXX1)(XXYX于是:例3.2.1:在例2.1.1的家庭收入-消费支出例中, 53650000215002150010111111)(22121iiinnXXXnXXXXXXXX第17页/共130页39468400156741112121iiinnYXYYYYXXXYX可求得: 0735. 10003. 00

7、003. 07226. 0)(1EXX于是: 7770. 0172.10339648400156740735. 10003. 00003. 07226. 021E第18页/共130页正规方程组 的另一种写法对于正规方程组 XXYXXXeXXX于是 0eX或 (*)或(*)是多元线性回归模型正规方程组的另一种写法。 (*)(*)0ie0iijieX第19页/共130页样本回归函数的离差形式ikikiiiexxxy2211i=1,2n 其矩阵形式为:exy其中 :nyyy21yknnnkkxxxxxxxxx212221212111xk21 在离差形式下,参数的最小二乘估计结果为 kkXXY110y

8、xxx1)(第20页/共130页随机误差项的方差的无偏估计 可以证明,随机误差项的方差的无偏估计量为: 1122knkneiee第21页/共130页ikikiiiXXXY 22110易知),(2XiNYiY的随机抽取的n组样本观测值的联合概率)()(21)(212122222211022)2(1)2(1),(),(XYXYeeYYYPLnXXXYnnnkikiiin第22页/共130页 对数或然函数为)()(21)2()( 2*XYXYnLnLLnL对对数或然函数求极大值,也就是对 )()(XYXY求极小值。即为变量Y的或然函数 第23页/共130页 因此,参数的最大或然估计为YXXX1)(结

9、果与参数的普通最小二乘估计相同第24页/共130页YXX)X(并对它进行求解而完成的。 该正规方程组 可以从另外一种思路来导: XYXXXYXXX(YX)求期望 :0XYX)(E第25页/共130页0XYX)(E称为原总体回归方程的一组矩条件,表明了原总体回归方程所具有的内在特征。 0)1X(YXn第26页/共130页由此得到正规方程组 YXXX解此正规方程组即得参数的MM估计量。 易知MM估计量与OLS、ML估计量等价。矩方法是工具变量方法(Instrumental Variables,IV)和广义矩估计方法(Generalized Moment Method, GMM)的基础第27页/共1

10、30页 在矩方法中关键是利用了 E(X)=0 如果某个解释变量与随机项相关,只要能找到1个工具变量,仍然可以构成一组矩条件。这就是IV。 如果存在k+1个变量与随机项不相关,可以构成一组包含k+1方程的矩条件。这就是GMM。第28页/共130页 同时,随着样本容量增加,参数估计量具有: 渐近无偏性、渐近有效性、一致性。第29页/共130页 1、线性性 CYYXXX1)(其中,C=(XX)-1 X 为一仅与固定的X有关的矩阵。 2、无偏性 XXXXXXXYXXX11)()()()()()(1EEEE第30页/共130页 3、有效性(最小方差性) 这里利用了假设: E(X)=0第31页/共130页

11、其中利用了 YXXX1)(XXXXXXX11)()()(和I2)(E第32页/共130页 最小样本容量 样本最小容量必须不少于模型中解释变量的数目(包括常数项),即 n k+1因为,无多重共线性要求:秩(X)=k+1第33页/共130页 2、满足基本要求的样本容量 从统计检验的角度: n30 时,Z检验才能应用; n-k8时, t分布较为稳定 一般经验认为: 当n30或者至少n3(k+1)时,才能说满足模型估计的基本要求。 模型的良好性质只有在大样本下才能得到理论上的证明第34页/共130页解释变量:人均GDP:GDPP 前期消费:CONSP(-1)估计区间:19792000年第35页/共13

12、0页Eviews软件估计结果 LS / Dependent Variable is CONS Sample(adjusted): 1979 2000 Included observations: 22 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 120.7000 36.51036 3.305912 0.0037 GDPP 0.221327 0.060969 3.630145 0.0018 CONSP(-1) 0.451507 0.170308 2.651125 0.0158 R-sq

13、uared 0.995403 Mean dependent var 928.4946 Adjusted R-squared 0.994920 S.D. dependent var 372.6424 S.E. of regression 26.56078 Akaike info criterion 6.684995 Sum squared resid 13404.02 Schwarz criterion 6.833774 Log likelihood -101.7516 F-statistic 2057.271 Durbin-Watson stat 1.278500 Prob(F-statist

14、ic) 0.000000 第36页/共130页第37页/共130页则2222)()(2)()()()(YYYYYYYYYYYYYYTSSiiiiiiiiii 总离差平方和的分解第38页/共130页由于: )()(YYeYYYYiiiiikiikiiieYXeXee110=0所以有: ESSRSSYYYYTSSiii22)()(注意:一个有趣的现象 222222YYYYYYYYYYYYYYYYYYiiiiiiiiiiii第39页/共130页 可决系数TSSRSSTSSESSR12该统计量越接近于1,模型的拟合优度越高。 问题:在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大。 这就

15、给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。 但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,因此,R2需调整。第40页/共130页 调整的可决系数(adjusted coefficient of determination) 在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:) 1/() 1/(12nTSSknRSSR其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。第41页/共130页11)1 (122knnRR第42页/共130页nk

16、nAIC) 1(2lnee施瓦茨准则(Schwarz criterion,SC) nnknAClnlnee这两准则均要求仅当所增加的解释变量能够减少AIC值或AC值时才在原模型中增加该解释变量。 第43页/共130页 Eviews的估计结果显示: 中国居民消费一元例中: AIC=7.09 , SC=7.19 中国居民消费二元例中: AIC=6.68 , SC=6.83从这点看,可以说前期人均居民消费CONSP(-1)应包括在模型中。 第44页/共130页 1、方程显著性的F检验 即检验模型 Yi=0+1X1i+2X2i+ +kXki+i i=1,2, ,n中的参数j是否显著不为0。(j=1,2

17、, ,k)第45页/共130页 可提出如下原假设与备择假设: H0: 1=2= =k=0 H1: j不全为0,j=1,2, ,k F检验的思想来自于总离差平方和的分解式: TSS=ESS+RSS由于回归平方和2iyESS是解释变量X的联合体对被解释变量Y的线性作用的结果,考虑比值 22/iieyRSSESS第46页/共130页 如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。 因此,可通过该比值的大小对总体线性关系进行推断。(为了消除变量个数的影响,除以各自的自由度) 根据数理统计学中的知识,在原假设H0成立的条件下,统计量 ) 1/(/k

18、nRSSkESSF第47页/共130页服从自由度为(k , n-k-1)的F分布。 给定显著性水平,可得到临界值F(k,n-k-1),由样本求出统计量F的数值,通过 F F(k,n-k-1) 或 FF(k,n-k-1)来拒绝或接受原假设H0,以判定原方程总体上的线性关系是否显著成立。 第48页/共130页对于中国居民人均消费支出的例子: 一元模型:F=2859.235 二元模型:F=2057.271给定显著性水平 =0.05,查分布表,得到临界值: 一元例:F(1,21)=4.32 二元例: F(2,19)=3.52显然有 F F(k,n-k-1) ,即二个模型的线性关系在95%的水平下显著成

19、立。第49页/共130页) 1/()1 (/22knRkRF) 1/() 1/(12nTSSknRSSR) 1/(/knRSSkESSF可推出:kFknnR1112,或TSSESSR 2,第50页/共130页值无穷大。时,值也越大;当越大,;时,同向变化:当与FRFRRRF11F02222第51页/共130页 在中国居民人均收入-消费一元模型中, 在中国居民人均收入-消费二元模型中, 第52页/共130页第53页/共130页 1、t统计量 由于12)()(XXCov 其中2为随机误差项的方差,在实际计算时,用它的估计量代替: 1122knkneieei+1,i+1icVar2)(ki,.,1

20、, 0则设(,)()11kijcXX第54页/共130页因此,可构造如下t统计量 ) 1(11, 1kntkneecStiiiiiiiii=0,1,2,k),(1, 12 iiiicN第55页/共130页 2、t检验 设计原假设与备择假设: H1:i0 给定显著性水平,可得到临界值t/2(n-k-1),由样本求出统计量t的数值,通过 |t| t/2(n-k-1) 或 |t|t/2(n-k-1)来拒绝或接受原假设H0,从而判定对应的解释变量是否应包括在模型中。 H0:i=0 (i=0,1,2k) 第56页/共130页注意:一元线性回归中,t检验与F检验一致 一方面,t检验与F检验都是对相同的原假

21、设H0:1=0 进行检验; 另一方面,两个统计量之间有如下关系: 222212221222122212212)2()2()2()2(txnexnexnenexneyFiiiiiiiiii第57页/共130页在中国居民人均收入-消费支出二元模型例中,由应用软件计算出参数的t值:651. 2630. 3306. 3210ttt给定显著性水平=0.05,查得相应临界值: t0.025(19) =2.093。 可见,计算的所有t值都大于该临界值,所以拒绝原假设。即:包括常数项在内的3个解释变量都在95%的水平下显著,都通过了变量显著性检验。第58页/共130页) 1(1kntkneecStiiiiii

22、ii第59页/共130页容易推出:在(1-)的置信水平下i的置信区间是 ($,$)$iitstsii22 其中,t/2为显著性水平为、自由度为n-k-1的临界值。 在中国居民人均收入-消费支出二元模型例中,给定=0.05,查表得临界值:t0.025(19)=2.093第60页/共130页计算得参数的置信区间: 0 : (44.284, 197.116) 1 : (0.0937, 0.3489 ) 2 : (0.0951, 0.8080)170. 04515. 0061. 02213. 051.3670.120210210sss 从回归计算中已得到:第61页/共130页如何才能缩小置信区间? 增

23、大样本容量n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小; 提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小。第62页/共130页1)(XX第63页/共130页一、E(Y0)的置信区间 二、Y0的置信区间第64页/共130页对于模型 XY 给 定 样 本 以 外 的 解 释 变 量 的 观 测 值X0=(1,X10,X20,Xk0),可以得到被解释变量的预测值:X00Y 它可以是总体均值E(Y0)或个值Y0的预测。 但严格地说,这只是被解释变量的预测值的估计值,而不是预测值。 为了

24、进行科学预测,还需求出预测值的置信区间,包括E(Y0)和Y0的置信区间。 第65页/共130页易知 )()()()(00YEEEYEXXX000)()()(20()X(XXX0000EEYVar0102000)()()(XXXXX)(XX)(X00EEYVar第66页/共130页容易证明 ),(020XX)X(XX100NY) 1(knt)E(YY00010XX)X(X于是,得到(1-)的置信水平下E(Y0)的置信区间:010000100)()()(22XXXXXXXXtYYEtY其中,t/2为(1-)的置信水平下的临界值。第67页/共130页000YYe容易证明 0)()()()(10000

25、0000XXXXXXXEEEeE)(1 ()()()(01022100200XXXXXXXXEeEeVar第68页/共130页e0服从正态分布,即 )(1 (, 0(01020XXXXNe)(1 (010220XXXXe构造t统计量 ) 1(000kntYYte可得给定(1-)的置信水平下Y0的置信区间: 010000100)(1)(122XXXXXXXXtYYtY第69页/共130页 中国居民人均收入-消费支出二元模型例中:2001年人均GDP:4033.1元, 于是人均居民消费的预测值为 2001=120.7+0.22134033.1+0.45151690.8=1776.8(元) 实测值(

26、90年价)=1782.2元,相对误差:-0.31% 预测的置信区间 :第70页/共130页00004. 000001. 000828. 000001. 000001. 000285. 000828. 000285. 088952. 1)(1XX3938. 0010XX)X(X于是E(2001)的95%的置信区间为: 3938.05 .705093.28 .1776或 (1741.8,1811.7)第71页/共130页3938. 15 .705093. 28 .1776或 (1711.1, 1842.4) 同样,易得2001的95%的置信区间为第72页/共130页第73页/共130页第74页/共

27、130页一、模型的类型与变换 1、倒数模型、多项式模型与变量的直接置换法 例如,描述税收与税率关系的拉弗曲线:抛物线 s = a + b r + c r2 c0 s:税收; r:税率设X1 = r,X2 = r2, 则原方程变换为 s = a + b X1 + c X2 ck。 如果出现n2F(n2, n1-k-1) ,则拒绝原假设,认为预测期发生了结构变化。第113页/共130页 例3.6.2 中国城镇居民食品人均消费需求的邹氏检验。 1、参数稳定性检验19811994:)ln(92. 0)ln(08. 0)ln(05. 163. 3)ln(01PPXQRSS1=0.003240 19952

28、001:01ln71. 0ln06. 3ln55. 078.13lnPPXQ (9.96) (7.14) (-5.13) (1.81) 第114页/共130页19812001: 01ln39. 1ln14. 0ln21. 100. 5lnPPXQ (14.83) (27.26) (-3.24) (-11.17) 34.10)821/()000058. 0003240. 0(4/)0000580. 0003240. 0(013789. 0F给定=5%,查表得临界值F0.05(4, 13)=3.18第115页/共130页 结论:F值临界值,拒绝参数稳定的原假设,表明中国城镇居民食品人均消费需求在1

29、994年前后发生了显著变化。 2、邹氏预测检验65. 4) 1314/(003240. 07/ )003240. 0013789. 0(F给定=5%,查表得临界值F0.05(7, 10)=3.18 结论: F值临界值,拒绝参数稳定的原假设 第116页/共130页kkXXXY22110 施加非线性约束12=1,得到受约束回归模型: *211101kkXXXY第117页/共130页第118页/共130页1、最大似然比检验 (likelihood ratio test, LR) 估计:无约束回归模型与受约束回归模型, 方法:最大似然法, 检验:两个似然函数的值的差异是否“足够”大。 记L(,2)为一似然函数:无约束回归 : Max:),(2L受约束回归 : Max:),(2L约束:g()=0第119页/共130页或求极值:)(),(2gL g():以各约束条件为元素的列向量, :以相应拉格朗日乘数为元素的行向量 受约束的函数值不会超过无约束的函数值,但如果约束条件为真,则两个函数值就非常“接近”。22,L,L

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论