计量经济学第三章_第1页
计量经济学第三章_第2页
计量经济学第三章_第3页
计量经济学第三章_第4页
计量经济学第三章_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量经济学第三章第一页,共五十九页,编辑于2023年,星期五一、估计问题多元线性回归模型多元线性回归模型的假设偏回归系数的OLS估计偏回归系数的含义第二页,共五十九页,编辑于2023年,星期五1.多元线性回归模型设因变量y是k-1个解释变量x2,x3,…xk和误差项的线性函数:

yi=1+2x2i+3x3i+…+kxki+ii=1,2,…n

其中:1为常数项,2,3,…

k为偏回归系数这一模型实际上包含n个方程:

y1=1+2x21+3x31+kxk1+1……yn=1+2x2n+3x3n+kxkn+n第三页,共五十九页,编辑于2023年,星期五多元回归模型的矩阵表示Y=X+Un×1n×1n×kk×1注意:解释变量个数为k-1第四页,共五十九页,编辑于2023年,星期五2.多元回归模型的假设假设1:x2,x3,…xk是非随机的。假设2:E(i)=0i=1,2,…n假设3:Var(i)=2(E(ii)=2)假设4:无序列相关,E(ij)=0假设5:x诸变量间无准确的线性关系,即:无多重共线性。数学表示为:不存在一组不全为零的数2、3、…k,使得:2x2i+3x3i+…+

kxki=0假设6:iN(0,2)第五页,共五十九页,编辑于2023年,星期五关于多重共线性的进一步说明如果存在一组不全为零的数2、3、…k,使得:

2x2i+3x3i+…+

kxki=0

不妨设20,则上式可变为:

x2i=-(3x3i+…+

kxki)/2称解释变量之间存在完全共线性,此时,某个解释变量可以写为其它解释变量的线性组合。如果,会不会破坏无多重共线假定?不会,因为这两个变量的关系是非线性的!!第六页,共五十九页,编辑于2023年,星期五经典假设的矩阵表示假设2:假设3和4:假设5:矩阵X的秩等于回归参数的个数(或解释变量个数加1),R(X)=k,n>k第七页,共五十九页,编辑于2023年,星期五3.偏回归系数的OLS估计二元回归的样本回归函数为:OLS估计:极值条件正规方程解此联立方程既可求得参数估计值第八页,共五十九页,编辑于2023年,星期五OLS估计量的方差和标准误自变量相关程度越高,参数估计的方差越大。当x2和x3完全共线时,方差趋于无穷。第九页,共五十九页,编辑于2023年,星期五OLS估计量的性质在经典线性模型假定下,可证明,偏回归系数的OLS估计量满足高斯-马尔可夫定理。OLS回归线的性质:三变量回归线通过各观测值均值

残差和ŷi不相关,即:第十页,共五十九页,编辑于2023年,星期五4.偏回归系数的含义二元回归模型为:yi=1+2x2i+3x3i+i

偏回归系数告诉我们什么偏回归系数表示了其他因素不变时,相应解释变量对因变量的“净影响”。第十一页,共五十九页,编辑于2023年,星期五例1“期望扩充”菲利普斯曲线菲利普斯曲线表明:通货膨胀率和失业率是反向变化的。期望扩充菲利普斯曲线增加了预期通货膨胀率的影响。1970-1982年美国真实通货膨胀率y(%)、失业率x2(%)和与其通货膨胀率x3(%)数据如表,作菲利普斯曲线。原始菲利普斯曲线:yt=b1+b12x2t+1t期望扩充菲利普斯曲线:yt=1+2x2t+3x3t+t

第十二页,共五十九页,编辑于2023年,星期五b122估计值为正,失业率与通胀率同方向?符号正确,统计显著。统计上不显著异于0例1“期望扩充”菲利普斯曲线估计结果原始菲利普斯曲线期望扩充菲利普斯曲线设定偏误?第十三页,共五十九页,编辑于2023年,星期五a1=-1.392472=22表示了x3不变时,x2单位变化到值的y均值的变化例1偏回归系数2的含义做三步回归:yt=b1+b13x3t+1t

X2t=b2+b23x3t+2t1t=a0+a12t+3t1t=yt-b1-b13x3t

表示除去x3对y的线性影响后的yt值2t=x2t-b2–b23x3t

表示除去x3对x2的线性影响后的x2t值净化了的yt对净化了的x2t的回归:系数a1反映了x2的单位变化对y的真实或“净”影响第十四页,共五十九页,编辑于2023年,星期五E(b12)=2+3b32

b12不仅度量了x2对y的净影响,还包括了x2对x3的影响而间接对y产生的影响2=-1.392472b122?设定偏误初探yt=b1+b12x2t+1tyt=1+2x2t+3x3t+t

b12=0.244934x3t=b2+b32x2t+2t

x3t

=-0.725280+1.113857x2tb32=1.113857第十五页,共五十九页,编辑于2023年,星期五5.复判定系数R2以二元回归为例,复判定系数R2定义如下:ESSRSSTSS0R21,R2=1时,所拟合的回归线100%地解释y的变异。第十六页,共五十九页,编辑于2023年,星期五校正的复判定系数R2的重要性质:模型中解释变量个数的非减函数,即随着解释变量个数的增加,R2几乎必然增大,不减小。易给人错觉:要使模型拟合得更好,只要在方程中加入新的变量即可。校正的判定系数定义如下:对有k-1个解释变量的多元回归方程

n-k为残差平方和的自由度

n-1为总平方和的自由度是真实方差的一个无偏估计为y的样本方差校正指对R2中的平方和用其自由度校正第十七页,共五十九页,编辑于2023年,星期五二、相关分析简单相关系数偏相关系数复相关系数第十八页,共五十九页,编辑于2023年,星期五1.简单相关系数两个变量间的相关系数总体相关系数:由于总体参数未知,样本相关系数:样本项关系数与回归系数的关系一元线性回归方程:样本标准误rxy=0时,即当x与y线性无关时,回归系数应为0,反之亦然。第十九页,共五十九页,编辑于2023年,星期五例2某地一年级12名女大学生的体重x与肺活量y数据如表,试计算肺活量与体重的相关系数,并检验两者间是否有直线相关关系。求解过程:AnalyzeCorelateBivariate第二十页,共五十九页,编辑于2023年,星期五1.简单相关系数相关矩阵:多个变量两两之间的简单相关系数形成的矩阵。例3手表需求:手表价格、销售量和人均收入之间的相关矩阵。第二十一页,共五十九页,编辑于2023年,星期五2.偏相关系数偏相关定义:在多个变量y,x1,x2,…xk之间,如果只考虑两个变量之间的真实相关关系,而排除其他变量对它们的影响(或者说其他变量保持不变),这种相关成为偏相关。在偏相关中,根据被固定的变量数目的多少,可分为零阶偏相关(即简单相关)、一阶偏相关、二阶偏相关、…(k-1)阶偏相关等。偏相关系数:用来衡量偏相关程度的数量指标。例:为x3保持不变下y和x2的一阶偏相关系数第二十二页,共五十九页,编辑于2023年,星期五简单相关系数vs偏相关系数r12·3与r12的关系r12=0时,r12·3并不为0,除非r13或r23为0。r12·3与r12不一定同号。

即使r13=r23=0,r12不一定为0,即y与x3不相关,x2与x3也不相关,但并不意味着y与x2不相关。如果y与x2的偏向关系数为0,意味着在消除了x3对每个变量的线性影响后,y与x2之间没有线性关联,这时我们可以下结论说:在模型中x2对y没有直接影响。第二十三页,共五十九页,编辑于2023年,星期五例4某地15名13岁男童身高x1(cm)、体重x2(kg)、和肺活量y(ml)的数据如表。试对该资料做控制体重影响的身高与肺活量的偏相关分析。步骤:AnalyzeCorelatePartial选“身高”和“肺活量”为分析变量,“体重”为控制变量,“双尾检验”,“显示实际显著性水平”选项:同时输出均值和标准差及零阶相关系数第二十四页,共五十九页,编辑于2023年,星期五偏判定系数可称为偏判定系数,并可解释为y的变异中未被x2

解释的部分,由于x3被引进到模型总来而得到解释的比例。复判定系数R2、简单相关系数以及偏判定系数之间的关系由x2和x3解释的部分由x2单独解释的部分未被x2解释的部分乘以在x2影响保持不变下由x3解释的比例解释变量个数的非减函数第二十五页,共五十九页,编辑于2023年,星期五3.复相关系数R定义:指反映多个变量y,x2,…xk,其中一个变量y于其他所有变量相关程度的度量指标。

复相关系数意义不大第二十六页,共五十九页,编辑于2023年,星期五三、推断问题关于单个偏回归系数的假设检验方程总显著性检验检验两个或多个系数是否相等检验偏回归系数是否满足某种约束条件检验所估计的回归模型在时间上或在不同截面上的稳定性检验回归模型的函数形式第二十七页,共五十九页,编辑于2023年,星期五㈠单个偏回归系数假设检验假设iN(0,2),便可用t检验统计量对任一个别偏回归系数的假设进行检验。单零检验:H0:2=0;H1:20

检验统计量服从自由度为n-3的t分布服从n-4的t分布例:检验两个回归系数是否相等:

H0:2=3H0:2-3=0H1:23H1:2-30第二十八页,共五十九页,编辑于2023年,星期五㈡方程显著性检验概念:对二元线性回归方程,

H0:2=3=0

H1:2和3不同时为0

被称作对所估回归系数的总显著性检验,即检验y是否与x2和x3有线性关系。——联合检验。联合检验与单零检验是否等同?即是否能通过对偏回归系数逐一进行单零检验,以此来检验联合假设呢?否!Cov(2,3)未必是0第二十九页,共五十九页,编辑于2023年,星期五1.多元回归的总显著性检验给定多元线性回归方程

yi=1+2x2i+3x3i+…+kxki+i联合检验为:

H0:2=3=…=k=0H1:全部回归系数不同时为0检验统计量如果F>F(k-1,n-k),或由F得到的p值足够小,则拒绝H0

,否则不要拒绝。第三十页,共五十九页,编辑于2023年,星期五2.R2与F的关系假定干扰为正态分布,从上式可看出,F与R2是通向变化的:当R2=0时,F=0R2越大,F值也越大。当R2=1时,F∞∴F检验既是所估回归的总显著性的一个度量,也是R2的一个显著性检验第三十一页,共五十九页,编辑于2023年,星期五3.一个解释变量的“边际”贡献例51956-1970年美国个人消费PCE(y)和个人可支配收入PDI(x2)数据如表。做回归:yt=b1+b12x2t+1t(1)针对可能存在的谬误相关,引入时间趋势变量x3做新回归:yt=1+2x2t+3x3t+t(2)第三十二页,共五十九页,编辑于2023年,星期五3.一个解释变量的“边际”贡献解释变量的“边际”贡献:指当计量经济模型已存在若干个解释变量时,再新增加一个解释变量,这个解释变量的引入是否相对于RSS来说,“显著地”增加了ESS,从而增加了R2。例5:美国个人消费支出和个人可支配收入模型,yt=b1+b12x2t+1t(1)新增加一个时间趋势变量x3,模型变为:yt=1+2x2t+3x3t+t(2)新模型的判定系数R2是否由于新解释变量x3的引入而显著增加了——x3的边际贡献问题第三十三页,共五十九页,编辑于2023年,星期五新变量增量贡献的方差分析表变异来源平方和(SS)df均方和ESS仅由于x2ESS由于x3的加入ESS由于x2和x3RSS总计(TSS)Q2=Q3-Q1Q4=Q5-Q3112n-3n-1Q1/1Q2/1Q3/2Q4/n-3为了评估x3的增量贡献,构造F统计量:第三十四页,共五十九页,编辑于2023年,星期五例5时间趋势变量的边际贡献变异来源平方和(SS)df均方和ESS仅由于x2ESS由于x3的加入ESS由于x2和x3RSS总计(TSS)Q1=65898.2354Q2=Q3-Q1=66.866Q3=65965.10098Q4=77.16902Q5=66042.27112121465898.266.86632982.66.43075F服从(1,12)的F分布,查F表可知F值在1%水平上显著,∴时间变量的引入显著地增大ESS,应把时间变量加到模型中来第三十五页,共五十九页,编辑于2023年,星期五四、多元线性回归模型的延伸线性回归模型的普遍性对数线性模型——测度弹性半对数模型——测量增长率倒数模型多项式回归受约束的最小二乘法:检验线性等式约束第三十六页,共五十九页,编辑于2023年,星期五1.线性回归模型的普遍性“线性”一词的含义:两重对解释变量线性:y的条件期望值是xi的线性函数对参数线性:y的条件期望是诸参数的线性函数我们前面给出的模型:yi=1+2x2i+3x3i+kxki+ii=1,2,…n符合哪种含义?线性回归指对参数为线性的回归,对解释变量x可以非线性。通过适当的变换,就可得到标准多元线性回归模型。第三十七页,共五十九页,编辑于2023年,星期五2.对数线性模型——测度弹性对数线性模型的特点:斜率系数2测度了y对x的弹性:第三十八页,共五十九页,编辑于2023年,星期五例6美国咖啡需求:1970-1980美国咖啡消费(y)与平均真实零售价格(x)数据如表,(x=名义价格/食品与饮料的消费者价格指数,1967年=100),求咖啡消费函数。输入数据散点图:确定函数形式:y-x;lny-lnx建立模型:lny=+lnx+i参数估计:第三十九页,共五十九页,编辑于2023年,星期五线性模型对数线性模型R2=0.6631=-0.480R2=0.7451=-0.253哪个模型更好?回归参数的意义?不可比第四十页,共五十九页,编辑于2023年,星期五R2的可比性问题根据判定系数来比较两个模型的时候,一定要注意样本容量n和因变量都必须相同,而解释变量则可取任何形式。对咖啡需求的两个模型:yi=+xi+ilnyi=+lnxi+IR2项是不可直接相比的,因为它们是不同尺度的。要比较必须进行处理。第四十一页,共五十九页,编辑于2023年,星期五不同尺度R2的比较方法以咖啡需求为例yi=+xi+i(1)lnyi=+lnxi+i(2)方法一:对模型(1)得到的取对数,然后求其与方程(2)的lnyi之间的R2,此R2与(2)的判定系数有可比性。(1)转换后的R2=0.677<对数模型的R2=0.745方法二:对模型(2)得到的取反对数,然后求其与方程(1)的yi之间的R2,此与(1)的判定系数有可比性。(2)转换后的R2=0.719>线性模型的R2两种方法比较结果相同:对数线性模型的拟合程度高于线性模型。第四十二页,共五十九页,编辑于2023年,星期五3.半对数模型-测度增长率假如要求GDP的增长率,有如下公式:yt=y0(1+r)t其中,yt:时间t的实际GDP;y0:实际GDP的初始值;r:y的复合增长率。两边取对数:lnyt=lny0+tln(1+r)令1=lny0

,2=ln(1+r),并增加干扰项方程变为:lnyt=1+2t+i——半对数模型模型特点:2:测度了GDP的恒定相对增长率。第四十三页,共五十九页,编辑于2023年,星期五b23=17.13,说明个人可支配收入每年平均增长17亿美元。例:用例5数据,求1956-1970年美国个人可支配收入的增长率。X2:个人可支配收入,x3:时间变量模型:lnx2i=1+2x3i+i求解过程结果:2=0.04228,说明56-70年间,美国个人可支配收入每年增长4.23%比较线性趋势模型:x2i=b2+b23x3i+i第四十四页,共五十九页,编辑于2023年,星期五4.倒数模型模型特点:随着x无限增大,项趋于0,y趋于极限值。分三种类型:2>01<0xy-12>01>0xy12<01>0xy1倒数模新的线性化:令原方程变为:y=1+2zi+i第四十五页,共五十九页,编辑于2023年,星期五5.多项式回归模型关于参数线性令:作代换得:y=0+1xi+2x2i+i常用于成本和生产函数的计量经济分析第四十六页,共五十九页,编辑于2023年,星期五6.受约束的最小二乘法经济理论有时会提出某一回归模型中系数满足一些线性等式约束条件——受约束最小二乘法例:柯克·道格拉斯生产函数如果规模报酬不变,即每一同比例的投入变化有同比例的产出变化,则C-D函数有如下约束:2+3=1第四十七页,共五十九页,编辑于2023年,星期五2+3=1的检验t检验法:先做无约束回归,得到2、3的估计之后,就可通过t检验来检验约束是否满足。t服从n-k的t分布。第四十八页,共五十九页,编辑于2023年,星期五F检验法:受约束最小二乘法基本思路:将约束条件纳入估计过程中。将2=1-3带入模型:产出与劳动比率资本与劳动比率对上式进行参数估计后,计算2=1-3,就可得到2值。这种估计方法保证了所估计的两投入系数之和必然等于1。可推广到含有任意多个解释变量、有多于一个线性等式约束的模型。第四十九页,共五十九页,编辑于2023年,星期五F检验法:受约束最小二乘法判断约束条件是否成立的F检验:H0:2+3=1F遵循分子自由度为m,分母自由度为(n-k)的F分布。F还可以通过R2表达如下:用R2计算F时要注意:当受约束和无约束模型中的因变量不同时,R2需要经转换后再计算。第五十页,共五十九页,编辑于2023年,星期五例758-72年台湾农业C-D函数1958-1972年台湾地区农业部门的实际总产值、劳动日和实际资本投入数据如表,求生产函数。无约束回归:?第五十一页,共五十九页,编辑于2023年,星期五例7规模报酬不变的t检验=0.05,=0.10,t/2=2.179t/2=1.782遵循15-3=12的t分布结论:在5%的水平上不能拒绝原假设,农业经历规模报酬不变仍有可能不显著异于1注意:第五十二页,共五十九页,编辑于2023年,星期五例7受约束回归N=15,k=3,m=1=0.05,=0.10,F=4.75F=3.18F在5%水平上不显著,接受原假设;在10%水平上显著,拒绝原假设。显著性水平影响结论2=1-3=1-0.613=0.387第五十三页,共五十九页,编辑于2023年,星期五有约束模型回归系数3的标准误小,估计精度高。例7两模型的比较:哪个更好?R2=0.769,转换后R2=0.85哪个模型拟合程度高?第五十

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论