回归方程的变量和形式_第1页
回归方程的变量和形式_第2页
回归方程的变量和形式_第3页
回归方程的变量和形式_第4页
回归方程的变量和形式_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归方程的变量和形式第一页,共五十五页,编辑于2023年,星期日目录7.1回归方程中遗漏和冗余变量问题7.2模型的稳定性检验7.3包含虚拟变量的回归模型7.4可线性化的非线性模型7.5不可线性化的非线性模型第二页,共五十五页,编辑于2023年,星期日7.1回归方程中遗漏和冗余变量问题1、一个简单例子:未偿付抵押贷款债务假定Y表示未偿付抵押债务(亿美元);X2表示个人收入(亿美元);X3表示新住宅抵押贷款费用(%),包括对常规抵押贷款和手续费收取的利率。一般地预期抵押债务与收入正相关,因为个人收入越高,则其借贷购买新房的能力就越强;预期抵押债务与抵押费用负相关,因为在其他条件不变时如果购房费用上升,则对住房的需求下降,从而减少了对新的抵押贷款的需求。(1)首先简单做Y(抵押贷款债务)对X2(个人收入)回归,得到以下结果第三页,共五十五页,编辑于2023年,星期日7.1回归方程中遗漏和冗余变量问题(2)将抵押债务Y对收入和抵押费用同时回归,得到以下结果第四页,共五十五页,编辑于2023年,星期日7.1回归方程中遗漏和冗余变量问题(3)比较两个模型收入变量回归系数、截距和拟合优度的差异关于个人收入对抵押贷款的影响,本质上前一个模型只是简单略去了抵押费用变量,反映了个人收入对抵押贷款的总效果(直接的个人收入效果与间接的抵押贷款费用效果);而后一个模型是假设抵押贷款费用为常数,反应了个人收入对抵押贷款的净影响或净效果。两个回归结果的差异性很好地反映了偏回归系数的“偏”的含义。如果从模型中将抵押贷款变量略去,会导致(模型的)设定偏差或设定误差(specificationerror)。所以在设定模型时要以经济理论为根据并充分利用已有研究的经验,设定回归变量。第五页,共五十五页,编辑于2023年,星期日7.1回归方程中遗漏和冗余变量问题2、遗漏(omitted)变量检验检验对现有模型添加某些变量后,新变量是否对因变量的解释有显著贡献。检验的零假设时新变量都是不显著的。检验要求前后两个模型的观测样本是相同的,增加滞后变量作为新变量,该检验是失效的。检验统计量为其中右边中括号内分别表示约束条件合无约束条件下方程的对数似然值,在零假设下统计量服从渐进的χ2(m)分布,这里m代表约束条件的个数,比如增加变量的数目。第六页,共五十五页,编辑于2023年,星期日7.1回归方程中遗漏和冗余变量问题2、遗漏(omitted)变量检验Eviews实现:View-CoefficientTests-OmittedVariables-LikelihoodRatio。举例:柯布-道格拉斯生产函数采用美国27家主要金属行业SIC33的观测值,被解释变量Y代表产出,解释变量为劳动投入L和资本投入K,利用基本模型形式Y=AKαLβeu进行估计,检验(1)规模报酬不变的假设;(2)利用遗漏变量检验是否能够采用超越对数生产函数形式。第七页,共五十五页,编辑于2023年,星期日7.1回归方程中遗漏和冗余变量问题2、冗余(Redundant)变量检验检验一部分变量的统计显著性,通过判断方程中一部分变量系数是否与0没有显著差异,决定是否从方程中剔除这些变量,检验方法可以通过F检验和似然比(LR)检验。Eviews实现:View-CoefficientTests-RedundantVariables-LikelihoodRatio。第八页,共五十五页,编辑于2023年,星期日7.2模型的稳定性检验1、Chow断点(Breakpoint)检验思想:是对每个子样本单独拟合方程,并与对于全部样本拟合方程进行比较,来观察每个子样本的估计方程是否有显著差异,判断是否存在结构变化。

零假设:两个子样本拟合的方程无显著差异。而有显著差异意味着模型中存在结构变化。第九页,共五十五页,编辑于2023年,星期日7.2模型的稳定性检验1、Chow断点(Breakpoint)检验检验之前,需先把数据分成两个或更多的子样本,每个子样本的观察数必须多于方程参数的个数,这样才能对每个子样本分别拟合方程。对总体样本可单独拟合一个方程,对子样本可分别拟合方程,Chow’s断点检验基于这两组方程的残差平方和的比较。可构造统计量:其中e’e是利用整个样本数据进行回归得到的残差平方和,ei’ei是第i个子样本回归的残差平方和。第十页,共五十五页,编辑于2023年,星期日7.2模型的稳定性检验1、Chow断点(Breakpoint)检验Chow检验时的限制条件(1)应用Chow检验必须满足子样本回归模型的随机误差项是独立同分布,均服从正态分布。(2)Chow检验的结果仅仅告知以子样本的回归方程是否相同,而无法告知导致这种差异的原因。(3)Chow检验假定知道结构发生变化的时间点。第十一页,共五十五页,编辑于2023年,星期日1、Chow断点(Breakpoint)检验实例一:估计C-D函数(1)1929-1967年数据估计如下(2)分1929-1948和1949-1967两段数据估计如下7.2模型的稳定性检验第十二页,共五十五页,编辑于2023年,星期日从而有RSSu=0.03555+0.00336=0.0389F统计量为Eviews应用步骤:View——stabilitytest——chowbreakpointtest输入断点,为第二个数据集的第一个。第十三页,共五十五页,编辑于2023年,星期日

1、Chow断点(Breakpoint)检验实例二:美国个人可支配收入与个人储蓄的相关性分析给出美国1970-1995年美国个人可支配收入与个人储蓄的数据,估计个人储蓄Y对个人可支配收入X的变化,但考虑到在1982年美国遭受到了和平期间最严重的经济衰退,当年的城市失业率高达9.7%,是自1948年以来失业率最高的一年,类似这种事件会扰乱收入和储蓄之间的关系。这可以借助Chow检验建立回归方程。7.2模型的稳定性检验第十四页,共五十五页,编辑于2023年,星期日

1、Chow断点(Breakpoint)检验实例三:中国消费函数稳定性检验

20世纪90年代前的中国仍然处于卖方市场,虽然居民收入水平增幅较大,但商品供给有限,而且当时的利息率较高,因而居民收入更加倾向于储蓄增值而不是消费,1994年我国开始全面的体制改革和制度创新。随着国有企业体制改革的推进和大量非国有企业的兴起并日益壮大,国内商品市场日益繁荣,商品品种更加丰富,使得居民收入用入消费的部分增加,试用Chow检验判断1994年之前和之后两段时期消费函数是否产生显著的差异。7.2模型的稳定性检验第十五页,共五十五页,编辑于2023年,星期日2、Chow预测检验检验

Chow预测检验是先对包含前T1个观察值的子样本建立模型,然后用这个模型对后T2个观察值的自变量进行预测,如果实际值与预测值有很大变动,就可以怀疑模型中存在结构性变化。T1和T2的相对大小,没有确定的规则,可能根据如战争、石油危机、经济改革等明显的转折点来确定,如果不存在这样明显的转折点,常用的方法是用85%-90%的数据进行估计,剩余的数据进行检验。7.2模型的稳定性检验第十六页,共五十五页,编辑于2023年,星期日1、模型中引入虚拟变量的必要性计量经济学模型,需要经常考虑属性因素(定性变量)的影响。例如职业、战争与和平、繁荣与萧条、文化程度、灾害等;这些变量往往很难直接度量它们的大小,只能建立人工变量给予赋值:“D=1”或”D=0”、或者它们的程度或等级回归模型中有必要引入虚拟变量,以表示这些质的区别。例如消费函数,对于平时与战时,萧条与繁荣,乃至性别、教育程度、季节性等等,都会因质的不同表现出不同的差异。7.3包含虚拟变量的回归模型第十七页,共五十五页,编辑于2023年,星期日例:文化程度

第十八页,共五十五页,编辑于2023年,星期日1、模型中引入虚拟变量的必要性例如考虑是否受过大学教育对收入的影响,可以建立定性变量,并赋值为0(非大学毕业)或1(大学毕业),用D表示。像这样只取0和1两个值的变量称为虚拟变量(dummyvariable).可以构造以下回归模型7.3包含虚拟变量的回归模型第十九页,共五十五页,编辑于2023年,星期日2、虚拟变量模型(1)方差分析模型(ANOVA):回归模型中,解释变量仅是虚拟变量的模型。例如前述是否大学毕业对初始年薪的影响模型,大学毕业生的初始年薪期望值为非大学毕业生的初始年薪期望为7.3包含虚拟变量的回归模型第二十页,共五十五页,编辑于2023年,星期日举例:工作权利法对工会会员的影响

Brennan等(1987)建立了工会会员对工作权利法的函数模型。研究包括50个州,其中19个州制定了工作权利法,31个州允许有工会会员制度(即工会允许进行劳资谈判)。基本模型为

Y=a+b*D

其中Y表示工会会员占工人的比例(1980),D=1表示制定工人工作权利法的州,D=0表示未制定工人工作权利法的州。回归结果如下第二十一页,共五十五页,编辑于2023年,星期日7.3包含虚拟变量的回归模型2、虚拟变量模型(2)协方差分析模型(ANCOVA)。指引入虚拟变量后,回归方程中同时含有一般解释变量和虚拟变量的模型。例如其中y为大学教师的年薪,x为教龄,D=1表示男教师,D=0表示女教师,通过求期望可以得到男女教师的平均年薪。第二十二页,共五十五页,编辑于2023年,星期日注意的几个问题:在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:如果模型中含有常数项,对于有m种互斥的属性类型,在模型中引入m-1个虚拟变量,即每个虚拟变量的个数要比该变量的分类数少1。例如性别有2个互斥的属性,引用2-1=1个虚拟变量。否则就会陷入虚拟变量陷阱,存在完全的多重共线性,不能得到参数的唯一估计值。赋值为0的一类称为基准类、对比类等。虚拟变量D的系数称为差别截距系数。第二十三页,共五十五页,编辑于2023年,星期日用3个虚拟变量表示4个季度这里用3个虚拟变量表示4个季度,Q2、Q3、Q4同时取不同值组合起来表示4个季节——春、夏、秋和冬。第二十四页,共五十五页,编辑于2023年,星期日7.3包含虚拟变量的回归模型3、虚拟变量的引入方式(1)加法方式——影响截距虚拟变量D与其它解释变量在模型中是相加关系,称为虚拟变量的加法引入方式。加法引入方式引起截距变动例如讨论消费问题,消费水平C主要由收入水平Y决定,但是当特殊情况出现时政府会采取对消费品限量供应措施,因此引入虚拟变量D来表示这些特殊情况与非特殊情况。第二十五页,共五十五页,编辑于2023年,星期日例:消费问题的虚拟变量模型以D=1表示反常年份,D=0表示正常年份

C=b0+b1x+b2D+e反常年份消费函数(截距不同斜率同)

正常年份消费函数(截距不同斜率同)

第二十六页,共五十五页,编辑于2023年,星期日运用虚拟变量改变回归直线的截距b2b0xcY=b0+b1XY=(b0+b2)+b1XY=b0+b1X+b2D+eD=0正常D=1反常第二十七页,共五十五页,编辑于2023年,星期日7.3包含虚拟变量的回归模型3、虚拟变量的引入方式(2)乘法方式——影响斜率模型中虚拟变量与其它解释变量是相乘关系,称为虚拟变量的乘法引入方式。乘法引入方式引起斜率变动例如D=1异常时期D=0正常时期,设定以下模型

Y=b0+b1

X+b2

DX+e,b2表示差别斜率则异常时期模型:(截距相同斜率不同)

Y=b0+(b1+b2

X+e

则正常时期模型:(截距相同斜率不同)

Y=b0+b1

X+e第二十八页,共五十五页,编辑于2023年,星期日运用虚拟变量改变回归直线的斜率C=b0+b1xC=b0+(b1+b2)xxcY=b0+b1X+b2DXD=1反常D=0正常第二十九页,共五十五页,编辑于2023年,星期日加法与乘法组合引入—截距与斜率均不同例如D=1表示异常时期,D=0表示正常时期,设定模型

Y=b0+b1X+b2D+b3DX+e则异常时期模型:(截距与斜率均不同)

Y=(b0+b2)+(b1+b3)

x+e反常时期模型:(截距与斜率均不同)

Y=b0

+b1x+e

第三十页,共五十五页,编辑于2023年,星期日运用虚拟变量同时改变回归直线的截距和斜率Y=(b0+b2)+(b1+b3)x+eY=b0+b1x+e正常时期Y=b0+b1X+b2D+b3DX+eD=1反常D=0正常第三十一页,共五十五页,编辑于2023年,星期日7.3包含虚拟变量的回归模型3、虚拟变量的引入方式(3)临界指标的虚拟变量的引入在经济转折时期,可以建立临界值指标的虚拟变量模型来反映。设转折时期t*,转折时期的指标值=x*,设定虚拟变量D=1(t>=t*)D=0(t<t*),建立模型

y=b0+b1x+b2(x-x*)D+e

则t<t*时,y=b0+b1x+et>=t*时y=b0-b2x*+(b1+b2)x+e

当t=t*时,x=x*两式计算的y相等,两条直线在转折期连接成一条折线

第三十二页,共五十五页,编辑于2023年,星期日临界折线的图例y=b0+b1x*(t*)X*xyy=b0+b1xy=b0-b2x*+(b1+b2)xy=b0+b1x+b2(x-x*)D第三十三页,共五十五页,编辑于2023年,星期日折线回归G0G18488GIt<84D1=0G0t<88D2=0G1D1、D2处理3状态I=b0+b1G+b2(G-G0)D1+b3(G-G1)D2+e第三十四页,共五十五页,编辑于2023年,星期日4、对虚拟变量的解释例如Log(wage)=0.417-0.297female+0.080educ+0.029exper+……Female的系数近似表示在educ、exper等相同水平上,女人比男人约少挣100×0.297%=29.7%

精确的百分比如何计算?(25.7%)7.3包含虚拟变量的回归模型第三十五页,共五十五页,编辑于2023年,星期日7.3包含虚拟变量的回归模型5、应用举例例1、棒球运动员薪水影响因素模型在前述棒球运动员薪水的数据中,运动员有如下六个位置可供选择:frstbase,scndbase,thrdbase,shrtstop,outfield和catcher。为了说明不同位置上薪水的差异,以外场手(outfield)那一组为基组,应将哪些虚拟变量作为自变量?第三十六页,共五十五页,编辑于2023年,星期日7.3包含虚拟变量的回归模型5、应用举例例2、工资上性别歧视的检验基本模型如下:

Log(wage)=a0+a1*female+a2*educ+a3*exper+a4*tenure

其中tenure表示现职任期。模型中可以包含female与educ的交叉项,以反映男女在受教育回报中的差异,也可在回归中包括exper和tenure的二次项。采用Wooldridge中的数据集Wage1.Raw估计不同模型第三十七页,共五十五页,编辑于2023年,星期日7.4可线性化的非线性模型1、(双)对数模型(幂函数曲线)该模型能够对弹性进行度量,模型中B2度量了y对x的弹性。由于由双对数模型所得到的弹性是一个常数,所以双对数模型又称为不变弹性模型。如何选择(对数)线性模型:根据经验来选择。根据数据作散点图,再比较。第三十八页,共五十五页,编辑于2023年,星期日实例:利用双对数模型估计对Widget的需求lnY=3.9617-0.2272lnX线性模型与对数线性模型的比较:(1)根据散点图进行确定;(2)R2系数不能作为选择的根据;(3)模型中变量之间的相关性(以经济理论为基础)、预期的解释变量系数的符号、统计显著性以及类似弹性系数等应该成为选择模型的基本准则;(4)两类模型弹性系数的比较:平均弹性与不变弹性系数第三十九页,共五十五页,编辑于2023年,星期日2、多元对数线性回归模型其中B2、B3又称为偏弹性系数。实例:能源需求函数给出1960-1982年间7个OECD国家(美国、加拿大、德国、英国、意大利、日本、法国)的总最终能源需求指数(Y)、实际的GDP(X2)、实际能源价格(X3)的数据,所有指数均以1970年为基准,建立能源需求函数。7.4可线性化的非线性模型第四十页,共五十五页,编辑于2023年,星期日3、对数-线性模型其中B2表示y对x的半弹性,即当x增加一单位时y的百分数变化。例1:美国未偿付消费者信贷的增长由复利计算公式Yt=Y0(1+r)t可以得到lnYt=B1+B2t+ut例2:我国实际GDP平均增长率7.4可线性化的非线性模型第四十一页,共五十五页,编辑于2023年,星期日4、线性-对数模型(对数曲线)

模型给出了x变动一个百分点时y的绝对变动量例:美国GNP与货币供给间的关系假定美联储很关注货币供给的变动对GNP的影响(货币供给是由FED控制的),建立GNP和货币供给(M2)之间的模型

Y=B1+B2lnX2+u7.4可线性化的非线性模型第四十二页,共五十五页,编辑于2023年,星期日7.4可线性化的非线性模型5、双曲函数模型(双曲线)由于B1、B2符号的差异双曲函数模型具有不同的形状。举例:美国的菲利普斯曲线利用美国1955-1984年的数据,建立通货膨胀率和失业率之间的反向关系,建立双曲函数;如果考虑到20世纪70年代出现的石油危机所引发的滞胀,通货膨胀伴随着高失业率,进一步在模型中引入代表通货膨胀预期变量(例如用通货膨胀前期值来表示),重新建立模型。第四十三页,共五十五页,编辑于2023年,星期日6、多项式模型例1:环境Kuznets曲线例2:总成本函数曲线,利用以下数据估计以上多项式模型。总成本Y193226240244257260274297350420产出X123456789107.4可线性化的非线性模型第四十四页,共五十五页,编辑于2023年,星期日7、Box-Cox转换如果λ=1,模型是线性的,λ=0,模型是对数线性或半对数线性的;λ=-1,模型是双曲形式;λ的其他不同取值会产生不同的函数形式。7.4可线性化的非线性模型第四十五页,共五十五页,编辑于2023年,星期日不同函数形式模型小结

模型形式斜率=dY/dX弹性=(dY/dX)(X/Y)线性模型Y=B1+B2XB2B2(X/Y)双对数模型lnY=B1+B2lnXB2(Y/X)B2对数-线性模型lnY=B1+B2XB2YB2X线性-对数模型Y=B1+B2lnXB2(1/X)B2(1/Y)双曲函数模型Y=B1+B2(1/X)-B2(1/X2)-B2(1/XY)第四十六页,共五十五页,编辑于2023年,星期日实例某企业在16个月的某产品产量和单位成本资料,试分别采用双曲线、对数曲线和幂函数曲线模型分析二者的关系。其中X表示产量(台),Y表示单机成本(元/台)。第四十七页,共五十五页,编辑于2023年,星期日

月度XY月度XY14300346.2396024310.8224004343.34106194306.8334300327.46117558305.1145016313.27127381300.7155511310.75136950306.8465648307.61146471303.4475876314.56156354298.0386651305.72168000296.21第四十八页,共五十五页,编辑于2023年,星期日7.5不可线性化的非线性模型1、一般形式2、非线性最小二乘法3、根据前述数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论