版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章绪论1.1引言1.1.1计量经济学简介
计量经济学是经济学的一个分支学科,诞生于20世纪30年代,是以揭示经济活动中客观存在的数量关系为内容的分支学科。关于计量经济学的定义,已经形成了共识。弗里希(RagnarFrisch,1933)指出:“经验表明,统计学、经济理论和数学这三者对于真正了解现代经济生活的数量关系来说,都是必要的,但本身并非是充分条件。三者结合起来,就是力量,这种结合便构成了计量经济学。”萨缪尔森(P.A.Samuelson,1954)认为:“计量经济学可以定义为实际经济现象的数量分析。这种分析基于理论与观测的并行发展,而理论与观测又是通过适当的推断方法得以联系。”戈登伯格(S.Goldberger,1964)给出的定义是:“计量经济学可以定义为这样的社会科学:它把经济理论、数学和统计推断作为工具,应用于经济现象的分析。”总之一句话,即计量经济学是经济理论、统计学和数学的结合。根据计量经济学定义,计量经济学的核心问题就是如何实现经济理论、数学和统计学的科学的结合。1.1.2计量模型发展
计量经济学自20世纪20年代末30年代初诞生以来,已经形成了十分丰富的内容体系。一般认为,可以以20世纪70年代为界将计量经济学分为经典计量经济学和现代计量经济学,而现代计量经济学又可以分为四个分支:时间序列计量经济学、微观计量经济学、非参数计量经济学、面板数据计量经济学(包括空间计量经济学)。
如图1.1.1所示:图1.1.1
经典计量经济学与现代计量经济学1.1.2计量模型发展
在理论方法方面的特征可以简要概括为:(1)模型类型——参数模型、随机模型;(2)模型导向——理论导向;(3)模型结构——线性模型、因果分析模型;(4)数据类型——截面数据、时间序列数据、被解释变量具有服从正态分布的连续观测值;(5)估计方法——仅利用样本信息、最小二乘方法、最大似然方法。在应用方面的特征可以简要概括为:(1)应用模型方法论基础——实证分析、经验分析;(2)应用模型的功能——结构分析、政策评价、经济预测、理论检验与发展;(3)应用模型的领域——传统的应用领域,例如生产、需求、消费、投资、货币需求、就业、福利以及宏观经济等。1.1.2计量模型发展
计量经济学自20世纪20年代末30年代初诞生以来,已经形成了十分丰富的内容体系。一般认为,可以以20世纪70年代为界将计量经济学分为经典计量经济学和现代计量经济学,而现代计量经济学又可以分为四个分支:时间序列计量经济学、微观计量经济学、非参数计量经济学、面板数据计量经济学(包括空间计量经济学)。
如图1.1.1所示:图1.1.1
经典计量经济学与现代计量经济学年份获得者国家获奖时所在机构1969拉格纳·弗里希(Ragnar
Frisch)挪威挪威奥斯陆大学简·丁伯根(JanTinbergen)荷兰荷兰经济学院1980劳伦斯·克莱因(LawrenceR.Klein)美国美国宾夕法尼亚大学1989特里夫·哈维默(TrygveHaavelmo)挪威挪威奥斯陆大学2000詹姆斯·赫克曼(JamesJ.Heckman)美国美国芝加哥大学丹尼尔·麦克法登(DanielL.McFadden)美国美国加州大学2003罗伯特·恩格尔(RobertF.Engle)美国美国纽约大学克莱夫·格兰杰(CliveW.J.Granger)美国美国加州大学2011托马斯·萨金特(ThomasJ.Sargent)美国纽约大学克里斯托·西姆斯(ChristopherA.Sims)美国普林斯顿大学2013尤金法马(EugeneF.Fama)美国芝加哥大学拉斯·彼得·汉森(LarsPeterhansen)美国芝加哥大学罗伯特·希勒(RobertJ.Shiller)美国耶鲁大学计量经济学领域诺贝尔经济学奖得主情况1.1.3研究步骤(1)理论模型的设计:主要包含三部分工作,即选择变量,确定变量之间的数学关系,拟定模型中待估计参数的数值范围。设计时要遵循“从一般到简单”的原则。(2)样本数据的收集和整理:是建立计量经济学模型过程中最费时费力的工作,也是对模型质量影响极大一项工作。计量经济学常用数据有三大类型:横横截面数据、时间序列数据、面板数据。(3)模型参数的估计:参数估计是计量经济学的核心内容,选择适当的方法估计模型是一个纯技术过程,也涉及到软件的应用等内容。(4)模型检验:模型的检验包含多方面的内容,通常有经济意义检验、统计检验、计量经济学检验和模型预测检验。1.1.4主要数据类型横横截面数据:对给定的某个时间点的个人、家庭、企业、城市、国家或者一系列其他单位采集的样本所构成的数据集。时间序列数据:在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。如我国GDP从1949年到2015年的变化就是时间序列数据。面板数据:由数据集中每个横截面单位的一个时间序列组成,面板数据前后年份的样本是相同的,具有可比性。1.2本书框架介绍
1.3
Stata操作简介1.3.1Stata启动第一种方法是直接双击桌面的Stata图标,在win8以上系统中,也可以通过左下角搜索栏进入,路径为“搜索栏”>输入“Stata”>回车键进入。第二种方法就是直接在Stata安装文件夹里找到扩展名为*.dta的文件,双击打开即可。1.3.2Stata基本窗口介绍1.3.3Stata数据基本操作(参见教材中案例操作)例:我国2000—2014年GDP增长率以及第三产业增长率的数据1、导入数据2、修改变量标签3、变量的创建4、变量的描述与整理5、画图1.3.4Stata帮助系统Stata的帮助是该软件的一个重要特色。而作为初学者,能够看懂help命令,对于学习Stata具有极大的帮助点击菜单栏中的“帮助”按钮,然后选择“内容”,在弹出的对话框中,可以点击各个部分的链接,查看对应得更进一步得内容。有时,我们需要得一些命令,可能Stata中没有,需要我们进行安装命令,常用从ssc上下载命令,操作命令为:sscinstall[…]/*括号内为需要安装得外置命令*/
建议:尽管目前已出版的有关Stata的学习资料有很多,但是最好的学习资料还是Stata的帮助文件中Stata的PDF手册,这个手册对于每个Stata命令有着非常详细的解释说明。本章到此结束第二章一元线性回归模型2.1回归分析概述2.1.1回归分析的基本概念“回归”这一概念是19世纪80年代由英国统计学家高尔顿在研究父代身高和子代身高之间的关系时提出来的。他发现在同一族群中,子代的平均身高介于其父代的身高和族群的平均身高之间,即:高个子父亲的儿子的身高有低于其父亲身高的趋势,而矮个子父亲的儿子的身高则有高于其父亲的趋势;也就是说,子代的身高有向族群平均身高“回归”的趋势。这就是统计学上“回归”的最初含义。如今,回归已经成为社会科学定量研究方法中最基本、应用最广泛的一种数据分析技术。它既可以用来描述自变量与因变量之间的数量关系,也可以基于自变量的取值变化对因变量的取值变化进行预测,更可以用来揭示自变量与因变量之间的因果关系。2.1回归分析概述2.1.1回归分析的基本概念在计量经济学中,回归分析方法是研究某一变量关于另一(些)变量间数量依赖关系的一种方法,即通过后者观测值或预设值来估计或预测前者的(总体)均值。前一个变量称为被解释变量(explainedvariable)或因变量(dependentvariable),后一个变量称为解释变量(explanatoryvariable)或自变量(independentvariable)。回归分析方法是计量经济学理论的基础方法,其主要内容包括:(1)根据样本观察值对计量经济学模型参数进行估计,求得回归方程(2)对回归方程、参数估计值进行显著性检验;(3)利用回归方程进行分析、评价及预测。2.1回归分析概述2.1.2回归模型一个应用计量经济分析一般是从这样的假设前提开始的:y和x是两个代表某个总体的变量,我们感兴趣的是“用x来解释y”,或“研究y如何随x而变化”。例如:y是消费支出,x是收入;y是工资,x是受教育年数。在构建x与y关系间的模型时,需要考虑以下三个问题。首先,除了x影响因素外,是否还有其他影响y的影响因素,如果有,我们将如何考虑?其次,y和x的函数关系形式我们将如何设定?再者,若假设其他条件不变,如何刻画x和y间关系?我们不妨将x和y之间的关系表达式写成如下形式:这样我们就定义了变量x和y之间的一个简单线性回归模型,也称为两变量或一元线性回归模型。其线性的含义表示无论变量x的取值如何,它的任何一单位变化都对变量y产生相同的影响。
2.2一元线性回归模型的基本假设2.2.1对回归模型设定的假设假设1:回归模型是正确设定的。模型的正确设定主要包括两方面的内容:(1)模型选择了正确的变量;(2)模型选择了正确的函数形式。计量经济模型应用于现实经济问题时,因果关系必须有经济理论为其依据,函数关系也必须要有可靠的依据。模型选择了正确的变量指既没有遗漏重要的相关变量,也没有多选无关变量且有经济理论支持该因果关系。当假设1满足时,称模型没有设定偏误,否则模型存在设定偏误。假设1‘:线性回归模型回归模型对变量不一定是线性的,但对参数是线性的。在计量经济学里说到的线性回归都是指关于参数是线性的。要注意的是回归模型的估计原理不依赖于y和x的定义,但系数的解释依赖于它们的定义。2.2一元线性回归模型的基本假设2.2.2对解释变量的假设假设2:解释变量X是确定性变量,不是随机变量,在重复抽样中取固定值。在很多情形中,X往往也是随机的,通过假定X是确定性变量,能够简化对参数估计性质的讨论。假设3:解释变量X在所抽取的样本中具有变异性,而且随着样本容量的无限增加,解释变量X的样本方差趋于一个非零的有限常数,回归分析的目的就是用X的变化来解释Y的变化,因此,解释变量X要有足够的变异性,否则无法回答这个问题。2.2一元线性回归模型的基本假设2.2.3对随机干扰项的假设假设4:随机误差项u具有给定x条件下的零均值、同方差以及无序列相关。随机误差项u的零条件均值假设意味着u的期望不依赖于x的变化而变化,且总为0。该假设表明u与x不存在任何形式的相关性,因此该假设成立时也称x为外生解释变量,否则称x为内生解释变量。这是一个最关键的假设,我们后面会证明,这个假设不成立的话,我们无法得到参数的无偏估计。零条件均值假设可以推导出两个结论:E(u)=0,COV(x,u)=0随机误差项u的条件同方差假设意味u的方差不依赖于x的变化而变化,且总为常数。随机误差项u的条件无序列相关性表明在给定解释变量任意两个不同值时,对应的随机误差项不相关。假设5:随机误差项服从零均值、同方差的正态分布。假设5是为了统计推断的需要而提出的,尤其在小样本下,这个假设非常必要。在大样本下,因为中心极限定理,正态性假设可以放松。以上5个假设也称为线性回归模型的经典假设,满足该假设的线性回归模型称为经典线性回归模型。而前4个假设称为高斯-马尔可夫假设,这些假设能保证估计方法有良好的统计性质。
2.3一元线性回归模型的参数估计 2.3.1普通最小二乘法由(2.3.2)、(2.3.3)式得:
(2.3.4)
(2.3.5)(2.3.4)式两边除以n,并整理得,
(2.3.6)把(2.3.6)式代入(2.3.5)式并整理,得,
(2.3.7)2.3一元线性回归模型的参数估计
2.3.1普通最小二乘法
(2.3.8)
(2.3.9)因为,,分别在(2.3.9)式的分子和分母上减和得,
2.3一元线性回归模型的参数估计2.3.2最小二乘估计量的统计性质(1)线性性这里指和分别是的线性函数。令,代入上式得可见是的线性函数,是
1的线性估计量。同理
0也具有线性特性。2.3一元线性回归模型的参数估计2.3.2最小二乘估计量的统计性质(2)无偏性利用上式
2.3一元线性回归模型的参数估计2.3.2最小二乘估计量的统计性质Gauss-Markov定理:若ui满足E(ui|x)=0,Var(ui|x)=
2,那么用OLS法得到的估计量就具有最佳线性无偏性。估计量被称为最佳线性无偏估计量。最佳线性无偏估计特性保证估计值最大限度的集中在真值周围,估计值的置信区间最小。(4)一致性回归系数的最小二乘估计依概率收敛到实际参数值。2.4一元线性回归模型的统计检验计量经济学模型是通过分析样本数据来量化经济关系,因此我们必须考虑结论的可靠性。而假设检验决定了从样本中能够获得哪些关于现实世界的信息。得出的结论会不会是偶然得到的呢?使用从样本中得到的结论能否拒绝已有的理论?如果理论是正确的,则这一特定样本被观测到的概率有多大?本章讨论的假设检验是针对回归模型的,也会简要回顾概率统计的基本知识。在实践中人们想知道他们所关心的理论能否被实际观测样本中得到的估计结果所支持,但要证明已经给出的假设是否正确几乎是不可能的。唯一能说明的是,特定的样本符合特定的假设。即使假设检验不能证实一个给定的结论,却能在一定的显著性水平下拒绝它。在这种情况下,研究者认为在理论假设正确的时候,抽样结果很难被观测到。2.4一元线性回归模型的统计检验2.4.1假设检验显著性检验是一种利用样本结果来证实一个虚拟假设真伪的检验程序。它的关键思想在于一个检验统计量及其它在虚拟假设下的抽样分布。它根据样本数据计算出的检验统计量值来判断是否接受H0。虚拟假设(也称原假设,nullhypothesis)通常表述为研究者不希望出现的结果,记为H0,它是不希望出现结果的数值范围。例如,我们不希望某个解释变量对被解释变量是没有影响的,即影响等于0,那么原假设可以表述为:H0:β=0(不希望出现的数值)对立假设(alternativehypothesis)通常是对研究者希望出现的结果的表述,记为H1,它是希望出现的结果的数值范围。例如继续前面的例子,如果希望出现一个非0的影响,则对立假设为:H1:β≠0(希望出现的数值)上述检验是双侧检验,其对立假设的取值位于原假设的两侧。还有一种是单侧检验,其对立假设的值只位于原假设的一侧。在实践中,经济学家总是将其所期望的结果置于对立假设中,这样便可以有充分的理由来拒绝原假设。要注意的是,当没有充分理由来拒绝原假设的时候,不能说接受原假设,更严谨的说法是不能拒绝原假设。2.4一元线性回归模型的统计检验2.4.1假设检验“就像法庭宣布裁决时用无罪而不是无辜的表述一样,统计检验的结论为不能拒绝而不是接受。”——JanKmenta假设检验的基本思想是先对总体参数提出一个假设,然后利用样本信息来判断这一假设是否成立。它通过数据来确认原假设的合理性,一般总是将期望结果的反面作为原假设,即原假设确定了一个与我们期望不符的参数值。其原理是概率性质的反证法,小概率事件原理,即小概率事件在1次试验中几乎是不可能发生。2.4一元线性回归模型的统计检验2.4.2回归系数的显著性检验
2.4一元线性回归模型的统计检验2.4.2回归系数的显著性检验
2.4一元线性回归模型的统计检验2.4.2回归系数的显著性检验
2.4一元线性回归模型的统计检验2.4.2回归系数的显著性检验
2.5应用
例2.5.1对资本资产定价模型(CAPM)的实证分析2.5应用
使用stata16打开在目录“D:\stata16\shuju\chap02”中的“0201.dta”数据文件,命令如下:use"D:\stata16\shuju\chap02\0201.dta",clear然后对数据进行处理,在Command窗口输入如下命令:
genRI=rit_mt-0.001genRM=rmt-0.0012.5应用新生成后的变量RI和RM如下图所示:2.5应用然后对生成的变量RI和RM进行普通最小二乘回归,在Command窗口输入回归命令如下:regressRIRMregress代表回归命令,stata中的命令可以缩写,如regress可以缩写为reg,一般查看帮助时,命令可缩写的部分,底边标有横线。RI和RM分别的被解释变量和解释变量,一般将被解释变量置于最前边,将解释变量置于被解释变量的后面。Stata与其他计量软件有所不同,默认回归中具有常数项,后续我们会进行不含常数项的回归。Stata中对命令的大小写具有识别性,对于大写的命令,若用小写的命令进行回归,是会出现报错提示,但对变量的大小写没有识别性。具体的可见下图。2.5应用回归的结果如下图2.5.3所示:图2.5.3带有常数项模型的估计结果根据上述的估计结果,可以得到如下的回归方程:
(2.60)(13.95)显然上述估计结果还可以采用更合理的无风险利率,周收益率或月收益率进行改进,从而更加精确的验证CAPM模型。2.5应用
2.5应用上述回归的结果如下图2.5.4所示:图2.5.3不带有常数项模型的估计结果根据上述常数项去掉后的估计结果,可以得到如下的回归方程:(13.64)2.5应用例2.5.2
中国人均食品消费的实证分析表2.5.1给出了2018年中国各省(市、自治区)城镇居民人均可支配收入与人均食品支出的数据。此表格统计了同一年份不同地区的两个变量,故为横截面数据。19世纪德国统计学家恩格尔根据统计资料,对消费结构的变化得出一个规律:一个家庭收入越少,家庭收入中(或总支出中)用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中(或总支出中)用来购买食物的支出比例则会下降。为了考察我国各地区城镇居民人均可支配收入与人均食品支出是否满足这种关系,可以通过拟建立一元线性回归模型来判断。2.5应用在stata导入数据0202.xlsx,在命令窗口输入:.rename人均可支配收入x.rename人均食品消费y将人均可支配收入变量名改为x,将人均食品消费变量名改为y。在命令窗口输入:.scatteryx得到人均可支配收入与人均食品消费散点图图2.5.4。图2.5.4人均可支配收入与人均食品消费散点图2.5应用假设城镇居民人均可支配收入X与人均食品支出Y之间满足一元线性回归模型:在命令窗口输入:.regyx回归结果如图2.5.5。图2.5.5回归结果2.5应用由上述回归结果可以得到回归分析结果:(3.51)
(5.98)从回归结果可以看出,该模型的拟合效果良好,城镇居民人均食品支出变化的55.25%能够由人均可支配收入解释。再看t检验值,可以看出t值都大于临界值,或等价地,所有t统计量的p值都小于0.05,表明参数在显著性水平5%下都不显著为零,也证明了人均可支配收入确实对人均食品支出有影响,人均可支配收入每增加1元,人均食品消费则增加0.117元。由此可以看出,人均可支配收入的增加对人均食品支出有正向促进作用。但当人均可支配收入增加时,在食品支出上的开销增加得较小,即随着家庭收入的增加,家庭收入中(或总支出中)用来购买食物的支出比例会下降。为了检验这个经济规律,我们以人均可支配收入为36000元作为分界线,把数据分为高和低人均可支配收入两组。在stata命令窗口输入:.scatteryxifx>36000.scatteryxifx<360002.5应用就得到两组的散点图。图2.5.6为低收入组人均可支配收入与人均食品消费的散点图,图2.5.7为高收入组人均可支配收入与人均食品消费的散点图。图2.5.6低收入组的散点图
图2.5.7高收入组的散点图2.5应用在stata命令窗口输入:.regyxifx<36000.regyxifx>36000就得到两组的回归结果。图2.5.8为低收入组的回归结果,图2.5.9为高收入组的回归结果。可见,低收入组收入增加1元中用于食品消费0.3616141元,而高收入组收入增加1元中用于食品消费才0.0874791元。明显,随着家庭收入的增加,家庭收入中用来购买食物的支出比例会下降。图2.5.8低收入组的回归结果2.5应用图2.5.9高收入组的回归结果若我们想知道某地区城镇居民人均可支配收入达到80000元时,其在食品消费中的支出是多少,则可以利用高收入组的回归结果,通过预测得到预测值的估计值,当作食品支出的估计值:4225.602+0.0874791*80000=11223.93可见,当城镇居民人均可支配收入为80000元时,人均食品支出为11223.93元,95%的置信区间预测为:[634.4951+0.0135109*80000,7816.708+0.1614473*80000]=[1715.3671,20732.492]2.5应用例2.5.3中国出口贸易的实证分析为了研究中国出口总额与国内生产总值之间的关系,由经济理论分析知,国内生产总值是影响出口总额的主要因素,出口总额y与国内生产总值x之间存在着密切的关系,出口总额随着国内生产总值的增加而增加。表2.5.2为1990-2018年中国出口总额与国内生产总值。资料来源:《中国统计年鉴》(2019)2.5应用在stata导入数据0203.xlsx,在命令窗口输入:.scatteryx得到中国出口总额与国内生产总值散点图图2.5.10。2.5应用从图2.5.10可以看出,出口总额与国内生产总值之间存在线性关系,因此可建立一元线性回归模型:
其中y为出口总额,x为国内生产总值。在命令窗口输入:.regyx回归结果如图2.5.11。图2.5.11中国出口总额回归结果2.5应用由上述回归结果可以得到回归分析结果:(0.86)
(21.37)从回归结果可以看出,该模型的拟合效果良好,中国出口总额变化的94.42%能够由国内生产总值解释。再看t检验值,可以看出斜率的t值大于临界值,或等价地,斜率的t统计量21.37的p值0.00<0.05,表明斜率在显著性水平5%下不显著为零,也证明了国内生产总值确实对出口总额有影响,国内生产总值每增加1亿元,出口总额则增加0.0317766亿美元。但截距项在显著性水平5%下显著为零,为此,再进行没有截距项的回归。在命令窗口输入:.regyx,noc
2.5应用回归结果如图2.5.12。图2.5.12没有截距项的回归结果由上述回归结果可以得到回归分析结果:(32.50)2.5应用若我们想知道中国国内生产总值达到1000000亿元时,出口总额是多少?则可以利用回归结果,通过预测得到预测值的估计值,当作出口总额的估计值:0.032712*1000000=32712亿美元可见,当中国国内生产总值达到1000000亿元时,出口总额为32712亿美元,95%的置信区间预测为:[0.03065*1000000,0.034774*1000000]=[30650,34774](亿美元)本章到此结束第三章多元线性回归模型3.1多元回归线性回归模型3.1.1为什么使用多元回归许多经济现象往往要受多个因素的影响,为了更好地研究被解释变量是如何受多个解释变量影响的,就要利用多元线性回归模型。要把所有影响被解释变量的因素考虑到模型中来。例如,在教育回报率的研究中,除了教育水平之外,工作经历也是一个显著的影响因素,因此需要增加自变量个数,建立多元回归模型。其中wage为工资,educ为教育水平,exper为工作经历。即使我们只关心某个因素对被解释变量的影响,若还有其它因素影响被解释变量,此时也必须使用多元回归模型。若使用一元回归模型的话,则模型估计一般情况下是有偏估计。在简单(一元)回归中,最大的困难在于:要得到在其它因素不变的情况下,x对y的影响(ceterisparibuseffect)是很有挑战的。如果影响y的其它因素与x不相关,则改变x,利用模型的斜率,就可识别出在其它条件不变情况下x对y的影响。但通常影响y的其它因素(包含在u中)往往与x相关,此时改变x,利用简单回归模型,就无法识别出在其它条件不变情况下x对y的影响。3.1多元回归线性回归模型3.1.1为什么使用多元回归一个策略就是,将与x相关的其他因素从误差项u中取出来,放在方程里,作为新的解释变量,这就构成多元回归模型。多元回归分析可以明确地控制许多其它同时影响因变量的因素,而不是放在不可观测的误差项中,故多元回归分析更适合于其它条件不变情况下考察特定因素x对y的影响。多元回归模型也能实现更好的预测。预测一个变量的变化,往往需要尽可能多地知道影响该变量变化的因素。简单回归模型,只包含一个解释变量,有时只能解释y的变动的很小部分,常常拟合优度很低。多元回归模型由于可以控制更多的解释变量,因此可以解释更多的因变量变动。多元回归模型由于包含更多的解释变量,也可以利用函数变化,在模型中表达更复杂的函数关系。因此,多元线性回归模型,是实证分析中应用最广泛的分析工具。3.1多元回归线性回归模型3.1.2多元回归的代数和矩阵表示所谓的多元线性总体回归模型:就是指被解释变量y与多个解释变量之间具有线性关系,是解释变量的多元线性函数。用一个式子来表达即:其中:y是被解释变量;是解释变量;μ为随机扰动项;k为解释变量的数目,为回归系数(regressioncoefficient),(i=0,1,2,…k)。对于n组观测值,将其代入(3.1.1)式,得到多元线性样本回归模型。其方程组形式为:(3.1.1)
(3.1.2)3.1多元回归线性回归模型3.1.2多元回归的代数和矩阵表示式(3.1.2)是由n个方程,k+1个未知参数组成的一个线性方程组,即:(3.1.3)把线性方程组写成矩阵的形式:即(3.1.4)式:(3.1.4)3.1多元回归线性回归模型3.1.2多元回归的代数和矩阵表示这个模型相应的矩阵表达式简记为:(3.1.5)其中:注意:Y是被解释变量样本观测值n*1阶列向量;X是解释变量样本观测值的阶矩阵;是未知参数的(k+1)*1阶列向量;是随机误差项列向量。从上面线性方程组的表示形式可以看出,多元线性回归模型相对于一元线性回归模型来说,其解释变量较多,因而计算公式比较复杂。在现实中如果解释变量多于三个,手工计算此时一般是不太现实的,则需要借助计算机来进行。3.2参数估计和系数的解释在一元线性回归模型中,普通最小二乘法(Ordinaryleastsquares,OLS)给出的准则是:残差的平方和最小。根据此原理,考虑含有k个解释变量的多元线性回归模型(3.1.2)与一元线性回归模型一样,根据最小二乘法准则,使得:(3.2.1)为了计算的简便,我们令,接下来用分别对求偏导数,并令其为零,满足该条件的可以使得最小,也即最小。这是因为多元函数达最小必须满足一阶条件和二阶条件,二阶条件为二阶偏导形成的海塞矩阵为正定,容易验证Q的海塞矩阵为正定。所以,最小化Q只需求满足一阶条件的解,3.2参数估计和系数的解释(3.2.2)把式(3.2.2)经过整理,可得:
(3.2.3)上述式(3.2.3)称为有(k+1)个方程的正规方程组,其矩阵形式为:
(3.2.7)3.2参数估计和系数的解释样本回归模型两边同乘样本观测值矩阵的转置矩阵,则有
(3.2.6)由正规方程组可知,最小二乘估计满足,也就是对应的总体满足,即随机误差项是零数学期望且与每个解释变量都不相关。当时,为(k+1)阶方阵,满秩,所以,的逆矩阵存在。因而
(3.2.8)则为参数向量的OLS估计量。3.3多元回归模型的基本假设要从样本得到对总体参数的估计,并讨论它们的统计性质,需要一系列的假设。只有在满足一些假设情况下,OLS估计量才是总体参数的无偏估计,或者具备一些良好的统计性质。这里讨论的假设,很多是简单回归模型假设的推广。回归分析是社会科学研究中最基本,也是最常用的工具,但它同样有可能是最容易被滥用的工具。理解回归假设可以让研究人员看到应用该模型所需要的条件,同时也能够使他们更好地驾驭回归分析,以得到更有效的估计。首先是关于模型关系的假设。假设1:模型设定正确/线性于参数这个假设是在说模型设定是正确的。模型的正确设定主要包括两方面的内容:(1)模型选择了正确的变量;(2)模型选择了正确的函数形式模型选择了正确的变量指既没有遗漏重要的相关变量,也没有多选无关变量且有经济理论支持该因果关系。一般来讲,我们认为正确的模型就是线性回归模型,但要注意的是,这里的线性是指针对参数的线性,回归模型对变量不一定是线性的。这个假设是简单回归模型假设的直接推广3.3多元回归模型的基本假设接下来是关于解释变量的假设。
假设2:X固定
这个假设是在说X在重复抽样中是固定的,也就是说X是非随机的。同简单回归,在很多情形中,X往往也是随机的,这里这样假设可以简化对参数估计性质的讨论。当X是随机时,模型参数估计的性质都是在X给定情况下讨论的。假设3:X有变异解释变量X在所抽取的样本中具有变异性,而且随着样本容量的无限增加,解释变量X的样本协方差阵趋于一个非零的有限正定矩阵。回归分析的目的就是用X的变化来解释Y的变化,因此,解释变量X要有足够的变异性,否则无法回答这个问题。
假设4:不存在完全共线性
这个假设指在样本中(从而也在总体中),没有一个自变量是常数,自变量之间不存在严格(完全)的线性关系。我们现在必须关注所有自变量之间的关系,如果方程中有一个自变量是其他自变量的线性组合,那么我们说这个模型遇到了完全共线性问题。3.3多元回归模型的基本假设假设5是个关键假设,它涉及解释变量X和随机误差项u之间的关系,以及随机误差项u的性质。假设5:零条件数学期望这是一个关键假设,它指给定自变量的任何值,误差u的期望值为零。换句话说,E(u|x1,x2…xk)=0当这个假定成立时,我们常说xj是外生解释变量。如果由于某种原因某个解释变量xj与u有关,那么我就成xj是内生解释变量。从零条件数学期望假设可以推导出两个结论:E(u)=0,cov(X,u)=0在很多教科书上是给出了这两个假设,但零条件数学期望的表述更加严谨,因为协方差只是表示X和u之间没有线性相关关系,但它们可能存在非线性的统计依赖关系。零条件均值则表明X和u之间是统计独立的,没有任何统计依赖关系。假设5a:随机误差项零数学期望,E(u)=0假设5b:解释变量与随机误差项不相关,cov(X,u)=0以上5个假设满足的情况下,最小二乘估计量是无偏的。以下是关于随机误差项u的假设。3.3多元回归模型的基本假设假设6:同方差对于解释变量的所有观测值,随机误差项有相同的方差假设7:无序列相关满足以上7个假设,OLS估计量是最优线性无偏估计量,这被称为高斯-马尔可夫定理。这7个假设也称为高斯-马尔可夫假设。假设8:正态性假设随机误差项μ服从均值为零,方差为σ^2的正态分布:μ_i~N(0,σ^2),i=1,2,⋯,n。以上假设(正态性假设除外)也称为线性回归模型的经典假设,满足该假设的线性回归模型,也称为经典线性回归模型(ClassicalLinearRegressionModel,CLRM)。同时满足正态性假设的线性回归模型,称为经典正态线性回归模型(ClassicalNormalLinearRegressionModel,CNLRM)。3.4若干问题3.4.1回归的解释多元线性回归方程将被解释变量分解成为两部分:(1)(2)这部分是可以由解释变量来解释。
3.4若干问题3.4.2遗漏变量偏误多元回归模型的误差项u包括那些影响y但没有被包含在回归方程中的因素,而遗漏变量总是存在的。那么存在遗漏变量的后果是什么?在某些时候,遗漏某些变量会导致OLS估计量有偏。(非一致估计量)遗漏变量导致的OLS估计量的偏差被称为遗漏变量偏差。遗漏因素“z”必须满足:(1)是y的一个决定因素(即z是u中的一部分);(2)与回归变量x相关(即corr(z,x)≠0)。两个条件都成立时,遗漏z才会导致遗漏变量偏差。3.4.3拟合优度拟合优度:是指样本回归直线对观测数据拟合的优劣程度。我们所希望的就是围绕回归直线的剩余尽可能的小。样本观测值距离回归线越近,拟合优度越好,X对Y的解释能力就越强。为了较好地理解样本的可决系数,我们首先要引入总离差平方和的分解问题。3.4若干问题3.4.3拟合优度假如我们给定了X和Y的样本观测值,并得到了样本回归函数则观测值的离差可以分解为两部分之和:图3.4.1可以看出这种分解情况。其中是样本回归直线理论值与观测值的平均值之差,它是由样本回归线解释的部分;是样本观测值与回归直线所确定的估计值之差。是回归直线不能解释的部分。3.4若干问题3.4.3拟合优度我们可以记:(3.4.2)
(3.4.3)
(3.4.4.)称为回归平方和(explainedsumofsquares),反映模型中解释变量所解释的那部分离差的大小。3.4若干问题3.4.3拟合优度利用OLS估计的正规方程组容易推出:TSS=RSS+ESS(3.4.4)
即总离差平方和=残差平方和+回归平方和由式(3.4.4)左右两边自由度相等,可知回归平方和的自由度为k。ESS/服从χ^2(k)。ESS与RSS相互独立。当根据样本采用最小二乘法确定了一条回归直线时,TSS的大小是一定的。ESS越大,RSS越小,该回归直线拟合的越好;反之,拟合的越差。拟合优度度量为:
(3.4.5)它是介于0和1之间的数。因为所以
(3.4.6)3.4若干问题3.4.3拟合优度与n和k有关。因为和都相当于一个标准正态随机变量的平方,所以,关于n是反向关系,关于k是正向关系。为了得到与n和k无关可以比较的拟合优度,将拟合优度用自由度进行修正,得到校正拟合优度:(3.4.7)校正后的拟合优度与n和k无关且。当时,,当时,3.5多元回归模型的统计检验与简单回归相比,多元回归的假设检验可以有更加丰富和复杂的形式,不仅可以检验个别的回归系数,还可以检验多个系数之间是否存在某种关系,回归系数是否同时满足某种或多个约束条件,甚至检验回归模型的函数形式和在时间上的稳定性等。3.5.1单个系数的检验:t检验多元回归模型单个系数的检验是简单回归模型单个系数检验的推广。总体多元回归模型可以写为:如果模型满足经典线性回归模型基本假设,那么我们有以下结论:(3.5.1)3.5多元回归模型的统计检验3.5.1单个系数的检验:t检验以上结论使我们能检验关于
的假设,但实践中一个最常用的假设是:(3.5.2)这个假设的含义是,在原假设下,第j个解释变量
对y的局部效应为0,即在其他条件不变的情况,对y没有影响。用来检验(3.5.2)的检验统计量被称为
的t统计量或t比率(tratio),并被定义为:(3.5.3)t统计量度量了估计系数与零有多少个标准误。例3.5.1工资方程通过选取美国526个工人小时工资的相关数据,检验在控制了教育和任职期限后,更高的工作经验是否会导致更高的小时工资。使用stata16打开在目录“D:\stata16\shuju\chap03”中“0301.dta”数据文件,命令如下:use"D:\stata16\shuju\chap03\0301.dta",clear然后利用最小二乘法进行多元回归分析,在Command窗口中输入命令为:genlnwage=log(wage)reglnwageeducexpertenureEnter键得到如下结果:3.5多元回归模型的统计检验图3.5.1工资方程回归结果3.5多元回归模型的统计检验根据上述回归结果,可得如下函数方程:如果我们想对形如H0:的假设进行检验,需要更一般的t统计量。此时,恰当的t统计量是:(3.5.4)在原假设成立的情况下,它服从自由度为n-k-1的t分布。3.5多元回归模型的统计检验例3.5.2住房价格与空气污染选取某市506个社区组成的样本数据,考虑住房价格和空气污染的一个简单模型。其中Price表示社区中平均住房价格;nox表示空气中氧化亚氮的含量;dist表示该社区相距五个商业中心的加权距离;rooms表示该社区平均每套住房的房间数;而stratio则表示该社区学校的平均学生—教师比。是price对nox的弹性。希望针对对立假设H1:≠-1来检验H0:=-1。做这个检验的统计量为式(3.5.4)。在这里假设=0是没有意义的,更有意义的假设是=-1,即社区污染程度每增加1%,房价大概下降1%3.5多元回归模型的统计检验例3.5.2住房价格与空气污染下面我们利用Stata对该例子中的假设条件进行验证一下,使用stata16打开在目录“D:\stata16\shuju\chap03”中“0302.dta”数据文件,命令如下use“D:\stata16\shuju\chap03\0302.dta”,clear然后利用最小二乘法进行多元回归分析,在Command窗口中输入命令为genlprice=log(price)genlnox=log(nox)genldist=log(dist)reglpricelnoxldistroomsstratioEnter键得到如下结果:图3.5.2房屋价格于空气污染回归结果3.5多元回归模型的统计检验例3.5.2住房价格与空气污染根据上述回归得到的结果,估计模型为:由上述结果知,t统计量在5%水平下接受原假设。或者在Command窗口中输入命令为:testlnox=-1得到检验结果为:F(1,501)=0.16Prob>F=0.6908也得出相同结论:在5%水平下接受原假设。3.5多元回归模型的统计检验3.5.2参数线性组合的检验在应用中,我常常需要检验涉及不止一个总体参数的假设。在本节,我们考虑的问题是,如何对涉及不止一个参数
的单个假设进行检验。例3.5.3柯布-道格拉斯生产函数柯布—道格拉斯生产函数最初是美国数学家柯布(C.W.Cobb)和经济学家保罗·道格拉斯(PaulH.Douglas)共同探讨投入和产出的关系时创造的生产函数,1928年,他们发表了经典论文《生产理论》,使用1899-1922年的美国数据估计了美国制造业的生产函数。柯布-道格拉斯生产函数是经济学中使用最广泛的一种生产函数形式,它在微观经济学、宏观经济学与计量经济学的研究与应用中都具有重要的地位。生产函数公式为:其中α和β是参数,Q表示产出,L表示劳动投入,K表示资本使用量。3.5多元回归模型的统计检验3.5.2参数线性组合的检验对上述模型两边进行取对数,则上述生产函数模型转化成以下线性回归模型:并检验假设:α+β=1是否成立。下面我们将在Stata中进行操作,实现上例多元回归模型参数的估计以及检验。首先使用stata16打开在目录“D:\stata16\shuju\chap03”中的“0303.dta”数据文件,命令如下:use“D:\stata16\shuju\chap03\0303.dta”,clear然后根据上述回归模型,首先对数据进行对数处理,然后进行最小二乘法回归,在Command界面输入命令:genlnQ=log(output)genlnL=log(labor)genlnK=log(capital)reg
lnQ
lnL
lnK3.5多元回归模型的统计检验3.5.2参数线性组合的检验Enter键后结果如下:图3.5.3柯布—道格拉斯生产函数模型的估计从上述最小二乘回归结果,可得估计方程为:3.5多元回归模型的统计检验3.5.2参数线性组合的检验现在我们要检验假设:
是否成立。在Command命令窗口输入命令:te
lnL+lnK=1检验结果如下:根据上述检验结果,p值为0.6628,显然原假设不能拒绝,即不能拒绝α+β=1,所以是规模报酬不变的生产函数。3.5多元回归模型的统计检验3.5.3多个线性约束的检验:F检验前面我们讨论的都是只有单个约束的假设检验,我们经常还想检验关于参数
的多重假设,这会是关于多个约束联合假设检验。我们先来看一个非常普遍的重要问题,检验一组自变量是否对因变量都没有影响。在对回归单个系数的假设检验中,我们已经知道可用t统计量来检验某个自变量是否对因变量没有偏效应。现在我们要检验几个自变量一起是否对因变量都没有影响。我们通过一个例子来说明,考虑如下一个解释美国棒球职业大联盟中运动员薪水的模型:(3.5.1)式中,salary为总薪水,years是加入联盟的年资,gamesyr是平均每年参赛次数,bavg是职业击球率,hrunsyr是平均每年本垒打次数,rbisyr是每年的击球跑垒得分。3.5多元回归模型的统计检验3.5.3多个线性约束的检验:F检验使用stata16打开在目录“D:\stata16\shuju\chap03”中“0304.dta”数据文件,命令如下:use“D:\stata16\shuju\chap03\0304.dta”,clear首先在Stata16中进行模型(3.5.1)参数的估计,在Command窗口输入以下命令:genS=log(salary)regSyearsgamesyrbavghrunsyrrbisyr图3.5.4模型(3.5.1)参数的估计3.5多元回归模型的统计检验3.5.3多个线性约束的检验:F检验我们想检验的一个虚拟假设是,如果控制了加入联盟的年资和每年的比赛次数,度量球员表现的指标(bavg,hrunsyr,rbisyr)对薪水没有影响。这个假设的一个含义就是,由棒球技术统计指标度量的球员表现对薪水没有影响。这个假设可以正式地表述为:这个假设由三个排除性约束构成,若假设正确,则在控制了years和gamesyr之后,bavg,hrunsyr,rbisyr对log(salary)没有影响,因此应该把它们从模型中排除。这是多重约束的一个例子,以后我们还会看到更一般的例子,对多重约束的检验被称为多重假设检验或联合假设检验。这个假设我们一般使用F检验。我们使用0304.dta中的数据来估计方程,结果见图3.5.1.我们可以看到,bavg,hrunsyr和gamesyr都是统计不显著的。于是,从三个t统计量来看,我们不能拒绝H0。这个式中的残差平方和SSR=183.186(我们以后会用到)。3.5多元回归模型的统计检验3.5.3多个线性约束的检验:F检验但这个结论是错误的,我们需要使用一个多重约束检验来看出这一点。而残差平方和为多重假设检验提供了一个途径。它的思路是如果我们将bavg,hrunsyr和gamesyr从模型中去掉,SSR会增大多少。根据OLS原理最小化残差平方和,从模型中去掉变量时,SSR总是增加的,但这个增加是否足够大,以致可以拒绝原假设。不含上述三个变量的模型是:我们把方程(3.5.2)称为受约束模型(restrictedmodel),模型(3.5.1)称为无约束模型(unrestrictedmodel)。有约束模型的参数要比无约束模型的参数少一些。更一般的情况,有k个自变量的不受约束模型写成:3.5多元回归模型的统计检验3.5.3多个线性约束的检验:F检验它对模型(3.5.3)施加了q个排除性约束。在H0的约束下,有约束模型是:根据上述理论知识,在Stata16中进行有约束条件模型的参数估计,在Command窗口输入以下命令:regSyearsgamesyrEnter键结果如下:图3.5.5有约束模型参数估计结果3.5多元回归模型的统计检验3.5.3多个线性约束的检验:F检验多重约束检验的统计思想是考虑当从无约束模型变到受约束模型时,SSR的相对增加量对检验原假设是有意义的。如果原假设成立,这个增加量应该不大,否则应该较大。我们可定义F统计量为:3.5多元回归模型的统计检验3.5.3多个线性约束的检验:F检验公式(3.5.5)也可以改成拟合优度R2的表示形式,因为TSS=ESS+RSS,所以RSS=TSS(1-R2),代入上式,可得:
(3.5.6)在以上例子中我们可以计算出:查表可得拒绝原假设,所以我们拒绝bavg,hrunsyr和gamesyr对薪水没有影响的原假设。从这个例子可以看出,虽然三个变量每个的t统计量都不显著,但联合检验的结果是它们对薪水有显著影响。这里的一个可能原因是三个变量之间存在多重共线性。或者回归regSyearsgamesyrbavghrunsyrrbisyr之后,在Command命令窗口输入命令:testbavg=hrunsyr=rbisyr=0或test(bavg=0)(hrunsyr=0)(rbisyr=0)得到检验结果如下:
F(3,347)=9.55Prob>F=0.0000获得同样检验结果。3.5多元回归模型的统计检验3.5.4回归方程的整体显著性检验对一个回归方程,我们希望知道模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立,这就是方程总体的显著性检验。对于以下模型,这个检验的原假设是:很多软件包都会自动报告这个F统计量,从这个检验式子看,即使很小的R2也导致高度显著的F统计量,所以我们不能根据R2大小来看整体回归方程是否有解释力,而要通过F统计量来检验联合显著性。3.6回归分析小结回归是计量经济学的基本工具,它帮助我们评估一个变量变化一个单位对另一个变量的影响,并帮助我们评估这种影响的可靠性,还帮助我们评判所观察到的影响是否与我们的预期是相符还是矛盾。被解释变量或内生变量是回归分析要解释的对象。解释变量或外生变量是指那些我们认为影响被解释变量的因素。斜率反映的是解释变量的变化对被解释变量的影响。t统计量反映解释变量对被解释变量的影响是否可以得到确认。统计显著意味解释变量对被解释变量的影响是可以辨别的,不显著意味不能辨别,表示没有证据支持解释变量对被解释变量有影响的观点。通常情况下,截距项没有什么意义,它反映的是每个个体都具备的共同特征,而不反映可能使个体取值不同的那些特征。通常我们只解释统计上显著的斜率。对回归进行解释可分为以下几步:首先要确认解释变量是否对被解释变量有显著的影响;然后理解这种影响的大小;最后用这种理解来验证或修正回归之初的行为学动机。有意义的结果在统计上必须是显著的,但统计显著不是结果有意义的充分条件。统计上显著且很大的斜率系数才是重要的。有些斜率尽管在统计上是非常显著的,但其值很小,那么相应的解释变量对被解释变量的影响也不太重要。3.7应用例3.7.1教育的回报率人力资本理论指出人们的大部分知识、技术和能力并非天生具有,而是要通过教育、工作培训等后天途径来获得,而雇主愿意为更高的教育支付更高工资。教育的收益问题多年来一直是很多研究的热门主题,特别是更多高质量数据的更容易获得以及计量经济学模型的发展,使教育回报的研究不断新瓶装旧酒,也是应用计量领域一个经典热门应用。宏观上讲,如果教育收益率低,意味一国或地区通过教育投资行为转化为人力资本的能力较弱,影响了经济增长的潜力。从微观角度上看,如何解释中国父母对子女在教育投资的热情和大学生就业及收入问题也是人们切身关心的。明瑟方程(Mincer)是研究教育收益率的经典方法,它考虑了两种人力资本形式对个人收入或工资的影响,一是从学校教育获得的知识,二是在工作实践中积累的技能。其形式如下:我们使用从CHIP88整理出来的数据,来估计教育回报率。样本由15862个城市居民构成。其中受教育年限的编码为:小于3年=1、3年以上但未完成小学教育=4、小学教育=6、初中=9、高中=12、技校=13、大专=15、本科生研究生=17。3.7应用根据上述设定的基本模型,以及选取的样本数据利用Stata进行简单回归、明瑟方程和控制变量三种回归。使用stata16打开在目录“D:\stata16\shuju\chap03”中“0305.dta”数据文件,命令如下:use“D:\stata16\shuju\chap03\0305.dta”,clear首先进行第一种简单回归,在Command窗口输入命令:reglogearneduEnter键得到如下结果:图3.7.1简单回归结果3.7应用然后进行第二种利用明瑟方程进行回归,在Command窗口输入命令:genexp2=exp^2reglogearneduexpexp2Enter键得到如下结果:图3.7.2明瑟方程回归结果3.7应用然后进行第三种利用明瑟方程和控制变量进行回归,在Command窗口输入命令:reglogearneduexpexp2cpcsexEnter键得到如下结果:图3.7.3控制变量回归结果3.7应用将上述三种形式的回归结果进行汇总,得到如表3.7.1所示的回归结果。表3.7.1给出了教育回归的三种回归结果。回归1是简单回归,每增加一年教育回报只有1.7%,回归2是经典的明瑟方程,在控制了工作经验后教育的回报是3.85%。此时我们发现教育回报增加了2倍以上,这种情形的出现是由于简单回归的遗漏变量偏误问题,导致教育回报的低估。在回归3还控制了党员身份(cpc=1为党员)和性别(female=1为女性)。可以看到党员身份和性别对工资有显著影响。从这个例子可以看出,建立回归模型应将所有的影响因素考虑进来,不然,会造成模型的偏误。所以,应该以回归3的估计结果为准,因为回归1和回归2都会因为遗漏变量而产生偏误问题。3.7应用例3.7.2
考察亚洲各国人均寿命,影响因素有人均GDP,成人识字率,一岁儿童疫苗接种率,数据如表3.7.2所示。数据也见0306.dta。3.7应用回归结果如图3.7.1所示。可见,三个解释变量的系数在显著性水平5%下都显著不为零,系数估计值符合经济意义。人均GDP增加100美元,平均寿命增加0.072年;成人识字率增加1%,平均寿命增加0.169年;一岁儿童疫苗接种率增加1%,平均寿命增加0.179年。图3.7.4亚洲各国人均寿命回归结果3.7应用例3.7.3为了了解一个人一周的睡眠时间和哪些因素相关,或者什么因素会影响一个人一周的睡眠时间,建立了以下模型:其中,sleep是每周晚上睡眠的总分钟数;totwrk为每周花在工作上的总分钟数;educ为受教育的年限,以年为单位;age为年龄,单位为岁。male是一个关于性别的虚拟变量,男性为1,女性为0。数据见0307.dta。应用stata软件进行模型参数的估计,估计结果如下:图3.7.5睡眠时间初步回归结果3.7应用将不显著的解释变量剔除,再进行回归,得到回归结果如下:图3.7.6睡眠时间回归结果3.7应用影响中国税收收入增长的主要因素可能有:①经济整体增长是税收增长的基本源泉;②社会经济的发展和社会保障等都对公共财政提出要求,公共财政的需求对当年的税收收入可能会有一定的影响。建立模型为:其中Y----总税收收入(被解释变量)(亿元)X1----国内生产总值,用来表示经济整体增长水平(亿元)X2----财政支出,用来表示公共财政的需求(亿元)表3.7.3为1970-2018年中国GDP、财政支出、总税收收入的数据(数据来源国家统计局网)。3.7应用在stata中导入数据0308.xlsx,在命令窗口输入:regYX1X2得到回归结果如图3.7.7。图3.7.7中国税收收入回归结果可见,两个解释变量都很显著,两个t统计量的P值都为0。模型拟合优度很高,接近1。国内生产总值增加1亿元,将使税收收入增加0.1167527亿元。财政支出增加1亿元,将使税收收入增加0.2576949亿元。3.7应用例3.7.5关于教育回报影响因素的研究数据来源:《伍德里奇计量经济学导论》(第五版)WAGE2.RAW数据;总共选取了935个相关数据进行分析和研究,其中数据变量如下:wage为每月的收入(教育回报);educ为受教育年限;exper为工作经历年限。建立教育回报模型:在stata中打开数据WAGE2.dta,在命令窗口输入:reglwageeducexper
得到回归结果如图3.7.8。图3.7.8教育回报回归结果3.7应用经过系数的估计后,得到模型如下:可见,两个解释变量都显著。受教育年限增加1年,将使每月收入提高7.7782%。工作经历年限增加1年,将使每月收入提高1.97768%。本章到此结束第四章回归分析专题
本章将专门讨论回归分析中的几个重要问题,它们包括:在OLS中应用不同形式的函数进行建模、数据的测度单位对模型估计结果的影响以及如何进行含有定性信息的多元回归分析等内容。这些专题虽不像之前章节中的内容那么基础,但在应用经济分析中占有重要地位,故值得读者研习与深思。4.1对数形式
在前面的章节中,我们集中讨论了被解释变量与解释变量的线性关系,而现实的经济中,变量之间的关系错综复杂,线性关系尚不满足经济学应用中的一般适用性。当模型不满足参数线性时,计量经济学就进入了非参数领域,此部分内容超出本书的范围;当模型满足参数线性、变量非线性时,我们便要重新考虑模型中的非线性因素对参数估计的影响,此情况值得我们重点关注。虽然线性关系的应用受到局限,但较多非线性因素又可以通过合理定义变量的方式引入分析之中并运用线性回归模型进行参数估计,这一点值得我们庆幸。
4.1.1对数-对数模型
4.1.2对数-线性模型
4.1.3线性-对数模型4.1对数形式4.2其他函数形式
4.2.1倒数模型
4.2.2多项式回归模型
4.2.3无截距模型
4.3度量单位的改变
4.4虚拟变量回归
4.4虚拟变量回归
4.4虚拟变量回归
4.5回归函数形式和虚拟变量回归实例例4.5.1贸易开放与经济增长贸易开放度又称为对外贸易系数,它反映一国对国际市场的依赖程度,是衡量一国对外开放程度的重要参考信息,该指标是用一国的进出口总额占该国国民生产总值或国内生产总值的比重来度量。现如今,贸易开放是一国扩大市场规模的重要途径,也是影响一国经济增长的重要因素。在此我们从省际的角度出发来探讨贸易开放度对经济增长的影响,在分析过程中以2016年31个省的数据为例。将“2016年省际贸易开放度&人均GDP.xlsx”导入Stata中,之后的操作步骤如下:
4.5回归函数形式和虚拟变量回归实例Enter键确认后得到结果:4.5回归函数形式和虚拟变量回归实例
4.5回归函数形式和虚拟变量回归实例
4.5回归函数形式和虚拟变量回归实例
4.5回归函数形式和虚拟变量回归实例
4.5回归函数形式和虚拟变量回归实例例4.5.2
一个扩充的经济增长问题的探讨经济增长是指在一个较长的时间跨度上,一个国家人均产出或收入水平的持续增加,它是宏观经济学的重要主题之一,对于影响经济增长的各相关因素分析与探讨是有意义的。在上一案例中我们已经看到,贸易开放关键影响因素之一,本例也将继续考虑此因素。除此之外,我们将考虑城市化水平对经济增长的影响,该指标以城镇人口于总人口的占比来衡量;将样本区分为沿海城市与内陆城市,进一步考虑异质性影响。在此我们从省际的角度出发来探讨本例,在分析过程中以2016年31个省的数据为例。将“2016年省际人均GDP&贸易开放度&城市化水平.xlsx”导入Stata中,之后的操作步骤如下:
4.5回归函数形式和虚拟变量回归实例
4.5回归函数形式和虚拟变量回归实例
4.5回归函数形式和虚拟变量回归实例
4.5回归函数形式和虚拟变量回归实例Enter键确认后得到结果:
图4.5.5加法和乘法形式引入虚拟变量
4.5回归函数形式和虚拟变量回归实例4.5回归函数形式和虚拟变量回归实例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初级会计实务-《初级会计实务》模考试卷954
- 基于干扰噪声协方差矩阵重构的稳健波束形成算法研究
- 安全防范与电信诈骗应对
- 现代农业产业园发展与建设综合方案
- 科创孵化器项目商业计划书
- 光伏组件回收产业未来机遇与发展报告
- 文化传媒行业编导培训总结
- 2025版高端石材工程采购及售后服务合同协议3篇
- 二零二五年度个人汽车维修贷款合同范本4篇
- 二零二五年度公益广告宣传海报设计与制作合同3篇
- JJG 705-2014液相色谱仪行业标准
- 地雷基本知识课件
- 五年级上册小数除法竖式计算练习200题及答案
- 人教版五年级上册数学简便计算大全500题及答案
- 创新创业教育课程体系
- 包装品质彩盒外箱知识课件
- 神经外科课件:神经外科急重症
- 颈复康腰痛宁产品知识课件
- 2024年低压电工证理论考试题库及答案
- 《民航服务沟通技巧》教案第14课民航服务人员上行沟通的技巧
- MT/T 538-1996煤钻杆
评论
0/150
提交评论