单方程回归模型的几个专题_第1页
单方程回归模型的几个专题_第2页
单方程回归模型的几个专题_第3页
单方程回归模型的几个专题_第4页
单方程回归模型的几个专题_第5页
已阅读5页,还剩120页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

单方程回归模型的几个专题第1页,共125页,2023年,2月20日,星期四2.引入虚拟变量的作用引入虚拟变量的作用,在于将定性因素或属性因素对因变量的影响数量化。

(1)可以描述和测量定性(或属性)因素的影响;

(2)能够正确反映经济变量之间的相互关系,提高模型的精度;

(3)便于处理异常数据。设置虚拟变量(即将异常数据作为一个特殊的定性因素)。例如:

7.1.2虚拟变量的设置

1.虚拟变量的设置规则

(1)一个因素多个属性第2页,共125页,2023年,2月20日,星期四

若定性因素有m个不同属性或相互排斥的类型,在模型中则只能引入m-1个虚拟变量,否则会产生完全多重共线性。

例7.1.1

设居民住房消费函数为第3页,共125页,2023年,2月20日,星期四同类型居民对住房消费支出是否有显著影响。但在此例中,若引入m=2个虚拟变量:

例7.1.2

设公司职员的年薪(y)与工龄(x)和学历(D)有关。学历分成三种类型:大专以下、本科、研究生(一个定性因素,三个不同属性)。为了反映“学历”这个定性因素的影响,应该设置两个虚拟变量:第4页,共125页,2023年,2月20日,星期四第5页,共125页,2023年,2月20日,星期四

(2)多个定性因素多种不同属性

例7.1.3

研究居民住房消费函数时,考虑到城乡差异以及不同收入层次的影响,将消费函数设定为第6页,共125页,2023年,2月20日,星期四

(3)虚拟变量取值应从分析问题的目的出发予以界定一般地,“1”表示这种属性或特征存在,“0”表示这种属性或特征不存在。而且设置虚拟变量时,基础类型、否定类型通常取值为0,而将比较类型、肯定类型取值为1。

(4)虚拟变量在单一方程中,可以作为解释变量,也可以作为因变量

2.虚拟变量的引入方式

(1)加法类型所设定的计量经济模型中加入适当的虚拟变量,此时虚拟变量与其他解释变量在设定模型中是相加关系。其作用是改变了设定模型的截距水平。

例7.1.4

居民家庭的教育费用支出除了受收入水平的影响之外,还与子女的年龄结构密切相关。如果家庭中有适龄子女(6-21岁),教育费用支出就多。因此,为了反映“子女年龄结构”这一定性因素,设置虚拟变量:第7页,共125页,2023年,2月20日,星期四第8页,共125页,2023年,2月20日,星期四

图7.1.1表明,在相同的收入水平情况下,有适龄子女家庭的教育费用平均要比无适龄子女家庭的教育费用多支a出个单位。图7.1.1虚拟变量对截距的影响

第9页,共125页,2023年,2月20日,星期四

(2)乘法类型

在所设定的计量经济模型中,将虚拟解释变量与其他解释变量相乘作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的。乘法形式引入虚拟解释变量的主要作用在于:①两个回归模型之间的比较;②因素之间的交互影响分析;③提高模型对现实经济现象的描述精度。

例7.1.5

随着收入水平的提高,家庭教育费用支出的边际消费倾向可能会发生变化。为了反映定性因素对斜率的影响,可以用乘法方式引入虚拟变量,将家庭教育费用支出函数取成:第10页,共125页,2023年,2月20日,星期四图7.1.2虚拟变量对斜率的影响

第11页,共125页,2023年,2月20日,星期四

(3)一般方式实际应用中,一般是直接以加法和乘法方式引入虚拟变量,然后再利用t检验判断其系数是否显著的不等于零,进而确定虚拟变量的具体引入方式。我们还可以用加法模型与乘法模型相结合的方式建立模型来拟合经济发展出现转折的情况。

例7.1.6

进口商品消费支出y主要取决于国民生产总值x的多少。我国改革开放前后,由于国家政策的变化,及改革开放后外资的大量引入等因素的影响,1978年前后,y和x

第12页,共125页,2023年,2月20日,星期四第13页,共125页,2023年,2月20日,星期四

例7.1.7:关于家庭储蓄的模型随机调查美国旧金山地区20个家庭的储蓄情况,拟建立年储蓄额y(千美元)对年收入x(千美元)的回归模型。y和x的数据见表7.1.1。相应散点图见图7.1.4。第14页,共125页,2023年,2月20日,星期四表7.1.1家庭年储蓄额y与收入额x数据(单位:千美元)tyxDtyxD11.020.00110.39.0021.324.00120.06.0030.712.00131.018.0040.816.00142.020.0150.511.00150.412.0062.432.01160.714.0070.310.00171.515.0183.240.01181.616.0192.832.01190.615.00100.07.00200.614.00第15页,共125页,2023年,2月20日,星期四

图7.1.4家庭年储蓄额yt与收入额xt散点图通过散点图分析,可以给模型加入一个定性变量“住房状况”,用D表示。虚拟变量D定义如下:第16页,共125页,2023年,2月20日,星期四第17页,共125页,2023年,2月20日,星期四

例7.1.8中国进出口模型。中国进出口贸易总额数据(1950-1884)见表7.1.2。试检验改革开放前后该时间序列的斜率是否发生变化。表7.1.2中国进出口贸易总额数据(单位:百亿元人民币)第18页,共125页,2023年,2月20日,星期四年份进出口总额y时间x虚拟变量D1D1*x19500.41510019510.59520019520.64630019530.80940019540.84750019551.09860019561.08770019571.04580019581.28790019591.493100019601.284110019610.908120019620.809130019630.857140019640.975150019651.184160019661.271170019671.122180019681.0851900第19页,共125页,2023年,2月20日,星期四年份进出口总额y时间x虚拟变量D1D1*x19691.069200019701.129210019711.209220019721.469230019732.205240019742.923250019752.904260019762.641270019772.725280019783.550290019794.5463013019805.6383113119817.3533213219827.7133313319838.60134134198412.01035135第20页,共125页,2023年,2月20日,星期四第21页,共125页,2023年,2月20日,星期四图7.1.8中国进出口贸易总额序列图图和回归直线图

第22页,共125页,2023年,2月20日,星期四

例7.1.9中国城镇居民消费函数

表7.1.2给出了中国1952-2005年城镇居民人均可支配收入、人均消费性支出(单位:元)数据。采用上述建模方法来建立我国城镇居民消费函数。表7.1.2中国1952-2005年城镇居民人均可支配收入、人均消费(单位:元)第23页,共125页,2023年,2月20日,星期四年份可支配收入AI消费支出AC年份可支配收入AI消费支出AC1952110.13104.941980477.6412.441953121.76118.371981500.4456.841954121.82119.571982535.3471.001955124.47122.861983564.6505.921956138.24134.241984652.1559.441957137.74134.271985739.1673.201958143.98136.191986900.1798.961959150.24143.4619871002.1884.401960156.29150.2519881180.21103.981961132.30139.1219891373.91210.951962131.06135.5319901510.21278.891963136.40135.1419911700.61453.811964133.74130.8719922026.61671.731695141.30137.3119932577.42110.811966145.86142.0519943496.22851.341967149.47147.3319954283.03537.571968145.89144.0619964838.93919.471969151.23151.4119975160.34185.64第24页,共125页,2023年,2月20日,星期四1970151.32152.8019985425.14331.611971161.95158.1719995854.04615.911972177.52172.4020006280.04998.001973182.36177.8220016859.65309.011974187.16182.6720027702.86029.881975189.21186.3320038472.26510.941976194.76190.8820049421.67182.101977202.45200.45200510493.07943.001978343.4311.16200611759.01979405.0361.80第25页,共125页,2023年,2月20日,星期四

分析:由于1978-1991年我国实行的是有计划的商品经济体制,以前为计划经济,1992年以后我国实行的市场经济体制。因此,可以设置两个虚拟变量D1和D2:图7.1.8中国城镇居民人均可支配收入、人均消费趋势图第26页,共125页,2023年,2月20日,星期四

利用EViews软件,输入样本数据AI、AC、D1和D2,然后在命令窗口键入:LSACCAID1D2(AI-343.4)*D1(AI-2026.6)*D2剔除不显著的变量、消除自相关后,得到表7.1.3回归结果。设定模型的数学表达式为:第27页,共125页,2023年,2月20日,星期四表7.1.3我国城镇居民消费函数回归结果第28页,共125页,2023年,2月20日,星期四第29页,共125页,2023年,2月20日,星期四

由此可以看出,我国城镇居民消费函数的特点:1978年前后、1992年前后几个时期的回归结果在截距与斜率项上不同。1978年以前计划经济时期我国城镇居民边际消费倾向为0.85,1978-1991年我国实行的是有计划的商品经济体制,城镇居民边际消费倾向提高,达到为0.87,1992年以后我国实行的市场经济体制,自发消费大幅度提高,但边际消费倾向在下降(仅为0.72)。第30页,共125页,2023年,2月20日,星期四变参数线性回归模型(选学)

如果模型参数取值呈连续变化的,称为连续型确定性变参数线性回归模型。

(1)截距系统变动模型。即在回归模型中仅截距项发生系统性变化,而斜率在整个样本期内不发生变化的变参数线性回归模型。

(2)斜率系统变动模型。即在回归模型中仅有斜率项发生系统性变化,而截距在整个样本期内不发生变化变参数线性回归模型。

(3)截距和斜率系统变动模型。即在回归模型中截距和斜率在样本期内都发生变动的模型。其一般形式为:第31页,共125页,2023年,2月20日,星期四

以1952-1991年我国城镇居民人均可支配收入与人均消费支出的数据资料表7.1.2为例,建立我国城镇居民系统变参数消费函数模型。对本例而言,要体现自发消费支出和边际消费倾向随经济发展过程的变动状况,应取时间作为影响模型参数的外生变量。因此,可设定系统变参数模型为第32页,共125页,2023年,2月20日,星期四第33页,共125页,2023年,2月20日,星期四第34页,共125页,2023年,2月20日,星期四

上述模型表明:

(1)b1和b3在统计上是高度显著的,从而证明我国城镇居民的消费行为在1952~2005年间是不断变化的。

由此可见,随着时间的推移,我国城镇居民的边际消费倾向呈逐年下降趋势,如1977年城镇居民的边际消费倾向为0.92,到1991年下降为0.83,2005年下降至0.75。第35页,共125页,2023年,2月20日,星期四7.1.3虚拟变量的特殊应用

1.虚拟变量在季节调整模型中的应用使用虚拟变量也可以反映季节因素的影响。例如,利用季度数据分析某公司利润y与销售收入x之间的相互关系时,为研究四个季度对利润的季节性影响,引入三个虚拟变量(设第1季度为基础类型):第36页,共125页,2023年,2月20日,星期四

例7.1.10

用虚拟变量处理季节数据模型中国1982-1988年市场用煤销售量(yt)季节数据(《中国统计年鉴》1987,1989)见图7.1.6与表7.1.4。第37页,共125页,2023年,2月20日,星期四表7.1.4

中国市场用煤销售量季节数据年与季度yttD4D3D2年与季度yttD4D3D21982.12599.810001985.33159.1150101982.22647.220011985.44483.2161001982.32912.730101986.12881.8170001982.44087.041001986.23308.7180011983.12806.550001986.33437.5190101983.22672.160011986.44946.8201001983.32943.670101987.13209.0210001983.44193.481001987.23608.1220011984.13001.990001987.33815.6230101984.22969.5100011987.45332.3241001984.33287.5110101988.13929.8250001984.44270.6121001988.24126.2260011985.13044.1130001988.34015.1270101985.23078.8140011988.44904.228100第38页,共125页,2023年,2月20日,星期四

由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度。图7.1.7给出了直接用yt对t回归的拟合直线。数据拟合效果不好。鉴于是季节数据,初步设三个季节变量如下:第39页,共125页,2023年,2月20日,星期四在EViews软件中,生成D2数据的EViews命令是GENRD2=@SEAS(2),D3、D4类似。以时间t为解释变量(1982年1季度取t=1,EViews命令是:GENRT=@TREND(1981:1))的煤销售量(yt)模型回归结果如表7.1.5所示。表7.1.5回归结果第40页,共125页,2023年,2月20日,星期四

由于D3,D2的系数没有显著性,剔除虚拟变量D3,D2,得煤销售量(yt)模型回归结果如表7.1.6所示。表7.1.6回归结果第41页,共125页,2023年,2月20日,星期四第42页,共125页,2023年,2月20日,星期四若不采用虚拟变量,yt对t直接回归,得结果如表7.1.7所示。表7.1.7回归结果第43页,共125页,2023年,2月20日,星期四上式与式(7.1.9)相比,决定系数不足一半、F统计量明显减小。从残差图7.1.8与图7.1.9看,式(7.1.9)拟合优度明显高于式(7.1.10)。第44页,共125页,2023年,2月20日,星期四2.虚拟变量在模型结构稳定性检验中的应用利用不同的样本数据估计同一形式的计量经济模型,可能会得到不同的估计结果。如果估计的参数之间存在着显著差异,则称模型结构是不稳定的,反之则认为是稳定的。模型结构的稳定性检验主要有两个用途:一是分析模型结构对样本变化的敏感性,如多重共线性检验;二是比较两个(或多个)回归模型之间的差异情况,即分析模型结构是否发生了显著变化。利用一些特定的统计检验(如邹氏检验法,是美国计量经济学家邹至庄教授于1960年提出的一种检验两个或两个以上计量经济模型间是否存在差异的统计方法),可以检验模型结构的稳定性问题,使用虚拟变量也可以得到相同的检验结果。设根据同一总体两个样本估计的回归模型分别为第45页,共125页,2023年,2月20日,星期四第46页,共125页,2023年,2月20日,星期四为“相异回归”(Dissimilarregressions)。上述情况中,只有第(1)种情况模型结构是稳定的,其余情况都表明模型结构不稳定。

3.虚拟变量在分段回归中的应用第47页,共125页,2023年,2月20日,星期四第48页,共125页,2023年,2月20日,星期四

回归系数反映了奖金的提高程度。使用虚拟变量既能如实描述不同阶段的经济关系,又未减少估计模型时的样本容量,保证了模型的估计精度。

4.虚拟变量在混合回归中的应用建估计模型时,样本容量越大则估计误差越小。如果能同时获得变量的时序数据和横截面数据(简称为TS—CS数据),是否可以将它们“混合”成一个样本来估计模型?只要模型参数不随时间而改变,并且在各个横截面之间没有差异,就可以使用混合样本估计模型。

例7.1.11

表7.1.8为我国城镇居民1998年、1999年全年人均消费支出和可支配收入的统计资料(单位:元/年)。试使用混合样本数据估计我国城镇居民消费函数。第49页,共125页,2023年,2月20日,星期四表7.1.8我国城镇居民人均消费支出和可支配收入统计资料收入等级1998年1999年消费支出Y收入XD消费支出Y收入XD困难户2214.472198.8802327.542325.701最低收入户2397.602476.75O2523.102617.801低收入户2979.273303.17O3137.343492.271中等偏下户3503.244107.2603694.464363.781中等收入户4179.645118.9904432.485512.121中等偏上户4980.886370.5905347.096904.961高收入户6003.217877.6906443.338631.941最高收入户7593.9510962.108262.4212083.791第50页,共125页,2023年,2月20日,星期四第51页,共125页,2023年,2月20日,星期四表7.1.9回归结果

第52页,共125页,2023年,2月20日,星期四

这表明1998年、1999年我国城镇居民消费函数并没有显著差异。因此,可以将两年的样本数据合并成一个样本,估计城镇居民的消费函数,结果如下(见表7.1.10)。第53页,共125页,2023年,2月20日,星期四表7.1.10

回归结果第54页,共125页,2023年,2月20日,星期四

利用1998年、1999年数据分别估计我国城镇居民消费函数与合并1998年、1999年两年的数据估计我国城镇居民消费函数表明,使用混合回归明显地降低了系数的估计误差,t统计量值增大,显著性增强(见表7.1.11)。表7.1.11利用不同样本估计的消费函数第55页,共125页,2023年,2月20日,星期四

5.虚拟变量在异常值问题中的应用

现实经济中常常存在这样的情况,一些突发事件对经济活动、经济关系造成短暂的,但却是很显著的冲击影响。这种情况在经济数据上反映出来,就会表现为一个脱离基本趋势的异常值。例如,变量y和x在长期中的关系基本满足线性回归模型的各个假设,但在时刻有一个突发情况,使得y出现一个C单位的暂时性波动。那么如果用线性回归模型第56页,共125页,2023年,2月20日,星期四

(1)异常值的发现判断用回归残差序列分析发现和判断异常值问题的方法是:在模型假设成立的前提下,回归残差是服从正态分布的随机变量,因此根据正态分布的性质,其取值95%左右的概率应分布在均值加减2倍标准差的范围内。如果发现某个残差出现第57页,共125页,2023年,2月20日,星期四图7.1.10异常值的残差序列图检验可以直接根据EViews输出的残差序列图判断是否有异常值的可能性。

(2)异常值问题的处理

如果判断模型存在异常值问题,必须作针对性的处理。例如,一个两变量线性回归模型

第58页,共125页,2023年,2月20日,星期四第59页,共125页,2023年,2月20日,星期四

下面举例说明异常值的判断和利用虚拟变量的处理方法。

例7.1.12

上海市1981-2002年城市居民人均可支配收入(x)和人均消费性支出(y)数据见表7.1.12所示,建立如下消费函数模型是否有异常值问题,如何处理?

第60页,共125页,2023年,2月20日,星期四年份可支配收入x消费性支出y年份可支配收入x消费性支出y19816375851992300925091982659576199342773530198368661519945868466919848347261995717258681985107599219968159676319861293117019978439682019871437128219988773686619881723164819991093282481989197618122000117188868199021821936200112883933619912485216720021325010464表7.1.12人均可支配收入(x)和消费(y)第61页,共125页,2023年,2月20日,星期四

利用EViews软件,可以得到消费函数模型的回归结果(表7.1.13)和残差序列图(图7.1.11)。表7.1.13消费函数模型的回归结果第62页,共125页,2023年,2月20日,星期四图7.1.11消费函数残差序列图根据图7.1.13中的残差分布可以看出,1996、2001和2002年的回归残差绝对值,都大于2倍的残差标准差,因此可能属于异常值。第63页,共125页,2023年,2月20日,星期四第64页,共125页,2023年,2月20日,星期四第65页,共125页,2023年,2月20日,星期四第66页,共125页,2023年,2月20日,星期四第67页,共125页,2023年,2月20日,星期四第68页,共125页,2023年,2月20日,星期四

很显然,根据回归系数的标准差、t统计量值、决定系数、F统计量值等指标看(见表7.1.17),回归模型的效果有很大改进,而且虚拟变量的系数也都有显著性。因此,引进虚拟变量对原模型确实是一个改进。表7.1.17引进虚拟变量前后估计的消费函数

再看引进虚拟变量后回归的残差序列图(见图7.1.14),则现在是有多点而不是个别点在2倍标准差临界值之外,而且都离临界值不远,并且2倍标准差的临界值范围也比未引进虚拟变量时小了许多,因此可不再认为存在异常值。第69页,共125页,2023年,2月20日,星期四第70页,共125页,2023年,2月20日,星期四7.2模型的设定误差7.2.1判断计量经济模型优劣的基本准则

1.传统建模方法的过程

2.传统建模方法的思路

3.判断计量经济模型优劣的基本准则

(1)模型应力求简单。

(2)模型具有可识别性。

(3)模型具有较高的拟合优度。

(4)模型应与理论相一致。

(5)模型具有较好的超样本功能。第71页,共125页,2023年,2月20日,星期四7.2.2模型设定误差的类型1.模型遗漏了重要的解释变量第72页,共125页,2023年,2月20日,星期四2.模型包含无关的解释变量第73页,共125页,2023年,2月20日,星期四

3.模型采用了不正确的函数形式

在某些情况下,研究者对模型变量的选择正确,但因为多种原因对这些变量之间内在关联关系的判断发生失误,就可能对模型采用错误的函数形式。对于上例,如果研究者误认为第74页,共125页,2023年,2月20日,星期四7.2.3模型存在设定误差的后果

1.模型遗漏重要变量的后果对于模型遗漏重要变量的后果,可以用一个二元线性模型遗漏一个重要变量的情况加以说明,至于多元模型中遗漏一个以上重要变量的后果,可以类推,只不过计算过程要复杂得多。假设正确的回归模型为第75页,共125页,2023年,2月20日,星期四第76页,共125页,2023年,2月20日,星期四检验的结果不可靠,也不可信。第77页,共125页,2023年,2月20日,星期四2.模型包含无关变量的后果假设正确的模型是:第78页,共125页,2023年,2月20日,星期四上述分析表明,相关变量的遗漏,损失的是无偏性和一致性;无关变量的误选,其损失是失去有效性。第79页,共125页,2023年,2月20日,星期四

3.模型遗漏重要解释变量和引进无关解释变量的后果比较第一,模型中遗漏重要解释变量的不良后果比模型中引入无关解释变量的后果要严重得多。遗漏了重要解释变量的模型是一个错误的不可用的模型,而引进了无关解释变量的模型是一个精度不高、但仍具一定利用价值的模型。第二,虽然在模型引进无关解释变量的不良后果相对较小,但不能认为在模型中包含无关解释变量是可以容忍的。一般说来,模型设定是对偏误与有效进行权衡,偏爱哪一方取决于模型研究的目的。若建模目的是为了进行准确预测,最小均方误差(均方误差=方差+偏误的平方)则是兼顾有效性和无偏性的良好准则。第80页,共125页,2023年,2月20日,星期四4.模型函数形式设定错误的后果假设真实回归模型为可见,真实的回归模型实质上是一个关于x的高次方程,误将它设定为线性函数,实质上就是遗漏了真实方程中应该包含的二次项和其余高次项。由此所产生的影响与遗漏相关解释变量相类似。第81页,共125页,2023年,2月20日,星期四

7.2.4模型设定误差的检验

1.模型是否包含无关解释变量的检验对模型中是否包含无关解释变量的检验,就是对模型解释变量的参数是否为零的检验。如果发现模型中某个解释变量的参数为零的可能性很大,这一解释变量就是一个无关的变量,不应当包含在模型中。如果模型中每一个解释变量的参数都不为零,则模型中就不包含无关解释变量。第82页,共125页,2023年,2月20日,星期四第83页,共125页,2023年,2月20日,星期四

2.模型遗漏重要解释变量和采用错误函数形式的检验

(1)残差图示法检验这种检验方法分三步进行:第一步,对所构建的模型应用相宜的计量经济学方法进行估计,求出样本估计式。第84页,共125页,2023年,2月20日,星期四

图7.2.1给出了残差序列随时间持续上升与呈现循环变化的两类图形。前者预示着模型设定时可能遗漏了一随着时间的推移而持续上升的变量;后者则表明模型设定时可能遗漏了一随着时间的推移而呈现循环变化的变量。(a)趋势变化(b)循环变化图7.2.1残差序列变化图第85页,共125页,2023年,2月20日,星期四图7.2.2模型函数形式设定偏误时残差序列呈现正负交替变化图7.2.2给出了一元回归模型中,真实模型呈幂函数形式,但却选取了线性函数进行回归的情形。在这种情形下,容易知道残差序列呈现先正、后负、再正的变化特征。第86页,共125页,2023年,2月20日,星期四

(2)一般性设定偏误检验:拉姆齐(Ramsey)的RESET检验常用的判定方法是拉姆齐(Ramsey)于1969年提出RESET检验(gressionerrorspecificationtest)。第87页,共125页,2023年,2月20日,星期四第88页,共125页,2023年,2月20日,星期四第89页,共125页,2023年,2月20日,星期四第90页,共125页,2023年,2月20日,星期四表7.2.1某公司单位成本、产量指数和产量投入相关数据

年份单位成本产量指数要素投入成本年份单位成本产量指数要素投入成本1980365858019904281041151981422789319914428211719824298210719925117512819835436411519934888413419846625013019944998613519855716212819954579013519865097011619964849413919873999092199751680142198840894941998567721471989438100110199962660150第91页,共125页,2023年,2月20日,星期四利用EViews软件容易得到表7.2.2回归结果。表7.2.2回归结果第92页,共125页,2023年,2月20日,星期四第93页,共125页,2023年,2月20日,星期四表7.2.3检验结果

第94页,共125页,2023年,2月20日,星期四表7.2.4加入产量二次项后的回归结果

第95页,共125页,2023年,2月20日,星期四

可以看出,各项检验指标都进一步趋好,而且也符合经济学意义。对该模型进一步实施RESET检验,得如表7.2.5所示的检验结果。

表7.2.5检验结果第96页,共125页,2023年,2月20日,星期四表7.2.6回归结果

第97页,共125页,2023年,2月20日,星期四第98页,共125页,2023年,2月20日,星期四

7.3模型变量的观测误差在搜集与处理过程中由于受到各种因素的影响,使样本数据存在着一定的误差。例如,由于虚报和误报数据、重复或遗漏数据、错误抄录数据而产生的登记性误差;由于统计指标口径的不一致性或误解指标含义而产生的统计误差;由于汇总计算而产生的数据整理误差,等等。我们把这些误差统称为“观测误差”或“测量误差”。

7.3.1模型变量存在观测误差的后果模型变量存在观测误差的后果,可以用一个简单的线性回归模型为例加以说明。设真正的回归模型为第99页,共125页,2023年,2月20日,星期四第100页,共125页,2023年,2月20日,星期四这表明当观测误差存在时,OLS法常常低估真正的回归参数。回归变量中的观测误差问题是数据问题,目前计量经济学家们还提不出有效的解决方法。第101页,共125页,2023年,2月20日,星期四7.3.2观测误差的检验关于观测误差存在与否的检验是豪斯曼(Hausman)1978年提出的,豪斯曼检验的具体步骤为

(1)对所研究的回归模型,无论是否存在观测误差,先采用OLS法得到参数估计量;

(2)对可能存在观测误差的解释变量,选择与其相关的工具变量,将可能存在观测误差的解释变量对选择的工具变量进行回归,并获得回归残差。第102页,共125页,2023年,2月20日,星期四

例7.3.1

我们研究某地区出口额与国内生产总值的关系,拟建立回归模型其观测值数据如表7.3.1所示。表7.3.1某地区出口额与国内生产总值统计数据年份出口额(y)国内生产总值(x)储蓄(z)1986580.57171.01214.71987808.98964.41622.619881082.110202.22237.619891470.011962.53073.319901766.714928.33801.519911956.016909.25146.9第103页,共125页,2023年,2月20日,星期四年份出口额(y)国内生产总值(x)储蓄(z)19911956.016909.25146.919922985.818547.97119.819933827.121617.89241.619944676.326638.111759.419955284.834634.415023.5199610421.846759.421518.8199712451.858478.129662.3199812576.467884.638520.8199915160.774462.646279.8200015223.678345.253407.5200116159.882067.559621.8200220634.489468.164332.4200322024.497314.873762.4200426947.9105172.386910.6200536287.9117251.9103617.7第104页,共125页,2023年,2月20日,星期四

但我们怀疑x可能有观测误差,会影响分析结果,于是我们采用豪斯曼(Hausman)检验。

(1)我们用居民储蓄z作为国内生产总值x的工具变量。

(2)x对z作回归得方程第105页,共125页,2023年,2月20日,星期四

7.4随机解释变量

7.4.1估计量的渐近统计性质线性、无偏性和有效性是评价一个估计量优劣的标准。在有些情况下,小样本时的估计量不具有某种统计性质,但随着样本容量的增大,估计量逐渐具有了这种统计性质,此时称之为估计量的渐近统计性质。

1.渐近无偏性第106页,共125页,2023年,2月20日,星期四2.一致性

第107页,共125页,2023年,2月20日,星期四

因此,一致估计量一定是渐近无偏的,并且在真实值附近离散的程度随样本容量的增大逐渐趋于0。

7.4.2随机解释变量的概念与来源

1.随机解释变量的概念

如果解释变量中某些为随机变量,不为确定性变量,则称模型存在随机解释变量问题。

2.随机解释变量的来源

模型中随机解释变量问题首先来源于省略解释变量。被省略的解释变量一般与模型中保留的解释变量相关,导致模型中的随机误差项与解释变量相关。被解释变量往往受到前若干期值的影响。当模型中含有被解释变量的滞后期变量时,模型就存在随机解释变量问题。第108页,共125页,2023年,2月20日,星期四第109页,共125页,2023年,2月20日,星期四7.4.3随机解释变量的后果当模型中存在随机解释变量时,采用最小二乘法估计参数可能会带来一些不良的结果。假定模型满足除解释变量非随机的所有其他古典假设,考虑利用一元线性回归模型:第110页,共125页,2023年,2月20日,星期四第111页,共125页,2023年,2月20日,星期四第112页,共125页,2023年,2月20日,星期四第113页,共125页,2023年,2月20日,星期四

7.4.4随机解释变量的修正方法:工具变量法

工具变量(InstrumentVariable—IV)法的基本思路是:当随机解释变量与随机误差项相关时,则寻找另一个变量,该变量与随机解释变量高度相关,但与随机误差项不相关,称其为工具变量,用其替代随机解释变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论