线性模型的扩展_第1页
线性模型的扩展_第2页
线性模型的扩展_第3页
线性模型的扩展_第4页
线性模型的扩展_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 线性模型的扩展基本要求:1、掌握非线性模型的转化方法2、3、4、第一节 非线性回归模型现实经济活动复杂多变,并不能都抽象为线性形式。非线性计量经济学模型的理论与方法的研究是计量经济学理论与方法研究中的另一个广泛领域。在20世纪70年代末,非线性模型理论与方法已经形成了一个与线性模型相对应的体系,包括基于最小二乘法原理和最大似然原理的一整套方法,也包括随机误差项违背基本假设的非线性问题的估计方法。一、模型变量的直接代换1、直接代换法的涵义直接代换法适用于变量之间关系虽然是非线性的,但被解释变量与参数之间关系却是线性的非线性模型。这时可以利用变量直接代换的方法将模型线性化。对于以下形式的非

2、线性方程我们可以直接进行变量代换转换为线性方程: (4-1) (4-2) (4-3) (4-4) (4-5)我们可以分别令,、,则上述几个模型就变换为: (4-6) (4-7) (4-8) (4-9) (4-10)2、直接代换法一般步骤第一步,根据有关理论或变量之间的散点图判断回归模型形式。第二步,根据模型本身特点对模型或数据进行变量变换,使变换后的模型或数据具有线性回归模型形式。第三步,对变换后的线性模型进行拟合,并进行回归检验。第四步,对检验符合要求的模型用原变量写出回归模型,并用于预测或控制,对检验不符合要求的模型重新拟合,直到符合要求为止。在以上的这几类模型形式中尤其应该指出的是双曲线

3、模型(4-1),它是一条双曲线,常用于考察产量与平均固定成本、失业率与通货膨胀率之间的关系,由于该模型对X作倒数变换后转化为标准形式的线性回归模型,所以有时也称为倒数模型。3、实例表4-1给出了1985 -2001年17年间,某国通货膨胀率与失业率的统计数据。记失业率为X,通货膨胀率为Y,试利用回归分析方法确定两者之间的关系。表4-1 1985-2001年某国通货膨胀率与失业率之间的统计数据表 单位:%年 份198519861987198819891990199119921993失业率1.41.11.51.51.21.01.11.31.8通膨率1.88.58.44.54.36.98.05.03

4、.6年 份19941995199619971998199920002001-失业率1.91.51.41.82.11.51.31.4-通膨率2.62.64.23.63.74.84.34.6-解:菲利普斯曲线描述了失业率与通货膨胀率之间的关系,该曲线是凸向原点的,而且随着失业率上升,通货膨胀率下降;失业率下降,通货膨胀率上升,这正是双曲线所具有的性质。上述问题是研究通货膨胀率与失业率之间的关系,所以可设模型为:估计出参数,的结果。图4-1参数估计结果从图4-1所示的回归结果可以看到,用于检验变量之间线性关系是否显著的统计量F值为9.3854,其对应的概率为0.0078,在0.05的显著性水平下应拒

5、绝原假设,即变量之间存在线性关系。但拟合优度R2只有0.38,拟合效果不太理想,需要进行调整。图4-2 残差图从残差图(图4-2)中我们发现,有两个观测点的残差值特别大,经检查是第一个观测点和第3个观测点,这意味着这两个观测点可能是异常点。把这两个观测去掉,重新拟合这一模型,得到结果如图4-3所示。可见,此时的F值为24.9955,对应的概率为0.000243,在0.05的显著性水平下通过检验。与没有剔除异常点之前相比,拟合优度和精度明显提高,说明剔除异常点后模型拟合较好。综上所述,建立的回归方程为: 图4-3 参数估计结果二、模型变量的间接代换在某些经济问题中,经济变量之间的非线性关系,不能

6、通过直接变量代换转化为线性形式,需要先通过方程形式的变形后再进行变量代换,转化为线性形式,这种代换方法称为间接代换法。进行变量间接代换应用最广泛的模型就是指数模型与幂函数模型。1、指数模型 (4-11)由于,所以称为Y对X的弹性系数,它表示X变化1%所引起的Y变化的百分比。对上式(4-11)取对数,则有: (4-12)令, ,变换后有: (4-13)由于该模型同时对X和Y作对数变换,所以有时也称该模型为双对数线性模型。对上述变换后的模型,利用OLS估计可得到参数估计值,。由此可得到原模型的样本回归方程: (4-14)2、幂函数模型幂函数模型常用于人口增长、产值或利润增长、劳动生产率以及就业等问

7、题。这类模型的一般形式为: (4-15)对上述模型两边同时取对数,则有: (4-16)令,则变换后有: (4-17)由于该模型只对Y作对数变换而对X不变,所以有时也称该模型为半对数线性模型。3、实例某商业公司想要研究推销员进行职业培训的天数(X)与其业务表现评分(Y)之间的关系,收集了10个推销员的有关数据如下:表4-2 某公司推销员培训时间与业务表现相关数据资料职业培训天数1122334555业务表现得分454060627581115150145148试分析两者之间的关系,并确定回归模型。解:为确定回归模型形式,在没有有关信息的条件下,一般先绘制两变量的散点图,并根据散点图的形状来确定回归模

8、型的形式。首先绘出Y与X的散点图(见图4-4)。图4-4 培训天数与业务表现的散点图从散点图分析初步可以认为业务表现评分与培训天数之间既可能为线性关系,也可能为非线性关系。考虑到散点图中的形状可假定回归模型的形式为幂函数,即假定回归模型形式为:利用变换后的模型(4-17)()估计上式参数,结果如图4-5所示。在参数估计结果中,拟合优度,用于检验变量之间线性关系的F检验值为940.6557,对应的概率近似为0.0000,说明培训天数与业务表现评分的对数之间线性关系是显著的。用于检验参数是否显著的T检验值分别为99.32和30.67,对应的概率分别近似为0.0000和0.0000,说明截据项和斜率

9、都与0存在显著差异。图4-5幂函数模型的参数估计表综上所述,用幂函数来拟合这组数据是比较合适的,拟合结果为:三、Eviews软件中常用函数1.常用的运算符和函数+ 加 ,add。- 减 ,subtract。* 乘 ,multiply。/ 除,divide。 幂次,raise to the power。> 大于, greater than。D() 一阶差分,frist difference of 。LOG() 自然对数,natural logarithm。DLOG() 自然对数改变量,LOG()-LOG(),change in the natural logarithm。EXP() 指数函

10、数,exponential function。ABS() 绝对值, absolute value。SQR() 平方根,square root。RND 0和1之间均匀分布的随机数,uniformly distributed random number between zero and one。NRND 均值为0方差为1的正态分布的随机数,normally distributed random number with zero mean and variance of one。PCH()百分改变量,percent change (decimal)。INV()逆或倒数,inverse or reci

11、procal。 DNORM()标准正态密度,standard normal density。CNORM()累计正态分布函数,cumulative normal distribution。LOGIT()逻辑特函数,logit of 。FLOOR()转换为不大于的最大整数,convert to integer by rounding down;returns the largest integer not greater than 。CEILING()转换为不小于的最小整数,convert to integer by rounding up;returns the smallest integer

12、 not less than 。2.特殊函数SUM()序列的和,sum of 。MEAN()序列的平均数,mean of 。VAR()序列的方差,variance of 。SUMSQ()序列的平方和,sum of squared。OBS()序列有效观察值的个数,number of valid observations in。COV()序列和序列的协方差,covariance betweenand 。COR()序列和序列的相关系数,correlation betweenand 。CROSS()序列和序列的乘积和,cross product of and 。当序列是一个数时下列统计函数也返回一个数

13、值;当是一个序列时,下列统计函数返回的是一个序列:DNORM()标准正态分布密度函数,standard normal density function of 。CNORM()标准累计分布函数,standard cumulative normal distribution function of 。TDIST()自由度为的统计量的概率,probability that a t-statistic exceeds with degrees of freedom。3.其他功能的特殊函数下列函数计算产生一个序列:MOVAV()序列平滑期为的移动平均数,其中为正整数,period moving aver

14、age of , where is an integer。MOVSUM()序列平滑期为的移动和,其中为正整数,period moving sum of , where is an integer。TREND()在时期正态化为0的时间趋势变量,其中为时期或观察值个数,time trend variable normalized to be zero in period , where is a date or observation number。SEAS()生成一个季度或月度等于时取1,其他取0的季节变量,seasonal dummy equal to one when the quarter

15、 or month equals and zero otherwise。 特殊的函数可以与其他EViews运算符和其他函数结合起来使用。例如: -MEAN()在当前样本区间上,产生一个新的序列,等于序列加序列再减去()的均值。又如: SEAS(3)建立一个虚拟变量,该虚拟变量第3季度取1,其他季度取0。 特殊的函数也可用于估计方程或者定义一个样本。例如: TREND(1970)使用回归常数、序列和在1970年正态化为0的趋势变量来定义回归变量。第二节 虚拟变量在前面的学习中,模型中所使用的变量均是的假定,而在实际应用工作中,我们遇到的变量有时是连续型变量,有时遇到的变量只具有性质上的区别。即在

16、现实问题的解决上,存在多种变量,有些经济变量(如,商品需求量、产品价格、居民人均收入等)是可以定量度量的。但也有一些经济变量(如,人们的职业、性别、国家政策等)是非数量型的,它们没有具体数值。在建立一个社会经济问题数学模型时,经常需要考虑这些非数量型变量。通常在回归分析中,被解释变量不仅受一些定量变量(如,收入、产出、成本、价格等)的影响,而且还受一些定性变量(如,性别、宗教、民族、婚姻等)的影响。为了在模型中反映这些非数量型变量的影响,就需要将它们进行“量化”。由于这些非数量型变量通常指某一性质或属性出现或不出现,比如男性或女性、战争或和平、季节变动等。因此,“量化”这些非数量型变量的方法,

17、通常是构造一个取值为“0”或“1”的人工变量,“0”表示某一属性不出现,“1”表示某一属性出现。比如,“1”表示改革后,则“0”表示改革前。这类赋值“0”或“1”值的变量通常称为虚拟变量(Dummy Variables),常记为D。对于某些经济问题的研究,我们可以引进虚拟变量,建立带有虚拟变量的模型,我们把同时含有一般解释变量与虚拟变量的模型常称为虚拟变量模型或者方差分析模型。一、时间序列资料问题虚拟变量的引入1、时间序列数据时间序列数据(Time Series Data )是经济学研究中最常见的一种数据形式,它主要是各类以时间顺序形式排列的数据序列。例如,宏观经济研究中的某国家的不同年份的G

18、DP组成的数据序列,就是时间数据序列型的数据。研究和分析时间序列数据的模型被称为时间序列模型(Time Series Model)。它的最重要功能就是分析时间序列数据的变化规律并进行预测。时间序列模型可用来预测需求、利率及其它经济变量的变化等。2、实例表4-4给出某地区二战前后10余年1940-1950年期间的消费和可支配收入的数据。试建立消费与可支配收入之间的关系模型。表4-4 某地区19401950年的可支配收入和消费 单位:10亿美元年份19401941194219431944194519461947194819491950可支配收入Y244.0277.9317.5332.1343.63

19、38.1332.7318.8335.8336.8362.8个人消费C229.9243.6241.1248.2255.2270.9301.0305.8312.2319.3337.3解;根据消费和收入之间的关系我们可以建立下述的模型:应用EVIEWS3.0根据上面所给的数据进行回归,结果如图4-7所示:图4-7 消费与收入参数估算结果从上面回归的结果看出方程的整体拟合优度不是很好R2=0.43218,而常数项也不能通过检验。为此我们在方程中引入虚拟变量。根据上面的数据资料,可看出在1942-1945年期间的消费数据明显低于正常趋势。因此我们引入虚拟变量来反映这种异常因素的影响。则模型变为:应用数据

20、重新对模型进行回归。结果如图4-8。图4-8 引入虚拟变量后的参数估算结果可以看出方程回归的显著性明显有提高,这说明虚拟变量对消费的影响是显著存在的。而且D的T统计值为7.755,战争确实导致了消费水平的异常。二、横截面资料问题虚拟变量的引入1、横截面资料横截面资料(Cross-sectional data)是指在某一给定时间点上的度量值。如我们想要解释为什么各地对住房的需求不同,就需要获得某一期间内不同地区特征的观察值。2、实例如在一些研究报告中指出,在其他条件不变的情况下,公司员工中女员工的工资要比相应的男员工的工资低。无论这种差别的原因是什么,在遇到这类横截面资料问题时,都应该将虚拟变量

21、作为解释变量引入到模型之中。我们可以看一个以性别为虚拟变量考察某企业员工工资的模型可表示为: (4-18)其中,Y为企业员工的工资,X为工龄,D=1,表示是男性,D=0,表示是女性。上述企业员工工资模型中就引入了性别这一虚拟变量。在该模型中,如果仍假定随机误差项满足经典线性回归模型的假定,由模型(4-18)可得到该企业女员工的平均工资为:其几何意义为:假定,则两个函数有相同的斜率,但有不同的截距。即:男女员工的平均工资对工龄的变化率是一样的,但两者的平均工资水平相差。按照通常的方法,对估计模型(4-18)式,在T检验的基础上,考察的估计值是否在统计意义上显著,以判断该企业男女员工的平均工资水平

22、是否存在显著差异。三、季节变动虚拟变量1、季节变化许多用月度或季度数据表示的经济时间序列,呈现出季节变化的规律性。例如,春节前后商店的销售量,节假日期间家庭对旅游的需求,夏天人们对冰淇淋、啤酒的需求等等。通常可以从时间序列中将季节因素除去,这样就可以将注意力集中在研究其他的因素的影响上。把季节成分从时间序列除去的过程称为消除季节成分或季节调整时间序列。重要的经济时间序列诸如消费价格指数、批发价格指数和工业生产指数,通常以季节调整的形式出现。解决时间序列的非季节化有许多方法,其中之一就是引进虚拟变量。2、实例澳大利亚从1977年第一季度到1980年第四季度的Y(衣服、硬件、电器、家具的零售价,称

23、为个人消费支出)和X(个人可支配收入)的季度数据。试建立个人消费支出与个人可支配收入之间的函数关系式。表4-5 消费支出与个人可支配收入数据 单位:万美元年份季度1977年第一季度第二季度第三季度第四季度1978年第一季度第二季度第三季度第四季度个人消费支出Y16.6319.9119.4124.0117.5521.9720.9025.61个人可支配收入X136.5132.1157.5177.7152.4150.7173.0199.8年份季度1979年第一季度第二季度第三季度第四季度1980年第一季度第二季度第三季度第四季度个人消费支出Y19.4622.7222.1427.4221.4225.4

24、125.4932.07个人可支配收入X179.1167.4191.6227.0187.3185.0219.2261.5解:建立个人消费支出与个人可支配收入的模型,我们考虑引入季节虚拟变量。建立季节虚拟变量模型需要引入三个虚拟变量,模型建立如下:其中,Y 和X的定义与前面的相同,D的定义为: 我们令第一季度为基准类:第一季度的平均消费支出:第二季度的平均消费支出:第三季度的平均消费支出:第四季度的平均消费支出:根据上面所给的资料进行模型的回归,结果如图4-9所示:图4-9 引入虚拟变量模型的参数估算表根据模型得到的回归结果为:由上面估计的模型可知,所有统计量都是通过检验的,为此引入季节变动的虚拟

25、变量的回归模型能够很好地解释季节变动对消费支出的影响。四、分组资料虚拟变量有些变量虽然是数值变量,可以获得实际观测值,但在某些特定情况下把它选取为虚拟变量则更为方便。如年龄因素,虽然可以用数值计量,但如果将年龄作为资料分组的特征,则可将年龄设为虚拟变量。如家庭教育消费支出不仅取决于其收入而且与年龄因素有关。这是因为家庭中如果有适龄(622岁)的成员,则家庭教育消费支出较多。因此,可按年龄划分为两个年龄组:622岁组和其他年龄组。模型为: (4-19)其中:Yi是第i个家庭的教育消费支出,Xi是第i家庭的收入,Di为虚拟变量。五、上机实验第三节 检验的扩展在前面的章节中我们介绍了线性回归分析的拟

26、合优度检验、回归系数的显著性检验和回归方程的显著性检验。在这一节中我们将继续讨论有关线性回归模型的其他问题,诸如模型所描述的经济结构的稳定性、模型参数的稳定性及模型的线性约束等问题。一、经济结构检验1、结构变化被解释变量和解释变量的关系可能会发生结构性变化,即关系式可能会随时间段的不同而不同。假设被解释变量C为某一段时间内汽车的消费量,解释变量为价格和收入,随着经济的发展,汽车价格会不断下降而人们的收入水平却在不断提高,因此在不同的阶段由于收入和价格的变化可能会导致消费行为模式的改变。所以有理由认为收入与汽车消费的弹性在不同的阶段是不同的。结构变化的统计检验方法称为邹(Chow)检验。对某一经

27、济问题的模型参数的估计结果取决于采用的样本观测值,样本不同则结果有异。在样本期(1970-2006年)内,样本容量n=n1+n2,假设有模型:,考虑到由于时间间隔较长,其期间发生了一些政策上的变化,因此在1970-1985年和1986-2006年时间段内,模型的结构可能会发生一些变化,因此假设模型: (1)样本期(19701985),样本容量为n1 (2)样本期(19862006),样本容量为n2同一问题用不同时间段的样本估计所得。2、检验现要检验两个模型(1)和(2)在时间上有无差异,即两个时间段的经济结构是否发生了显著变化。首先,由模型(1)得,其自由度为。由模型(2)得,其自由度为。其次将两个样本合为一个样本,进行回归分析,得模型 (3)残差平方和为,自由度为。 构造检验统计量:若,则拒绝,说明两个模型显著不同,经济结构已经发生显著变化。若,则接受。说明两个模型无显著差异,经济结构没有发生显著变化。我们也可以使用虚拟变量的引进技术,通过引进虚拟变量进行结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论