




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第4章 违背基本假设的情况信14.2 序列相关性(Serial Correlation)序列相关性实际经济问题中的序列相关性序列相关性的后果序列相关性的检验解决自相关的方法2 如果模型的随机误差项违背了不相关的基本假设的情况,称为序列相关性。 普通最小二乘法(OLS)要求模型的随机误差项序列不相关或相互独立(正态假设下)。注意:自相关现象不是指两个或两个以上的变量之间的相关关系,而指的是一个变量前后期数值之间存在的相关关系。3一 序列相关性41 序列相关的概念对于模型 随机误差项不相关的基本假设表现为: 如果出现 即对于不同的样本点,随机误差项之间不再是完全互相独立,而是存在某种相关性,则认为
2、出现了序列相关性。5如果仅存在 称为一阶序列相关,或自相关。这是最常见的一种序列相关问题。 自相关往往可写成如下形式: 其中, 被称为一阶自相关系数。在其他假设仍成立的条件下,序列相关即意味着6 二 实际经济问题中的序列相关性7为什么会出现序列相关性?下面通过两个例子加以说明。例如,建立行业生产函数模型,以产出量为被解释变量,资本、劳动、技术为解释变量,选择时间序列数据作为样本观测值。于是有: 在该模型中,政策因素等,没有包括在解释变量中,但它们对产出量是有影响的,该影响被包含在随机误差项中。如果该影响构成随机误差项的主要部分,则可能出现序列相关性。如果政策因素对前一年产出量的影响是正的,后一
3、年的该影响往往也是正的。于是在不同的样本点之间,随机误差项出现了相关性,这就产生了序列相关性。8 再如,以绝对收入假设为理论假设、以时间序列数据作样本建立居民总消费函数模型: 消费习惯没有包括在解释变量中,其对消费量的影响被包含在随机误差项中。如果该项影响构成随机误差项的主要部分,可能出现序列相关性。因为消费习惯对消费量的影响是具有内在联系的。前一年是正的影响,后一年往往也是正的影响。于是在不同的样本点之间,随机误差项出现了相关性,这就产生了序列相关性。 91 遗漏关键变量时会产生序列的自相关性2 经济变量的滞后性会给序列带来自相关性3 采用错误的回归函数形式也可能引起自相关性4 蛛网现象可能
4、带来序列的自相关性5 因对数据加工整理而导致误差项之间产生自相 关性产生序列自相关的原因主要有以下几个方面:10 11三 序列相关性的后果121 参数估计量非有效 OLS参数估计量仍具无偏性 OLS估计量不具有有效性 在大样本情况下,参数估计量仍然不具有渐近有效性,这就是说参数估计量不具有一致性 13 2 变量的显著性检验失去意义 在关于变量的显著性检验中,当存在序列相关时,参数的OLS估计量的方差增大,标准差也增大,因此实际的 t 统计量变小,从而接受原假设 的可能性增大, 检验就失去意义。 采用其它检验也是如此。143 模型的预测失效 区间预测与参数估计量的方差有关,在方差有偏误的情况下,
5、使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。15四 序列相关性的检验161 基本思路序列相关性检验方法有多种,但基本思路是相同的。首先采用普通最小二乘法估计模型,以求得随机误差项的“近似估计量”: 然后,通过分析这些“近似估计量”之间的相关 性,以达到判断随机误差项是否具有序列相关 性的目的。172 图示法由于残差 可以作为 的估计,因此如果 存在序列相关,必然会由残差项 反映出来,因此可利用 的变化图形来判断随机误差项的序列相关性。 (1)绘制 的散点图 (2)按照时间顺序绘制回归残差项 的图形18192 解析法(1) 回归检验法以 为被解释变量,以各种
6、可能的相关量,诸如以 等为解释变量,建立各种方程: 20 具体应用时需要反复试算。 回归检验法的优点是: 一旦确定了模型存在序列相关性,也就同时知道了相关的形式; 它适用于任何类型的序列相关性问题的检验。 对各方程估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。21(2) 冯诺曼比检验法冯诺曼比检验法在于构造统计量 该统计量被称为冯诺曼比。当样本容量足够大时(大于30),该统计量近似服从正态分布。计算该 统计量的值,将它与具有正态分布的理论分布值进行比较,如果大于临界值,表示不存在序列相关,如果小于临界值,表示存在序列相关。 22(3)自相关系数法误
7、差序列 的自相关系数定义为自相关系数的取值范围是-1,1,当 时,表明误差序列存在正相关,当 时,表明误差序列存在负相关。在实际应用中,误差序列的真实值未知,用其估计值 代替,得自相关系数的估计值为(4.10)23(4.11) 作为自相关系数 的估计值与样本量有关,需要做统计显著性检验才能确定自相关性的存在。通常采用下面的DW检验代替对 的检验。24(3)D.W.检验 D.W.检验是杜宾(J.Durbin)和沃特森(G.S. Watson)于1951年提出的一种检验序列自相关的方法(小样本情形)。25D.W.检验只能用于检验随机误差项具有一阶自回归形式的序列相关问题。随机误差项的一阶自回归形式
8、为检验步骤(仅适用于一阶自相关的检验)(1) 为了检验序列的相关性,构造假设26 (2) 计算D.W.统计量的值 (4.13)27说明:DW的表达式可以近似为结合(4.11)式又可以写成(4.17 )28于是得到D.W.的取值范围D.W.值与 的对应关系如下表1(1,0)0(0,1)1D.W.误差项的自相关性4(2,4)2(0,2)0完全负自相关负自相关无自相关正自相关完全正自相关29 根据样本容量n和解释变量数目p查D.W.分布表 得到临界值 和 ;(4) 按照下列准则考察计算得到的D.W.值,以判断模型的自相关状态。3031 D.W.的取值范围为 D.W. 0时,模型存在完全一阶正相关 D
9、.W. 4时,模型存在完全一阶负相关 当D.W.值在2左右时,模型不存在一阶自相关32 (1)从判断准则看到,存在一个不能确定的D.W.值区域,这是这种检验方法的一大缺陷。 (2)D.W.检验虽然只能检验一阶自相关,但在实际计量经济学问题中,一阶自相关是出现最多的一类序列相关; (3)经验表明,如果不存在一阶自相关,一般也不存在高阶序列相关。 所以在实际应用中,对于序列相关问题一般只进行D.W.检验。注意:33五 解决自相关的方法34如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。最常用的方法是广义最小二乘法、迭代法、一阶差分法和广义差分法35 1、广义最小二乘法(GLS) 对于
10、模型如果存在序列相关,同时存在异方差,即有(5.1)对称正定阵36 设 用 左乘(5.1)两边,得到一个新的模型:该模型具有同方差性和随机误差项互相独立性。即(5.2)37 于是,可以用OLS法估计模型(5.2),得(5.3) 这就是原模型(5.1)的广义最小二乘估计量,是无偏的、有效的估计量。38 如何得到矩阵 ? 仍然是对原模型(5.1)首先采用普通最小二乘法,得到随机误差项的近似估计量,以此构成矩阵的估计量 ,即392 迭代法设一元线性回归模型的误差项存在一阶自相关(4.18)(4.19)(4.20)(4.19)式表明误差项 存在一阶自相关,(4.20)式表明 满足随机扰动项的基本假设。
11、40根据回归模型(4.18)式,有(4.21)用(4.18)式减去乘以 的(4.21)式,则有令则(4.22)式变成(4.22)(4.24)(4.23)41模型(4.24)式有独立随机误差项,它已满足线性回归模型的基本假设,用普通最小二乘法估计的参数估计量具有通常的优良性。(4.23)式中要用到 ,并计算 ,然后用(4.24)式作普通最小二乘回归。如果误差项确实是(4.19)式的一阶自相关模型,通过以上变换,模型(4.24)式已经消除自相关,迭代结束。423 一阶差分法(原模型存在完全一阶正自相关 ) 一阶差分法是将原模型 变换为 其中 (4.26)43 由于 不存在序列相关,该差分模型满足应
12、用OLS法的基本假设,用OLS法估计可得到原模型参数的无偏的、有效的估计量。即使对于非完全一阶正相关的情况,只要存在一定程度的一阶正相关,差分模型就可以有效地加以克服。44 模型(4.27)为广义差分模型,该模型不存在序列相关问题。采用OLS法估计可以得到原模型参数的无偏、有效的估计量。 广义差分法可以克服所有类型的序列相关带来的问题,一阶差分法是它的一个特例。如果原模型存在: 可以将原模型变换为: (4.27)4 广义差分法455 随机误差项相关系数 的估计 应用广义差分法,必须已知不同样本点之间随机误差项的相关系数 。实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。 常用的
13、方法有:迭代法、杜宾两步法。 (1) 迭代法其基本思路是采用普通最小二乘法估计原模型,得到随机误差项的“近似估计值”,然后利用该“近似估计值”求得随机误差项相关系数的估计量。 46(2)杜宾(durbin)两步法 该方法仍是先估计 ,再对差分模型进行估计。第一步,变换差分模型为下列形式: 采用OLS法估计该方程,得各前的系数 的估计值 。 47第二步,将估计的 代入差分模型 采用OLS法估计,得到参数 的估计量48例题分析在研究我国人均消费水平的问题中,把全国人均消费金额记作 ,人均国民收入为 ,收集到1980-1998年数据。计算出DW0.873,查DW表,n=19,k=2, ,得 ,由DW
14、1.39,可知残差序列 不存在自相关,一阶差分法成功地消除了序列自相关性。差分法的回归标准差为29.34,大于一步迭代的标准差 小于 的标准差 ,因而差分法的效果低于迭代法的效果。55对 的回归方程为将 代入,还原为原始变量的方程56年份序号x_ty_te_tx_ty_te_t19801460234.75-12.1119812489259.26-0.82924.5115.0719823525280.584.133621.328.5819834580305.974.485525.393.6819845692347.15-5.3311241.18-7.4319856853433.537.75161
15、86.3814.6419867956481.368.6910347.833.46198781104545.45.3514864.03-1.57198891355687.5133.19251142.1127.881989101512756.2730.4715768.77-1.091990111634797.0815.7412240.8-12.531991121879890.66-2.2224593.59-17.8119921322871063.39-15.24408172.73-15.619931429391323.22-52.24652259.83-43.6619941539231736.32
16、-87.12984413.1-47.119951648542224.59-22.7931488.2753.0919961755762627.0651.07722402.4665.9319971860532819.3626.21477192.3-28.619981963922958.1810.7339138.83-16.9357Model Summary (d)ModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson10.9910.9810.98029.338571.569d. Linear Regression
17、 through the OriginANOVAModel Sum of SquaresdfMean SquareFSig.1Regression762,593.891762,593.89885.960.000Residual14,632.77817860.752Total777,226.671858CoefficientsModel Unstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1X20.4650.0160.99129.7650.000以上对例2.2数据的分析中,使用了一步迭代法、二步迭代法和差
18、分法,这三种方法各有利弊。一步迭代法的DW1.372,略小于临界值 ,没有彻底消除误差项的自相关性,但是回归标准差从31.75减小到26.96,说明一步迭代的效果是显著的。再进行二步迭代后,DW1.701,完全消除了自相关性,但是回归标准差仅从一步迭代的26.96减小为二步迭代的26.4,改进不大。差分法的DW1.569,彻底消除了自相关性,但回归标准差29.34,高于一步迭代的标准差26.96。由此可以认为选用一步迭代回归模型是可行的。59 异常值:这些观测值与其他数据远远分开,可能引起较大的残差,极大地影响回归拟合的效果 一 关于因变量y的异常值 二 关于自变量x的异常值4.3 异常值与强
19、影响点60有影响的观测值1. 如果某一个或某一些观测值对回归的结果有强烈的影响,那么该观测值或这些观测值就是有影响的观测值 2. 一个有影响的观测值可能是 一个异常值,即有一个值远远偏离了散点图中的趋势线 对应一个远离自变量平均值的观测值 或者是这二者组合而形成的观测值, 61有影响的观测值(图示)不存在影响值的趋势有影响的观测值存在影响值的趋势62一 关于因变量y的异常值在残差分析中,认为超过 的残差为异常值。由于普通残差 的方差 不等,用 作判断会带来一定的麻烦,可以引入标准化残差和学生化残差,以改进普通残差的性质。标准化残差学生化残差63标准化残差使残差具有可比性, 的相应 观测值即判定
20、为异常值。学生化残差可以进一步 解决方差不等的问题,比标准化残差又有所改进 当观测数据中存在关于y的异常观测值时,普通残差 、标准化残差、学生化残差都不再适用,这是由于异常值把回归线拉向自身,使异常值本身的残差减少,而其余观测值的残差增大,这时回归标准差 也会增大,因而“ ”准则不能正确分辨出异常值,改用删除残差。64删除残差的构造思想:在计算第i个观测值的残差时,用删除掉这第i个观测值的其余n-1个观测值拟合回归方程,计算出第i个观测值的删除拟合值 ,这个删除拟合值与第i个值无关,不受第i个值是否为异常值的影响,由此定义第i个观测值的删除残差为删除学生化残差的观测值即判定为异常值。65二 关
21、于自变量x的异常值在式 中,杠杆值 表示自变量的第i次观测值与自变量平均值之间距离的远近,是调节 方差大小的杠杆,较大的杠杆值的残差偏小,这是因为大杠杆值的观测点远离样本中心,能够把回归方程拉向自身,因而把杠杆值大的样本点称为强影响点。 强影响点并一定是y值的异常值点,因而并不总会对回归方程造成不良影响。但对回归效果通常有较强的影响。66由于强影响点并不总是y的异常值点,因而不能单纯根据 的大小判断强影响点是否异常。为此,引入库克距离来判断强影响点是否为y的异常值点。库克距离反映了杠杆值 与残差 大小的一个综合效应。根据(3.22)式, ,则 的平均值为67这样,如果杠杆值 就认为是大的。用库
22、克距离来判定的一个粗略标准是:当 时,认为不是异常值;当 时,认为是异常值。用SPSS计算出的是中心化的杠杆值,即自变量中心化后生成的帽子矩阵的主对角线元素:可以证明 ,中心化杠杆值 的平均值是68例题分析以例3.2的北京开发区的数据为例,作异常值的诊断分析。分别计算普通残差 ,学生化残差 ,删除残差 ,删除学生化残差 ,杠杆值 ,库克距离 ,见下表。69序号x1x2yeiSREie(i)SRE(i)chiiDi1253548554-832-2.34-1491-3.040.3751.447220896.3208.675.050.16784.250.160.0430.00136750.33.1-
23、33.5-0.08-38.1-0.070.0543E-044100120872815126.80.376252.80.3620.4320.047552516391052-458-1.03-529-1.040.0680.056682533583427501.51.305767.91.3480.280.3017120808.5442.8146.90.326163.70.3130.0360.004828520.370.1296.50.218111.80.2090.070.00397671.1122.2120.70.272138.20.2610.060.0041053228621400-697-1.6
24、1-836-1.730.10.17211751160464950.209104.10.2010.0210.0011240862.87.5-151-0.34-169-0.320.040.00513187673224.2-145-0.32-164-0.310.0520.00514122901.8538.9195.20.431215.80.4160.0290.0071574354624439582.61316133.810.3391.55570从表中看到,绝对值最大的学生化残差为 2.631,小于3,因而根据学生化残差诊断认为数据不存在异常值。绝对值最大的删除学生化残差为 ,因而根据学生化残差诊断认
25、为第15个数据为异常值。其 位于第三大,库克距离 位于第一大。由于第15个数据 ,因而从杠杆值看第15个数据是自变量的异常值,同时 ,这样第15个数据为异常值的原因是由自变量与因变71量异常两个原因共同引起的。 诊断出异常值后,要判断引起异常值的原因。异常值原因异常值消除方法1.数据登记误差,存在抄写错误重新核实数据2.数据测量误差重新测量数据3.数据随机误差删除或重新观测异常值数据4.缺少重要自变量增加必要的自变量5.缺少观测数据增加观测数据,适当扩大自变量取值范围6.存在异方差采用加权线性回归7.模型选用错误,线性模型不适用改用非线性回归模型72对引起异常值的不同原因,需要采取不同的处理方法。对本例数据,删除第15组数据,用其余14组数据拟合回归方程,发现第6组数据的删除学生化残差增加为 ,仍然存在异常值现象,因而认为异常值的原因不是由于数据的随机误差。此数据存在异方差,用加权最小二乘回归。权数为 ,用SPSS计算出加权最小二乘回归的有关变量值如下表。73序号x1x2yeiSREie(i)SRE(i)chiiDi1253547.79553.96-890-1.14883-1165.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 劳务合同范本林业
- 传单派发合同范本
- 乡镇物业收费合同范本
- 劳务公司租车合同范本
- 公会主播合同范本
- 劳务购买合同范例
- 公司经营模式合同范本
- 出售买卖合同范本
- 劳动合同转签合同范本
- 2025国合通测校园招聘笔试参考题库附带答案详解
- JJG 144-2007标准测力仪
- GB/T 8417-2003灯光信号颜色
- GB/T 7984-2001输送带具有橡胶或塑料覆盖层的普通用途织物芯输送带
- GB/T 7324-2010通用锂基润滑脂
- GB/T 5916-2020产蛋鸡和肉鸡配合饲料
- GB/T 28114-2011镁质强化瓷器
- GB/T 15566.1-2020公共信息导向系统设置原则与要求第1部分:总则
- 现代汉语常用词汇表(两字)
- 食品添加剂培训讲义
- 医院内静脉血栓栓塞症防治质量评价与管理指南(2022版)
- 冷藏车的制冷原理、发展进程及前景课件
评论
0/150
提交评论