统计前沿虚假回归_第1页
统计前沿虚假回归_第2页
统计前沿虚假回归_第3页
统计前沿虚假回归_第4页
统计前沿虚假回归_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计前沿虚假回归第1页,课件共20页,创作于2023年2月

在线性回归模型中,我们总是以样本决定系数R2作为回归方程对解释变量与被解释变量样本变化关系的拟合程度的度量。然而变量之间的样本相关与总体相关是两个概念,虽然经济变量的样本之间的关系在一定程度上可以说明变量总体之间的关系,但也有例外,这主要取决于经济变第2页,课件共20页,创作于2023年2月

量总体分布的性质。有研究表明,当用两个相互独立的非平稳时间序列建立回归模型时,常常会得到一个在统计意义上显著的回归方程。我们称之为虚假回归(SpuriousRegression)或伪回归。称不相关的随机变量之间的这种统计相关关系为虚假相关。第3页,课件共20页,创作于2023年2月

研究虚假回归的第一位学者是尤尔(G.U.Yule),他于1926年研究了虚假回归的问题,但是格兰杰—纽博尔德(C.W.J.Granger–P.Newbold)于1974年首先提出了虚假回归问题。在计量经济应用研究中,我们常常可以看到回归方程的拟合优度极高,即解释变量与被解释变量之间的多重相关系数很高第4页,课件共20页,创作于2023年2月

但是DW统计量却极低的例子。比如,作1950年至2003年的美国个人消费支出(Y)关于个人可支配收入(X)的线性回归估计,得:R2=0.997,DW=0.172从DW检验的角度考虑,这样的回归方程不可信,而本章进一步讨论问题的症结所在,即时间序列的非平稳性所至。第5页,课件共20页,创作于2023年2月

格兰杰—纽博尔德曾经提出一个较好的经验规则:当R2>DW时,所估计的回归方程就有虚假回归之嫌。为说明虚假回归的可能性,研究者采用反复生成相互独立的时间序列的方法考察其相关系数的变化。分别考察三组时间序列:第一组为两个相互独立的平稳时间序列;第二组为两个相互第6页,课件共20页,创作于2023年2月

独立的一阶单整非平稳时间序列;第三组为两个相互独立的二阶单整非平稳时间序列。研究方法为采用蒙特卡罗(MonteCarlo)模拟计算的方法,生成两个相互独立的白噪声随机序列εt、ωt,且εt、ωt为标准正态分布,即E(εt)=E(ωt)=0,Var(εt)=Var(ωt)=1。设样本容量n=100,生成随机序列εt、ωt各第7页,课件共20页,创作于2023年2月

10000次,计算每次所生成随机序列εt、ωt的样本相关系数,考察这10000个样本相关系数的分布;对εt、ωt分别进行累加可得两个随机游动序列Xt、Yt,即Xt、Yt为两个I(1)序列,对相应的Xt、Yt的10000个随机样本计算样本相关系数,观察其分布规律;对εt、ωt分别累加两次,即对Xt、Yt分别第8页,课件共20页,创作于2023年2月进行累加得两个I(2)序列Zt、Wt,计算Zt、Wt的样本相关系数,观察其分布规律。三组不同的随机时间序列的样本相关系数研究结果如下:第9页,课件共20页,创作于2023年2月

1.两个相互独立的标准正态平稳时间序列的相关系数的分布特征。用蒙特卡罗方法随机生成两个相互独立的标准正态白噪声随机序列εt、ωt,样本容量n=100,各生成10000次。对于随机生成的两个相互独立的正态白噪声随机序列εt、ωt,其样本相关系数R的分布变化如图13-1,显然,这时相关系数R的均值为0,且相关系数为0的概率较大。第10页,课件共20页,创作于2023年2月图13-1第11页,课件共20页,创作于2023年2月

2.两个相互独立的一阶单整时间序列的相关系数的分布

可以证明,由相互独立的正态白噪声εt、ωt累加所生成的两个随机游动序列Xt、Yt为两个相互独立的I(1)序列,其中,

第12页,课件共20页,创作于2023年2月

序列Xt、Yt的一阶差分为正态白噪声序列。然而用蒙特卡罗方法随机生成10000次的序列Xt、Yt的样本相关系数R的分布如图13-2,类似于半椭圆形,虽然其均值仍为0,但是样本相关系数R为0的概率大大降低。第13页,课件共20页,创作于2023年2月图13-2第14页,课件共20页,创作于2023年2月

3.两个相互独立的二阶单整时间序列的相关系数的分布。

由相互独立的正态白噪声εt、ωt分别累加两次所生成的两个随机序列Zt、Wt为相互独立的I(2)序列,其二阶差分为两个相互独立的正态白噪声序列。但序列Zt、Wt的10000次随机生成的样本的相关系数R的分布如图13-3,这时,两个原本是相互独立的随机变量Zt、Wt的最可能的相关系数R却是±1。而只有当两个时间序列高度相关时才应该出现这种情况第15页,课件共20页,创作于2023年2月图13-3第16页,课件共20页,创作于2023年2月

研究表明,作平稳时间序列变量之间的线性回归模型,样本的特性与总体性质是相一致的,而作非平稳时间序列变量之间的线性回归模型,错误地判断解释变量为显著的概率很高。当解释与被解释变量均为I(1)序列时,错误地拒绝解释变量为不显著的原假设β1=0之概率接近76%,即虚假回归的可能性为76%;当两个变量为I(2)时,这一概率竟高达94%以上,第17页,课件共20页,创作于2023年2月

有研究证实,这种结果对于两个变量的单整阶数不同的情况也同样成立。由此可见,只要解释变量或被解释变量为非平稳的,虚假回归的可能性就存在。比如在应用经济研究中作中国人口数与美国国民生产总值之间的回归分析,回归估计的拟合优度会很高,此二指标均为I(1)时间序列,显然,中国人口数与美国国民生产总值之间是第18页,课件共20页,创作于2023年2月

毫不相干的,这是一个典型的虚假回归之例子。因此,我们在经济分析中不能盲目依赖于R2及t-检验的结果,要正视由变量的非平稳性给我们带来的虚假回归问题。此外,在虚假回归的情况下,回归的DW

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论