计量经济学课件全_第1页
计量经济学课件全_第2页
计量经济学课件全_第3页
计量经济学课件全_第4页
计量经济学课件全_第5页
已阅读5页,还剩616页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第一章:绪论,什么是计量经济学? 计量经济学的研究对象 计量经济学的内容体系 计量经济学的应用 计量经济学研究经济问题的步骤 计量经济学软件,2,一、什么是计量经济学,计量经济学又名经济计量学 英文名称:Econometrics。这个词是在1926年由挪威经济学家、第一届诺贝尔经济学奖获得者之一拉格纳费瑞希(Ragnar Frish)仿照“生物计量学”(Biometrics)一词提出。,3,一、什么是计量经济学,费瑞希:“对经济的数量研究有好几个方面,其中任何一个就其本身来说都不应该和经济计量学混为一谈。因此,经济计量学与经济统计学绝不是一样的。它也不等于我们所说的一般经济理论,即使这种理

2、论中有很大部分具有确定的数量特征,也不应该把经济计量学的意义与在经济学中应用数学看成是一样的。,4,一、什么是计量经济学,经验表明,统计学、经济理论和数学三个方面观点的每一种都是实际理解现代化经济生活中数量关系的必要条件,但任何一种观点本身都不是充分条件。这三者的统一才是强有力的工具;正是由于这三者的统一才构成了经济计量学。”,5,一、什么是计量经济学,丁伯根:“计量经济学的范围包括用数学表示那些从统计检验的观点所做的经济假设和对这些假设进行统计检验的实际过程。” 萨缪尔森:“经济计量学的定义为:在理论与观测协调发展的基础上,运用相应的推理方法,对实际经济现象进行数量分析。”,6,一、什么是计

3、量经济学,兰格:“经济计量学是经济理论和经济统计学的结合,并运用数学和统计方法对经济学理论所确定的一般规律给予具体的和数量上的表示。” 克莱茵:“经济计量学是数学方法、统计技术和经济分析的综合。就其字义来讲,经济计量学不仅是指对经济现象加以测量,而且包含根据一定的经济理论进行计算的意思。”,7,一、什么是计量经济学,计量经济学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学。 计量经济学运用数理统计知识分析经济数据,对构建于数理经济学基础之上的数学模型提供经验支持,并得出数量结果。 计量经济学是以经济理论为前提,利用数学、数理统计方法与计算技术,根据实际观测资料来研究带有随

4、机影响的经济数量关系和规律的一门学科。,8,计量经济学构成要素,9,三大要素,经济理论 数据 统计推断 经济理论、数据和统计理论这三者对于真正了解现代经济生活中的数量关系都是必要的,但本身并非是充分条件。三者结合起来就是力量,这种结合便构成了计量经济学。,10,经济理论,经济理论的作用是对经济现象进行分析和解释,描述在一定条件下经济变量之间的相互关系。体现在计量经济学模型之中。 经济理论对于计量经济学是建立计量经济模型的依据和出发点。 计量经济学对于经济理论而言是理论到实际的桥梁和检验工具。,11,经济理论,理论是抽象的,在实证分析时,需要具体化。 计量经济的方法和统计方法一样,本质上是归纳法

5、,是将实事归纳成理论的一个有效的辅助工具。计量经济学可以结合实际观测数据对经济理论进行验证,检验理论的正确性,提供进一步改进理论的方向。,12,数据,观测数据:主要是指统计数据和各种调查数据。是所考察的经济对象的客观反映和信息载体,是计量经济工作处理的主要现实素材。 经济数据是计量经济分析的材料。 经济数据是经济规律的信息载体。,13,1、数据类型,时间序列数据(time series data) 截面数据(cross-section data) 平行数据(panel data) 虚拟变量数据(dummy variable data),14,时间序列数据(time series data),按

6、照时间的顺序,每隔一定的时间观测经济变量的取值,所得到的统计数据。 观测对象是一个单位:一国,一地区,某企业 时间间隔:可以是一年,一个季度,一个月,一天,甚至更短,要视问题的性质和重要性而定。,15,时间序列数据(time series data),这类变量反应了变量的动态特征,即在时间上的变动趋势。 一般可由统计年鉴、公报得到,是计量经济模型使用得最多的一类数据。,16,例 、中国的GDP(19522000当年价,亿元),17,18,截面数据(cross-section data),在某一时刻所观察到的一组个体的数据。 这类数据反应个体在分布或者结构上的差异。 例:某班计量经济学的考试成绩

7、。六十个学生,有六十个成绩,这是一个容量为60的截面数据。,19,时序数据和截面数据的区别,前者:同一个体在不同时间的数据; 后者:一组个体在同一个时刻的数据。 例如,一名学生的体重,被连续的记录了十年,得到一个容量为10的时间序列数据;在某一时间,记录一个班级所有30个学生的体重,得到一个容量为30的截面数据。,20,平行数据(panel data),是时间序列数据和截面数据的结合。是一组个体在一段时间上的数据,既研究某段时间内的数据又研究某个时刻上的数据。,21,例 从1997年到2000年,我国各省的GDP,22,虚拟变量数据(dummy variable data),或者称为二进制数据

8、,一般取0和1两个值(也可以取其他两个不同的值)。 这类变量往往用来表示性质和状态的差异,也可以表示分组 取0还是1:研究者按照实际情况来确定,23,例 时间序列型的虚拟变量,24,例 截面数据型虚拟变量,25,2、数据采集和处理,来源:统计、调查 质量:非实验,历史数据残缺,各种偏误(观测误差、选择性、随机性问题、处理方法问题) 加工:加总、指数运算、季节调整,随变量作变换 结论:研究结果的质量不可能高于数据的质量。不管方法多么科学。,26,统计推断,统计理论:是指各种数理统计方法,包括参数的估计,假设检验等内容。是计量经济的主要数学基础,很多计量经济学方法都是在数理统计的基础上发展起来的。

9、,27,计量经济学与经济理论、统计学和数学的联系和区别,是经济学,统计学,数学构成的一门交叉学科和边缘学科。,28,1、计量经济学与经济理论,经济学是计量经济学的服务对象,计量经济学是提高经济学科科学性和实用性的工具。 一般经济理论(定性)是计量经济学的基础。 例:关于失业问题的数量实证分析(1)菲利普斯曲线(工资和失业率);(2)资本和技术变化的影响;(3)人口和移民的影响(供给方面);(4)经济增长和产业结构(需求方面、结构性失业)。,29,1、计量经济学与经济理论,一般经济理论是修正计量经济分析模型、方法的依据。 一般经济理论是解读计量分析结果的工具。 定性、定量,30,2、计量经济学与

10、统计学,计量的参数估计、模型检验、数据收集和处理、方法设计,应用分析中的置信区间分析等,都与统计有关,以统计为基础。,31,3、计量经济学与数学,数学(微积分、线性代数、概率统计)是计量分析(级数、矩阵、方差、期望,)的基础和工具。 数学知识(函数性质等)对计量建模的作用。 计量经济学不是数学,是经济学。,32,二、研究对象,计量经济学是利用数学的方法,根据统计测定的经济数据,对反映经济现象本质的经济数量关系进行研究。 计量经济学研究的对象是经济现象,是研究经济现象中的具体数量规律。,33,三、内容体系,1、从学科发展角度划分 2、从内容角度划分 3、从程度角度划分 4、从模型类型角度划分 5

11、、从估计方法角度划分 6、从数据类型角度划分,34,1、从学科发展角度划分,经典计量经济学 广义计量经济学:包括投入产出分析方法、时间序列分析方法等,35,2、从内容角度划分,理论计量经济学:也称经济计量方法,以介绍、研究计量经济学的理论与方法为主要内容,侧重于理论与方法的数学证明与推导。包括计量经济学的数学理论基础,计量经济模型的估计和检验方法等内容。 应用计量经济学:以建立与应用计量经济模型为主要内容,强调应用模型的经济学和统计学基础,侧重于建立与应用模型过程中实际问题的处理。,36,理论计量经济学与应用计量经济学,37,3、从程度角度划分,初级计量经济学 中级计量经济学 高级计量经济学,

12、38,4、从模型类型角度划分,经典线性模型 非经典线性模型 非线性模型 动态模型 无参数回归模型,39,5、从参数估计方法角度,最小二乘法 最大似然法 贝叶斯估计方法 广义矩方法,40,最小二乘法,最小二乘法是一类依赖样本信息,从最小二乘原理出发的参数估计方法。 概念清楚、方法简单,是经典线性计量经济模型的最主要的估计方法。,41,最小二乘法,普通最小二乘法(OLS):模型满足基本假设时采用 加权最小二乘法:模型存在异方差 广义最小二乘法:模型存在序列相关 二阶段最小二乘法:估计联立方程,42,最大似然法,最大似然法是一类依赖样本信息,从最大似然原理出发的参数估计方法。 坚实的理论基础、数学描

13、述复杂 最大似然法普通最小二乘法 有限信息最大似然法二阶段最小二乘法 完全信息最大似然法三阶段最小二乘法,43,贝叶斯估计方法,在计量经济模型参数估计中,它的主要特点是利用了非样本信息,包括前验信息和后验信息。 在一些特殊的计量经济应用模型中,由于样本量不足,使得最小二乘法和最大似然法无法应用,这时贝叶斯估计方法是无可替代的。,44,广义矩方法,广义矩(Generalized method of moments,GMM)方法是矩方法( Method of moments ,MM)的一般化,也是一类依赖样本信息的参数估计方法,具有广泛的适用性。 最小二乘法和最大似然法等可以看作是广义矩方法的特例

14、。,45,6、从数据类型角度划分,截面数据分析 时序数据分析 平行数据分析 离散被解释变量数据计量经济模型 受限被解释变量数据计量经济模型 持续被解释变量数据计量经济模型,46,四、计量经济模型的应用,结构分析 经济预测 政策评价 检验与发展经济理论,47,1、结构分析,经济学中的结构分析是对经济现象中变量之间相互关系的研究。它研究的是当一个变量或几个变量发生变化时会对其他变量以至经济系统产生什么样的影响。 结构分析采用的主要分析方法:弹性分析、乘数分析、比较静态分析。,48,2、经济预测,计量经济模型作为一类经济数学模型,是从用于经济预测,特别是短期预测而发展起来的。 计量经济模型是以模拟历

15、史,从已经发生的经济活动中找出变化规律为主要技术手段。,49,3、政策评价,政策评价是指从许多不同的政策中选择较好的政策予以执行,或者说是研究不同的政策对经济目标所产生的影响的差异。 经济计量模型充当“经济政策实验室”。,50,政策评价方法,工具目标法:给定目标变量的预期值即我们所希望达到的目标,通过求解模型可以得到政策变量值。 政策模拟法:即将各种不同的政策代入模型,计算各自的目标值,比较其优劣,决定政策的取舍。 最优控制法:将经济计量模型与最优化方法结合起来,选择使得目标最优的政策或政策组合。,51,4、经济理论的检验与发展,经济理论的检验:首先根据某种经济理论建立模型,然后用已经发生的经

16、济活动的样本数据去拟合,如果拟合效果好,则这种经济理论通过检验。 经济理论的发现与发展:用所采集的样本数据拟合各种模型,拟合最好的模型所表现出来的数量关系就是经济活动所遵循的经济规律。,52,应用示例1,例子: 各种产品和服务的供给和需求关系 厂商欲估计广告对销售和利润的影响 将股票价格和厂商的特征联系起来 宏观政策,国家,地方税收收入预测,53,应用示例2,例子: 广告战是否成功地增加了销售? 需求对价格变化是富有弹性的,还是缺乏弹性的? 政府的宏观政策是否有效? 确实存在工资的性别差异吗?,54,应用示例3,例子: 厂商需要预测销售、利润、生产成本、所需的存货 城市发展对交通、能源、通讯的

17、需求 国家的税收、支出、通货膨胀、失业、预算和贸易等方面的预测 汽车厂商对中国轿车市场的预测,55,五、研究经济问题的步骤,1、理论或假说的陈述 2、收集数据 3、建立数学模型 4、建立统计或经济计量模型 5、估计计量经济模型参数 6、检查模型的准确性:模型的假设检验 7、检验来自模型的假说 8、运用模型进行预测,56,五、研究经济问题的步骤,57,1、模型设计,模型设定(理论模型设计):依据一定的经济理论,先验地用一个或一组数学方程式来表示被研究经济系统内经济变量之间的关系。 需要做以下工作: 研究有关经济理论 确定函数形式 确定参数的符号和理论期望值,58,研究有关经济理论,根据经济理论分

18、析所研究的经济现象,找出经济变量之间的因果关系及相互之间的联系,把目标或者经济问题作为因变量,影响问题的主要因素作为自变量,非主要因素归入随机项,按照它们之间的结构关系和经济理论,建立方程。,59,需求函数:Q=f(P1,P2,Y,T) - ? + + 消费函数:Cf(Y) 按照凯恩斯的绝对收入假说,“平均说来,当人们收入增多时,消费倾向于增加,但其增长的程度并非和收入增加的程度一样多。” 按照凯恩斯的观点, 边际消费倾向 MPCb=dc/dy ,0b1。,60,一般形式,y:因变量,被解释变量;是被研究对象。 “果” xs:自变量,解释变量;是影响因素。 “因” 变量选择要注意: 变量的选择

19、要以经济理论为基础,要有明确的经济解释 要突出主要的影响因素,把握主要矛盾,从而使模型凝练、简明。,61,确定函数形式,设定模型的函数形式,是线性的,还是非线性的,如果是非线性的话,是对数的,还是指数的,还是倒数的, 例 Qa+bP+cPr+dI+eN+fPe QaPb PrcIdNePef,62,例:某商品的市场需求量,Q=b0+b1P1+b2P2+b3Y+b4T+u Q:该商品需求量 P1:该商品的价格 P2:其他相关商品的价格 Y:消费者收入 T:消费者偏好,63,2、数据的收集整理,数据的来源: 官方公布的统计年鉴、公报等; 各种调查,包括抽样、典型和问卷等调查。 对样本数据的要求:

20、完整性 准确性 可比性,64,完整性,经济数据作为系统状态和外部环境的数量描述,必须是完整的。 文革10年中,很多经济数据是残缺不全的 比如,1000个企业中,只有100个企业有完整的数据,65,准确性,必须是模型中所要求的数据 必须准确反映被研究对象的状态,否则经济模型将被扭曲,不能客观反映经济的实际状况。 炕头上点羊 怀揣报表开统计会议,比着填数字 美国匹兹堡大学经济学家托马斯罗斯基 2000年中国GDP统计发生了什么? 罗斯基认为1997年1999年中国经济增长率在正负2.2之间。,66,可比性,统计口径的可比性 如价格的可比性 当年价可比价 指标内涵的可比性 社会总产值GDP 工业总产

21、值工业增加值,67,口径问题,(1)价格上的口径,一般使用可比价; (2)指标内涵的口径 比如在我国,反应经济活动总规模的总产值被国民生产总值所代替,而这两个指标的含义是不同的,因此在使用时要进行数据的调整。,68,不变价和当年价,69,数据整理中变量的构造,在计量经济建模中,数据变量未必是原始观测变量,而是通过某种变换,把原始数据转变为符合于某种统计或经济概念的新的变量 。 常用变换: 取对数 LGDP=Log(GDP) 取倒数 AFC=TFC/Q,70,常用变换,比值 恩格尔系数食品支出总支出 乘积 名义GDP实际GDP*GDP指数 和 狭义货币通货活期存款, 即M1=Cu+D 差 实际利

22、率名义利率通涨率 等等,71,数据收集的困难,某些变量无法直接测得,只好用“替代”变量。不能直接观测的变量有如技术进步、消费者嗜好、企业信心等 等,如何取代,难有完美的方法。还有一些变量的数据属于“保密范围”,如有关个人财富的数字,财富持有人往往不愿透露真情。 数据缺落。 数据不足,样本太小。 数据不准确,有内在予盾。不同机构,不同时期发表的数字不一致。诸如按加值计算的部分之和不等于总数;不同时期的数列不衔接;如此等等,均有待于修补。,72,3、估计参数,建立计量经济模型后,需要根据统计资料估计出模型的参数。 在这个过程中,首先要有详实、客观的统计数据,然后利用相应的经济计量方法如OLS、最大

23、似然估计法等对参数进行估计。 Q=b0+b1P1+b2P2+b3Y+b4T+u,73,4、模型检验,参数估计以后,模型便已确定。但模型是否符合实际,能否解释实际经济过程,还需要进行检验。 运用数理统计中关于假设检验的原理,验证已经估计出的参数与理论上的预期是否一致,验证所建立的模型是否符合实际,否则就有必要对模型进行适当的修正。经过检验之后,模型才可以被使用。,74,4、模型检验,检验分四方面内容: 经济意义检验 统计检验 计量经济学检验 预测检验,75,4、模型检验,经济意义检验:检验各个参数是否与经济理论和实际经验相符; 统计假设检验:利用统计推断的原理,对模型和参数的可靠性进行检验。包括

24、拟合优度检验、变量和模型的显著性检验等内容。,76,4、模型检验,计量经济学检验:计量经济学所特有的统计检验方法,包括: 自相关检验 异方差检验 多重共线性检验等内容 预测检验:用预测来检验模型的稳定性。 内插预测(解释历史) 外推预测(外推到研究范围之外),77,4、模型检验,计量经济学研究是一个动态过程。模型通过上述各项检验之后,才能实际应用,检验不能通过,则需修正模型,再设计,再估计,再检验。,78,5、模型应用,计量经济模型需要接受实践的检验,如果检验结果较好,我们就可以利用模型来解决实际问题。 经济计量模型主要用于结构分析,政策评价(仿真经济系统)、经济预测和理论验证与发展等四个方面

25、。,79,六、计量经济学软件,TSP Eviews SPSS SAS PC-GIVE GAUSS MATLAB,80,TSP,TSP:时间序列分析软件包 DOS下的计量经济学应用软件。简单、灵活、功能强大。我国曾流行 V4.2.,V 6.5。,81,EViews,EViews(Econometrics Views ) 计量经济学软件包 是TSP的For Windows版本。它是由经济学家采用面向对象程序语言Basic设计开发的。 EViewsV1.0V4.0 EViewsV3.1是目前应用较多的版本。 简单易学 ,适合于教学和科研,82,SPSS,SPSS:社会科学统计分析软件包。目前的流行版

26、本:V10V11 是功能强大的广谱性的统计分析软件,并非计量经济学分析专用软件。 在进行联立方程系统估计方面存在局限。 但并不影响使用它进行计量经济学的教学和研究。,83,SAS,统计分析系统 为我国应用最为广泛的通用统计分析软件。 目前最高版本SAS V8.2,流行版本是V6.12 SASETS模块提供了强大的计量经济分析工具。,84,PC-GIVE,根据Hendry理论方法研制的独具特色的计量经济学分析软件,主要用于动态计量经济学分析。,85,参考书目,【1】李子奈,计量经济学,清华大学出版社,1992 【2】李长风,计量经济学,上海财经大学,1996 【3】林少宫等,简明经济统计与计量经

27、济,上海人民出版社,1993 【4】D.N.Gujarati,经济计量学精要,机械工业出版社,2000 【5】D.N.Gujarati,计量经济学(上、下),中国人民大学出版社,2000,86,参考书目,【6】罗伯特 S.平狄克,丹尼尔,L.鲁宾费尔德著,钱小军等译,计量经济模型与经济预测,机械工业出版社,1999 【7】经济计量学, 张寿, 于清文 编著,上海交通大学出版社, 1984 【8】于俊年,计量经济学,对外经济贸易大学出版社,2000,87,计量经济学主要刊物,Econometrica, 双月刊,美国经济计量学会主办,1933年创刊。 Journal of Econometrics

28、, 双月刊,瑞士出版,1973年创刊。 Journal of Applied Econometrics,双月刊,美国John WileyX=货币供给 回归结果: Y=-16329.0+2584.8lnX t= (-23.494) (27.549) R2 =0.9832,361,第四节:双曲函数模型,双曲函数模型: Y=b0+b1(1/X)+u 参数线性 变量非线性(X以倒数形式进入模型) 特征:X无限增大时,1/X趋近于0,Y逐渐接近b0渐近值。,362,双曲函数模型,平均固定成本 恩格尔消费曲线 菲利普斯曲线,363,例:美国菲利普斯曲线,数据:美国19581969年间小时收入指数(Y)和城

29、市失业率(X) 回归结果:Y=-0.2594+20.588(1/X) t=(-0.2572) (4.3996) R2 =0.6594 线性模型:Y=8.0147-0.7883X t=(6.4625) (-3.2605) R2 =0.5153,364,第五节:多项式回归模型,多项式回归模型:在模型等式右边只有一个解释变量,但却以不同的次幂出现,可将它们看作多元回归模型。 多项式回归模型在生产与成本函数领域中被广泛应用。,365,多项式回归模型,形式: 变量非线性,参数线性 变量之间不完全共线性,366,三次多项式函数,形式:c=a0+a1Q+a2Q2+a3Q3 又称为立方函数 变量Q的最高次幂代

30、表了多项式函数的次,上式最高次为3。,367,例:成本产出,数据 Y=141.7667+63.4776X-12.961X2+0.9396X3,368,第六节 包含虚拟变量的回归模型,虚拟变量:定性的或者反映质的差别的或者分组的信息结合到回归模型中。比如性别、种族、宗教、季节、战争/和平、有自然灾害/无自然灾害、南方/北方。我们可以用只取0和1的变量来表示这些定性或者分组的因素。称为虚拟变量。 指标变量、二元变量、分类变量、二分变量,369,虚拟变量,(1)D=1 表示男,0表示女 (2)D=1 表示生活在南方,0 表示不生活在南方 一般地 D=,370,虚拟变量,季节 i=1、2、3、4 四个

31、变量合起来可以表示各个季度,371,虚拟变量的性质,如果定性变量有m种情形,则应引进m -1个虚拟变量。否则就会陷入虚拟变量陷阱,即完全多重共线性。 虚拟变量赋值是任意的。赋值依习惯而定。 赋值为0的一类称为基准类、控制类、对比类。基准类的选择根据研究目的确定。 虚拟变量D 的系数称为差别截距系数,表明赋值为1的类和基准类截距值的差距。,372,1、方差分析模型,虚拟变量和定量变量一样可以用于回归分析。 模型中的解释变量可以同时包含定量变量和虚拟变量。 若回归模型中的变量仅仅只有虚拟变量,这样的模型称为方差分析模型(ANOVA)。,373,例:大学毕业生的初职年薪,模型:Y=b0+b1D1+u

32、 Y:初职年薪 D1=1:大学毕业 D1=0:其他(非大学毕业) 毕业生初职年薪的期望为: E(Y|D1=0)= b0+b1*0 = b0 E(Y|D1=1)= b0+b1*1 = b0 +b1,374,大学毕业生的初职年薪,截距b0表示非大学毕业生的平均初职年薪 “斜率” b1表明大学毕业生的平均初职年薪与非大学毕业生的初职年薪的差距 b0 +b1表示大学毕业生的平均初职年薪,375,例:回归结果/图形,376,例:工作权利法对工会会员的影响,为了研究工作权利法的效果(该法使工会的劳资谈判合法化),Brennan等人建立了工会会员(属于工会的工人占所有工人的百分比)对工作权利法(1980年)

33、的函数模型,这项研究包括了50个州,其中19个州制定了工作权利法,31个州允许有工会会员制度(即允许进行劳资谈判),377,工作权利法对工会会员的影响,回归结果: Y=26.68-10.51D Se=(1.00) (1.58) t=(26.68) (6.65) R2 =0.497 Y工会会员占工人的比例(1980) D=0,制定工人工作权利法的州 D=1,未制定工作权利法的州,378,2、协方差模型,在许多的经济研究中,回归模型中的解释变量有些是定量的,有些是定性的,我们将这种模型称为协方差模型(ANCOVA)。 包含一个定量变量,一个定性变量的回归模型 包含一个定量变量,两个定性变量的回归模

34、型,379,例:教师年薪与教龄、性别的关系,考虑ANCOVA模型: Y=b0+b1D+b2X+u Y:大学教师的年薪,X:教龄 D=1:男教师,D=0:女教师 男教师平均年龄:E(Y|X,D=1)= b0+b1+b2X 女教师平均年龄:E(Y|X,D=0)= b0+b2X,380,例:教师年薪与教龄、性别的关系,381,虚拟变量多种分类的情况,个人假期旅游的年支出对其收入与受教育水平的回归 教育变量是定性变量,假设本问题有三种分类:未达到中学水平、中学水平、大学水平,382,假期旅游支出与教育水平,模型:Y=b0+b1D1+b2D2+b3X+u Y:用于假期旅游的年支出 X:年收入 D1=1:

35、中学教育,D1=0:其他 D2=1:大学教育,D2=0:其他 基准类:未达到中学水平,383,假期旅游支出与教育水平,未达到中学水平平均旅游支出 E(Y| D1 =0, D2 =0,X)= b0 +b3X 中学水平的平均旅游支出 E(Y| D1 =1, D2 =0,X)= b0 +b1 +b3X 大学毕业的平均旅游支出 E(Y| D1 =0, D2 =1,X)= b0 +b2 +b3X,384,回归结果,385,包含一个定量、两个定性变量的模型,教师年薪一例中,假定除教龄、性别外,肤色也是一个重要的决定因素。 模型: Y=b0+b1D1+b2D2+b3X+u Y:年薪,X:教龄 D1=1:男教

36、师,D1=0:女教师 D2=1:白种, D2=0:非白种,386,3、回归模型中的结构稳定性:虚拟变量法,美国储蓄收入关系是否在严重萧条之后于1982年经历了一个结构变动。 模型: 19701981年:Y=A1+A2X+u 19821995年:Y=B1+B2X+u Y个人储蓄;X个人可支配收入,387,美国储蓄收入关系,四种可能结果: 一致回归:A1 = B1 , A2 = B2 平行回归:A1 B1 , A2 = B2 并发回归:A1 = B1 , A2 B2 相异回归:A1 B1 , A2 B2,388,美国储蓄收入关系,虚拟变量法: Y=M1+M2D+M3X+M4 ( DX ) +u Y

37、个人储蓄;X个人可支配收入 D=0:观察值是从1970年到1981年 D=1:观察值是从1982年到1995年 E(Y|D=0,X)= M1+ M3X E(Y|D=1,X) =(M1+M2 )+ (M3+M4 ) X,389,美国储蓄收入关系,M2 :差别截距;M4:差别斜率 回归结果 Y=1.02+152.48D+0.0803X-0.0655(DX) se=(20.16) (33.08) (0.0145) (0.0159) t=(0.05) (4.61) (5.54) (-4.10) R2 =0.822 ; F=54.78,390,例:美国菲利普斯曲线失灵了吗?,回顾19581969年菲利普

38、斯曲线 数据:美国19581969年间小时收入指数(Y)和城市失业率(X) 回归结果:Y=-0.2594+20.588(1/X) t=(-0.2572) (4.3996) R2 =0.6594,391,美国菲利普斯曲线失灵了吗?,样本区间:19581977年 回归方程: Y=M1+M2D+M3 (1/X)+M4 D(1/X ) +u Y:小时工资指数的年变化率 X:失业率 D=1:1969年以前观察值 D=0:19701977年观察值,392,回归结果,Y=10.078-10.337D 17.549(1/X)+38.137 D(1/X ) se=(1.4024) (1.6859) (8.337

39、3) (9.3999) t=(7.1860) (-6.1314) (-2.1049) (4.0572) R2 =0.8787 19581969:Y=-0.259+20.588(1/X) 19701977: Y=10.078-17.549(1/X)(失灵),393,4、虚拟变量在季节分析中的应用,许多用月度或季度数据表示的经济时间序列,呈现出季节变化的规律性(季节模式) 例如: 春节前后商场的销售量; 节假日期间家庭对货币的需求; 夏天对冰激凌、软饮料的需求,394,虚拟变量在季节分析中的应用,通常可以从时间序列中将季节因素或成分剔除,进而将注意力集中在其他成分上。 把季节成分从时间序列中剔除的

40、过程称为消除季节成分或季节调整时间序列。 美国政府公布的一些重要的经济时间序列数据就是经过季节调整后得到的。,395,例:澳大利亚支出消费关系,数据:澳大利亚从1977年第一季度到1980年第四季度的个人消费支出Y(衣服、硬件、电器、家具的零售价),个人可支配收入X 模型:Y=b0+b1D1+b2D2+b3D3+b4X+u D1=0:第二季度数据;D1=1:其他 D2=0:第三季度数据;D2=1:其他 D3=0:第四季度数据;D3=1:其他,396,回归结果,397,例:不同规模报酬对产出的影响,为了研究对于同一资本条件下,企业经营不同的产品是否会带来不同的收益率,根据48个企业的数据,得到如

41、下回归结果 Y=1.339+1.490D+0.246X1-9.507X2-0.016X3 Se= (1.38) (0.056) (4.244) (0.017) t= (1.079) (4.285) (-2.24) (-0.941) R2 =0.26,398,不同规模报酬对产出的影响,Y:规模报酬率 D=1:企业的产品有差别 X1=市场份额 X2=企业数目 X3=行业增长率,399,第六章:多重共线性,多重共线性的性质 多重共线性的原因 多重共线性的后果 多重共线性的诊断 多重共线性的补救措施,400,回顾多元线性回归模型的若干假定,零均值假定 同方差假定 无自相关假定 随机项与自变量不相关 非

42、多重共线性,401,假定1,零均值假定:E(ui)=0,i=1,2,.n 对X1 ,X2的每个观测值,u可以取不同的值,考虑u的所有可能值,它们的总体平均值(期望值)等于0。,402,假定2,同方差假定:Var(ui)= u 2, i=1,2,n 上式表明,各次观测值中u具有相同的方差,即各次观测所受到的随机影响的程度相同,称为等方差性。 违反假定:异方差,403,假定3,无自相关假定: Cov(ui, uj)=0, i j, i,j=1,2.n 表明任意两次观测的ui, uj是不相关的,即u在某次的观测值与任何其它次观测中的值互不影响,称为无序列相关性。 等方差性和无序列相关性称为高斯马尔柯

43、夫(Gauss-Markov)假定。 违反假定:自相关,404,假定4,随机项与自变量不相关: Cov(ui, x1i)=0; Cov(ui, x2i)=0 区分随机项u与每个自变量各自对y的影响。 如果x是非随机变量,即x是在重复抽样中取某固定值,该条件自然满足。,405,假定5,解释变量之间不存在线性相关关系,即任意两个解释变量之间无确切的线性关系。 用统计学语言,称为非共线性或非多重共线性。 非完全共线性是指变量不能完全表示为其他变量的完全线性函数。 违反假定:多重共线性,406,完全多重共线性,完全共线性(Perfect collinearity)的例子 : X1 X2 X3 10 5

44、0 52 15 75 75 18 90 97 24 120 129 X1 和 X2 是完全线性相关的: X2 = 5X1,407,完全多重共线性,若X2 = 5X1 将其代入Y=b0 +b1 X1+b2 X2 +b3 X3 Y=b0 +b1 X1 +b2 * 5X1 +b3 X3 = b0 +(b1 + 5b2 ) X1 +b3 X3 = b0 +A X1 +b3 X3 三变量模型 无法从A值中得到b1 、b2的值,408,接近完全多重共线性的情形,多重共线性是一个极端的情形 在实际中,很少遇到完全多重共线性的情况,常常是接近或高度多重共线性。亦即解释变量是接近线性相关的。 例:widget教

45、科书,409,问题,多重共线性的性质是什么? 多重共线性产生的原因是什么? 多重共线性的理论后果是什么? 多重共线性的实际后果是什么? 在实际中,如何发现多重共线性? 消除多重共线性的弥补措施有哪些?,410,多重共线性的性质,可以获得原始系数的一个线性组合的估计值。 当解释变量之间存在完全线性相关或完全多重共线性时,不可能获得所有参数的唯一估计值。 既然我们不能获得它们的唯一估计值,也就不能根据某一样本做任何统计推论(也即假设检验),411,多重共线性的原因,例:消费函数 Y = b0 + b1X1 + b2X2 X1 = income ; X2 = wealth X2 = 5X1 Y =

46、b0 + b1X1 + b2 5X1 Y = b0 + (b1 + 5b2)X1,412,多重共线性的原因,所用的数据收集方法 例:在X的一个限定的范围内抽样 有关被抽样总体的约束: 例:具有高收入的人倾向于有更多的财富 也许有关低收入的富有的人和高收入的没钱人的数据不够充足。,413,多重共线性的原因,模型设定: 例: 在模型中加入多项式项,特别是当X的取值范围很小的时候。 变量之间有共同的时间趋势 模型的过定( overdetermined) 解释变量的数目多于观测的数目。,414,多重共线性的理论后果,在存在高度多重共线性的情形下,即使多元回归方程的一个或者多个偏回归系数是统计不显著的,

47、普通最小二乘估计量仍然是最优线性无偏估计量。,415,注意,无偏性是一个重复抽样的性质,即:保持X不变,如果得到一些样本并用OLS计算这些样本估计量,则其平均值收敛于估计量的真实值。但这并不是某个样本估计值的性质,在现实中,我们经常无法得到大量的重复样本。,416,注意,接近共线性并未破坏最小二乘估计量的最小方差性:在所有线性无偏估计量中,OLS估计量的方差最小。 最小方差并不意味着方差值本身也比较小。,417,注意,即使变量总体之间不线性相关,但却可能与某一样本线性相关 多重共线性本质上是一个样本(回归)现象。 原因:大多数经济数据不是通过试验获得。如:国民生产总值、价格、失业率、利润、红利

48、等,是以其实际发生值为依据,而并非试验得到。,418,多重共线性的实际后果,OLS估计量的方差和标准差较大。也就是说,OLS估计量的精确度下降。 置信区间变宽。 t值不显著, R2较高。 OLS估计量及其标准差对数据的微小变化非常敏感,也就是说它们趋于不稳定。 回归系数符号有误。 难以衡量各个解释变量对回归平方和(ESS)或R2的贡献。,419,例:消费函数,消费函数的结果: Y = 24.77 + 0.94X1 - 0.04X2 t (3.67) (1.14) (-0.53) R2=0.96, F = 92.40 X1 是收入 X2 是财富 高的 R2 表明收入和财富可以解释消费变化的96%

49、,420,结果分析,没有任何一个斜率系数是显著的。 财富变量的符号是错误的。 高的 F 值意味着系数都等于0的联合假设不成立 两个变量是如此地高度相关,以至于不能将二者的效应分离出来。,421,例:消费函数,如果将 X2 对 X1 回归,得到: X2 = 7.54 + 10.19X1 (0.26) ( 62.04) R2 =0 .99 表明,在 X1 和 X2之间有近乎完全的线形关系,422,例:消费函数,Y 只对收入回归: Y = 24.45 + 0.51X1 (3.81) (14.24) R2= 0.96 收入变量是高度显著的,但是在前一个模型中是不显著的,423,例:消费函数,Y 只对财

50、富回归: Y = 24.41 + 0.05X2 t (3.55) (13.29) R2 = 0.96 财富变量也是高度显著的,但是在前一个模型中是不显著的,424,多重共线性真的是一个问题吗?,取决于研究目的 如果是为了预测,多重共线性未必是坏事 如果是为了估计参数(比如弹性、边际值等),多重共线性必定是坏事,425,多重共线性的检验,多重共线性是一个程度问题而不是存在与否的问题。 由于多重共线性是在假定解释变量是非随机的条件下出现的问题,因而它是样本的特点,而不是总体的特征。,426,检验方法1,R2较高但t值显著的不多。这是多重共线性的“经典”特征。,427,检验方法2,解释变量两两高度相

51、关。 逐对检查解释变量之间的相关系数 这些仅仅是一些有用的指示,经过这些探查后可能还会有多重共线性 解释变量的组合或许具有相关性,428,检验方法3,辅助或从属回归:将每个变量对其他剩余变量回归并计算相应的R2 值,其中每一个回归都被称作是从属或者辅助回归。 然后用F test 检验 R2 是否显著地区别于0 F = R2/(k-1) /(1-R2)/(n-k) k 是 X的数目 如果F大于临界值,则 R2 是显著区别于0的 计算较繁琐,429,例,考虑Y对X1,X2,X3,X4,X5、X6这6个解释变量的回归 辅助回归:用R12表示X1对其余X的回归的判决系数,430,检验方法4,方差膨胀因

52、素(Variance inflation factor ) 其中 R2j 是Xj对其他X的辅助回归的判决系数 这个指标度量方差增加的速度,431,R2 和 VIF,当 R2 增加时, VIF也随着增加 如果大于10 ,就表明有问题,432,注意,R2较高,标准差未必一定大。也就是说它不一定扩大估计量的标准差。 辅助回归方程的R2可能只是多重共线性的一个“表面指示器”。 更正规的表述为:“较高的R2既不是较高标准差的必要条件也不是充分条件,多重共线性本身并不必然导致较高的标准差。”,433,总结,检验多重共线性有许多种不同的方法,但却没有一种检验方法能够使我们彻底解决多重共线性问题。 多重共线性

53、是一个程度的问题,它是与样本相关的一种现象。 有时我们必须综合运用以上各种手段来诊断多重共线性的严重程度。 总之,没有一个简单的办法判断多重共线性问题。,434,补救措施,如果t统计量大于2,就不用担心 如果回归的 R2大于任何一个 X对其余 Xs回归的R2 ,就不用担心 如果仅仅是对预测感兴趣,并且解释变量的线性组合在未来仍然延续,就不用担心,435,补救措施(经验法则),从模型中删除不重要的解释变量 获取额外的数据或者新的样本 重新考虑模型 先验信息 变量变换 其他补救措施,436,1、从模型中删除不重要的解释变量,对待严重的多重共线性问题,最简单的解决方法就是删除一个或多个共线性变量。

54、导致“模型设定误差”,参数估计量可能是有偏的。 建议不要仅仅因为共线性很严重就从一个经济上可行的模型中删除变量。所选模型是否符合经济理论是一个重要的问题。,437,2、获取额外的数据或者新的样本,有些情况下,通过获得额外的数据(增加样本容量)就能削减共线性的程度。,438,获取额外的数据或者新的样本,既然多重共线性是一个样本特征,那么在包括同样变量的另一样本中,共线性也许不象第一个样本那样高。 关键是能否获得另一个样本,因为收集数据的费用很高。,439,Y:消费支出;X1:收入;X2:财富 10个观察值: Y=24.337+0.87164 X1 -0.0349 X2 se=(6.2801) (

55、0.31438) (0.0301) t= (3.875) (2.7726) (-1.1595) R2 =0.9682,消费支出对于收入和财富的回归方程,440,消费支出对于收入和财富的回归方程,40个观察值: Y=2.0907+0.7299 X1 +0.0605 X2 t= (0.8713) (6.0014) (2.0641) R2 =0.9672,441,3、重新考虑模型,模型的不恰当设定可能是回归模型存在共线性的原因。 省略一些重要的变量 没有正确选择模型的函数形式 例:需求函数 Q=b0+b1p+b2pr+b3income+u 变形成 Q=b0+b1(p/pr)+b2income+u,4

56、42,4、先验信息,根据以往的研究,我们或许知道有关参数值的某些信息,可以将这些信息用于当前的样本。 假设先验信息是“正确”的,就“解决”了共线性问题。,443,例 对wideget需求函数,假设在过去估计过的对wideget需求函数中,收入系数为0.9,并且是统计显著的。如果收入系数的过去值没有多少改变的话,我们可以重新估计方程 需求量=b0+b1*价格+b2*收入+u = b0+b1*价格+0.9*收入+u 需求量- 0.9*收入= b0+b1*价格+u,444,先验信息的缺陷,获得外生的或先验的信息并不总是可行的。 即使我们能够获得这一信息,但要假设先验信息在当前研究的样本中依然有效这个

57、要求“太高”。,445,5、变量变换,有些情形,通过对模型中变量的变换能够降低共线性程度。 例如:在对美国总消费支出的研究中(总消费支出作为总收入和总财富的函数),我们可以采取人均的形式,也就是说,作人均消费支出对人均收入和人均财富的函数,有可能在总消费函数中存在严重的共线性问题,而在人均消费函数中其共线性问题并没有那么严重。 不能保证这样的一个变换总能够有助于问题的解决。,446,例,假设我们具有消费、财富和收入的时间序列 将会出现严重的多重共线性,因为这些变量随着时间作同方向的运动 我们意欲估计 Yt = b0 + b1X1t + b2X2t + ut 在时间t-1处的模型: Yt-1 =

58、 b0 + b1X1t-1 + b2X2t-1 + ut-1 两个方程相减 Yt-Yt-1=b1(X1t-X1t-1)+b2(X2t-X2t-1)+vt,447,例,这样做有时会解决问题,因为和原始变量相比,变量的差分也许不再共线 但由此产生的问题是新的误差项v或许不再满足干扰项序列不相关的假设,448,例,在多项式回归中,常常会遇到多重共线性 我们可以将解释变量减去它的平均值,往往会减小多重共线性的程度,449,6、其他补救措施,时间序列数据和截面数据的结合 要素分析或主成分分析 岭回归法 逐步回归法,450,第七章 异方差,同方差假定:Var(ui)= u 2, i=1,2,n 上式表明,

59、各次观测值中u具有相同的方差,即各次观测所受到的随机影响的程度相同,称为等方差性。 违反假定:异方差 假设方差随着观测数据而变化 就得到异方差性(heteroskedasticity) var(ui) = (i)2 随着观测数据而变化,451,问题,异方差的性质是什么? 异方差的后果是什么? 如何检验异方差的存在? 如果存在异方差,有哪些补救措施?,452,异方差的性质,453,异方差的性质,异方差问题多存在于横截面数据中,在时间序列中出现较少。 规模效应:如果截面数据来自于一组规模差异很大的对象,在数据中就会存在异方差性。比如,小公司、中等的公司、大公司;低收入家庭、中等收入家庭、高收入家庭。 在时间序列数据中,变量趋于具有相似的数量等级。,454,例:工资与企业规模,平均工资随着厂商规模的增加而增加。见下表:,455,工资与企业规模,我们能指望工资的方差是不变的吗? 方差随着厂商规模的增加而增加 因此,厂商越大,支付的工资越多,但工资的变异性也更大(variability),456,例:储蓄与收入,储蓄随着收入增加而增加,储蓄和支出的变异性也随着增

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论