第一章线性回归的性质_第1页
第一章线性回归的性质_第2页
第一章线性回归的性质_第3页
第一章线性回归的性质_第4页
第一章线性回归的性质_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第一章线性回归的性质董志勇博士教授北京大学经济学院Email:电话:

2⑴理论与应用并重。既要重视理论方法,也要重视应用模型和应用中实际问题的解决;⑵以教材中的经典理论方法为主,也要理解适当引入的、教材中没有的非经典理论方法;⑶对于理论方法,重点是思路而不是数学过程;⑷对于应用模型,重点不是每种模型本身,而是它们演变与发展的方法论;⑸必须十分重视综合练习;⑹必须掌握Eviews软件,注意课堂的软件应用演示,“师傅领进门,修行在个人”,多练。关于学习方法的说明3§1“回归”一词的历史渊源回归一词最早由F.加尔顿FrancisGalton引入加尔顿研究发现,父母和孩子的身高有这样的一个趋势:父母高,儿女就高;父母矮,儿女也矮。但是高个父母的儿女们在同龄人中并不像父辈那样在同龄人中显得那样高,儿女辈的平均身高将“退化”到或者说“回归”到全体人口的平均身高。这也叫加尔顿的“普遍回归定律”。加尔顿在智力遗传的方面也得到了类似的结果:一般来说,天才是要遗传的。但是天才的后代却要比他们的父辈们平庸,也就是他们的智力水平将“回归”到中等水平;而一个智商一般的父母,其孩子却可能是个天才!4“回归”一词的历史渊源加尔顿的普遍回归定律(lawofuniversalregression)还被他的朋友K.皮尔逊(KarlPearson)证实。皮尔逊曾收集过一些家庭集体的1千多名成员的身高纪录。他发现,对于一个父亲高的群体,儿辈的平均身高低于他们父辈的身高。这样就把高的和矮的儿辈一同回归到所有男子的平均身高。用加尔顿的话说,这是“回归到中等”(regressiontomediocrity)5§1.2回归的现代释义然而,对回归的现代解释确是非常不同的:回归分析是关于一个叫做应变量的变量对另一个或多个叫做解释多变量的变量的依赖关系,其用意在于通过后者(在重复抽样中)的已知或设定值,去估计和(或)预测前者的(总体)均值。下面,我们用几个简单的例子来把线性回归的概念弄清楚6对于给定的父亲身高与儿子身高的假想分布7570656060657075儿子身高父亲身高7再考虑加尔顿的普遍回归定律该散点图展示了对于设定的父亲身高,儿子在一个假想人口总体中的身高分布。对于任一给定的父亲身高,都有儿子身高的一个分布范围。随着父亲身高的增加,儿子的平均身高也增加。我们可以勾画一条通过这些散点的直线,以表明儿子的平均身高是怎样随着父亲身高的增加而增加的。这条线就是回归线。8转到经济学中的例子经济学家也许想研究个人消费支出对税后或可支配实际个人收入的依赖关系。这种分析会有助于估计边际消费倾向。一位假定能知道价格或产出的垄断商,也许想知道产品需求对价格变化的实际反应,通过这种定价试验,也许能估计出产品需求的价格弹性,从而有助于确定最有利可图的价格。9菲利普斯曲线Philipscurve一位劳工经济学家也许想要研究货币工资变化率对失业率的关系。曲线是把货币工资变化同失业率联系起来:著名的菲利普斯曲线。这样的散点图能使劳工经济学家在给定某个失业率下货币工资的平均变化。10其他领域的应用可以作出散点图来描述通货膨同人们愿意以货币形式保存的收入比例之间的关系,从而货币经济学家能够对各种通货膨胀率预测人们愿意以货币形式保存的收入比例。公司的销售部主任很想知道人们对公司产品的需求和广告费开支的关系。农业经济学家想研究作物收成对气温,降雨量,阳光量和施肥量的依赖关系。11

回归分析(regressionanalysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。

其用意:在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。这里:前一个变量被称为被解释变量(ExplainedVariable)或应变量(DependentVariable),后一个(些)变量被称为解释变量(ExplanatoryVariable)或自变量(IndependentVariable)。回归分析的基本概念12§1.3统计关系与确定性关系在回归分析中,我们考虑的是一种所谓统计依赖关系。在变量之间的统计关系式中,我们主要处理的是随机变量,也就是有着概率分布的变量。无论我们考虑多少变量,都无法完全的解释因变量。因为它的一些内在的或随机的变异是注定存在的。博伊尔的气体定律,牛顿的引力定律,运动定律描述的是确定性现象,本书中不对此作研究。13§1.4回归与因果关系虽然回归分析研究一个变量对另一个变量的依赖关系,但它并不一定意味着因果关系。一个统计关系,不管多强也不管多么有启发性,却始终不能确立因果方面的联系:对因果关系的理念,必须来自统计学以外,最终来自这种或那种理论。从逻辑上说,统计关系是本身不可能意味着任何因果关系。要谈因果律,必须诉诸先验的或理论上的思考。14§1.5回归与相关与回归分析密切相关而在概念上迥异的,是以测量两个变量之间的线性关联度为主要目的的相关分析(correlationanalysis)相关系数(correlationcoefficient)是用来测量这种(线性)关联强度的。在线性回归中,我们并不主要对这种度量感兴趣,感兴趣的却是试图根据其他变量的设定值来估计或预测某一变量的平均值15回归和相关的基本分歧在回归分析中,对应变量和解释变量的处理方法存在着不对称性。应变量被当作是统计的,随机的,也就是它有一个概率分布。在相关分析中,我们对称的对到任何变量,即应变量和解释变量之间不加区别。此外,两个变量都被看作是随机的。本书要阐述的回归理论的大部分均以下述假定为条件:应变量是随机的,而解释变量是固定的或非随机的。16对变量间统计依赖关系的考察主要是通过相关分析(correlationanalysis)或回归分析(regressionanalysis)来完成的:17

①不线性相关并不意味着不相关;

②有相关关系并不意味着一定有因果关系;③回归分析/相关分析研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味着一定有因果关系。

④相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。回归分析对变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量):前者是随机变量,后者不是。▲注意:18建立计量经济学模型的步骤和要点

一、理论模型的设计

二、样本数据的收集

三、模型参数的估计

四、模型的检验

五、计量经济学模型成功的三要素19一、理论模型的建立⑴确定模型包含的变量根据经济学理论和经济行为分析。例如:同样是生产方程,电力工业和纺织工业应该选择不同的变量,为什么?考虑数据的可得性。注意因素和变量之间的联系与区别。考虑入选变量之间的关系。

要求变量间互相独立。20⑵确定模型的数学形式利用经济学和数理经济学的成果根据样本数据作出的变量关系图选择可能的形式试模拟⑶拟定模型中待估计参数的理论期望值区间符号、大小、关系例如:ln(人均食品需求量)=α+βln(人均收入)+γln(食品价格)+δln(其它商品价格)+ε

其中α、β、γ、δ的符号、大小、关系21二、样本数据的收集⑴几类常用的样本数据时间序列数据截面数据虚变量离散数据联合应用⑵数据质量完整性准确性可比性一致性问题来源(1)非实验性质(2)即使实验数据,误差(3)选择性偏误(4)样本(5)高度加总(6)保密22三、模型参数的估计

⑴各种模型参数估计方法⑵如何选择模型参数估计方法⑶关于应用软件的使用课堂教学结合Eviews

23四、模型的检验⑴经济意义检验根据拟定的符号、大小、关系例如:ln(人均食品需求量)=-2.0-0.5ln(人均收入)-4.5ln(食品价格)+0.8ln(其它商品价格)24⑵统计检验由数理统计理论决定包括拟合优度检验总体显著性检验变量显著性检验⑶计量经济学检验由计量经济学理论决定包括异方差性检验序列相关性检验共线性检验25⑷模型预测检验由模型的应用要求决定包括稳定性检验:扩大样本重新估计预测性能检验:对样本外一点进行实际预测26计量经济学模型成功的三要素

理论数据方法27计量经济学模型的应用

一、结构分析二、经济预测三、政策评价四、理论检验与发展28一、结构分析经济学中的结构分析是对经济现象中变量之间相互关系的研究。结构分析所采用的主要方法是弹性分析、乘数分析与比较静力分析。计量经济学模型的功能是揭示经济现象中变量之间的相互关系,即通过模型得到弹性、乘数等。应用举例29例1:如果说我国人民的生活水平还没有日本人民的生活水平高,这只是一种定性的描述。若用经济计量学方法进行定量分析,将会使我们对此问题理解的更深刻、更具体。30中国:Engel=0.60–0.0077t(1981-98)(1.1)(69.9)(-8.9)R2=0.83,DW=0.86,F=79.9日本:Engel=0.29–0.0043t(1981-95)(1.2)(24.0)(-12.1)R2=0.97,DW=1.2,F=37231(1)从恩格尔系数的下降速度看,中国是先慢后快;日本是先快后慢(1931年0.38)。(2)中国1956年的恩格尔系数与日本1946年的恩格尔系数近似相等。食品支出约占总支出的63%。40多年间,日本降了0.4,中国降了0.2。(3)从整体看,日本恩格尔系数的年下降速度是中国的2.3倍。从1980年以后考察,中国恩格尔系数的年下降速度是日本的1.8倍。(4)1995年日本的恩格尔系数是0.222,1998年中国的恩格尔系数是0.445。以1981-1998年的平均速度,中国若要把恩格尔系数降至0.222至少需要30年!(5)验证了经济理论。随着收入的增加,恩格尔系数的下降速度要减慢。可见,通过定量分析,对这一问题的了解要比只做定性分析清晰的多。32二、经济预测计量经济学模型作为一类经济数学模型,是从用于经济预测,特别是短期预测而发展起来的。计量经济学模型是以模拟历史、从已经发生的经济活动中找出变化规律为主要技术手段。对于非稳定发展的经济过程,对于缺乏规范行为理论的经济活动,计量经济学模型预测功能失效。模型理论方法的发展以适应预测的需要。

33三、政策评价政策评价的重要性。经济政策的不可试验性。计量经济学模型的“经济政策实验室”功能。34例2:图1.2给出1952-1998年中国现金需求量(M0)和国内生产总值(GDP)的散点图。为充分展示改革开放前后M0与GDP之间关系的变化,用1952-1985年数据画散点图见图1.3。从图中可以看到,改革开放以后,M0与GDP关系的斜率比改革开放以前大一倍多。用1952-1985年数据得到的现金需求量模型如下:图1.2图1.335

M0t=0.062GDPt+0.078GDPtD1(1952-1998)(1.3)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论