线性回归分析Eviewsppt课件_第1页
线性回归分析Eviewsppt课件_第2页
线性回归分析Eviewsppt课件_第3页
线性回归分析Eviewsppt课件_第4页
线性回归分析Eviewsppt课件_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二讲第二讲1研究经济问题 量化分析意识 量化分析手段 建立计量模型 用模型解释经济问题2上一讲重要概念:研究某一经济现象,会面临两个问题:一是一个变量的变化常常受其他多个经济变量的影响。为描述这些变量之间的关系,研究这些变量之间的变化规律,通常要建立计量经济模型,研究模型参数,进而利用计量经济模型进行预测。通常运用回归分析方法。二是仅知道一个变量的历史数据,要研究它的变化规律,也要建立计量经济模型,研究模型参数,进而利用计量经济模型进行预测。通常运用时间序列分析方法3上一讲重要概念:线性回归分析主要研究经济变量之间的线性因果线性回归分析主要研究经济变量之间的线性因果关系。关系。以预先设定的线

2、性回归模型为基础,而且设定的以预先设定的线性回归模型为基础,而且设定的模型一般有经济理论根据。模型一般有经济理论根据。回归分析关心的是根据解释变量的已知或给定值回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,考察被解释变量的总体均值在给定解释变量在给定解释变量Xi条件下被解释变量条件下被解释变量Yi的期望的期望(平平均值轨迹称为总体回归线均值轨迹称为总体回归线相应的函数相应的函数称为双变量总体回归函数称为双变量总体回归函数4)()|(iiXfXYE回归函数PRF说明被解释变量Y的平均状态总体条件期望随解释变量X变化的规律随机扰动项总体回归模型5)|(iiiXYEY随机误差

3、项主要包括下列因素的影响:随机误差项主要包括下列因素的影响:1在解释变量中被忽略的因素的影响;2变量观测值的观测误差的影响;3模型关系的设定误差的影响;4其它随机因素的影响。6产生并设计随机误差项的主要原因:产生并设计随机误差项的主要原因:1理论的含糊性;理论的含糊性;2数据的欠缺;数据的欠缺;3节省原则。节省原则。样本回归函数样本回归函数SRF)记样本回归线的函数形式为:称为样本回归函数7iiiXXfY10)(iiiiieXYY10 这里将样本回归线看成总体回归线的近似替代这里将样本回归线看成总体回归线的近似替代8那么 注意:注意:回归分析的主要目的:根据回归分析的主要目的:根据样本回归函数

4、样本回归函数SRF,估计总体,估计总体回归函数回归函数PRF。SRF 在某种规则下古典假设) 是PRF的最好估计 910总体回归模型总体回归模型n个随机方程的矩阵表达式为个随机方程的矩阵表达式为XY)1(212221212111111knknnnkkXXXXXXXXXX1)1(210kk121nnnknknnnkkkkXXXYXXXYXXXY2211022222121021121211101ikikiiiXXXY 22110模型的假设模型的假设线性回归模型必须满足一定的假设,主要包括:1、变量Y和 之间存在线性随机函数关系2、对应每组观测数据的误差项 都为零均值的随机变量;E( )=03、误差

5、项 的方差为常数;Var( )= 4、对应不同观测数据的误差项不相关 11KXX,1011KKYXXiiii2njijiCovji, 2 , 1,0),(5、解释变量 (k=1,K是确定性变量而非随机变量。当存在多个解释变量K1时假设不同解释变量之间不存在线性关系,包括严格的线性关系和强的近似线性关系。 6、误差项 服从正态分布。 12iXi第二节第二节 参数估计参数估计设定线性回归模型的前提是相信变量关系确实存在。根据数据求出参数的取值。这就是线性回归模型的参数估计,是线性回归分析的核心工作。13一、参数的最小二乘估计一、参数的最小二乘估计在模型假设成立的前提下,线性回归模型参数估计的主要方

6、法有最大似然估计、矩估计最小二乘估计三种方法估计的结果基本一致。由于最小二乘法的要求比较简单,而且可以作更多的扩展,因此最小二乘法是线性回归模型参数估计的基本方法。1415( (一一).).一元线性回归模型一元线性回归模型 一元线性回归模型:只有一个解释变量 iiiXY10i=1,2,nY为被解释变量,X为解释变量,0与1为待估参数, 为随机干扰项 给定一组样本观测值Xi, Yi)(i=1,2,n要求样本回归函数Y=a+bX尽可能好地拟合这组值.对给定的Xi ,样本点纵坐标与回归直线纵坐标之间的偏差 ei= Yi-(a+bXi) 普通最小二乘法Ordinary least squares, O

7、LS给出的判断标准是:二者之差的平方和16niiiniXYYYQ121021)()(最小。最小二乘估计的基本思路: 核心: 最小化22()00iiiiiVeYabXVaVb17eii2n 参数估计值参数估计值222()()()iiiiiiiiiiYYXXX YnXYbXXXnXaYbX18例例3-2-1上海经济的消费规律研究上海经济的消费规律研究年份可支配收入X消费性支出Y年份可支配收入X消费性支出Y1981636.8258519902181.6519361982659.2557619912485.4621671983685.9261519923008.9725091984834.157261

8、9934277.38353019851075.2699219945868.48466919861293.24117020197171.91586819871437.09128220198158.74676319881723.44164820198438.89682019891975.64181220198773.10686619使用使用Eviews进行回归分析进行回归分析1.打开Eviews2.建立工作文件:File/New/Workfile 在Workfile Create(创建文件)对话框中 (1) Workfile Structure Type(数据结构类型)中选择Dated-requl

9、ar frequency(对通常时间序列数据都这样选)20(2)Dated Specification框下Frequency中选择AnnualStart中填入1981End中填入2019(3)Names(Optional)框下Wf中填入文件名Page中填入p1或pi(也可不填)点击OK21(3输入和编辑数据建立新序列:点击Objects/New Object在Type of object下选择Seris(时间序列)在Name for object下填入序列名点击OK在Workfile对话框下双击序列x的图标,出现Series:x对话框点击Edit+/- ,依次输入数据。22(4).回归分析 E

10、quation(1)点击Object/New object/Equation/填入回归方程的名字;(2)在Equation specification框中输入 Y C X可得到Eviews回归结果:23Eviews回归结果 Dependent Variable: Y Method: Least Squares Date: 03/02/08 Time: 10:13Sample: 1981 2019 Included observations: 18 Variable CoefficientStd. Error t-Statistic Prob. C 144.6786 35.507814.0745

11、56 0.0009 X 0.789808 0.008022 98.45858 0.0000R-squared0.998352 Mean dependent var 2807.444Adjusted R-squared0.998249 S.D. dependent var2333.000S.E. of regression97.61747 Akaike info criterion12.10443Sum squared resid 152466.7 Schwarz criterion12.20336 Log likelihood-106.9399 F-statistic9694.092Durbi

12、n-Watson stat 1.082919 Prob(F-statistic)0.00000024(5).保存工作文件点击File/Save as/盘符/文件名6.加载工作文件点击File/Open/Eviews workfile/盘符/文件名/翻开25操作图示262728293031323334Eviews回归结果 Dependent Variable: Y Method: Least Squares Date: 03/02/08 Time: 10:13Sample: 1981 2019 Included observations: 18 Variable CoefficientStd.

13、Error t-Statistic Prob. C 144.6786 35.507814.074556 0.0009 X 0.789808 0.008022 98.45858 0.0000R-squared0.998352 Mean dependent var 2807.444Adjusted R-squared0.998249 S.D. dependent var2333.000S.E. of regression97.61747 Akaike info criterion12.10443Sum squared resid 152466.7 Schwarz criterion12.20336

14、 Log likelihood-106.9399 F-statistic9694.092Durbin-Watson stat 1.082919 Prob(F-statistic)0.00000035例例3-2-2(教材例教材例3-1)Eviews计算结果计算结果Dependent Variable: YMethod: Least SquaresDate: 03/02/08 Time: 15:13Sample: 1981 2019Included observations: 22Variable Coefficient Std. Error t-Statistic Prob. C 237.752

15、952799707 68.3551736117468 3.47820192361730.00237181875731987 X 0.751088775963591 0.010396452398397 72.2447184079256 1.15963513340516e-25R-squared0.996182695679258 Mean dependent var3975Adjusted R-squared0.995991830463221 S.D. dependent var3310.25739180505S.E. of regression209.572746755865 Akaike in

16、fo criterion13.6145269063696Sum squared resid878414.723655962 Schwarz criterion13.7137125839476Log likelihood-147.759795970065 F-statistic5219.29933784047Durbin-Watson stat1.28776506339404 Prob(F-statistic)1.15963513340517e-2536(二二)、多元线性回归模型、多元线性回归模型 多元线性回归模型多元线性回归模型:表现在线性回归模型中的解释表现在线性回归模型中的解释变量有多个。

17、变量有多个。 一般表现形式:一般表现形式:37ikikiiiXXXY 22110i=1,2,n其中:k为解释变量的数目,j称为回归参数regression coefficient)。 习惯上:把常数项看成为一虚变量的系数,该虚变量的样本观测值始终取1。这样: 模型中解释变量的数目为k+1) 38ikikiiiXXXY 22110也被称为总体回归函数的随机表达形式。它也被称为总体回归函数的随机表达形式。它 的的非随机表达式为非随机表达式为:kikiikiiiiXXXXXXYE 2211021),|( 方程表示:各变量方程表示:各变量X值固定时值固定时Y的平均响应。的平均响应。 j也被称为偏回归系

18、数,表示在其他解释变量保持也被称为偏回归系数,表示在其他解释变量保持不变的情况下,不变的情况下,Xj每变化每变化1个单位时,个单位时,Y的均值的均值E(Y)的的变化变化; 或者说或者说j给出了给出了Xj的单位变化对的单位变化对Y均值的均值的“直接或直接或“净净”(不含其他变量影响。(不含其他变量影响。39样本回归函数:用来估计总体回归函数样本回归函数:用来估计总体回归函数kikiiiiXXXY22110其随机表示式其随机表示式: : ikikiiiieXXXY22110 ei称为残差或剩余项称为残差或剩余项(residuals),可看成是总,可看成是总体回归函数中随机扰动项体回归函数中随机扰动

19、项i的近似替代。的近似替代。 样本回归函数的矩阵表达样本回归函数的矩阵表达: XY或或eXY其中:其中:k10neee21e1 1、多元线性回归的普通最小二乘估计、多元线性回归的普通最小二乘估计对于随机抽取的n组观测值40kjniXYjii, 2 , 1 , 0, 2 , 1),(如果样本函数的参数估计值已经得到,则有: KikiiiiXXXY22110i=1,2n根据最小二乘原理,参数估计值应该是下列方程组的解 0000210QQQQk其中2112)(niiiniiYYeQ2122110)(nikikiiiXXXY41于是得到关于待估参数估计值的正规方程组: kiikikikiiiiikik

20、iiiiiikikiiikikiiXYXXXXXYXXXXXYXXXXYXXX)()()()(221102222110112211022110 解该(k+1)个方程组成的线性代数方程组,即可得到(k+1)个待估参数的估计值, , ,jjk 012 。42正规方程组的矩阵形式正规方程组的矩阵形式nknkknkkiikikikiiiikiiYYYXXXXXXXXXXXXXXXXn212111211102112111111即YXX)X(由于XX满秩,故有 YXXX1)(43正规方程组 的另一种写法对于正规方程组 XXYXXXeXXX于是 0eX或 0ie0iijieX(*)或(*)是多元线性回归模型

21、正规方程组的另一种写法 (*)(*)44样本回归函数的离差形式ikikiiiexxxy2211i=1,2n其矩阵形式为 exy其中 :nyyy21yknnnkkxxxxxxxxx212221212111xk21在离差形式下,参数的最小二乘估计结果为 Yxxx1)(kkXXY110 2 2、多元线性回归模型的参数估计实例、多元线性回归模型的参数估计实例 例3-2-3 经研究,发现家庭书刊消费水平Y(元/年)受家庭收入X(元/月)和户主受教育年数T(年)的影饷。现对某地区的家庭进行抽样调查,得样本数据如下,试估计家庭书刊消费水平同家庭收入、户主受教育年数之间的线性关系。45.46Y X T Y X

22、 T 450 1027.2 8 793.2 1998.6 14 507.7 1045.2 9 660.8 2196 10 613.9 1225.8 12 792.7 2105.4 12 563.4 1312.2 9 580.8 2147.4 8 501.5 1316.4 7 612.7 2154 10 781.5 1442.4 15 890.8 2231.4 14 541.8 1641 9 1121 2611.8 18 611.1 1768.8 10 1094.2 3143.4 16 1222.1 1981.2 18 1253 3624.6 20 例例3-2-2用用Eviews计算结果计算结果

23、Dependent Variable: YMethod: Least SquaresDate: 03/02/08 Time: 23:08Sample: 1 18Included observations: 18 Variable Coefficient Std. Error t-Statistic Prob. C-50.01638 49.46026-1.0112440.3279X0.086450 0.0293632.9441860.0101T52.370315.20216710.067020.0000R-squared 0.951235 Mean dependent var755.1222Ad

24、justed R-squared0.944732 S.D. dependent var258.7206S.E. of regression 60.82273 Akaike info criterion11.20482Sum squared resid 55491.07 Schwarz criterion 11.35321Log likelihood-97.84334 F-statistic146.297Durbin-Watson stat 2.605783 Prob(F-statistic)0.000000回归方程为:Y=-50.0164+0.08645X+52.37031T47二、二、 最小二乘估计的性质最小二乘估计的性质1、线性性2、无偏性3、最小方差性有效性)4、一致性481、线性性、线性性参数估计量可以表示为被解释变量观测值的线性组合。参数估计量可以表示为被解释变量观测值的线性组合。证明只要把参数估计量表达式作适当的变形即可。证明只要把参数估计量表达式作适当的变形即可。49线性回归模型参数的最小二乘估计向量为 : B = (XX)-1XY各个参数的估计量为: =(XX)-1Xk+1Y50kb2、无偏性、无偏性最小二乘估计量是参数真实值的无

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论