计量经济学-2章:一元线性回归模型(1)PPT课件_第1页
计量经济学-2章:一元线性回归模型(1)PPT课件_第2页
计量经济学-2章:一元线性回归模型(1)PPT课件_第3页
计量经济学-2章:一元线性回归模型(1)PPT课件_第4页
计量经济学-2章:一元线性回归模型(1)PPT课件_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 7/24/2021重庆工商大学经济贸易学院-张文爱4 l注意注意 不线性相关并不意味着不相关。 有相关关系并不意味着一定有因果关系。 回归分析/相关分析研究一个变量对另一个 (些)变量的统计依赖关系,但它们并不意 味着一定有因果关系。 相关分析相关分析对称地对待任何(两个)变量,两个变量 都被看作是随机的。回归分析回归分析对变量的处理方法存 在不对称性,即区分应变量(被解释变量)和自变 量(解释变量):前者是随机变量,后者不是。 7/24/2021重庆工商大学经济贸易学院-张文爱5 l回归分析回归分析(regression analysis)(regression analysis)是研究

2、一个变量关于另一个(些)变量的依赖关 系的理论和计算方法。其目的其目的在于通过后 者的已知或设定值,去估计和(或)预测 前者的(总体)均值。 l被解释变量被解释变量(Explained Variable)或应应 变量变量(Dependent Variable)。 l解释变量解释变量(Explanatory Variable)或自自 变量变量(Independent Variable)。 回归分析回归分析概念概念 7/24/2021重庆工商大学经济贸易学院-张文爱6 l回归分析构成计量经济学的方法论基础,其回归分析构成计量经济学的方法论基础,其 主要内容包括:主要内容包括: (1)根据样本观察值

3、对经济计量模型参数 进行估计,求得回归方程; (2)对回归方程、参数估计值进行显著性 检验; (3)利用回归方程进行分析、评价及预测。 7/24/2021重庆工商大学经济贸易学院-张文爱7 l回归分析回归分析关心的是根据解释变量的已 知或给定值,考察被解释变量的总体 均值,即当解释变量取某个确定值时, 与之统计相关的被解释变量所有可能 出现的对应值的平均值。 7/24/2021重庆工商大学经济贸易学院-张文爱8 l例例2.1:一个假想的社区有100户家庭组成,要 研究该社区每月家庭消费支出家庭消费支出Y与每月家庭可家庭可 支配收入支配收入X的关系。 即如果知道了家庭的月收 入,能否预测该社区家

4、庭的平均月消费支出水 平。 为达到此目的,将该100户家庭划分为组内收 入差不多的10组,以分析每一收入组的家庭消 费支出。 7/24/2021重庆工商大学经济贸易学院-张文爱9 表表 2.1.1 某某社社区区家家庭庭每每月月收收入入与与消消费费支支出出统统计计表表 每月家庭可支配收入X(元) 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 561 638 869 1023 1254 1408 1650 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627 814 9

5、24 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045 1243 1474 1672 1881 2189 2486 2871 1078 1254 1496 1683 1925 2233 2552 1122 1298 1496 1716 1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 1771 20

6、35 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1716 1947 2200 每 月 家 庭 消 费 支 出 Y (元) 2002 共计 2420 4950 11495 16445 19305 23870 25025 21450 21285 15510 7/24/2021重庆工商大学经济贸易学院-张文爱10 l由于不确定因素的影响,对同一收入水平X,不同家 庭的消费支出不完全相同; l但由于调查的完备性完备性,给定收入水平X的消费支出Y 的分布是确定的,即以X的给定值为条件的Y的条件条件 分布分布(Conditional di

7、stribution)是已知的,例如: P(Y=561|X=800)=1/4。 l因此,给定收入X的值Xi,可得消费支出Y的条件均条件均 值值(conditional mean)或条件期望条件期望(conditional expectation):E(Y|X=Xi)。 l该例中: 1111 E(Y | X=800)=561+594627638605 4444 7/24/2021重庆工商大学经济贸易学院-张文爱11 7/24/2021重庆工商大学经济贸易学院-张文爱12 由对全体居民的收入和支出的调查结果,我们知由对全体居民的收入和支出的调查结果,我们知 道处于不同收入阶层的居民有一个平均的支出

8、水平,道处于不同收入阶层的居民有一个平均的支出水平, 这一支出水平与收入大致呈线性关系。这一支出水平与收入大致呈线性关系。 l描出散点图发现:随着收入的增加,消费“平平 均地说均地说”也在增加,且Y的条件均值均落在一根 正斜率的直线上。这条直线称为总体回归线总体回归线。 l概念:在给定解释变量Xi条件下被解释变量Yi 的期望轨迹称为总体回归线总体回归线(population regression line),或更一般地称为总体回归曲总体回归曲 线线(population regression curve)。 7/24/2021重庆工商大学经济贸易学院-张文爱13 )()|( ii XfXYE

9、称为总体回归函数总体回归函数(population regression function, PRF)。 总体回归结对应的函数: l回归函数(PRF)说明被解释变量Y的平均状态(总体 条件期望)随解释变量X变化的规律。 函数形式:函数形式:可以是线性或非线性的。 例2.1中,将居民消费支出看成是其可支配收入的线性函数时: ii XXYE 10 )|( 为线性函数。线性函数。其中,0,1是未知参数,称为回归系数回归系数 (regression coefficients)。 7/24/2021重庆工商大学经济贸易学院-张文爱14 l总体回归函数说明在给定的收入水平Xi下,该 社区家庭平均的消费支出

10、水平。 l但对某一个别的家庭,其消费支出可能与该平 均水平有偏差。 l称为观察值围绕它的期望值的离差离差 (deviation),是一个不可观测的随机变量, 又称为随机干扰项(随机干扰项(stochastic disturbance)或 随机误差项(随机误差项(stochastic error)。 )|( iii XYEY 7/24/2021重庆工商大学经济贸易学院-张文爱15 l例2.1中,给定收入水平Xi ,个别家庭的支出可表示 为两部分之和:(1)该收入水平下所有家庭的平均 消费支出E(Y|Xi),称为系统性(系统性(systematic)或确定确定 性(性(deterministic)

11、部分;部分;(2)其他随机随机或非确定性非确定性 (nonsystematic)部分部分 i。 7/24/2021重庆工商大学经济贸易学院-张文爱16 l称为总体回归函数(PRF)的随机设定形式。 l表明被解释变量除了受解释变量的系统性影 响外,还受其他因素的随机性影响。由于方 程中引入了随机项,成为计量经济学模型, 因此也称为总体回归模型。 7/24/2021重庆工商大学经济贸易学院-张文爱17 l随机误差项主要包括下列因素:随机误差项主要包括下列因素: 在回归模型中被省略的因素的影响; 经济变量之间的合并误差 变量观测值的观测误差的影响; 模型关系的设定误差的影响; 其他随机因素的影响。

12、7/24/2021重庆工商大学经济贸易学院-张文爱18 l问题:问题:能从一次抽样中获得总体的近似的信息吗? 如果可以,如何从抽样中获得总体的近似信息? l例例2.2:在例2.1的总体中有如下一个样本,能否从 该样本估计总体回归函数PRF? 表表2.1.3 家家庭庭消消费费支支出出与与可可支支配配收收入入的的一一个个随随机机样样本本 Y 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 X 594 638 1122 1155 1408 1595 1969 2078 2585 2530 回答:能 7/24/2021重庆工商大学经济贸易学院-张文爱1

13、9 l 画一条直线以尽好地拟合该散点图,由于样本 取自总体,可以该直线近似地代表总体回归线。 该直线称为样本回归线样本回归线(sample regression lines)。)。 7/24/2021重庆工商大学经济贸易学院-张文爱20 l 记样本回归线的函数形式为: iii XXfY 10 )( 称为样本回归函数(样本回归函数(sample regression function, SRF)。 7/24/2021重庆工商大学经济贸易学院-张文爱21 样本回归函数的随机形式(样本回归模型)样本回归函数的随机形式(样本回归模型) 同样地,样本回归函数也有如下的随机形式: iiiii eXYY 1

14、0 由于方程中引入了随机项,成为计量经济模 型,因此也称为样本回归模型(样本回归模型(sample regression model)。 式中,i e 称为(样本)残差(样本)残差 (或剩余剩余)项项(residual),代表 了其他影响 i Y 的随机因素的集合,可看成是i 的估计量 i 。 7/24/2021重庆工商大学经济贸易学院-张文爱22 回归分析的主要目的:根据样本回归函数SRF, 估计总体回归函数PRF。 即,根据 iiiii eXeYY 10 估计 iiiii XXYEY 10 )|( 7/24/2021重庆工商大学经济贸易学院-张文爱23 总体总体 回归回归 模型模型 样本样

15、本 回归回归 模型模型 iii uXY 10 iii eXY 10 总体回归模型总体回归模型Y X 55 11001400 140 160800 样本回归模型样本回归模型 一元 多元(k元) 一元 多元(k元) ikikiii uXXXY 22110 回归模型类类型回归模型类类型 ikikiii eXXXY 22110 7/24/2021重庆工商大学经济贸易学院-张文爱24 一、基本假定一、基本假定 1、零均值。随机扰动项、零均值。随机扰动项ui的均值为零。即,的均值为零。即, E(ui|Xi)=0 2、同方差。随机扰动项、同方差。随机扰动项ui的方差相等。即的方差相等。即 Var(ui|Xi

16、)=E(ui-E(ui)|Xi2 =E(ui2|Xi2 = 2 3、无自相关。各个扰动项无自相关。即:、无自相关。各个扰动项无自相关。即: iii uXY 10 考虑回归模型:考虑回归模型: ji 0 )( ),( ji jjiiji uuE EuuEuuEuuCov 2.2 一元线性回归模型的参数估计一元线性回归模型的参数估计 7/24/2021重庆工商大学经济贸易学院-张文爱25 4、随机扰动项、随机扰动项ui解释变量解释变量Xi不相关。即不相关。即 Cov(ui,Xi)=Eui-EuiXi-EXi=0 i=1,2,n 5、ui服从正态分布,即服从正态分布,即 uiN(0, 2 ),),i

17、=1,2,n 上述基本假设也叫线性回归模型的经典假设经典假设或高高 斯(斯(Gauss)假设)假设; 满足上述基本假设的模型称为经典线性回归模型经典线性回归模型 (classical linear regression model, CLRM ) 注:“假设”只是为了运用;并非不满足假设就不能估计! 7/24/2021重庆工商大学经济贸易学院-张文爱26 给定一组样本观测值(Xi, Yi)(i=1,2,n)要 求样本回归函数尽可能好地拟合这组值. 普通最小二乘法普通最小二乘法(Ordinary least squares, OLS) 给出的判断标准是:残差平方和最小残差平方和最小 n iii

18、n i XYYYQ 1 2 10 2 1 ) () ( iii eXYSRF 10 :对于 7/24/2021重庆工商大学经济贸易学院-张文爱27 方程组(*)称为正规方程组(正规方程组(normal equations)。 7/24/2021重庆工商大学经济贸易学院-张文爱28 记 2 222 1 )( iiii X n XXXx iiiiiiii YX n YXYYXXyx 1 )( 上述参数估计量可以写成: XY x yx i ii 10 2 1 称为OLS估计量的离差形式(离差形式(deviation form)。)。 由于参数的估计结果是通过最小二乘法得到 的,故称为普通普通最小二乘

19、估计量(最小二乘估计量(ordinary least squares estimators)。 7/24/2021重庆工商大学经济贸易学院-张文爱29 几个常几个常 用结果用结果 0e )4( 0 e 0 2 )3( n )( ) ( Y )2( )1( i 0 10i 10 0 1 1110 1 1110 i ii ii ii i i iii ii iii X Xe XY XY e YY XXY XXYXY Y XXYY XXYXY YX 的第二式)。不相关(由求与 )( )( 的第一式:由求 的均值为零。残差 ,得两边求和,并同除 的均值:的均值等于实测的 )(亦即: )。,样本回归直线经

20、过点( 7/24/2021重庆工商大学经济贸易学院-张文爱30 当模型参数估计出后,需考虑参数估计值的 精度,即是否能代表总体参数的真值,或者说需 考察参数估计量的统计性质。 一个用于考察总体的估计量,可从如下几个 方面考察其优劣性: (1)线性性)线性性,即它是否是另一随机变量的线性 函数; .3最小二乘估计量的性质最小二乘估计量的性质 7/24/2021重庆工商大学经济贸易学院-张文爱31 (2)无偏性)无偏性,即它的均值或期望值是否等于总 体的真实值; (3)有效性)有效性,即它是否在所有线性无偏估计量 中具有最小方差。 l 这三个准则也称作估计量的小样本性质。小样本性质。 拥有这类性质

21、的估计量称为最佳线性无偏估计最佳线性无偏估计 量量(best liner unbiased estimator, BLUE)。 7/24/2021重庆工商大学经济贸易学院-张文爱32 (4)渐近无偏性)渐近无偏性,即样本容量趋于无穷大时, 是否它的均值序列趋于总体真值; (5)一致性)一致性,即样本容量趋于无穷大时,它是 否依概率收敛于总体的真值; (6)渐近有效性)渐近有效性,即样本容量趋于无穷大时, 是否它在所有的一致估计量中具有最小的渐近方 差。 当不满足小样本性质时,需进一步考察估计 量的大样本或渐近性质:大样本或渐近性质: 7/24/2021重庆工商大学经济贸易学院-张文爱33 高斯

22、高斯马尔可夫定理马尔可夫定理(Gauss-Markov theorem) 在给定经典线性回归的假定下,最在给定经典线性回归的假定下,最 小二乘估计量是具有最小方差的线性无偏小二乘估计量是具有最小方差的线性无偏 估计量估计量,即即OLSE是是BLUE(Best Linear Unbiased Estimator)。)。 7/24/2021重庆工商大学经济贸易学院-张文爱34 (1)线性性 : 。YI的线性函数是和 10 一、最小二乘估计量的性质一、最小二乘估计量的性质 (2)无偏性:最小二乘估计 10 和 的数学期望值分别等于总体回 10 , 归系数的值 1100 ) () (EE,即, (3)

23、最小方差性: OLS估计量 最小。和) () ( 10 VarVar 在所有线性无偏估计量中,具有最小方差。即 10 和 7/24/2021重庆工商大学经济贸易学院-张文爱35 二、最小二乘估计的方差二、最小二乘估计的方差 ),(),( 2 2 2 11 2 2 00 1 i i i xn X N x N 证明(略) )( 的无偏估计量为:是未知的,一般 2 2 22 2 22 n YY n e iii 7/24/2021重庆工商大学经济贸易学院-张文爱36 在随机误差项的方差 2 估计出后,参数0 和 1 的方方差差和标标准准差差的估计量分别是: 1 的样本方差: 222 1 i xS 1

24、的样本标准差: 2 1 i xS 0 的样本方差: 2222 0 ii xnXS 0 的样本标准差: 22 0 ii xnXS 7/24/2021重庆工商大学经济贸易学院-张文爱37 2.4 2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验 一、拟合优度检验一、拟合优度检验 二、变量的显著性检验二、变量的显著性检验 三、参数的置信区间三、参数的置信区间 7/24/2021重庆工商大学经济贸易学院-张文爱38 拟合优度检验拟合优度检验对样本回归直线与样本观测 值之间拟合程度的检验。 度量拟合优度的指标:判定系数判定系数(可决系数可决系数) R2 2 问题问题:采用普通最小二乘估计方法

25、,已经保 证了模型最好地拟合了样本观测值,为什么还要 检验拟合程度? 7/24/2021重庆工商大学经济贸易学院-张文爱39 1 1、总离差平方和的分解、总离差平方和的分解 已知由一组样本观测值(Xi,Yi),i=1,2,n 得到如下样本回归直线 ii XY 10 iiiiiii yeYYYYYYy) () ( 7/24/2021重庆工商大学经济贸易学院-张文爱40 7/24/2021重庆工商大学经济贸易学院-张文爱41 如果Yi=i 即实际观测值落在样本回归“线” 上,则拟合最好拟合最好。 可认为,“离差”全部来自回归线,而与 “残差”无关。 7/24/2021重庆工商大学经济贸易学院-张文

26、爱42 对于所有样本点,则需考虑这些点与样本均 值离差的平方和,可以证明: 7/24/2021重庆工商大学经济贸易学院-张文爱43 TSS=RSS+ESS 22 )(YYyTSS ii 记 22 ) (YYyRSS ii 22 ) ( iii YYeESS 7/24/2021重庆工商大学经济贸易学院-张文爱44 l在给定样本中,TSS不变, l如果实际观测点离样本回归线越近,则RSS在TSS中占 的比重越大,因此 l拟合优度:回归平方和拟合优度:回归平方和RSS占占Y的总离差平方和的总离差平方和TSS的的 比例。比例。 7/24/2021重庆工商大学经济贸易学院-张文爱45 TSS ESS T

27、SS RSS R1记 2 2、可决系数、可决系数R2 2统计量统计量 称 R2 为(样本)可决系数(样本)可决系数/判定系数(判定系数(coefficient of determination)。 可决系数可决系数的取值范围取值范围:0,1 R2 2越接近越接近1 1,说明实际观测点离样本线越近,说明实际观测点离样本线越近, 拟合优度越高拟合优度越高。 7/24/2021重庆工商大学经济贸易学院-张文爱46 回归分析回归分析是要判断解释变量解释变量X是否是被解释变被解释变 量量Y的一个显著性的影响因素。 在一元线性模型一元线性模型中,就是要判断X是否对Y具 有显著的线性性影响。这就需要进行变量

28、的显著变量的显著 性检验。性检验。 变量的显著性检验所应用的方法是数理统计变量的显著性检验所应用的方法是数理统计 学中的假设检验学中的假设检验。 计量经济学中,主要是针对变量的参数真值计量经济学中,主要是针对变量的参数真值 是否为零来进行显著性检验的。是否为零来进行显著性检验的。 7/24/2021重庆工商大学经济贸易学院-张文爱47 2. 变量的显著性检验变量的显著性检验 t检验 即是看解释变量对被解释变量有无显 著影响。也即变量前的回归系数是否为0。 统计上等于0,则不显著;统计上不等于0, 则显著; 7/24/2021重庆工商大学经济贸易学院-张文爱48 ),( 2 2 11 i x N )2( 1 11 22 11 nt S x t i 7/24/2021重庆工商大学经济贸易学院-张文爱49 变量显著性检验步骤(检验步骤(t检验步骤)检验步骤) : (1)对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论