计量经济学-第二章一元线性回归模型_第1页
计量经济学-第二章一元线性回归模型_第2页
计量经济学-第二章一元线性回归模型_第3页
计量经济学-第二章一元线性回归模型_第4页
计量经济学-第二章一元线性回归模型_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1经济学类核心课程经济学类核心课程计量经济学计量经济学第二章第二章 一元线性回归模型一元线性回归模型一元线性回归模型的参数估计一元线性回归模型的参数估计3一元线性回归模型的统计检验一元线性回归模型的统计检验4一元线性回归分析的应用:预测问题一元线性回归分析的应用:预测问题5回归分析概述回归分析概述1建模实例建模实例6一元线性回归模型的基本假设一元线性回归模型的基本假设22.1 回归分析概述回归分析概述一一回归分析基本概念回归分析基本概念变量间的相互关系变量间的相互关系 计量经济学的主要问题之一就是探寻各种经济变量之间的相互联系程计量经济学的主要问题之一就是探寻各种经济变量之间的相互联系程度、联

2、系方式以及运动规律。度、联系方式以及运动规律。 各种经济变量间的关系可以分为两类:各种经济变量间的关系可以分为两类:一类是确定的函数关系一类是确定的函数关系,另一另一类是不确定的统计关系类是不确定的统计关系。 确定的函数关系例如:确定的函数关系例如: 不确定的统计关系例如:农作物产量不确定的统计关系例如:农作物产量Y与施肥量与施肥量X之间的关系。无法之间的关系。无法确定农作物产量与施肥量之间的函数关系,因为农作物产量还会受到阳确定农作物产量与施肥量之间的函数关系,因为农作物产量还会受到阳光、气温、降雨等因素影响,但是可以通过统计计量方法研究统计相关关光、气温、降雨等因素影响,但是可以通过统计计

3、量方法研究统计相关关系,农作物产量系,农作物产量Y是非确定性变量,也称为是非确定性变量,也称为随机变量随机变量。2Sr2.1 回归分析概述回归分析概述一一回归分析基本概念回归分析基本概念变量间的相互关系变量间的相互关系 变量间的函数关系与相关关系并不是绝对的,一定条件下,可以相互变量间的函数关系与相关关系并不是绝对的,一定条件下,可以相互转化。确定性现象的观测中,往往存在测量误差,函数关系将通过相关关转化。确定性现象的观测中,往往存在测量误差,函数关系将通过相关关系表现出来,反之,如果将非确定性现象中的影响因素全部识别出来,并系表现出来,反之,如果将非确定性现象中的影响因素全部识别出来,并将此

4、全部纳入到变量间的依存关系中,相关关系将会向函数关系转化。将此全部纳入到变量间的依存关系中,相关关系将会向函数关系转化。相相关分析和回归分析主要研究非确定性现象间的统计相关关系关分析和回归分析主要研究非确定性现象间的统计相关关系。2.1 回归分析概述回归分析概述一一回归分析基本概念回归分析基本概念相关分析与回归分析相关分析与回归分析 相关分析(相关分析(Correlation Analysis)主要研究随机变量间的相关形式及)主要研究随机变量间的相关形式及相关程度。相关程度。 变量变量X与与Y的总体线性相关系数为:的总体线性相关系数为: 样本相关系数为:样本相关系数为:Cov(,)Var()V

5、ar( )XYX YXY12211()()()()niiiXYnniiiiXXYYrXXYY2.1 回归分析概述回归分析概述一一回归分析基本概念回归分析基本概念相关分析与回归分析相关分析与回归分析 具有相关关系的变量间存在因果关系,则可以通过回归分析具有相关关系的变量间存在因果关系,则可以通过回归分析(Regression Analysis)研究具体依存关系,比如考察可支配收入每)研究具体依存关系,比如考察可支配收入每1元的元的变化引起的消费支出的变化引起的消费支出的平均变化平均变化。 回归分析是研究一个变量(被解释变量,回归分析是研究一个变量(被解释变量,explained variable

6、;因变量,因变量,dependent variable)关于另一个(几个)变量(解释变量,)关于另一个(几个)变量(解释变量,explanatory variable;自变量,;自变量,independent variable)的依赖关系的计算方法和理论。)的依赖关系的计算方法和理论。目的在于通过后者的已知或设定值,去估计或预测前者的均值。目的在于通过后者的已知或设定值,去估计或预测前者的均值。2.1 回归分析概述回归分析概述一一回归分析基本概念回归分析基本概念相关分析与回归分析相关分析与回归分析 相关分析与回归分析既有联系又有区别:相关分析与回归分析既有联系又有区别: 首先首先,都是研究非确

7、定性变量间的统计依赖关系,并能度量线性依赖,都是研究非确定性变量间的统计依赖关系,并能度量线性依赖程度大小;程度大小;其次其次,两者间存在明显的区别,相关分析仅仅测量变量相关程,两者间存在明显的区别,相关分析仅仅测量变量相关程度,无需考察因果关系,因此变量地位是对称的,而回归分析更关注因果度,无需考察因果关系,因此变量地位是对称的,而回归分析更关注因果关系,地位是不对称的,有解释变量与被解释变量之分;关系,地位是不对称的,有解释变量与被解释变量之分;再次再次,相关分析,相关分析只关注变量联系程度,不关注具体依赖关系,回归分析更关注依赖关系,只关注变量联系程度,不关注具体依赖关系,回归分析更关注

8、依赖关系,可以通过解释变量变化去估计或预测被解释变量的变化。可以通过解释变量变化去估计或预测被解释变量的变化。 回归分析主要包括以下内容:回归分析主要包括以下内容: 根据样本观察值对计量经济学模型参数进行估计,求得回归方程;根据样本观察值对计量经济学模型参数进行估计,求得回归方程; 对回归方程、参数估计值进行显著性检验;对回归方程、参数估计值进行显著性检验; 利用回归方程进行分析、评价与预测。利用回归方程进行分析、评价与预测。2.1 回归分析概述回归分析概述二二总体回归函数总体回归函数例例2.1.1 以以X的给定值为条件的,的给定值为条件的,Y的的条件分布条件分布是已知的,如是已知的,如P(Y

9、=561X=800)=1/4。那么,给定那么,给定X的值,可以得到的值,可以得到Y的的条件均值或条件期望条件均值或条件期望,如,如E(YX=800)=605。 2.1 回归分析概述回归分析概述二二总体回归函数总体回归函数例例2.1.1 从人均可支配收入与消费支出从人均可支配收入与消费支出的散点图看出,虽然消费支出存在的散点图看出,虽然消费支出存在差异,差异,平均来说平均来说,随着可支配收入,随着可支配收入增加,消费支出也在增加。增加,消费支出也在增加。Y的的条件均值正好落在一条斜率为正的条件均值正好落在一条斜率为正的直线上,称之为总体回归线。直线上,称之为总体回归线。 总体回归线2.1 回归分

10、析概述回归分析概述二二总体回归函数总体回归函数总体回归线总体回归线 给定解释变量给定解释变量X条件下被解释变量条件下被解释变量Y的期望轨迹称为总体回归线的期望轨迹称为总体回归线(Population regression line),或总体回归曲线(),或总体回归曲线(Population regression curve),总体回归函数(),总体回归函数(Population Regression Function,PRF)为:)为: 将消费支出看成可支配收入的线性函数,可进一步写成将消费支出看成可支配收入的线性函数,可进一步写成 其中,其中, 和和 是未知参数,称之为回归系数(是未知参数,

11、称之为回归系数(Regression coefficients)。)。 线性函数主要指回归系数是线性,解释变量可以不是线性的。线性函数主要指回归系数是线性,解释变量可以不是线性的。 ()()E Y XfX01()+E Y XX012.1 回归分析概述回归分析概述三三随机干扰项随机干扰项定义定义 总体回归函数描述了考察总体的家庭消费支出总体回归函数描述了考察总体的家庭消费支出平均来说平均来说随着可支配收随着可支配收入变化的规律,但是对具体一个家庭来说,消费支出不一定是平均值入变化的规律,但是对具体一个家庭来说,消费支出不一定是平均值E(YX),而是在平均支出的周围。,而是在平均支出的周围。 对个

12、别家庭而言,消费支出与平均消费支出的差对个别家庭而言,消费支出与平均消费支出的差: 是一个不可观测的随机变量,称为是一个不可观测的随机变量,称为随机误差项随机误差项(stochastic error)或)或随机干扰项(随机干扰项(stochastic disturbance)。)。 于是,个别家庭消费支出:于是,个别家庭消费支出: (总体回归函数的随机设定形式总体回归函数的随机设定形式)当可支配收入当可支配收入X给定时,个别家庭消费支出由两个部分组成:给定时,个别家庭消费支出由两个部分组成:平均消费平均消费支出,系统性部分或确定性部分;随机部分或非系统性部分支出,系统性部分或确定性部分;随机部

13、分或非系统性部分。=()YE Y X01= ()+ =+YE Y XX 2.1 回归分析概述回归分析概述三三随机干扰项随机干扰项引入随机干扰项的原因引入随机干扰项的原因 代表未知的影响因素代表未知的影响因素,对考察总体认识不完备,未知的影响因素无,对考察总体认识不完备,未知的影响因素无法引入模型;法引入模型; 代表残缺数据代表残缺数据,部分数据无法获得,例如财富拥有量对消费支出的,部分数据无法获得,例如财富拥有量对消费支出的影响;影响; 代表众多细小影响因素代表众多细小影响因素,将众多细小变量的影响综合;,将众多细小变量的影响综合; 代表数据观测误差代表数据观测误差,数据往往存在测量误差;,数

14、据往往存在测量误差; 代表模型设定误差代表模型设定误差,模型设定可能与真实的模型有偏差;,模型设定可能与真实的模型有偏差; 变量的内生随机性变量的内生随机性 ,变量所固有的内生随机性,也会对被解释变,变量所固有的内生随机性,也会对被解释变量产生随机性影响。量产生随机性影响。2.1 回归分析概述回归分析概述四四样本回归函数样本回归函数定义定义 由于总体的信息往往无法全部得到,通过抽样得到总体的样本,再由于总体的信息往往无法全部得到,通过抽样得到总体的样本,再通过样本信息来估计总体回归函数。通过样本信息来估计总体回归函数。 样本回归线 样本回归线(样本回归线(Sample regression l

15、ine),函数形式为),函数形式为:称之为样本回归函数称之为样本回归函数(Sample Regression Function,SRF)称之为样本回归模型。称之为样本回归模型。01(X)YfX01YYXe2.1 回归分析概述回归分析概述四四样本回归函数样本回归函数目的目的 用样本回归函数估计,即用样本回归函数估计,即 去估计总体回归函数去估计总体回归函数 使使SRF尽可能接近尽可能接近PRF,右图,右图显示了样本回归线与总体回归线的显示了样本回归线与总体回归线的基本关系。基本关系。 样本回归线并不是唯一的。样本回归线并不是唯一的。01YYeXe01(Y)YEXX2.2 一元线性回归模型的基本假

16、设一元线性回归模型的基本假设模型介绍模型介绍一元线性回归模型是最简单的计量经济学模型一元线性回归模型是最简单的计量经济学模型 其中,其中,Y为被解释变量,为被解释变量,X为解释变量,为解释变量, 和和 为待估参数,为待估参数, 为随为随机扰动项,在有机扰动项,在有n个样本观测点的情况下,得到:个样本观测点的情况下,得到: 为了保证参数估计量具有良好性质,通过对模型提出若干基本假设:为了保证参数估计量具有良好性质,通过对模型提出若干基本假设: 对模型设定的假设对模型设定的假设 对解释变量的假设对解释变量的假设 对随机干扰项的假设对随机干扰项的假设01YX01011,2,iiiYXin2.2 一元

17、线性回归模型的基本假设一元线性回归模型的基本假设一一对模型设定的假设对模型设定的假设假设假设1:回归模型是正确设定的:回归模型是正确设定的 模型的正确设定主要包括模型的正确设定主要包括模型选择了正确的变量模型选择了正确的变量和和模型选择了正确的模型选择了正确的函数形式。函数形式。 选择了正确的变量指选择了正确的变量指设定总体回归函数时,既没有遗漏重要变量,也设定总体回归函数时,既没有遗漏重要变量,也没有多选无关的变量。没有多选无关的变量。选择了正确的函数形式是指选择了正确的函数形式是指设定的总体回归函数与设定的总体回归函数与因变量与自变量呈现的函数形式正好相同。因变量与自变量呈现的函数形式正好

18、相同。(柯布道格拉斯的幂函数形式)(柯布道格拉斯的幂函数形式) 假设假设1满足时,称为没有满足时,称为没有设定偏误设定偏误(specification error)。)。2.2 一元线性回归模型的基本假设一元线性回归模型的基本假设二二对解释变量的假设对解释变量的假设假设假设2:解释变量:解释变量X在所抽取的样本中具有变异性,而且随在所抽取的样本中具有变异性,而且随着样本容量的无限增加,解释变量着样本容量的无限增加,解释变量X的样本方差趋于一个非的样本方差趋于一个非零的有限常数,即满足零的有限常数,即满足 通过解释变量的变化来解释被解释变量的变化,因此需要足够的变异通过解释变量的变化来解释被解释

19、变量的变化,因此需要足够的变异性。方差非零假设旨在排除数值取值出现无界的变量作为解释变量,因为性。方差非零假设旨在排除数值取值出现无界的变量作为解释变量,因为这类数据使大样本统计推断变得无效。这类数据使大样本统计推断变得无效。21() /,niiXXnQ n 2.2 一元线性回归模型的基本假设一元线性回归模型的基本假设三三对随机扰动项的假设对随机扰动项的假设假设假设3:给定解释变量:给定解释变量X的任何值,随机扰动项的任何值,随机扰动项 的均值为的均值为零,即零,即 意味着意味着 的期望不依赖于的期望不依赖于X的任何观测点取值的变化而变化,且总为的任何观测点取值的变化而变化,且总为常数常数0,

20、表明,表明 与与X不存在任何形式的相关性,称不存在任何形式的相关性,称X是外生解释变量是外生解释变量(exogenous explanatory variable),或),或X是严格外生的(是严格外生的(strictly exogenous),否则称),否则称X是内生解释变量(是内生解释变量(endogenous explanatory variable)。)。 同期外生(同期外生(contemporaneously exogenous)或同期不相关)或同期不相关( contemporaneously uncorrelated )。)。i()0iEX()( ()(0)0iiEE EXE( ,)

21、= ()- ( ) ()= ()=0iiiiCov XE XE X EE X(,)= ()=0iiiiCov XE X2.2 一元线性回归模型的基本假设一元线性回归模型的基本假设三三对随机扰动项的假设对随机扰动项的假设假设假设4:随机扰动项:随机扰动项 具有给定具有给定X任何值条件下的同方差性任何值条件下的同方差性及不序列相关性,即及不序列相关性,即 条件同方差意味着条件同方差意味着 的方差不依赖于的方差不依赖于X的变化而变化,且总为常数的变化而变化,且总为常数 任意两个不同观测点的随机干扰项不相关任意两个不同观测点的随机干扰项不相关2Var()=,1,2,iXinCov(,)=0,ijXij

22、 22Var()=i2222Var()= ()- ()()iiiiXEXEXEX2222Var()= ()- ()()iiiiEEECov(,)= ()()0ijijXEXX 2.2 一元线性回归模型的基本假设一元线性回归模型的基本假设三三对随机扰动项的假设对随机扰动项的假设假设假设5:随机干扰项服从零均值、同方差的正态分布,即:随机干扰项服从零均值、同方差的正态分布,即 以上假设也称为以上假设也称为线性回归模型的经典假设线性回归模型的经典假设(classical assumption),),满足假设的模型称为满足假设的模型称为经典线性回归模型经典线性回归模型(Classical Linear

23、 Regression Model,CLRM),前四个假设称为高斯前四个假设称为高斯-马尔科夫假设(马尔科夫假设(Gauss-Markov assumption)。)。 被解释变量被解释变量Y具有如下分布特征具有如下分布特征2(0,)iXN201(,)Y XNX2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计一一参数估计的普通最小二乘法(参数估计的普通最小二乘法(OLS)判断标准判断标准 不同的估计方法可得到不同的不同的估计方法可得到不同的 和和 ,所估计的,所估计的 也不同。被解释也不同。被解释变量的估计值与实际观测值差的平方和最小,即变量的估计值与实际观测值差的平方和最小,即

24、理想的方法是选择理想的方法是选择 , 使使 与与 之差的平方和最小。之差的平方和最小。为什么使用为什么使用平方和?平方和?求解(正规方程组)求解(正规方程组)222min01111()()nnniiiiiiiiQeYYYX01iYiY2022122=()=()iiiiiiiiiiiiiXYXY XnXXnY XYXnXX 01iY2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计一一参数估计的普通最小二乘法(参数估计的普通最小二乘法(OLS)求解(离差形式)求解(离差形式) 其中,其中, 有关估计量与估计值的区别,估计值是具体数值,估计量是一个函数有关估计量与估计值的区别,估计值是具

25、体数值,估计量是一个函数1201= -iiix yxYX22221()()1()()iiiiiiiiiixXXXXnx yXX YYXYXYn2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计一一参数估计的普通最小二乘法(参数估计的普通最小二乘法(OLS)求解(离差形式)求解(离差形式) 回归线通过样本均值回归线通过样本均值 估计值估计值 的均值等于实际观测值的均值等于实际观测值 的均值的均值12YXiYiYiYYn2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计二二参数估计的最大似然法(参数估计的最大似然法(ML)基本思想基本思想 对于普通最小二乘法,当从模型总体随机抽

26、取容量为对于普通最小二乘法,当从模型总体随机抽取容量为n的样本观测的样本观测值后,最合理的参数估计量应该使得模型能最好地拟合样本数据;而对于值后,最合理的参数估计量应该使得模型能最好地拟合样本数据;而对于最大似然法,当从模型总体随机抽取容量为最大似然法,当从模型总体随机抽取容量为n的样本观测值后,的样本观测值后,最合理的最合理的参数估计量应该使得从模型中抽取该样本观测值的概率最大参数估计量应该使得从模型中抽取该样本观测值的概率最大。 要对每个可能的正态总体取得容量为要对每个可能的正态总体取得容量为n的样本观测值的联合概率,然的样本观测值的联合概率,然后选择其参数能使观测值的联合概率为最大的那个

27、总体,将样本观测值联后选择其参数能使观测值的联合概率为最大的那个总体,将样本观测值联合概率函数称为合概率函数称为变量的似然函数变量的似然函数。在已经取得样本观测值的情况下,使似。在已经取得样本观测值的情况下,使似然函数取极大值的总体分布参数所代表的总体具有最大的概率取得这些样然函数取极大值的总体分布参数所代表的总体具有最大的概率取得这些样本观测值,该总体参数即是所要求的参数。本观测值,该总体参数即是所要求的参数。2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计二二参数估计的最大似然法(参数估计的最大似然法(ML)求解求解 由于由于 服从正态分布服从正态分布于是,于是, 的概率函数为

28、:的概率函数为: 联合概率(似然函数)为:联合概率(似然函数)为: 在满足一系列基本假设的情况下,模型结构参数的最大似然估计量与在满足一系列基本假设的情况下,模型结构参数的最大似然估计量与普通最小二乘估计量是相同的。普通最小二乘估计量是相同的。iY201(,)iiYNXiY20121()21( ),1,2,2iiYXiP Yein20121()2201121(,)(,)2iiYXnLP Y ,YYe 2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计三三参数估计的矩估计法(参数估计的矩估计法(MM)基本思路基本思路 正规方程组可以通过矩估计的思想来导出,矩估计的基本原理是正规方程组可

29、以通过矩估计的思想来导出,矩估计的基本原理是用相用相应的样本矩来估计总体矩应的样本矩来估计总体矩。 于是,相应的样本矩条件可写成于是,相应的样本矩条件可写成 解与普通最小二乘法和最大似然法的结果相同。解与普通最小二乘法和最大似然法的结果相同。()0Cov(,)= ()0iiiiiEXE X01011()01()0iiiiiYXnYXXn2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计三三参数估计的矩估计法(参数估计的矩估计法(MM)例例2.3.1 12014975800=0.67017425000= -=1583-0.6701 2150=142.28iiix yxYX142.280

30、.6701iiYX2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计四四最小二乘估计量的统计性质最小二乘估计量的统计性质考察参数估计量的统计性质的原因考察参数估计量的统计性质的原因 由于抽样波动的存在,以及所选估计方法由于抽样波动的存在,以及所选估计方法的不同,都会使估计的参数与总体参数的真值的不同,都会使估计的参数与总体参数的真值有差距,因此考察参数估计量的统计性质就有差距,因此考察参数估计量的统计性质就成了衡量该统计量成了衡量该统计量“好坏好坏”的主要准则。的主要准则。2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计四四最小二乘估计量的统计性质最小二乘估计量的统计性质

31、线性性线性性 指估计量指估计量 , 是是 的线性组合。的线性组合。其中,其中,01iY12222()=iiiiiiiiiiiiix yx YYxxxYYxkYxx2iiixkx0111()iiiiiiiYXYkY XnXk YwYn1iiwXkn2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计四四最小二乘估计量的统计性质最小二乘估计量的统计性质无偏性无偏性 即以即以X的所有样本为条件,估计量的所有样本为条件,估计量 , 的均值等于总体回归参数真的均值等于总体回归参数真实值实值 和和 。所以,所以, ,2=0iiixkx1iik X 010110101()iiiiiiiiiikYkX

32、kk Xk11iik1111()()()iiiiEXEkXk EX0000()()()iiiiEXEwXw EX2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计四四最小二乘估计量的统计性质最小二乘估计量的统计性质有效性(最小方差性)有效性(最小方差性) 即在所有线性无偏估计量中,普通最小二乘估计量即在所有线性无偏估计量中,普通最小二乘估计量 和和 具有最小具有最小方差。方差。012101222222Var()=Var()=Var()=Var()=()iiiiiiiiiiXkY XkXXxkXxx200122222222222222222222Var()=Var()=Var()112

33、=()( )12() 1iiiiiiiiiiiiiiiiXwY XwXXkXkX knnnxXkXnnxxnXXXnxnxnx2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计四四最小二乘估计量的统计性质最小二乘估计量的统计性质有效性(最小方差性)有效性(最小方差性) 假设假设 是其他估计方法得到的关于是其他估计方法得到的关于 的线性无偏估计量:的线性无偏估计量:其中,其中,得到:得到: 普通最小二乘估计量具有线性性、无偏性和有效性,是最佳线性无偏普通最小二乘估计量具有线性性、无偏性和有效性,是最佳线性无偏估计量,也称高斯估计量,也称高斯-马尔科夫定理。马尔科夫定理。111iicYi

34、iickd11Var()Var()00Var()Var()2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计四四最小二乘估计量的统计性质最小二乘估计量的统计性质大样本性质大样本性质 除了拥有好的小样本性质外,还拥有好的大样本性质除了拥有好的小样本性质外,还拥有好的大样本性质11121112lim()lim()lim()lim()lim()0lim()iiiiiiiiPPkxPPxxPnQxPn2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计五五 和和 的概率分布及的概率分布及 的方差估计的方差估计参数估计量的概率分布参数估计量的概率分布 为了达到对所估计参数精度测定的目的

35、,还需进一步确定参数估计量为了达到对所估计参数精度测定的目的,还需进一步确定参数估计量的概率分布。的概率分布。 和和 概率分布取决于概率分布取决于i012112(,)iNx22002(,)iiXNnx01iY2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计五五 和和 的概率分布及的概率分布及 的方差估计的方差估计随机干扰项的方差估计随机干扰项的方差估计 在估计的参数在估计的参数 和和 的方差表达式中,都含有随机干扰项的方差的方差表达式中,都含有随机干扰项的方差 。由于由于 实际上是未知的,因此,实际上是未知的,因此, 和和 的方差实际上无法计算,需要对的方差实际上无法计算,需要对其

36、估计。由于随机扰动项其估计。由于随机扰动项 无法观测,只能从残差无法观测,只能从残差 出发,对总体方差出发,对总体方差进行估计。进行估计。 最小二乘估计量最小二乘估计量 最大似然估计量最大似然估计量 矩估计量矩估计量i01iie22 =2ien22 =ien22 =ien0122012.4 一元线性回归模型的统计检验一元线性回归模型的统计检验一一拟合优度检验拟合优度检验为什么需要进行统计检验?为什么需要进行统计检验? 尽管从统计性质上已知,如果有足够多的重复抽样,参数估计值的均尽管从统计性质上已知,如果有足够多的重复抽样,参数估计值的均值就等于其总体的参数真值,但是在一次抽样中,估计值不一定就

37、等于该值就等于其总体的参数真值,但是在一次抽样中,估计值不一定就等于该真值。真值。拟合优度检验:检验模型对样本观测值得拟合程度拟合优度检验:检验模型对样本观测值得拟合程度 构造一个统计量并计算其数值,然后与某一个标准进行比较,得出检构造一个统计量并计算其数值,然后与某一个标准进行比较,得出检验结论。验结论。 在一个特定的条件下做得最好的并不一定是高质量的,普通最小二乘在一个特定的条件下做得最好的并不一定是高质量的,普通最小二乘是同一个问题内部的比较,拟合优度检验是不同问题之间的比较。是同一个问题内部的比较,拟合优度检验是不同问题之间的比较。2.4 一元线性回归模型的统计检验一元线性回归模型的统

38、计检验一一拟合优度检验拟合优度检验拟合优度检验:检验模型对样本观测值得拟合程度拟合优度检验:检验模型对样本观测值得拟合程度 从左图可以看出,第二图从左图可以看出,第二图拟合效果更好,需要构造拟合效果更好,需要构造一个统计量去衡量。一个统计量去衡量。2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验一一拟合优度检验拟合优度检验总离差平方和的分解总离差平方和的分解 样本回归线样本回归线 Y的第的第i个观测值与样本均值的个观测值与样本均值的 离差离差 可分解为两部分之和可分解为两部分之和 01iiYXiiyYY()()iiiiiiiiyYYYYYYey2222iiiiiyyee y222i

39、iiyye222222()()()iiiiiiiyYYTSSyYYESSeYYRSStotal sum of squaresexplained sum of squaresresidual sum of squares()()()总总离离差差平平方方和和回回归归平平方方和和残残差差平平方方和和2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验一一拟合优度检验拟合优度检验总离差平方和的分解总离差平方和的分解 Y的观测值围绕其均值的总离差平方和可以分解为两个部分:的观测值围绕其均值的总离差平方和可以分解为两个部分:一部分一部分来自回归线,另一部分来自随机势力来自回归线,另一部分来自随机势

40、力。因此,可用来自回归线的回归平方。因此,可用来自回归线的回归平方和占和占Y的总离差平方和的比例判断样本回归线与样本观测值的拟合优度。的总离差平方和的比例判断样本回归线与样本观测值的拟合优度。 能否直接使用残差平方和作为拟合优度检验的统计量?作为检验统能否直接使用残差平方和作为拟合优度检验的统计量?作为检验统计量一般应该是相对量,而不能是绝对量。因为用绝对量无法设置标准。计量一般应该是相对量,而不能是绝对量。因为用绝对量无法设置标准。残差平方和与样本量残差平方和与样本量n密切相关。密切相关。2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验一一拟合优度检验拟合优度检验可决系数可决系数

41、 在总离差平方和中,回归平方和所占的比重越大,残差平方和所占的在总离差平方和中,回归平方和所占的比重越大,残差平方和所占的比重越小,回归直线与样本点拟合得越好。如果模型与样本观测值完全拟比重越小,回归直线与样本点拟合得越好。如果模型与样本观测值完全拟合,合, ,越接近,越接近1,模型拟合优度越高。,模型拟合优度越高。 非负统计量非负统计量2R21ESSRSSRTSSTSS 2=1R201R2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验二二变量的显著性检验变量的显著性检验 旨在对模型中被解释变量与解释变量之间的线性关系是否显著成立作旨在对模型中被解释变量与解释变量之间的线性关系是否

42、显著成立作出推断,或者所选解释变量是否对被解释变量有显著的线性影响。出推断,或者所选解释变量是否对被解释变量有显著的线性影响。假设检验假设检验 根据样本所提供的信息,对未知总体分布的某些方面的假设作出合根据样本所提供的信息,对未知总体分布的某些方面的假设作出合理的判断。理的判断。 程序:程序:根据实际问题的要求提出一个假设,称为根据实际问题的要求提出一个假设,称为原假设原假设H0,然后根,然后根据样本信息,对据样本信息,对H0的真伪进行判断,作出拒绝的真伪进行判断,作出拒绝H0或接受或接受H0的决策。的决策。 小概率事件原理:小概率事件原理:小概率事件在一次试验中几乎不可能发生。在原小概率事件

43、在一次试验中几乎不可能发生。在原假设假设H0下构造一个事件,这个事件在下构造一个事件,这个事件在“原假设原假设H0是正确是正确”的条件下是一的条件下是一个小概率事件。随机抽取一组容量为个小概率事件。随机抽取一组容量为n的样本观测值进行检验,如果事件的样本观测值进行检验,如果事件发生了,说明发生了,说明“假设假设H0正确正确”是错误的,因为不应该出现的小概率事件是错误的,因为不应该出现的小概率事件出现了,因而拒绝出现了,因而拒绝H0 ;反之,如果小概率事件没有出现,就没有理由拒;反之,如果小概率事件没有出现,就没有理由拒绝绝H0 ,应该接受,应该接受H0 。2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验二二变量的显著性检验变量的显著性检验变量的显著性检验方法变量的显著性检验方法 对于对于 ,已经知道服从正态分布,已经知道服从正态分布 如果真实的如果真实的 未知,用其无偏估计量未知,用其无偏估计量 替代时,可构造以下替代时,可构造以下统计量:统计量: 该统计量服从自由度为该统计量服从自由度为n-2的的t分布。分布。12112()iNx,222 =2ien1111122itSx2.4 一元线性回归模型的统计检验一元线性回归模型的统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论