一元线性回归模型_第1页
一元线性回归模型_第2页
一元线性回归模型_第3页
一元线性回归模型_第4页
一元线性回归模型_第5页
已阅读5页,还剩200页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第二章一元线性回归模型2第一节模型的建立及其假定条件第二节一元线性回归模型的参数估计第三节最小二乘估计量的统计性质第四节用样本可决系数检验回归方程的拟合优度第五节回归系数估计值的显著性检验与置信区间第六节一元回归方程的预测第七节小结第八节案例分析3第一节模型的建立及其假定条件一、回归分析的概念二、一元线性回归模型三、随机误差项的假设条件4一、回归分析的概念1.变量间的关系:

确定性关系或函数关系:研究的是确定现象,非随机变量间的关系。例如:企业销售收入Yi=产品价格P*销售量Xi5统计依赖或相关关系:研究的是非确定现象,随机变量间的关系。

例如:企业产出Yi与企业的资金投入Xi的关系。一般讲,投入越多产出越高,但是生产过程中各种条件的变化,使得不同时间内,同样的资金投入,会有不同的产出,造成了资金投入与产出之间关系的不确定性,因此,我们不能用函数这种精确的表达方式描述它们之间的关系。需要加入ui来表示其他影响因素,从而将这两个变量之间非确定的依赖关系描述成:Yi=f(Xi)+ui。6对变量间统计依赖关系的考察主要是通过相关分析(correlationanalysis)或回归分析(regressionanalysis)来完成的。相关分析与回归分析之间的区别与联系:7特别说明:①不线性相关并不意味着不相关。②有相关关系并不意味着一定有因果关系。③回归分析/相关分析研究一个变量对另一个(些)变量的统计依赖关系,但它们并不意味着一定有因果关系。④相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。回归分析对变量的处理方法存在不对称性,即区分被解释变量和解释变量:前者是随机变量,后者是确定性变量。82.回归分析的基本概念

回归分析是处理变量与变量之间关系的一种数学方法。其目的在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。

前者被称为被解释变量(ExplainedVariable)或应变量(DependentVariable)。

后者被称为解释变量(ExplanatoryVariable)或自变量(IndependentVariable)9回归分析构成计量经济学的方法论基础。其主要内容包括:(1)根据样本观察值对经济计量模型参数进行估计,求得回归方程;(2)对回归方程、参数估计值进行显著性检验;(3)利用回归方程进行分析、评价及预测。10二、一元线性回归模型1.一元线性回归模型例:商品需求函数。鲜蛋需求量与消费者年人均可支配收入之间的非确定依赖关系:Yi=β0+β1Xi+ui。Yi--某市城镇居民年人均鲜蛋需求量,被解释变量(应变量);Xi--某市城镇居民年人均可支配收入,解释变量(自变量);ui--随机误差项(随机扰动项、随机项、误差项);

β0、β1--回归系数(待定系数或待定参数)。11在上述数学模型当中,当Xi发生变化时,按照一定规律影响另一变量Yi,而Yi的变化并不影响Xi。即Xi的变化是Yi变化的原因,Xi与Yi之间具有因果关系。上面的数学模型就称为回归模型,因为只有一个解释变量,变量之间的关系又是线性的,故称为一元线性回归模型。122.随机误差项随机误差项主要包括下列因素:①回归模型中省略的变量;②人们的随机行为;③建立的数学模型的形式不够完善;④经济变量之间的合并误差;⑤测量误差。13为了把上述产生的误差考虑在内,在计量经济模型中引进了随机变量ui,认为它对假定存在于X和Y之间的精确线性关系进行扰动,这样一元线性回归模型就被分解成两部分:

Yi=(β0+β1Xi)+ui

一部分由直线β0+β1Xi组成,另一部分是随机误差项ui。143.总体回归函数回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。15对于一元线性回归模型Yi=β0+β1Xi+ui,进一步地,Yi=(β0+β1Xi)+ui,假设我们已经获得X、Y的n个样本观测值(Xi,

Yi),则Yi=(β0+β1Xi)+ui可由下图解释:16直线Yi’=β0+β1Xi表示X与Y之间的线性部分,称为总体回归直线。样本与回归直线的偏离ui表示对这种线性关系的随机扰动,即ui=Yi-Yi’

(i=1,2,……,n)。我们的目的就是在存在扰动的情况下,估计回归系数β0和β1,确定解释变量对被解释变量的影响。因此,一元线性回归模型的问题在几何上等于寻求一条拟合散布点(X1,Y1),(X2,Y2),……(Xn,Yn)的直线,用这条直线来拟合变量X与Y之间的关系。17三、随机误差项的假定条件随机误差项包括如下几个方面的假定:1.零均值:E(ui)=0,i=1,2,……n2.同方差:Var(ui)=u2

,i=1,2,……n3.无序列相关:Cov(ui,uj)=0,i≠j、i,j=1,2,…,n4.与解释变量X不相关:Cov(Xi,ui)=0,i=1,2,…,n5.服从正态分布:ui~N(0,u2

)18第二节一元线性回归模型的参数估计一、普通最小二乘法二、几个常用的结果三、截距为零的一元线性回归模型的参数估计四、一元线性回归模型范例19一、普通最小二乘法(1)总体回归模型、方程与总体回归线给定一元线性回归模型

Yi=β0+β1Xi+ui

随机项满足前述的5条假设,则,

Yi=β0+β1Xi+ui称为X,Y之间的总体回归模型。对总体回归模型两边取期望得:

E(Yi)=β0+β1Xi20对于E(Yi)=β0+β1Xi,表明在Xi已知的情况下,由于随机误差项ui的影响,被解释变量Yi的观测值出现一些变异,一般与Xi不在一条直线上。如果考虑Yi所有可能的值,其平均值E(Yi)与Xi在一条直线上。E(Yi)=β0+β1Xi为总体回归方程,也叫做总体回归线。21(2)样本回归模型、方程与样本回归线给出样本观测值(Yi,Xi),i=1,2,……n,n称为样本容量。

则可建立所谓的样本回归模型:分别为估计值或估计量。称为样本回归方程,或样本回归线。叫做样本观测值

的估计值或拟合值。

22(3)残差(residual)样本回归模型:称为残差项,也叫做拟合误差,是随机误差项的估计值,。

样本观测值与估计值的残差为:

残差代表了其他影响Yi的随机因素的集合。

残差是计量模型检验和修正的重要元素,在Eviews有残差专用的序列“residual”。23Yi、E(Yi)、及ui

、ei之间的关系如下图:24回归分析的主要目的:根据样本回归模型,估计总体回归模型。即,跟据估计这就要求,设计一种方法,构造样本回归模型,使得样本回归模型尽可能地接近总体回归模型,或者说,使得尽可能接近。25(3)普通最小二乘法(OrdinaryLeastSquares)为了研究总体回归模型中变量X与Y之间的关系,需要求一条拟合直线,使得这条拟合出来的直线与总体回归模型“尽可能接近”,这就要求这条拟合直线应该使残差平方和达到最小,即,拟合出来的直线与总体回归模型之间的偏差要求最小。

问1:为什么是以残差的平方和最小而不是残差和最小为判定标准?

26答:因为残差有正有负,因此,残差和中的正残差值与负残差值会相互抵消,这样,残差和是不能够反映拟合曲线与总体回归模型的真实偏差程度,所以,不能够选择残差和最小为拟合标准。问2:为什么选择残差平方和而不是残差绝对值和

?答:在数学处理上,平方要比绝对值更容易。27拟合一条直线使得残差平方和达到最小,确定X与Y之间线性关系的方法,就是著名的“普通最小二乘法”(OrdinaryLeastSquares),也叫做最小二乘法,最小平方法,简记为OLS。28(4)线性回归模型的基本假设为保证参数估计量具有良好的性质,我们通常对线性回归模型提出如下几点假设:

假设1:解释变量X是确定性变量,不是随机变量;假设2:随机误差项的5条基本假设。1.零均值:E(ui)=0,i=1,2,……n2.同方差:Var(ui)=u2

,i=1,2,……n3.无序列相关:Cov(ui,uj)=0,i≠j、i,j=1,2,…,n4.与解释变量X不相关:Cov(Xi,ui)=0,i=1,2,…,n5.服从正态分布:ui~N(0,u2

)29以上假设也称为线性回归模型的经典假设或高斯(Gauss)假设,满足该假设的线性回归模型,也称为经典线性回归模型(ClassicalLinearRegressionModel,CLRM)。

另外,在进行模型回归时,还有两个暗含的假设:

假设3.随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。即假设4.回归模型是正确设定的30假设3旨在排除时间序列数据出现持续上升或下降的变量作为解释变量,因为这类数据不仅使大样本统计推断变得无效,而且往往产生所谓的伪回归问题(spuriousregressionproblem)。假设4也被称为模型没有设定偏误(specificationerror)31(5)OLS参数估计下面用最小二乘法求总体回归系数的估计值。OLS要求残差平方和最小,即令:最小。

32(为方便,以下均将记为)跟据微积分学多元函数极值原理,要使达到最小,将残差平方和对求偏导,并使一阶偏导数都等于0。即:

333435称为正规方程组,简称为正规方程。解上面的正规方程组,得到:将上述结果带入正规方程组中的第一个方程,得到:将样本观测值Yi,Xi处理后带入上面的公式,就可以得到参数普通最小二乘估计量。36(6)OLS参数估计量的离差形式:离差:令,,其中,分别叫做对应的样本值与其平均值的离差。

特别注意区分“差”的概念:残差、离差。37估计量的离差形式(回归模型截距不为零时)

分子分母同时除以n

分子分母同时加减一项383940另外一种推导残差形式的方法(两边进行推进)(1)41(2)42分子分母同时除以n故(3)43这样的话,

上述参数估计量可以写成离差形式:

优点在于方便、好记。44二、几个常用结果(1)残差的均值等于0。(2)残差与解释变量

不相关。(3)样本回归直线经过点,原点移动,消除截距。45(4)被解释变量的样本平均值等于其估计值的平均值46常用结果的相关证明相关系数与协方差(1)总体相关系数:(2)样本相关系数:47这样常用结论(3)应该写成残差ei与解释变量Xi的相关系数为0,即:等价于分子4849因此,只需证明即可。由正规方程组中的第2个方程可知:50这样就证明了常用结果(3),残差与解释变量不相关。51三、截距为零的一元线性回归模型的参数估计请同学们使用OLS的思想自行推导。52补充:参数估计的最大似然法(ML)一、最大似然法及其原理(1)最大似然法

最大或然法(MaximumLikelihood,简称ML),也称最大似然法,是不同于最小二乘法的另一种参数估计方法,是从最大或然原理出发发展起来的其他估计方法的基础。53补充:参数估计的最大似然法(ML)(2)基本原理对于最大似然法而言,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量,应该使得从模型中抽取该n组样本观测值的概率最大。这与普通最小二乘法的基本原理和思想是不同的。普通最小二乘法要求,从n组样本观测值拟合出来的样本回归线与总体回归线之间尽可能接近,或者说差异最小。简单地说:

最大似然法是从抽样的概率最大的思想出发。

普通最小二乘法是从差异最小的思想出发。54补充:参数估计的最大似然法(ML)二、最大似然参数估计(1)似然函数样本观测值联合概率函数称为变量的似然函数。在已知取得样本观测值的情况下,使似然函数取极大值的总体分布函数所代表的总体,具有最大的概率取得这些样本观测值,该总体参数即是所要求的参数。通过似然函数极大化以求得总体参数估计量的方法就称为极大似然法。55补充:参数估计的最大似然法(ML)(2)一元线性回归模型的似然函数在满足基本假设条件下,对一元线性回归模型随机抽取n组样本观测值(Xi,Yi),i=1,2,……n,假设模型的参数估计量已经求得,为,由于假设随机误差项服从0均值同方差的正态分布,,那么Yi服从如下的正态分布:56补充:参数估计的最大似然法(ML)于是,Yi的概率函数为:因为Yi相互独立,所以Y的所有样本值的联合概率,也就是似然函数为:57补充:参数估计的最大似然法(ML)将该似然函数极大化,即可求得模型参数的极大似然估计量。58补充:参数估计的最大似然法(ML)(3)ML参数估计

由于似然函数的极大化与似然函数的对数的极大化是等价的,所以,取对数似然函数为:对这个对数似然函数取极大值,等价于对求极小值。(我们可以注意到,从这里开始,数学的计算与普通最小二乘法是完全一样的。)

59补充:参数估计的最大似然法(ML)

求一阶偏导数,并令一阶偏导数为0:解得模型的参数估计量为:

60补充:参数估计的最大似然法(ML)可见,在满足一系列基本假设的情况下,模型参数的最大似然估计量与普通最小二乘估计量是相同的。虽然两种方法估计参数所得到的结果是相同的,但是两种方法的思想并不相同。相比较而言,最小二乘法应用更普遍。但是,最大似然法的思想是很重要的,计量经济学理论的发展,更多地是以最大似然原理为基础的,对于一些特殊的计量经济学模型,只有最大似然方法才是成功的估计方法。61第三节最小二乘估计量的统计性质当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。一个用于考察总体的估计量,可从如下几个方面考察其优劣性:(1)线性性:即它是否是另一随机变量的线性函数(2)无偏性:即它的均值或期望值是否等于总体的真实值(3)最小方差性(有效性):即它是否在所有线性无偏估计量中具有最小方差。62第三节最小二乘估计量的统计性质这三个准则也称作估计量的小样本性质。拥有这类性质的估计量称为最佳线性无偏估计量(bestlinerunbiasedestimator,BLUE)。为了对参数估计量进行显著性检验,我们也需要讨论两个回归系数估计量的统计性质。下面我们就分别讨论参数估计量的线性性、无偏性和最小方差性。为了简便,仍然将简写成。631.线性性线性性是指均是(i=1,2,……n)的线性函数,可以表示为的线性组合。亦即,存在不全为0的Wi和Ki,(i=1,2,……n)使得641.线性性1.利用参数估计量的离差形式证明的线性性参数估计量的离差形式为:651.线性性由于那么661.线性性671.线性性这样,我们就找到了与之间的线性关系,即:由于xi为Xi的样本值与其平均值的离差,所以xi,(i=1,2,…,n),不全为零,亦即Ki(i=1,2,…,n)不全为0则有:

681.线性性存在不全为零的,使得即是Yi的线性函数,由此证明了的线性性。691.线性性2.利用参数估计量关系证明的线性性

701.线性性即是Yi的线性函数,由此证明了的线性性。711.线性性通过上面的证明,在经典线性回归的假定下,最小二乘估计量具有线性性。722.无偏性无偏性是指估计量的数学期望值分别等于总体回归系数,即:1.证明:由线性性得:732.无偏性因为742.无偏性752.无偏性由则返回762.无偏性2.证明772.无偏性782.无偏性所以则792.无偏性通过上面的证明,在经典线性回归的假定下,最小二乘估计量具有无偏性。80第三节最小二乘估计量的统计性质

——3.最小方差性(有效性)最小方差性指的是,在所有线性无偏估计量中,最小二乘估计量的方差最小。假如是用其他计量经济方法得到的任意一组线性无偏估计量,下面就需要证明最小二乘估计量满足813.最小方差性(有效性)(1)的方差(2)的方差823.最小方差性(有效性)(3)最小方差性证明:由于

是其他方法得到的一元线性回归模型的线性无偏估计量,令,其中

为一组不全为零的常数。

令,这里,di为不全为零的常数。

833.最小方差性(有效性)

首先,讨论的最小方差性。

第一步:利用无偏性得到需要的结论。843.最小方差性(有效性)这里是一组不为0的常数,因此,我们在模型的假设当中已经说过这里Xi,i=1,2,…,n

是确定性变量,因此,我们在抽取n组样本后,Xi,i=1,2,…,n就是一组确定性的常数。因此,为常数,为常数。为常数,为常数。853.最小方差性(有效性)由此,利用数学期望的计算法则:因为是线性无偏估计量,因此有。所以863.最小方差性(有效性)前面令,则在证明无偏性时,我们已经得到因此,873.最小方差性(有效性)第二步证明方差最小由所以,由是一组常数,

883.最小方差性(有效性)我们讨论893.最小方差性(有效性)由PPT16页的结论:903.最小方差性(有效性)因此:所以,因为di是不全为零的常数,所以di2不全为0,则913.最小方差性(有效性)其次,讨论的最小方差性。

与的最小方差性证明方法类似。

首先令其他方法得到的线性无偏估计量,为一组不全为0的常数。

这里,,di为不全为0的常数。923.最小方差性(有效性)第一步:利用无偏性得到需要的结论。933.最小方差性(有效性)因为是线性无偏估计量,因此有。所以。前面令,则在证明无偏性时,我们已经得到因此,

943.最小方差性(有效性)第二步证明方差最小由所以,由是一组常数,

953.最小方差性(有效性)我们讨论前面已经证明过,在证明的最小方差性的时候,我们还得到因此:963.最小方差性(有效性)因此:所以,因为di是不全为零的常数,所以di2不全为0,则973.最小方差性(有效性)通过证明,我们得到:即最小二乘估计量的方差最小,亦即最小二乘估计量具有有效性。98BLUE:最小二乘法估计量,具有线性性、无偏性、最小方差性(有效性),因此被称为最佳线性无偏估计量(TheBestLinearUnbiasedEstimator),简称BLUE性质。99第四节用样本可决系数检验回归方程的拟合优度拟合优度检验:是对样本回归直线与样本观测值之间拟合程度的检验。直白地说,样本观测值距回归直线越近,拟合优度越好,X对Y的解释程度越强。问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?100第四节用样本可决系数检验回归方程的拟合优度

答:问题在于,在一个特定的条件下,做得最好的并不一定是高质量的。普通最小二乘法所保证的最好拟合,是同一个问题的内部比较。都是残差平方和最小的拟合,但是不同问题下,得到的直线对样本观测值的拟合程度是不一样的。拟合优度检验结果所表示的优劣是不同问题之间的比较。

101第四节用样本可决系数检验回归方程的拟合优度

1.总离差平方和的分解:

:第i个样本观测值;:为Yi的估计值;

:为Y的样本平均值;:Yi的离差,。102第四节用样本可决系数检验回归方程的拟合优度由上面的各变量的关系图,我们知道,离差可以分为两部分:(1)与的差:

它是由样本回归线解释了的部分。(2)与的差,即残差:

它是不能由样本回归线解释的部分。

残差项是随机误差项ui的估计值,是由影响Y的X之外的随机因素产生的。103第四节用样本可决系数检验回归方程的拟合优度显然:由样本回归线解释的部分越大,残差ei的绝对值就越小,样本回归线与样本值的拟合优度就越好。即:(离差)(未被解释的部分)(被解释的部分)104第四节用样本可决系数检验回归方程的拟合优度为了克服离差的正负,又方便数学上的处理,用“离差平方和”来考虑总离差。其中105第四节用样本可决系数检验回归方程的拟合优度利用前面的几个常用结果1和2(本章第2节):因此这样的话也可写成106第四节用样本可决系数检验回归方程的拟合优度这样,我们就将总离差平方和

被分解为两部分。第一部分:回归平方和它是由样本回归线解释了的总离差平方和。

第二部分:残差平方和它是未被样本回归线解释的总离差平方和。107第四节用样本可决系数检验回归方程的拟合优度记那么可以记为即:总离差平方和=回归平方和+残差平方和108第四节用样本可决系数检验回归方程的拟合优度2.样本可决系数由可知,回归平方和RSS,也就是可以被样本回归线解释的那部分,所占比重越大,就说明样本回归线对样本值的拟合优度越好。为了测量回归平方和所占的比重,则做如下处理:

那么就是样本回归线对总离差平方和解释的比例。109第四节用样本可决系数检验回归方程的拟合优度记称r2为样本可决系数,也叫做决定系数、判定系数。极端情形:r2=0,变量X与Y没有线性关系,样本回归线没有解释总离差平方和。r2=1,X与Y在一条直线上,样本回归线与样本观测值重合这两种极端情形极少发生,若发生,模型可能存在其它问题,如违背某些计量经济学假设等。110第四节用样本可决系数检验回归方程的拟合优度一般讲,0<r2<1,可决系数r2越接近于1,样本回归线对样本值的拟合优度越好,X对Y的解释能力越强。

例2.1说明在鲜蛋需求量的总离差平方和中,有67%被样本回归线解释,还有33%未被解释。111第四节用样本可决系数检验回归方程的拟合优度r2的其他形式:由常用结论(3)112第四节用样本可决系数检验回归方程的拟合优度3.样本相关系数(1)样本相关系数样本相关系数是变量X与Y之间线性相关程度的度量指标。用离差形式表示:113第四节用样本可决系数检验回归方程的拟合优度由参数估计量的离差形式:可知相关系数r的符号与相同。114第四节用样本可决系数检验回归方程的拟合优度由上面推导,相关系数r的数值等于样本可决系数的平方根,符号与相同。但是样本相关系数与样本可决系数有明显的区别,相关系数r是建立在相关分析的理论基础之上,研究两个变量X与Y之间的线性相关关系;样本可决系数r2建立在回归分析的理论基础之上,研究非随机变量X对随机变量Y的解释程度。115第四节用样本可决系数检验回归方程的拟合优度(2)样本相关系数的检验(补充,与=0的检验等价)样本相关系数r是由X、Y的一组样本计算得到的,总体X与Y之间是否有显著线性相关关系,还要通过样本相关系数进行检验。

116第四节用样本可决系数检验回归方程的拟合优度补充:假设检验1.基本思想(1)先对总体的分布函数的某些参数或分布函数的形式作某种假设,然后利用样本的有关信息对所作的假设的正确性进行推断,这类统计问题叫做假设检验。(2)假设检验的原理是小概率事件在一次试验中实际不会发生的小概率事件原理。(3)假设检验的思路是反证法,即首先提出假设,然后根据一次抽样所得到的样本值进行计算,若导致小概率事件发生,则否定原假设,否则接受原假设。117第四节用样本可决系数检验回归方程的拟合优度2.假设检验的基本步骤(1)根据问题的要求建立原假设H0;(2)构造检验统计量,并确定其在H0下的分布;(3)对给定的检验水平α,查表确定临界值,得到拒绝域;(4)由给定的样本值,计算检验统计量的值;(5)作出判断,是否接受原假设H0。118第四节用样本可决系数检验回归方程的拟合优度3.假设检验的两类错误第Ⅰ类错误:以真为假,犯这类错误的概率记为α第Ⅱ类错误:以假为真,犯这类错误的概率记为β一般情况下,我们总是控制犯第Ⅰ类错误错误的概率,使它不大于α(α常取1%、5%、10%等),这种只控制犯第Ⅰ类错误的概率而不考虑犯第Ⅱ类错误的概率的检验,称为显著性检验。119第四节用样本可决系数检验回归方程的拟合优度样本相关系数的假设检验:原假设H0:ρ=0(ρ是X与Y之间的总体相关系数)备择假设H1:ρ≠0构造t统计量:给出显著性水平,查自由度为v=n-2的t分布表,得到临界值。

120第四节用样本可决系数检验回归方程的拟合优度当时,认为小概率事件在一次试验中没有发生,接受H0:ρ=0,总体相关系数等于零,X与Y之间没有显著的线性相关关系。当时,认为小概率事件在一次试验中发生,拒绝H0,接受H1:ρ≠0,X与Y之间具有显著的线性相关关系。121第四节用样本可决系数检验回归方程的拟合优度例2.1:设显著水平;自由度v=n-2=11-2=9;查表,得临界值;计算t统计量拒绝H0,接受H1:ρ≠0,说明X与Y之间具有显著的线性相关关系。122第五节回归系数估计值的显著性检验与置信区间由于是总体回归系数的样本估计值,必须检验它们的统计可靠性。首先,考虑的概率分布。ui正态分布(假设)Yi正态分布123第五节回归系数估计值的显著性检验与置信区间1.随机变量u的方差在参数估计量的方差中含有随机变量ui的方差。由于u是一个无法测量的量,因而也不可能计算出ui的方差。用u的估计值e的方差,作为其方差估计值:124第五节回归系数估计值的显著性检验与置信区间

无偏性证明:即证明证明:(1)首先写出模型的离差形式。

给定一组样本(Xi,Yi),i=1,2,…n;加和:

平均:

125第五节回归系数估计值的显著性检验与置信区间与相减其中xi,yi为离差得到的离差形式为:126第五节回归系数估计值的显著性检验与置信区间(2)跟据样本回归函数的离差形式(书P13/式2.24):利用总离差的分解公式,可知:利用无偏性证明中的结论:带入127第五节回归系数估计值的显著性检验与置信区间利用128第五节回归系数估计值的显著性检验与置信区间计算各部分的数学期望:(1)129第五节回归系数估计值的显著性检验与置信区间130第五节回归系数估计值的显著性检验与置信区间由于由正态分布的性质131第五节回归系数估计值的显著性检验与置信区间对于132第五节回归系数估计值的显著性检验与置信区间由基本假设,u无序列相关知:133第五节回归系数估计值的显著性检验与置信区间所以:无偏性得证。134第五节回归系数估计值的显著性检验与置信区间如此可知,的标准差估计值为:135第五节回归系数估计值的显著性检验与置信区间2.回归系数估计值的显著性检验—t检验回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。在一元线性模型中,就是要判断X是否对Y具有显著的线性性影响。这就需要进行变量的显著性检验。变量的显著性检验所应用的方法是数理统计学中的假设检验。

计量经济学中,主要是针对变量的参数真值是否为零来进行显著性检验的。136第五节回归系数估计值的显著性检验与置信区间

●对于一元线性回归方程中的一直知道它服从正态分布:由于真实的未知,在使用它的无偏估计量替代时,可构造如下统计量。(自由度为n-2,无常数项时,自由度为v=n-1。)137第五节回归系数估计值的显著性检验与置信区间检验步骤:(1)对总体参数提出假设(双侧检验)

原假设备择假设(2)以原假设H0构造t统计量,并由样本计算其值(3)给定显著性水平,查自由度v=n-2的t分布表,得临界值t/2(n-2)。138第五节回归系数估计值的显著性检验与置信区间(4)比较,判断若|t|

t/2(n-2),接受H0:1=0

,表明X对Y无显著影响,一元线性回归模型无意义;若|t|>

t/2(n-2),则拒绝H0

,接受H1:1

0

,表明X对Y具有显著影响。在计量经济学中,常用的显著性水平为或

的显著性检验与相同。139第五节回归系数估计值的显著性检验与置信区间例2.1:(1)显著性水平:给定;(2)自由度:v=n-2=9;(3)查表得临界值:t0.025(9)=2.26;(4)计算标准差估计量和t检验统计量140第五节回归系数估计值的显著性检验与置信区间(5)|t0|>t0.025(9),|t1|>t0.025(9)即0、1均显著不为零。说明,回归方程中应含有常数项,解释变量X对Y有显著影响。经验性结论:一般t检验绝对值大于2很多的话,可以初步判断“显著”。

141第五节回归系数估计值的显著性检验与置信区间3.回归系数0、1置信区间回归分析希望通过样本所估计出来的参数来代替总体的参数。假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。

为了确定接近总体的程度,我们构造一个以为中心的区间,总体参数在一定的置信度下落在这个区间以内。142第五节回归系数估计值的显著性检验与置信区间

计量经济学中选择的置信度(置信水平)一般为95%,置信区间越小,说明估计值越接近总体参数根据分布构造置信区间在变量的显著性检验中已经知道:

给定置信度(1-),从分布表中查得自由度为(n-2)的临界值,那么t值处在(-t/2,t/2)的概率是(1-

)。即:143第五节回归系数估计值的显著性检验与置信区间即:于是得到:(1-)的置信度下,0、

1的置信区间为:144第五节回归系数估计值的显著性检验与置信区间从置信区间的形式可以看出,置信区间的大小取决于回归系数估计值的标准差,标准差越小,置信区间越小,估计结果越可靠。要缩小置信区间,需要(1)增大样本容量n。因为在同样的置信水平下,n越大,t分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小。

(2)提高模型的拟合优度。因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和应越小。145第五节回归系数估计值的显著性检验与置信区间例2.1的95%置信区间

146第六节一元线性回归方程的预测当我们用一组样本观测值及普通最小二乘法得到总体回归模型的样本回归模型之后,如果经过直观判断(符号)和统计检验,表明样本回归模型拟合优度好,均显著,就可以用样本回归方程进行预测。点预测:将X的一个特定值X0代入样本回归方程,计算出,就是Y0的点预测。区间预测:求出以后,在一定置信度下,求Y0落在以为中心的一个区间,来分析预测结果的可靠性。147第六节一元线性回归方程的预测1.点预测:求出的是单个预测值

讨论点预测的无偏性,分析由点预测得到的预测值是否能代表实际值。

X0是一个给定的常数,提出。即是Y0的无偏估计量。148第六节一元线性回归方程的预测例2.1:1988~1998X2000=1863X2001=1983149第六节一元线性回归方程的预测内插预测:“回溯历史”。X0在样本范围内,即X0是X1,X2,…Xn样本点之一,用以检验模型的“预测能力”。外推预测:“预测未来”。X0在样本范围以外。150第六节一元线性回归方程的预测2.区间预测假设,是用的一个点预测值,它有两种不同的概念:(1)总体真值Y0的预测值。(2)总体回归线E(Y0|X0)的预测值。实际上E(Y0|X0),就是Xi=X0时,真值的条件数学期望

回忆一下,总体回归线:下面我们就分别讨论,以为中心,在一定的概率下Y0和E(Y0/X0)将落在一个什么样的置信区间内。151第六节一元线性回归方程的预测一般要讨论随机变量的置信区间,首先就要明确随机变量的分布与数字特征,因此,我们首先就要讨论所要研究的随机变量的分布与数字特征。一个关于正态分布的定理,用于下面的推导与证明:如果Z1,Z2,…,Zn都为正态分布,则其线性组合也服从均值为和方差

的正态分布,其中是不全为零的常数。当Z1,Z2,…,Zn相互独立时,因为独立一定不相关,因此

。152第六节一元线性回归方程的预测(1)总体条件均值的预测区间由于:且由上页的定理可知仍服从正态分布,且有153第六节一元线性回归方程的预测我们讨论154第六节一元线性回归方程的预测那么155第六节一元线性回归方程的预测156第六节一元线性回归方程的预测故:157第六节一元线性回归方程的预测将未知的用其无偏估计量来代替,其中构造t统计量:

于是,在1-α的置信度下,总体均值E(Y0)的置信区间为:158第六节一元线性回归方程的预测(2)单个值的预测区间159第六节一元线性回归方程的预测将未知的用其无偏估计量来代替,其中构造t统计量:

于是,在1-α的置信度下,单个值Y0的置信区间为:160第七节小结1.回归模型的分类汇总(4种):(1)总体回归模型的随机形式:总体回归模型。(2)总体回归模型的确定形式:总体回归方程、总体回归线。(3)样本回归模型的随机形式:样本回归模型。(4)样本回归模型的确定形式:

样本回归方程、样本回归线。161第七节小结2.普通最小二乘法的思想与推导方法:构造样本回归模型,使得样本回归模型尽可能地接近总体回归模型。第一步:令残差平方和最小

第二步:求对参数估计量一阶(偏)导数,并令偏导数为零;第三步:解二元一次方程或方程组;第四步:得OLS估计量

162第七节小结回归模型截距不为零时,OLS参数估计量:

其中(Xi,Yi)为样本观测值,i=1,2,……,n。回归模型截距为零时,OLS参数估计量:其中(Xi,Yi)为样本观测值,i-1,2,……,n。

163第七节小结3.普通最小二乘法估计量的离差形式:离差:164第七节小结4.最大似然参数估计(1)思路:使得模型抽取样本的概率最大。(2)步骤:第一步找Yi的分布,得到其概率函数;第二步计算Yi的联合概率密度,得到似然函数;第三步通过似然函数极大化,求得参数估计量。(3)在满足一系列基本假设的情况下,一元线性回归模型参数的最大似然估计量与普通最小二乘估计量是相同的。

165第七节小结5.最小二乘估计量的线性性:(1)其中:(2)其中:(3)在后面的证明和推导过程中要经常用到Ki和Wi。166第七节小结6.最小二乘估计量的无偏性:几个用到的推导结论:(1)(2)(3)(4)(5)167第七节小结7.最小二乘估计量的最小方差性即有效性

以线性性、无偏性为基础,得到想要的各种条件,证明:168第七节小结8.总离差的分解与可决系数即:总离差平方和=回归平方和+残差平方和一般讲,0<r2<1,可决系数r2越接近于1,样本回归线对样本值的拟合优度越好,X对Y的解释能力越强。样本可决系数:相关系数r的数值等于样本可决系数的平方根,符号与相同。169第七节小结9.回归系数估计值的显著性检验与置信区间(1)显著性检验—t检验:知道分布,数字特征,构造t统计量,比较临界值,得结论;(2)置信区间:知分布,数字特征,构造置信区间170第七节小结10.模型预测:(1)点预测:内插预测:“回溯历史”。外推预测:“预测未来”。(2)区间预测:知分布,数字特征,构造置信区间

总体条件均值的预测区间单个值的预测区间171第七节小结172第七节小结重要公式:书P37—P38。复习过程中已经提及,不再赘述。173第八节案例分析数据准备:Y:年人均消费性支出。X:年人均可支配收入。Excel格式的原始数据:存储路径英文文件名英文工作表名英文变量名英文文件名英文当前工作表名英文变量名英文174第八节案例分析Eviews工作文件的建立:间隔规律的时序数据年度数据80-00其中的1999,2000两年是准备进行预测的年份175第八节案例分析残差序列与参数估计量序列是Eviews系统默认项,用户“对象”不能与它们重名,也不能对其进行操作。残差序列参数估计值176第八节案例分析数据导入:读取Excel文件要求导入的Excel文件关闭或者设置为只读177第八节案例分析变量的名称就是Excel每列数据第一行的英文变量名从B2起,右边的变量。Excel数据表的“左上角”为B2格子要导入的变量名为Y,X若变量较多,则可填入要导入的变量个数178第八节案例分析Excel中的X,Y已经出现在工作文件中了分别双击X或Y就可以打开变量序列,也叫“对象”可以点击Edit进入编辑状态,对数据进行修改179第八节案例分析将需要一起研究的变量以“组”的形式打开。按住Ctrl后按左键选择变量。打开“组”的变量顺序是变量的选择顺序可以给这个Group命名180第八节案例分析经过上面的数据准备工作,下面我们就要进行规范的计量经济学分析。第一步,建立数学模型由经济理论知,消费支出受可支配收入的影响,当可支配收入增加时,消费性支出也随着增加,他们之间具有正向的同步变动趋势。181第八节案例分析做散点图,确定变量的大致关系,写出理论模型。在打开的“组”Croup中选择作图的指令,这里只选择了简单散点图来判别变量之间的关系182第八节案例分析Y与X的变化趋势是线性的。因此建立Y与X之间的一元线性回归模型:183第八节案例分析第二步,参数估计样本回归模型:由于样本数据为时间序列数据,通常下表写为t。首先选择回归年限,因为1999、2000为外推预测的年限,样本观测值为1980—1998,因此要重新划定数据范围.填入要分析的数据时间范围:1980-1998184第八节案例分析使用命令行来划定时间范围有时点击按钮来进行操作很不方便,特别是有时需要重复进行的操作,后面逐渐介绍一些常用的命令,方便使用。命令输入区域smpl指令回车执行185第八节案例分析将Y与X列为一组(Group):选定Y与X,“OpenasGroup”

并命名Name,命名只要容易分辨就可以了。生成了Group对象186第八节案例分析建立模型,估计参数Y:被解释变量C:常数项X:解释变量最小二乘法样本年限187第八节案例分析另一种建立模型的方法:188第八节案例分析估计结果参数估计值t统计量值可决系数r2显著性检验的伴随概率:当Prob值小于给定的显著性水平时,拒绝零假设残差平方和参数估计量的标准差189第八节案例分析模型命名,保存模型为一个Eviews“对象”。下次双击就可打开模型,进行分析190第八节案例分析第三步,模型评价(1)结构分析:边际消费倾向。:自发消费。参数的大小、符号合理,均符合经济理论。191第八节案例分析(2)统计检验拟合优度检验:r2=0.98,说明总离差平方和的98%被样本回归直线解释,样本回归直线对样本点的拟合优度是很高的。变量的显著性检验:α=0.05,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论