浙大宁波理工学院计量经济学第二章一元线性回归分析_第1页
浙大宁波理工学院计量经济学第二章一元线性回归分析_第2页
浙大宁波理工学院计量经济学第二章一元线性回归分析_第3页
浙大宁波理工学院计量经济学第二章一元线性回归分析_第4页
浙大宁波理工学院计量经济学第二章一元线性回归分析_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学习内容和要求本章介绍一元线性回归的一般方法,包括模型建立、参数估计、假设检验等。要求通过本章学习,掌握一元回归模型的基本性质,一元回归模型的运用方法。第二章一元线性回归分析第二章一元线性回归分析2.1一元线性回归模型2.2总体回归参数的最小二乘估计2.3参数最小二乘估计的统计性质2.4参数估计量的抽样分布及的估计量2.5回归参数的显著性检验和区间估计2.6回归方程的显著性检验和拟合优度2.7无条件预测2.8一元回归分析的EViews应用举例第二章一元线性回归分析

2.1一元线性回归模型第二章一元线性回归分析

2.1一元线性回归模型确定性关系:函数关系不确定性关系:回归分析第二章一元线性回归分析

2.1一元线性回归模型2.1.1变量间的关系及种类1、确定性关系与非确定性关系确定性关系——函数关系,可以用精确的数学表达式表示。非确定性关系——统计关系或相关关系,变量之间具有密切联系但又不能用函数关系精确表达的关系。计量经济学的研究对象是非确定性的关系。第二章一元线性回归分析

2.1一元线性回归模型2、相关变量间的关系相关变量:存在相关关系的变量。相关变量间的关系一般有两种:因果关系:一个变量的变化受另一个或几个变量的影响。平行关系:它们互为因果或共同受到另外因素的影响。第二章一元线性回归分析

2.1一元线性回归模型3、回归分析根据相关关系散点图模拟直线建立函数方程描述具有因果关系变量间的数量联系方法表示原因的变量称为解释变量、独立变量、自变量或回归变量。表示结果的变量称为被解释变量、相依变量、因变量或响应变量。第二章一元线性回归分析

2.1一元线性回归模型4、一元线性回归模型的重要意义(1)现实经济的普遍性。(2)原理和方法的基础性。第二章一元线性回归分析

2.1一元线性回归模型2.1.2一元线性回归模型的定义模型定义:一元线性回归模型——直线回归的数学模型它是变量y关于变量x的一元线性回归模型。模型解释:y称作被解释变量(或相依变量、因变量、响应变量)。x称作解释变量(或独立变量、自变量、回归变量),是影响y变化的重要变量。非随机部分随机部分第二章一元线性回归分析

2.1一元线性回归模型Ut称作随机误差项。包括除了xt以外的影响yt变化的众多微小因素:未在模型中专门列出的影响yt变化的非重要解释变量人的随机行为数学模型形式欠妥归并误差测量误差ut的变化是不可控的。第二章一元线性回归分析

2.1一元线性回归模型β0为常数项(或截距项)。β1为斜率系数影响程度——大小反映了x影响y的程度,表示x改变一个单位,y平均改变的数量。影响方向——正负性则反映了x影响y的性质。β0和β1称作回归系数。第二章一元线性回归分析

2.1一元线性回归模型t表示序数时间序列——当t表示时间序数时,xt和yt成为时间序列数据。非时间序列——当t表示非时间序数时,xt和yt称为截面数据。第二章一元线性回归分析

2.1一元线性回归模型模型形式可分为两部分:非随机部分——由x变化引起y线性变化的部分,即β0+β1xt部分。随机部分——由其他一切随机因素引起y发生改变的部分,即ut部分。第二章一元线性回归分析

2.1一元线性回归模型2.1.3总体回归函数与样本回归函数1、总体回归函数定义:在社会经济总体现象中,用来说明被解释变量的平均状态随解释变量变化的数量关系的函数。表示形式:E(yt)=β0+β1xt,称作(双变量)总体回归函数,或线性总体回归函数。其表明的直线被称为总体回归直线。确定方法:经验第二章一元线性回归分析

2.1一元线性回归模型2、样本回归函数定义:根据样本资料所做的、用以估计总体回归方程的函数。表示方式+函数解释:是样本回归直线上相应的的估计值,可视为总体条件均值E(/)的估计值。是样本回归函数的截距系数是样本回归函数的斜率系数第二章一元线性回归分析

2.1一元线性回归模型2.1.4一元线性回归模型的基本假定一元回归模型确定分析成功估计参数值,取决于随机变量u和解释变量x的性质。待估参数无法确定可观察得到第二章一元线性回归分析

2.1一元线性回归模型模型的基本假定(经典假定或高斯(Gauss)假设)(1)每个(t=1,2,…,n),均为服从正态分布的实随机变量。(2)每个(t=1,2,…,n)的期望值都为0,即E()=0。(3)所有的方差均为同一个常数——等方差假定。即,否则,称具有异方差性。第二章一元线性回归分析

2.1一元线性回归模型(4)非自相关假定。与解释变量x不同观测值相对应的随机项(t=1,2,…,n)之间彼此独立,即Cov(,)=0,t≠j。(5)随机项与解释变量x的任一观测值xj不相关,即Cov(,xj)=0满足该假设的线性回归模型,也称为经典线性回归模型(classicallinearregressionmodel,CLAM)在上述假定成立条件下,有E()=E(β0+β1xt+)=β0+β1xt,即为前述的总体回归函数。第二章一元线性回归分析

2.1一元线性回归模型一元回归模型的特点:(1)对经济过程的不可再现性——回归函数E()=β0+β1xt不能100%的再现所研究的经济过程。(2)对经济问题的高度抽象性——更深刻地揭示经济问题的内在规律。第二章一元线性回归分析

2.1一元线性回归模型例题2-1令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过过教育的年数,生育率对教育年数的简单回归模型为kids=β0+β1educ+u。(1)随机扰动项u包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?第二章一元线性回归分析

2.1一元线性回归模型解:(1)随机扰动项包含了收入、年龄、家庭状况、政府的相关政策等等影响生育率的重要因素。有些影响因素可能与教育水平相关。(2)上述回归模型不能够揭示教育对生育率在其它条件不变下的影响。因为归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,即出现解释变量与随机扰动项相关的情形。第二章一元线性回归分析

2.2回归参数的普通最小二乘估计(OLS)总体回归线与样本回归线的基本关系由于总体状况难以获得,需要根据样本对总体推断。但当采用样本推断总体时,存在着误差。第二章一元线性回归分析

2.2回归参数的普通最小二乘估计(OLS)2.2.1回归参数的估计思想总体回归直线E(yt)=β0+β1xt样本回归直线和分别是β0和β1的估计值,称作yt的拟合值,yt与的差,即称作回归残差,是对随机误差ut的估计。于是,可有第二章一元线性回归分析

2.2回归参数的普通最小二乘估计(OLS)最小二乘估计(ordinaryleastsquares,OLS)准则一组样本观测值(xt,yt)(t=1,2,…,n),要想最好地描述y与x关系的直线,εt要尽可能地小,从而得到最优的拟合直线。最优的拟合直线标准“残差和最小”标准“残差绝对值的和最小”标准“残差平方和最小”标准第二章一元线性回归分析

2.2回归参数的普通最小二乘估计(OLS)2.2.2最小二乘估计(OLS)的原理与计算观察数据散点图:第二章一元线性回归分析

2.2回归参数的普通最小二乘估计(OLS)最小二乘法的原理:设残差平方和用Q表示,所谓最小二乘法,即为和满足:按照该式求出的和,就称为β0和β1的最小二乘估计值。第二章一元线性回归分析

2.2回归参数的普通最小二乘估计(OLS)二元函数求极值,得到方程组:

该方程组常称作正规方程组,整理得:第二章一元线性回归分析

2.2回归参数的普通最小二乘估计(OLS)解之得,即第二章一元线性回归分析

2.2回归参数的普通最小二乘估计(OLS)由此可得样本回归方程:下图的残差和拟合值是哪一部分?第二章一元线性回归分析

2.2回归参数的普通最小二乘估计(OLS)举例假如有某一社区家庭组成的总体,根据抽出的10户家庭的样本资料,据此观察总体的可支配收入—消费支出关系。收入xt消费yt

1800594211006383140011224170011555200014086230015957260019698290020789320025851035002530单位:百元某社区居民收入—消费表第二章一元线性回归分析

2.2回归参数的普通最小二乘估计(OLS)xtyt

1800594-1350-9731314090182250094750864000035283621100638-1050-92997587011025008637841210000407044314001122-750-44533405056250019838119600001258884417001155-450-41218558020250017007428900001334025520001408-150-1592391022500254084000000198246462300159515028414022500762529000025440257260019694504021807202025001612836760000387696182900207875051138295056250026071284100004318084932002585105010181068480110250010355101024000066822251035002530135096312995101822500926599122500006400900求和2150015674————5769300742500045900205365000029157448平均21501567——————————————普通最小二乘法计算表第二章一元线性回归分析

2.2回归参数的普通最小二乘估计(OLS)由此,可计算出:所以,样本回归方程为:第二章一元线性回归分析

2.2回归参数的普通最小二乘估计(OLS)yx5588908011812014513514517580100120140160180200220240260课堂习题:若某一总体的随机样本如下,试根据该样本资料估计总体回归方程。第二章一元线性回归分析

2.3参数最小二乘估计的统计性质考察参数估计量的统计性质,是对据由模型估计的参数估计值的精度,能否代表总体参数的真值所做的说明。考察总体的估计量优劣性的条件:(1)线性性:即它是否是另一随机变量的线性函数该性质的实际意义是,参数估计量与另一随机变量具有相同的分布。第二章一元线性回归分析

2.3参数最小二乘估计的统计性质(2)无偏性:即它的均值或期望值是否等于总体的真实值。该性质的实际意义是,参数估计量是以参数真实值为分布中心的随机变量,反复抽样估计可得真实值。(3)有效性:即它是否在所有线性无偏估计量中具有最小方差。该性质的实际意义是,与其他线性无偏估计量相比,最小二乘估计法得到的估计量有更大的可能性离真值最近。拥有这类性质的估计量称为最佳线性无偏估计量(bestlinerunbiasedestimator,BLUE)第二章一元线性回归分析

2.3参数最小二乘估计的统计性质对用OLS法得到的估计量和的考察1、线性即和均为随机变量y或u的线性函数。2、无偏性指参数估计量和的均值(期望值)分别等于总体参数值和,即E()=,E()=。第二章一元线性回归分析

2.3参数最小二乘估计的统计性质3、最小方差性(有效性或最佳性)与其它的一切线性、无偏估计量比较,OLS估计量和的方差最小。高斯-马尔可夫定理(Gauss-Markovtheorem):若满足E()=0,Var()=,那么用OLS法得到的估计量一定为最佳线性无偏估计量。

第二章一元线性回归分析

2.3参数最小二乘估计的统计性质举例:若研究某公司员工的受教育水平与薪金的关系,设E为某类公司员工的薪金(元),N为所受教育水平(年),建立回归模型E=α+βN+μ,式中随机扰动项μ的分布未知,其他所有假定都满足。要求:(1)从直观及经济角度解释α和β。(2)OLS估计量满足线性、无偏性、及有效性吗?简单陈述理由。第二章一元线性回归分析

2.3参数最小二乘估计的统计性质解:(1)α+βN为接受过N年教育的员工的总体平均薪金。当N为0时,平均薪金为α。α表示没有接受过教育员工的平均起始薪金。β是每单位N变化所引起的E的变化,即表示多接受一年教育所对应的薪金增加值。(2)OLS估计量仍满足线性、无偏性及有效性,因为这些性质的成立勿需随机扰动项μ的正态分布假设(答案有问题吗?)。第二章一元线性回归分析

2.3参数最小二乘估计的统计性质计量单位变化对模型参数估计量的影响举例:在上例中,若被解释变量员工薪金的计量单位由元改为百元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化?第二章一元线性回归分析

2.3参数最小二乘估计的统计性质解:(1)若被解释变量度量单位变化以E*表示以百元为度量单位的薪金,则E*×100=E=α+βN+μ,可得如下新模型:E*=(α/100)+(β/100)N+(μ/100)或其中,,。新的回归系数为原始模型回归系数的1/100。(2)若解释变量度量单位变化设N*为用月份表示的新员工受教育的时间长度,则N*=12N,模型为估计的截距项不变,而斜率项将为原回归系数的1/12。第二章一元线性回归分析

2.3参数最小二乘估计的统计性质思考题:在上例中,如果被解释变量新员工起始薪金的计量单位由百元改为元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由月改为年,估计的截距项与斜率项有无变化?第二章一元线性回归分析

2.4参数估计量的抽样分布及的估计量参数估计量、的抽样分布:、服从正态分布由于和均为yt的线性函数,而每个yt都服从正态分布。

和的期望值分别为,方差分别为:故和的抽样分布为:~N~N第二章一元线性回归分析

2.4参数估计量的抽样分布及的估计量

的估计量:由于是未知的,为了得出和的方差,必须先给出的估计量。设为的估计,则=

其中,n表示样本容量,2表示回归方程中被估计参数(即和)的个数。因为是残差,所以又称做误差均方。可以证明是的无偏估计量,它可用来考察观测值对回归直线的离散程度。第二章一元线性回归分析

2.4参数估计量的抽样分布及的估计量用代替,就得到了和的估计的方差,即第二章一元线性回归分析

2.5回归参数的显著性检验和区间估计回归模型的正确性验证模型的函数形式变量选择参数估计的正确性2.5.1回归参数的t检验t分布:已知和都服从正态分布,且~,~,其中,第二章一元线性回归分析

2.5回归参数的显著性检验和区间估计则统计量和皆服从标准正态分布。若用无偏估计量代替,有无偏估计量,t统计量在小样本(一般n≤30)情况下,用无偏估计量和代替和,可得t统计量:

~t(n-2),~t(n-2)第二章一元线性回归分析

2.5回归参数的显著性检验和区间估计大样本(n>30)情况,则为Z(正态分布)统计量~N(0,1)~N(0,1)第二章一元线性回归分析

2.5回归参数的显著性检验和区间估计t检验:在一元回归模型中,x是否可以解释y的变化,即解释变量对被解释变量是否有显著影响。可通过对β1=0是否成立进行检验。原假设H0:β1=0;备择假设H1:β1≠0在H0成立时,有

=~t(n-2)第二章一元线性回归分析

2.5回归参数的显著性检验和区间估计检验判断对于给定的显著性水平α,查自由度为n-2的t分布表,得临界值。若︱T︱>,则拒绝H0:β1=0,接受备择假设H1:β1≠0,表明回归模型中因变量与自变量之间确实存在线性关系。若︱T︱<,则接受H0:β1=0,解释变量对因变量没有显著影响。第二章一元线性回归分析

2.5回归参数的显著性检验和区间估计显著性水平α的取值α通常取0.01或0.05。当其取0.05时,且n-2≥13时,临界值=大体保持在2附近。若T的绝对值远大于2,则在0.05的显著性水平下,可认为β1显著地异于0。第二章一元线性回归分析

2.5回归参数的显著性检验和区间估计举例:前述某一社区家庭组成的总体的样本资料,据此观察总体的可支配收入-消费支出关系,对回归参数的检验为:

==

=

=13402第二章一元线性回归分析

2.5回归参数的显著性检验和区间估计于是和的标准差的估计值分别是:===98.41===0.0425第二章一元线性回归分析

2.5回归参数的显著性检验和区间估计T统计量的计算结果分别为t1===18.29t0===-1.048给定一个显著性水平α=0.05,当n-2=8时,>,说明解释变量家庭可支配收入在95%的置信度下显著,即通过了变量显著性检验;但<,表明在95%的置信度下,无法拒绝截距项为零的假设。第二章一元线性回归分析

2.5回归参数的显著性检验和区间估计2.5.2回归参数的区间估计置信区间:由t1=,在显著型水平α下,可得,即[]。该范围被称为的置信区间。对参数的区间估计有类似的结果:。置信区间是原假设的接受域,置信区间以外的区域称作拒绝域或临界域,置信区间的端点称作临界点。第二章一元线性回归分析

2.5回归参数的显著性检验和区间估计置信度:1-α称为置信度。置信度和置信区间的理解给定置信系数为95%,从长远看,每100个某种置信区间中,将有95个包含着真实的β1值,不可以说,某个特定的区间有95%的概率包含着真实的β1,因为这个区间已经固定而不再是随机的了,那么,β1要么落入其中,要么落在其外。因此,这个给定的固定区间包含着真实的β1的概率不是1就是0。第二章一元线性回归分析

2.6回归方程的显著性检验和拟合优度检验回归方程是为了验证样本回归方程是否真正反映了变量y与变量x之间的统计规律性。2.6.1相关系数的显著性检验1、相关系数的定义与性质设(xt,yt)(t=1,2,…,n)是(x,y)的n组样本观测值,则为x与y样本相关系数。其中,第二章一元线性回归分析

2.6回归方程的显著性检验和拟合优度相关系数相关性质r=-1完全负相关(线性)r=0不存在线性相关r=1完全正相关(线性)0<|r|<1存在线性相关关系r反映了x与y之间线性相关程度大小。r绝对值的取值范围在0与1之间,即0≤|r|≤1。相关系数的性质:第二章一元线性回归分析

2.6回归方程的显著性检验和拟合优度2、相关系数的显著性检验样本相关系数是随机得到的,是对总体相关系数的估计,因此要进行显著性检验。相关系数显著性检验的步骤:(1)计算样本相关系数r值。(2)给定显著性水平α,查相关系数表的临界值。(3)判定:若|r|>,则x与y有显著的线性关系;若|r|<,则意味着x与y的线性关系在统计上不显著。提醒:这里仅仅判断的是x与y之间有无线性关系,即使两者没有线性关系,不意味着两者之间也没有非线性关系。第二章一元线性回归分析

2.6回归方程的显著性检验和拟合优度相关系数r与回归系数的关系

对于同一样本,检验相关系数r与回归系数是否显著是等价的,都可以用于判断x与y之间有无线性关系。第二章一元线性回归分析

2.6回归方程的显著性检验和拟合优度2.6.2拟合优度检验拟合优度回归直线与样本数据趋势的吻合程度。现实中没有一条样本回归直线可以完全拟合样本数据。对于同一组数据,可以拟合出不同的回归直线。样本决定系数或可决系数拟合优度的高低表明了观测点离回归直线的远近,常采用样本决定系数来衡量。第二章一元线性回归分析

2.6回归方程的显著性检验和拟合优度1、总离差平方和的分解设由样本观测值(xt,yt)得到的样本回归直线为:,因变量的观测值可分解成和之和:=+,即:-=-+对于全部观测值求平方和,有:+2

因为=0,所以有:第二章一元线性回归分析

2.6回归方程的显著性检验和拟合优度上式可表示为:TSS=ESS+RSS总离差平方和TSS=,是因变量的观测值与其均值的离差平方和,成为,反映了因变量波动的大小。回归平方和ESS=,是因变量的估计值与其均值的离差平方和,反映了解释变量的变化所引起的y的波动,是总离差中被y对x的回归解释的那部分。残差平方和RSS==,是因变量的观测值与估计值之差的平方和,反映了y的变化中不能由解释变量x所解释的那部分变差。第二章一元线性回归分析

2.6回归方程的显著性检验和拟合优度2、样本决定系数的计算样本决定系数是ESS与TSS之比,用来反映样本回归直线与全部观测值之间的拟合优度。或=1-=1-在总离差平方和TSS中,回归平方和ESS所占比重越大,线性回归效果越好,即回归直线与样本观测值的拟合优度越高。=第二章一元线性回归分析

2.6回归方程的显著性检验和拟合优度样本决定系数的意义它计量了y的总变差中可以归因于x和y之间关系的比例,或者说y的变动中可以由x的变动来解释的比例。它测度了回归直线对各观察点拟合紧密程度,说明了样本回归直线的解释能力。的取值范围[0,1]拟合优度高拟合优度低第二章一元线性回归分析

2.6回归方程的显著性检验和拟合优度样本决定系数和相关系数的关系由可得又知、、可得因此有

第二章一元线性回归分析

2.6回归方程的显著性检验和拟合优度举例:以前面的可支配收入-消费支出为例,

==

==它表明模型的拟合优度较高。因为该模型中,家庭可支配收入的离差的部分,解释了家庭消费支出总离差的97.66%,

第二章一元线性回归分析

2.6回归方程的显著性检验和拟合优度3、F检验已知一元线性回归方程的总变差分解式:TSS=ESS+RSS,即=+定义F统计量:F=

当β1=0时,F=~F(1,n-2)第二章一元线性回归分析

2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论