浙大宁波理工学院计量经济学第二章一元线性回归分析_第1页
浙大宁波理工学院计量经济学第二章一元线性回归分析_第2页
浙大宁波理工学院计量经济学第二章一元线性回归分析_第3页
浙大宁波理工学院计量经济学第二章一元线性回归分析_第4页
浙大宁波理工学院计量经济学第二章一元线性回归分析_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章第二章 一元线性回归分析一元线性回归分析第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元一元线性回归模型线性回归模型2.2 2.2 总体回归参数的总体回归参数的最小二乘估计最小二乘估计2.3 2.3 参数最小二乘估计的统计性质参数最小二乘估计的统计性质2.4 2.4 参数估计量的抽样分布及参数估计量的抽样分布及 的估计的估计量量2.5 2.5 回归参数的回归参数的显著性检验显著性检验和区间估计和区间估计2.6 2.6 回归方程的显著性检验和回归方程的显著性检验和拟合优度拟合优度2.7 2.7 无条件预测无条件预测2.8 2.8 一元回归分析的一元回归分析的EViewsE

2、Views应用举例应用举例2第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型确定性关系:函数关系不确定性关系:回归分析第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型2.1.1 2.1.1 变量间的关系及种类变量间的关系及种类1、确定性关系与非确定性关系确定性关系函数关系,可以用精确的数学表达式表示。非确定性关系统计关系或相关关系,变量之间具有密切联系但又不能用函数关系精确表达的关系。计量经济学的研究对象是非确

3、定性非确定性的关系。sabyabx第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型2、相关变量间的关系相关变量:存在相关关系的变量。相关变量间的关系一般有两种:因果关系:一个变量的变化受另一个或几个变量的影响。平行关系:它们互为因果或共同受到另外因素的影响。第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型3、回归分析根据相关关系散点图散点图模拟直线建立函数方程描述具有因果关系变量间的数量联系方法表示原因的变量称为解释变量、独立变量、自变量或回归变量。表示结果的变量称为被解释变量、相依变量、因变量或响应变

4、量。tttyabx第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型4、一元线性回归模型的重要意义(1)现实经济的普遍性。(2)原理和方法的基础性。第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型2.1.2 2.1.2 一元线性回归模型的定义一元线性回归模型的定义模型定义:一元线性回归模型直线回归的数学模型它是变量y关于变量x的一元线性回归模型。模型解释: y称作被解释变量(或相依变量、因变量、响应变量)。x称作解释变量(或独立变量、自变量、回归变量),是影响y变化的重要变量。 tttuxy10非随机部分

5、随机部分第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型Ut称作随机误差项随机误差项。包括除了xt以外的影响yt变化的众多微小因素:未在模型中专门列出的影响yt变化的非重要解释变量人的随机行为数学模型形式欠妥归并误差测量误差u ut t的变化是不可控的变化是不可控的。第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型0为常数项(或截距项)。1为斜率系数影响程度大小大小反映了x影响y的程度,表示x改变一个单位,y平均平均改变的数量。影响方向正负正负性则反映了x影响y的性质。0和1称作回归系数。第二章第二章

6、一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型t表示序数时间序列当t表示时间序数时,xt和yt成为时间序列数据。非时间序列当t表示非时间序数时,xt和yt称为截面数据。第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型模型形式可分为两部分:非随机部分由x变化引起y线性变化的部分,即0+1xt部分。随机部分由其他一切随机因素引起y发生改变的部分,即ut部分。第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型2.1.3 2.1.3 总体回归函数与样本回归函数总体回归函数与样本回

7、归函数1、总体回归函数定义:在社会经济总体现象中,用来说明被解释变量的平均状态随解释变量变化的数量关系的函数。表示形式:E(yt)=0+1xt,称作(双变量)总体回归函数,或线性总体回归函数。其表明的直线被称为总体回归直线。确定方法:经验第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型2、样本回归函数定义:根据样本资料所做的、用以估计总体回归方程的函数。 表示方式 函数解释: 是样本回归直线上 相应的 的估计值,可视为总体条件均值 E( / )的估计值。 是样本回归函数的截距系数 是样本回归函数的斜率系数0tytx1ty txtyty01第二章第二

8、章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型2.1.4 2.1.4 一元线性回归模型的一元线性回归模型的基本假定基本假定一元回归模型确定分析成功估计参数值,取决于随机变量随机变量u和解释变量解释变量x的性质。tttuxy10待估参数无法确定可观察得到第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型222( )( )( )ttttVar uE uE uE u模型的基本假定(经典假定经典假定或高斯(Gauss)假设)(1)每个 (t=1,2,n),均为服从正态分布的实随机变量。(2)每个 (t=1,2,n)的期望

9、值都为0,即E( )=0。(3)所有的 方差均为同一个常数等方差假定。即 ,否则,称 具有异方差性。 tututututu第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型(4)非自相关假定。与解释变量x不同观测值 相对应的随机项 (t=1,2,n)之间彼此独立,即Cov( , )=0,tj。(5)随机项 与解释变量x的任一观测值xj不相关,即Cov( ,xj)=0满足该假设的线性回归模型,也称为经典线性回归模型(classical linear regression model,CLAM)在上述假定成立条件下,有E( )=E(0+1xt+ )=0+

10、1xt,即为前述的总体回归函数。 txtutujutututytu第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型一元回归模型 的特点:(1)对经济过程的不可再现性回归函数 E( )=0+1xt 不能100%的再现所研究的经济过程。(2)对经济问题的高度抽象性更深刻地揭示经济问题的内在规律。tytttuxy10第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型例题2-1 令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过过教育的年数,生育率对教育年数的简单回归模型为kids=0+1educ+u

11、。(1)随机扰动项u包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?第二章第二章 一元线性回归分析一元线性回归分析2.1 2.1 一元线性回归模型一元线性回归模型解:(1)随机扰动项包含了收入、年龄、家庭状况、政府的相关政策等等影响生育率的重要因素。有些影响因素可能与教育水平相关。(2)上述回归模型不能够揭示教育对生育率在其它条件不变下的影响。因为归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,即出现解释变量与随机扰动项相关的情形。第二章第二章 一元线性回归分析一元线性回归分析2.2 2.2 回归参数的普通最小二

12、乘估计(回归参数的普通最小二乘估计(OLSOLS)总体回归线与样本回归线的基本关系由于总体状况难以获得,需要根据样本对总体推断。但当采用样本推断总体时,存在着误差。第二章第二章 一元线性回归分析一元线性回归分析2.2 2.2 回归参数的普通最小二乘估计(回归参数的普通最小二乘估计(OLSOLS)2.2.1 2.2.1 回归参数的估计思想回归参数的估计思想总体回归直线 E(yt)=0 + 1xt样本回归直线 和 分别是0和1的估计值, 称作yt的拟合值,yt与 的差,即 称作回归残差,是对随机误差ut的估计。于是,可有ttxy1001ty ty tttyy第二章第二章 一元线性回归分析一元线性回

13、归分析2.2 2.2 回归参数的普通最小二乘估计(回归参数的普通最小二乘估计(OLSOLS)最小二乘估计(ordinary least squares,OLS)准则一组样本观测值(xt,yt)(t=1,2,n),要想最好地描述y与x关系的直线,t要尽可能地小,从而得到最优的拟合直线。最优的拟合直线标准 “残差和最小”标准“残差绝对值的和最小”标准“残差平方和最小”标准第二章第二章 一元线性回归分析一元线性回归分析2.2 2.2 回归参数的普通最小二乘估计(回归参数的普通最小二乘估计(OLSOLS)2.2.2 2.2.2 最小二乘估计(最小二乘估计(OLSOLS)的原理与计算)的原理与计算观察数

14、据散点图:第二章第二章 一元线性回归分析一元线性回归分析2.2 2.2 回归参数的普通最小二乘估计(回归参数的普通最小二乘估计(OLSOLS)最小二乘法的原理:设残差平方和用Q表示,所谓最小二乘法,即为 和 满足:按照该式求出的 和 ,就称为0和1的最小二乘估计值。ntnttttttntxyyyQ11210221)()(01ntttttxyxyQ1210,210)(min)(1001第二章第二章 一元线性回归分析一元线性回归分析2.2 2.2 回归参数的普通最小二乘估计(回归参数的普通最小二乘估计(OLSOLS)二元函数求极值,得到方程组: 该方程组常称作正规方程组,整理得:ntttxyQ11

15、000) 1)(2nttttxxyQ11010)(2nttnttyxn1110)(ntttnttnttyxxx112110)(第二章第二章 一元线性回归分析一元线性回归分析2.2 2.2 回归参数的普通最小二乘估计(回归参数的普通最小二乘估计(OLSOLS)解之得 ,即nyynxxnxxnxyxyxxyttttttttt ,为样本容量,其中,)(2221010和22221)()/()/()(xnxyxnyxxxnyxyxnttttttttt 第二章第二章 一元线性回归分析一元线性回归分析2.2 2.2 回归参数的普通最小二乘估计(回归参数的普通最小二乘估计(OLSOLS)2110)()(xxy

16、yxxxyttt写成离差形式即为:由此可得样本回归方程:ttxy10下图的残差和拟合值是哪一部分?第二章第二章 一元线性回归分析一元线性回归分析2.2 2.2 回归参数的普通最小二乘估计(回归参数的普通最小二乘估计(OLSOLS)举例假如有某一社区家庭组成的总体,根据抽出的10户家庭的样本资料,据此观察总体的可支配收入消费支出关系。收入收入xt消费消费yt 1800594211006383140011224170011555200014086230015957260019698290020789320025851035002530单位:百元单位:百元某社区居民收入某社区居民收入消费表消费表第二

17、章第二章 一元线性回归分析一元线性回归分析2.2 2.2 回归参数的普通最小二乘估计(回归参数的普通最小二乘估计(OLSOLS)xtyt 1800594-1350-9731314090182250094750864000035283621100638-1050-92997587011025008637841210000407044314001122-750-44533405056250019838119600001258884417001155-450-41218558020250017007428900001334025520001408-150-1592391022500254084000

18、000198246462300159515028414022500762529000025440257260019694504021807202025001612836760000387696182900207875051138295056250026071284100004318084932002585105010181068480110250010355101024000066822251035002530135096312995101822500926599122500006400900求和21500156745769300742500045900205365000029157448平均

19、21501567xxtyyt)()(yyxxtt2)(xxt2)(yyt2tx2ty普通最小二乘法计算表普通最小二乘法计算表第二章第二章 一元线性回归分析一元线性回归分析2.2 2.2 回归参数的普通最小二乘估计(回归参数的普通最小二乘估计(OLSOLS)由此,可计算出:所以,样本回归方程为:777. 074250005769300)()(21xxyyxxttt172.1032150777. 0156710 xyttxy777. 0172.103第二章第二章 一元线性回归分析一元线性回归分析2.2 2.2 回归参数的普通最小二乘估计(回归参数的普通最小二乘估计(OLSOLS)yx5588908

20、011812014513514517580100120140160180200220240260课堂习题:若某一总体的随机样本如下,试根据该样本资料估计总体回归方程。第二章第二章 一元线性回归分析一元线性回归分析2.3 2.3 参数最小二乘估计的统计性质参数最小二乘估计的统计性质考察参数估计量的统计性质,是对据由模型估计的参数估计值的精度,能否代表总体参数的真值所做的说明。考察总体的估计量优劣性的条件:(1 1)线性性:)线性性:即它是否是另一随机变量的线性函数该性质的实际意义是,参数估计量与另一随机变量具有相同的分布。第二章第二章 一元线性回归分析一元线性回归分析2.3 2.3 参数最小二乘

21、估计的统计性质参数最小二乘估计的统计性质(2 2)无偏性)无偏性:即它的均值或期望值是否等于总体的真实值。该性质的实际意义是,参数估计量是以参数真实值为分布中心的随机变量,反复抽样估计可得真实值。(3 3)有效性)有效性:即它是否在所有线性无偏估计量中具有最小方差。该性质的实际意义是,与其他线性无偏估计量相比,最小二乘估计法得到的估计量有更大的可能性离真值最近。拥有这类性质的估计量称为最佳线性无偏估计量最佳线性无偏估计量(best liner unbiased best liner unbiased estimator, BLUEestimator, BLUE)第二章第二章 一元线性回归分析一

22、元线性回归分析2.3 2.3 参数最小二乘估计的统计性质参数最小二乘估计的统计性质对用OLS法得到的估计量 和 的考察1、线性即 和 均为随机变量y或u的线性函数。2、无偏性指参数估计量 和 的均值(期望值)分别等于总体参 数值 和 ,即E( )= , E( )= 。010101010011第二章第二章 一元线性回归分析一元线性回归分析2.3 2.3 参数最小二乘估计的统计性质参数最小二乘估计的统计性质3、最小方差性(有效性或最佳性)与其它的一切线性、无偏估计量比较,OLS估计量 和 的方差最小。高斯-马尔可夫定理(Gauss-Markov theorem):若 满足E( )=0 ,Var(

23、)= ,那么用OLS法得到的估计量一定为最佳线性无偏估计量。 01tututu2第二章第二章 一元线性回归分析一元线性回归分析2.3 2.3 参数最小二乘估计的统计性质参数最小二乘估计的统计性质举例:若研究某公司员工的受教育水平与薪金的关系,设E为某类公司员工的薪金(元),N为所受教育水平(年),建立回归模型E=+N+,式中随机扰动项的分布未知,其他所有假定都满足。要求:(1)从直观及经济角度解释和。(2)OLS估计量满足线性、无偏性、及有效性吗?简单陈述理由。第二章第二章 一元线性回归分析一元线性回归分析2.3 2.3 参数最小二乘估计的统计性质参数最小二乘估计的统计性质解:(1)+N为接受

24、过N年教育的员工的总体平均薪金。当N为0时,平均薪金为。表示没有接受过教育员工的平均起始薪金。是每单位N变化所引起的E的变化,即表示多接受一年教育所对应的薪金增加值。(2)OLS估计量仍满足线性、无偏性及有效性,因为这些性质的成立勿需随机扰动项的正态分布假设(答案有问题吗?)。第二章第二章 一元线性回归分析一元线性回归分析2.3 2.3 参数最小二乘估计的统计性参数最小二乘估计的统计性质质计量单位变化对模型参数估计量的影响举例:在上例中,若被解释变量员工薪金的计量单位由元改为百元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化?第二章第

25、二章 一元线性回归分析一元线性回归分析2.3 2.3 参数最小二乘估计的统计性质参数最小二乘估计的统计性质解:(1)若被解释变量度量单位变化以E*表示以百元为度量单位的薪金,则 E*100=E=+N+,可得如下新模型:E*=(/100)+ (/100)N+(/100)或其中, , 。新的回归系数为原始模型回归系数的1/100。(2)若解释变量度量单位变化设N*为用月份表示的新员工受教育的时间长度,则N*=12N,模型为估计的截距项不变,而斜率项将为原回归系数的1/12。*NE100/*100/*第二章第二章 一元线性回归分析一元线性回归分析2.3 2.3 参数最小二乘估计的统计性质参数最小二乘

26、估计的统计性质思考题:在上例中,如果被解释变量新员工起始薪金的计量单位由百元改为元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由月改为年,估计的截距项与斜率项有无变化?第二章第二章 一元线性回归分析一元线性回归分析2.4 2.4 参数估计量的抽样分布及参数估计量的抽样分布及 的估计量的估计量221)()(xxVt参数估计量 、 的抽样分布: 、 服从正态分布由于 和 均为yt的线性函数,而每个yt都服从正态分布。 和 的期望值分别为 ,方差分别为:故 和 的抽样分布为: N N20101010110和2220)(1)(xxxnVt0101)(1(,2220 xxxnt22

27、1)(,xxt第二章第二章 一元线性回归分析一元线性回归分析2.4 2.4 参数估计量的抽样分布及参数估计量的抽样分布及 的估计量的估计量 的估计量:由于 是未知的,为了得出 和 的方差,必须先给出 的估计量。设 为 的估计,则 = 其中,n表示样本容量,2表示回归方程中被估计参数(即 和 )的个数。因为 是残差,所以 又称做误差均方。可以证明 是 的无偏估计量,它可用来考察观测值对回归直线的离散程度。22012222nttn12201t2222第二章第二章 一元线性回归分析一元线性回归分析2.4 2.4 参数估计量的抽样分布及参数估计量的抽样分布及 的估计量的估计量用 代替 ,就得到了 和

28、的估计的方差,即22012222220)(2)()(xxnxnxxnxVttttt22221)(12)(1)(xxnxxVttt2第二章第二章 一元线性回归分析一元线性回归分析2.5 2.5 回归参数的显著性检验和区间估计回归参数的显著性检验和区间估计回归模型的正确性验证模型的函数形式变量选择参数估计的正确性2.5.1 2.5.1 回归参数的回归参数的t t检验检验t分布:已知 和 都服从正态分布,且 , ,其中010)(,00VN1)(,11VN2220)(1)(xxxnVt)()(21xxVt,第二章第二章 一元线性回归分析一元线性回归分析2.5 2.5 回归参数的显著性检验和区间估计回归

29、参数的显著性检验和区间估计则统计量 和 皆服从标准正态分布。 若用无偏估计量 代替 ,有无偏估计量 ,t统计量在小样本(一般n30)情况下,用无偏估计量 和 代替 和 ,可得t统计量: t(n-2), t(n-2)(000V)(111V222220)(1)(xxxnVt)()(21xxVt)(0V)(1V)(0V)(1V)(000V)(111V第二章第二章 一元线性回归分析一元线性回归分析2.5 2.5 回归参数的显著性检验和区间估计回归参数的显著性检验和区间估计大样本(n30)情况,则为Z(正态分布)统计量000()ZV111()ZVN(0,1)N(0,1)第二章第二章 一元线性回归分析一元

30、线性回归分析2.5 2.5 回归参数的显著性检验和区间估计回归参数的显著性检验和区间估计t检验:在一元回归模型中,x是否可以解释y的变化,即解释变量对被解释变量是否有显著影响。可通过对1=0是否成立进行检验。原假设H0:1=0;备择假设H1:10在H0成立时,有 = t(n-2)T)(111V)(11V第二章第二章 一元线性回归分析一元线性回归分析2.5 2.5 回归参数的显著性检验和区间估计回归参数的显著性检验和区间估计检验判断对于给定的显著性水平,查自由度为n-2的t分布表,得临界值 。若T ,则拒绝H0:1=0,接受备择假设H1:10,表明回归模型中因变量与自变量之间确实存在线性关系。若

31、T ,则接受H0:1=0,解释变量对因变量没有显著影响。)2(2nt)2(2nt)2(2nt第二章第二章 一元线性回归分析一元线性回归分析2.5 2.5 回归参数的显著性检验和区间估计回归参数的显著性检验和区间估计显著性水平的取值通常取0.01或0.05。当其取0.05时,且n-213时,临界值 = 大体保持在2附近。若T的绝对值远大于2,则在0.05的显著性水平下,可认为1显著地异于0。2t025. 0t第二章第二章 一元线性回归分析一元线性回归分析2.5 2.5 回归参数的显著性检验和区间估计回归参数的显著性检验和区间估计举例:前述某一社区家庭组成的总体的样本资料,据此观察总体的可支配收入

32、-消费支出关系,对回归参数的检验为: = = = =134022nttn1222)()(2212nxxyytt2107425000777. 045900202第二章第二章 一元线性回归分析一元线性回归分析2.5 2.5 回归参数的显著性检验和区间估计回归参数的显著性检验和区间估计于是 和 的标准差的估计值分别是 : = = =98.41 = = =0.0425 012220)(1)(xxxnVt222)(xxnxtt7425000105365000013402221)()(xxVt7425000134020018. 0第二章第二章 一元线性回归分析一元线性回归分析2.5 2.5 回归参数的显著

33、性检验和区间估计回归参数的显著性检验和区间估计T统计量的计算结果分别为t1= = =18.29t0= = =-1.048给定一个显著性水平=0.05,当n-2=8时, ,说明解释变量家庭可支配收入在95%的置信度下显著,即通过了变量显著性检验;但 ,表明在95%的置信度下,无法拒绝截距项为零的假设。)(11V0425. 0777. 0)(00V41.9817.10312,306. 2)8(tt)2(2nt0t)2(2nt第二章第二章 一元线性回归分析一元线性回归分析2.5 2.5 回归参数的显著性检验和区间估计回归参数的显著性检验和区间估计2.5.2 2.5.2 回归参数的区间估计回归参数的区

34、间估计置信区间:由t1= ,在显著型水平下,可得 , 即 。该范围被称为 的置信区间。对 参数的区间估计有类似的结果: 。置信区间是原假设的接受域,置信区间以外的区域称作拒绝域或临界域,置信区间的端点称作临界点。)(111V1)2()2(212nttntP)()2(, )()2(121121VntVnt0)()2(020Vnt1第二章第二章 一元线性回归分析一元线性回归分析2.5 2.5 回归参数的显著性检验和区间估计回归参数的显著性检验和区间估计置信度:1-称为置信度。置信度和置信区间的理解给定置信系数为95%,从长远看,每100个某种置信区间中,将有95个包含着真实的1值,不可以说,某个特

35、定的区间有95%的概率包含着真实的1,因为这个区间已经固定而不再是随机的了,那么,1要么落入其中,要么落在其外。因此,这个给定的固定区间包含着真实的1的概率不是1就是0。第二章第二章 一元线性回归分析一元线性回归分析2.6 2.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度检验回归方程是为了验证样本回归方程 是否真正反映了变量y与变量x之间的统计规律性。 2.6.1 2.6.1 相关系数的显著性检验相关系数的显著性检验1、相关系数的定义与性质设(xt,yt)(t=1,2,n)是(x,y)的n组样本观测值,则 为x与y样本相关系数。 其中,ttxy10yyxxxyLLLr nt

36、ntnttttyyynyyyL112122)(1)(ntntnttttxnxxx112122)(1)(ntntnttnttttttxyyxnyxyyxxL1111)(1)(xxL第二章第二章 一元线性回归分析一元线性回归分析2.6 2.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度相关系数相关性质r=-1完全负相关(线性)r=0不存在线性相关r=1完全正相关(线性)0|r|1存在线性相关关系r反映了x与y之间线性相关程度大小。r绝对值的取值范围在0与1之间,即0|r|1。相关系数的性质:第二章第二章 一元线性回归分析一元线性回归分析2.6 2.6 回归方程的显著性检验和拟合优

37、度回归方程的显著性检验和拟合优度2、相关系数的显著性检验样本相关系数是随机得到的,是对总体相关系数的估计,因此要进行显著性检验。相关系数显著性检验的步骤:(1)计算样本相关系数r值。(2)给定显著性水平,查相关系数表的临界值 。(3)判定:若|r| ,则x与y有显著的线性关系;若|r| ,则意味着x与y的线性关系在统计上不显著。提醒:这里仅仅判断的是提醒:这里仅仅判断的是x x与与y y之间有无线性关系,即之间有无线性关系,即使两者没有线性关系,不意味着两者之间也没有非线使两者没有线性关系,不意味着两者之间也没有非线性关系。性关系。rrr第二章第二章 一元线性回归分析一元线性回归分析2.6 2

38、.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度相关系数 r 与回归系数 的关系)()()()()()()()()(222221xVyVrnxxnyyyyxxyyxxxxyyxxttttttttt1 对于同一样本,检验相关系数r与回归系数 是否显著是等价的,都可以用于判断x与y之间有无线性关系。 1第二章第二章 一元线性回归分析一元线性回归分析2.6 2.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度2R2.6.2 2.6.2 拟合优度检验拟合优度检验拟合优度回归直线与样本数据趋势的吻合程度。现实中没有一条样本回归直线可以完全拟合样本数据。对于同一组数据,可

39、以拟合出不同的回归直线。样本决定系数或可决系数拟合优度的高低表明了观测点离回归直线的远近,常采用样本决定系数 来衡量。第二章第二章 一元线性回归分析一元线性回归分析2.6 2.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度1、总离差平方和的分解设由样本观测值(xt,yt)得到的样本回归直线为: ,因变量的观测值可分解成 和 之和: = + ,即: - = - + 对于全部观测值求平方和,有: +2 因为 =0,所以有:ttxy10ty ttyty ttyyty ytntntntttttyyyyyy111222)()()(ntt12ntttyy1)(ntttyy1)(2211(

40、)()nnttttyyyy21ntt第二章第二章 一元线性回归分析一元线性回归分析2.6 2.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度上式可表示为:TSS=ESS+RSS总离差平方和TSS= ,是因变量的观测值与其均值的离差平方和,成为,反映了因变量波动的大小。回归平方和ESS= ,是因变量的估计值与其均值的离差平方和,反映了解释变量的变化所引起的y的波动,是总离差中被y对x的回归解释的那部分。残差平方和 RSS= = ,是因变量的观测值与估计值之差的平方和,反映了y的变化中不能由解释变量x所解释的那部分变差。ntttyy12)(nttyy12)(ntttyy12)(n

41、tt12第二章第二章 一元线性回归分析一元线性回归分析2.6 2.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度2、样本决定系数的计算样本决定系数是ESS与TSS之比,用来反映样本回归直线与全部观测值之间的拟合优度。 或 =1- =1-在总离差平方和TSS中,回归平方和ESS所占比重越大,线性回归效果越好,即回归直线与样本观测值的拟合优度越高。 2R22)()(yyyyTSSESStt2RTSSRSS22)(yytt=第二章第二章 一元线性回归分析一元线性回归分析2.6 2.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度样本决定系数 的意义它计量了y的总变差

42、中可以归因于x和y之间关系的比例,或者说y的变动中可以由x的变动来解释的比例。它测度了回归直线对各观察点拟合紧密程度,说明了样本回归直线的解释能力。 的取值范围 0 , 1 2R2R拟合优度高拟合优度高拟合优度低拟合优度低第二章第二章 一元线性回归分析一元线性回归分析2.6 2.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度 样本决定系数和相关系数的关系由 可得又知 、 、 可得因此有 yyxxxyLLLr 22222 ()()()()xyxxyyLxxyyrL Lxxyy222()()ttyyRyyttxy100112()()()tttxxyyyxxx、1()yyxx222

43、22212222()()()()()()()()()tttttttttyyxxxxyyxxRyyyyxxyy22rR第二章第二章 一元线性回归分析一元线性回归分析2.6 2.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度举例:以前面的可支配收入-消费支出为例, = = = =它表明模型的拟合优度较高。因为该模型中,家庭可支配收入的离差的部分,解释了家庭消费支出总离差的97.66%, 2R22)()(yyyyTSSESStt221010)()()(yyxxtt2122)()(yyxxttt9766. 045900207425000777. 02第二章第二章 一元线性回归分析一元线性回归分析2.6 2.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度3、F检验已知一元线性回归方程的总变差分解式:TSS=ESS+RSS,即 = + 定义F统计量: F= 当1=0时,F= F(1,n-2)nttyy12)(nttyy12)(ntttyy12)()2(1nRSSESS)2(1nRSSESS第二章第二章 一元线性回归分析一元线性回归分析2.6 2.6 回归方程的显著性检验和拟合优度回归方程的显著性检验和拟合优度变差来源 平方和自由度均方统计量回归ESS1ESS/1F=残差R

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论