版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三一元线性回归演示文稿现在是1页\一共有60页\编辑于星期五(优选)第三一元线性回归现在是2页\一共有60页\编辑于星期五二、解决问题的思路寻找变量之间直线关系的方法很多。于是,再接下来则是从众多方法中,寻找一种优良的方法,运用方法去求出线性模型——y=a+bx+u中的截距a=?;直线的斜率b=?正是是本章介绍的最小二乘法。根据该方法所得,即表现变量之间线性关系的直线有些什么特性?所得直线可靠吗?怎样衡量所得直线的可靠性?最后才是如何运用所得规律——变量的线性关系?现在是3页\一共有60页\编辑于星期五1、最小二乘法产生的历史最小二乘法最早称为回归分析法。由著名的英国生物学家、统计学家高尔顿(F.Gallton)——达尔文的表弟所创。早年,高尔顿致力于化学和遗传学领域的研究。他研究父亲们的身高与儿子们的身高之间的关系时,建立了回归分析法。现在是4页\一共有60页\编辑于星期五2、最小二乘法的地位与作用现在回归分析法已远非高尔顿的本意已经成为探索变量之间关系最重要的方法,用以找出变量之间关系的具体表现形式。后来,回归分析法从其方法的数学原理——误差平方和最小(平方即二乘)出发,改称为最小二乘法。现在是5页\一共有60页\编辑于星期五
例:父亲们的身高与儿子们的身高之间关系的研究1889年F.Gallton和他的朋友(学生)K.Pearson收集了上千个家庭的身高、臂长和腿长的记录,企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式。下图是根据1078个家庭的调查所作的散点图(略图)现在是6页\一共有60页\编辑于星期五160165170175180185140150160170180190200YX儿子们身高向着平均身高“回归”,以保持种族的稳定现在是7页\一共有60页\编辑于星期五“回归”一词的由来从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到的具体规律如下:但他同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”——见1889年F.Gallton的论文《普用回归定律》。后人将此种方法普遍用于寻找变量之间的规律
现在是8页\一共有60页\编辑于星期五3、最小二乘法的思路1.为了精确地描述Y与X之间的关系,必须使用这两个变量的每一对观察值,才不至于以点概面(作到全面)。2.Y与X之间是否是直线关系(协方差或相关系数)?若是,将用一条直线描述它们之间的关系。3.在Y与X的散点图上画出直线的方法很多。任务?——找出一条能够最好地描述Y与X(代表所有点)之间的直线。4.什么是最好?—找出判断“最好”的原则。最好指的是找一条直线使得这些点到该直线的纵向距离的和(平方和)最小。现在是9页\一共有60页\编辑于星期五三种距离
yx纵向距离横向距离距离A为实际点,B为拟合直线上与之对应的点现在是10页\一共有60页\编辑于星期五距离是度量实际值与拟合值是否相符的有效手段点到直线的距离——点到直线的垂直线的长度。横向距离——点沿(平行)X轴方向到直线的距离。纵向距离——点沿(平行)Y轴方向到直线的距离。也就是实际观察点的Y坐标减去根据直线方程计算出来的Y的拟合值。这个差数以后称为误差——残差(剩余)。现在是11页\一共有60页\编辑于星期五4、最小二乘法的数学原理纵向距离是Y的实际值与拟合值之差,差异大拟合不好,差异小拟合好,所以又称为拟合误差或残差。将所有纵向距离平方后相加,即得误差平方和,“最好”直线就是使误差平方和最小的直线。于是可以运用求极值的原理,将求最好拟合直线问题转换为求误差平方和最小。现在是12页\一共有60页\编辑于星期五数学推证过程
现在是13页\一共有60页\编辑于星期五现在是14页\一共有60页\编辑于星期五5、拟合直线的性质1.拟合直线过Y和X的平均数点2、估计残差和为零3、Y的真实值和拟合值有共同的均值4、估计残差与自变量不相关5、估计残差与拟合值不相关现在是15页\一共有60页\编辑于星期五性质1:由(5)式,得即拟合直线过y和x的平均数点。现在是16页\一共有60页\编辑于星期五性质2估计残差和为零由(1)式直接得此结论无须再证明。并推出残差的平均数也等于零。现在是17页\一共有60页\编辑于星期五
性质3Y的真实值和拟合值有共同的均值
现在是18页\一共有60页\编辑于星期五性质4估计残差与自变量不相关
现在是19页\一共有60页\编辑于星期五性质5估计残差与拟合值不相关
现在是20页\一共有60页\编辑于星期五关于回归直线性质的总结
残差和=0平均数相等拟合值与残差不相关自变量与残差不相关注意:这里的残差与随机扰动项不是一个概念。随机扰动项是总体的残差。现在是21页\一共有60页\编辑于星期五二、一元线性回归模型的检验1、线性回归模型的基本假设(严格来说是针对普通最小二乘法)2、参数估计量的性质(包括回归系数、随机误差项):线性、无偏性和有效性3、模型的检验,包括方程的显著性检验和变量的显著性检验。现在是22页\一共有60页\编辑于星期五1、线性回归模型的基本假设1、自变量(解释变量)是非随机的确定性的变量,而且彼此之间不相关,即2、解释变量与随机误差项之间不相关。3、随机误差项具有零均值和同方差,即4、随机误差项之间不相关,即5、(当样本容量趋于无穷大时,由中心极限定理,对于任何实际模型都是满足)
现在是23页\一共有60页\编辑于星期五以上假设也称为线性回归模型的经典假设或高斯(Gauss)假设,满足该假设的线性回归模型,也称为经典线性回归模型(ClassicalLinearRegressionModel,CLRM)。
现在是24页\一共有60页\编辑于星期五2、最小二乘估计量的性质当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。一个用于考察总体的估计量,可从如下几个方面考察其优劣性:(1)线性性,即它是否是另一随机变量的线性函数;(2)无偏性,即它的均值或期望值是否等于总体的真实值;(3)有效性,即它是否在所有线性无偏估计量中具有最小方差。现在是25页\一共有60页\编辑于星期五这三个准则也称作估计量的小样本性质。拥有这类性质的估计量称为最佳线性无偏估计量(bestlinerunbiasedestimator,BLUE)。当不满足小样本性质时,需进一步考察估计量的大样本或渐近性质:(4)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值;(5)一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值;(6)渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。现在是26页\一共有60页\编辑于星期五高斯—马尔可夫定理(Gauss-Markovtheorem)
在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。(1)线性性,即估计量是Yi的线性组合现在是27页\一共有60页\编辑于星期五证:易知故同样地,容易得出
(2)无偏性,即估计量的均值等于总体回归参数真值现在是28页\一共有60页\编辑于星期五(3)有效性(最小方差性,即在所有线性无偏估计量中,最小二乘估计量具有最小方差先求的方差现在是29页\一共有60页\编辑于星期五证明最小方差性其中,ci=ki+di,di为不全为零的常数,则容易证明普通最小二乘估计量(ordinaryleastSquaresEstimators)称为最佳线性无偏估计量(bestlinearunbiasedestimator,BLUE)
现在是30页\一共有60页\编辑于星期五由于最小二乘估计量拥有一个“好”的估计量所应具备的小样本特性,它自然也拥有大样本特性。
如考察的一致性现在是31页\一共有60页\编辑于星期五(4)随机误差项估计量的无偏性问题随机误差项的方差估计量为:其中为残差通过变化可得:
现在是32页\一共有60页\编辑于星期五3、模型的检验(1)方程的显著性检验(F检验)
旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否成立作出推断。用以进行方程的显著性检验的方法主要有三种:F检验、t检验、r检验。他们的区别在于构造的统计量不同。而在目前使用的计量经济学软件包中都有关于F统计量的计算结果。现在是33页\一共有60页\编辑于星期五即检验方程中的参数是否显著不为0,即检验零假设:由于Yi服从正态分布,则有解释(回归)平方和(explainedsumofsquares)残差平方和(residualsumofsquares)现在是34页\一共有60页\编辑于星期五由此构造统计量F值小意味着X与Y之间(线性)关系很弱,而F值大意味X与Y之间(线性)关系很强。根据变量的样本观测值和估计值,计算F统计量的数值,给定一个显著性水平,查F分布表,若F现在是35页\一共有60页\编辑于星期五(2)变量的显著性检验(t检验)
主要对多元线性回归模型而言,在方程的总体线性关系呈显著性时,并不能说明每个解释变量对被解释变量的影响是显著的,必须对每个解释变量进行显著性检验,以决定是否作为解释变量保留在模型中。其检验的思路与方程显著性检验相似,用以检验的方法主要有三种:F检验、t检验、z检验。它们区别于方程显著性检验在于构造统计量不同,其中应用最为普遍的为t检验。现在是36页\一共有60页\编辑于星期五如果变量x是显著的,则参数b应该是显著的。于是在变量的显著性检验中即检验零假设,构造检验用统计量:统计量t服从自由度为n-2的t分布,对于给定的显著性水平,查t分布表,得临界值若|t|小于临界值,则未通过检验,大于临界值则通过检验。现在是37页\一共有60页\编辑于星期五4、模型的评价(在不同模型之间择优,拟合优度检验)由最小二乘法所得直线究竟能够对这些点之间的关系加以反映吗?对这些点之间的关系或趋势反映到了何种程度?于是必须经过某种检验或者找出一个指标,在一定可靠程度下,根据指标值的大小,对拟合的优度进行评价。拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。现在是38页\一共有60页\编辑于星期五(1)平方和的分解(a)总平方和(TSS)、回归平方和(ESS)、残差平方和(RSS)的定义(b)平方和的分解(c)自由度的分解现在是39页\一共有60页\编辑于星期五(a)总平方和、回归平方和、残差平方和TSS为总体平方和,反映样本观测值总体离差的大小;ESS为回归平方和,反映由模型中解释变量所解释的那部分离差的大小;RSS为残差平方和,反映样本观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。现在是40页\一共有60页\编辑于星期五(b)平方和的分解
现在是41页\一共有60页\编辑于星期五现在是42页\一共有60页\编辑于星期五平方和分解的意义TSS=ESS+RSS被解释变量Y总的变动(差异)=
解释变量X引起的变动(差异)
+除X以外的因素引起的变动(差异)如果X引起的变动在Y的总变动中占很大比例,那么X很好地解释了Y;否则,X不能很好地解释Y。
Y的观测值围绕其均值的总离差(totalvariation)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。现在是43页\一共有60页\编辑于星期五平方和分解图正交分解现在是44页\一共有60页\编辑于星期五(c)自由度的分解总自由度:dfT=n-1
回归自由度:dfE=k=1(k为自变量的个数)残差自由度:dfR=n-k-1=n-2
自由度分解:dfT=dfR+dfE现在是45页\一共有60页\编辑于星期五(2)拟合优度(或称判定系数、可决系数)目的:企图构造一个不含单位,可以相互进行比较,而且能直观判断拟合优劣。拟合优度的定义:意义:拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。取值范围:0-1现在是46页\一共有60页\编辑于星期五在收入-消费支出的例题中,注:可决系数是一个非负的统计量。它也是随着抽样的不同而不同。现在是47页\一共有60页\编辑于星期五修正的在应用过程中,如果在模型中增加一个解释变量,模型的解释功能增强了,回归平方和增大了,也增大了。从而给人一个错觉:要使得模型拟合得好,就必须增加解释变量,但是在样本容量一定的情况下,增加解释变量必定使得自由度减少,于是实际应用中引进修正的决定系数,具体表达式为(其中n是样本容量,n-k-1=n-1-1为残差平方和的自由度,n-1为总体平方和的自由度):现在是48页\一共有60页\编辑于星期五(3)拟合优度等于实际值与拟合值之间简单相关系数的平方
现在是49页\一共有60页\编辑于星期五5、预测计量经济学模型的一个重要应用是经济预测,对于模型如果给定样本以外的解释变量的观测值,可以得到被解释变量的预测值。但严格来说我们得到的仅是预测值的一个估计值,预测值仅以某一个置信水平处于以该估计为中心的一个区间中。现在是50页\一共有60页\编辑于星期五预测区间的推导现在是51页\一共有60页\编辑于星期五(1)样本容量n越大,预测精度越高,反之预测精度越低;(2)样本容量一定时,置信带的宽度当在X均值处最小,其附近进行预测(插值预测)精度越大;X越远离其均值,置信带越宽,预测可信度下降。
对于Y的总体均值E(Y|X)与个体值的预测区间(置信区间):现在是52页\一共有60页\编辑于星期五6、正态性检验在回归模型的参数和统计检验中都是建立在随机误差项服从正态分布的基础之上,在实际中如何检验随机误差项服从正态分布。一般的检验方法有三种:残差直方图、正态概率图、J-B检验,其中主要用J-B检验。现在是53页\一共有60页\编辑于星期五三、实例:时间序列问题
1、中国居民人均消费模型2、时间序列问题现在是54页\一共有60页\编辑于星期五
1、中国居民人均消费
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大型广告牌安装吊车租赁合同
- 电视剧制作团队制片人招聘协议
- 一卡通系统订货合同
- 建设工程施工合同地热能开发
- 企业内部网站管理办法
- 水电站土地开发合同
- 电子产品生产废标条件研究
- 酒店维护工程合同
- 矿山安全质量管理办法
- 企业产品演示员操作手册
- 一年级上册美术课件-第11课-花儿寄深情-▏人教新课标
- 植物的象征意义
- 夏商周考古课件 第5章 西周文化(1、2节)
- 二年级上册美术教案-7. 去远航 -冀教版
- 装配图画法及要求课件
- 翻译实习教学大纲
- 心力衰竭-英文版课件
- 邀请回国探亲邀请函范本
- 留置胃管与胃肠减压术课件
- 黄金分割在生活中的应用结题报告课件
- A5技术支持的课堂导入作业2-课堂导入设计:小学数学《圆的面积》针对选定的主题请提交一份运用信息技术手段支持的课堂导入设计须清晰地说明导入目的和媒体资源工具
评论
0/150
提交评论