版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章一元线性回归模型2.1经济变量间的关系2.2随机扰动项的内容及有关假定2.3最小平方估计方法2.4最小平方估计值的性质2.5最小平方估计值的标准误差与区间估计2.6最小平方估计式的拟合优度与假设检验2.7预测区间与弹性估计2.8一个案例分析目录2.1
经济变量间的关系2.1.1确定的函数关系如果一个变量的值能够被一个或者若干个其它变量的值按某一规律唯一地确定,则这类变量就具有完全确定的关系,通常称作为函数关系。可表示为:比如,如果某变量与多个变量成函数关系,可表示为:经济变量之间的函数关系是数理经济学研究的对象。经济变量间的关系
2.1.2非确定的相关关系
如果变量之间既存在着密切的数量关系,但又不能由一个或几个变量的值精确地求出另一个变量的值,只有在大量的统计资料或观测资料的基础上,方可判断这类变量之间的数量变化规律性,则这类变量之间的关系就是非确定的关系,也叫做统计相关关系或回归关系。经济变量之间的相关关系或回归关系,正是经济计量学研究的对象。经济计量学对于相关关系的研究,其基本的方法就是相关分析和回归分析。
相关分析主要用于确定两个变量之间是否存在密切的线性相关关系以及这种关系的密切程度。
回归分析,就是首先根据相关变量之间的实际观测值建立模型并估计有关参数,然后再回过头来应用模型研究相关变量之间的关系,或检验经济理论,或进行政策模拟,或进行经济预测等等。
非确定的相关关系与确定的函数关系相类似,相关关系也可以用如下类似的函数形式来表示:
该式说明,Y就等于X的类函数或者Y对于X的回归方程加随机误差,换言之,Y对于X的回归方程就等于Y在X为已知条件下的期望函数,其具体形式因Y与X之间的关系而异,可能是直线也可能是曲线。根据式(2-1),如果Y对于X的条件期望函数为直线,应有:或者:也就是说,U反映了Y的观测值与其条件期望即回归直线的离差。2.1.3相关关系与函数关系的联系及线性拟合
相关关系与函数关系的联系如图2-1和图2-2所示线性拟合,就是用直线近似地描述各对数据对应点的分布规律。线性拟合图2-1图2-2§2.2随机扰动项的内容及有关假定2.2.1随机扰动项的内容一.未列入模型但又共同影响因变量的其它所有因素
这主要是由于受主客观两个方面的限制,人们不可能将经济现象的所有因素都纳入到一个经济计量模型之中。比如,在消费函数中与个人可支配收入共同影响个人消费支出的消费偏好、物价指数及消费品质量等。二.模型的设计误差这主要是由于对模型的不适当简化造成的,比如可能将相乘关系设定为相加关系,把曲线关系设定为直线关系等等。随机扰动项的内容三、变量的观测误差这种误差主要地也受到主客观两个方面因素的影响。主观方面如报喜不报忧;客观方面比如条件限制等等。四、随机误差比如由于人的意识和行为的非重复性引起的误差,不在上述三种情况之中的其它误差,等等。2.2.2关于随机扰动项的基本假定假定1(零均值假定):以给定的Xi(i=1,2,…,n)为条件,Ui的条件期望值为零。用数学语言表示即:
E(Ui|Xi)=0
或简记为:E(Ui)=0这一假定实质是说,每一个时期中U的所有可能值的总体中总包含有正值、负值和零,其总和为零,因而均值亦为零。
根据假定1,对于线性相关关系,应有:
E(Y)=E(α+βX)+E(U)=α+βX
这可以用图2-3予以说明。如果违反这一假定,则出现如图2-4所示两种情况。
图2-3图2-4假定1要求必须保证:(1)方程中包含了所有的重要变量;(2)因变量不存在系统的测量正误差或负误差。基本假定(1)假定2(无序列相关假定):即各个扰动项互不相关,或者说各个扰动项之间不存在序列相关或自相关。用式子表示,即:
Cov(Ui,Uj)=E(Ui-E(Ui))(Uj-E(Uj))=E(UiUj)=0(其中i≠j)
其中,i、j表示观测值的两个不同观测时期或观测点,Cov为协方差。这一假定亦可以等价地表述为:对应于不同观测值的误差具有零相关,或者说,U是一个随机变量,它在不同时期或不同观测点上的取值相互独立。因为,E(UiUj)=0只有在U的各项分别以一定的概率取正值、负值或零是才是可能的。假定3(常方差假定):即对于每一个给定的Xi(i=1,2,…,n)来说,Ui的方差(即条件方差)为常数。换言之,即对应于不同的X值,各个U的总体具有相同的方差。用式子表示即:基本假定(2、3)
D2(Ui|Xi)=E(Ui-E(Ui))2=E(Ui)2=
这一假定表明,每一个U围绕其零均值的变差与X无关,换言之,U的取值不受X的影响,两者的协方差为零。用式子表示即:
Cov(U,X)=E[(Ui-E(Ui)][Xi-E(Xi)]=E{Ui[Xi-E(Xi)]}=XiE(Ui)-E(Xi)E(Ui)=0这种情况可以用某种商品在一年12个月中取不同价格时每天的销售量来说明。一方面,虽然销售量会随着每个月价格的不同而变化,但另一方面尽管一个月中每天的价格相同,但每天的销售量却不一定相同。违反常方差性假定称作异方差。下面的图2-5和图2-6分别说明常方差和异方差。
图2-5图2-6异方差还有先增后减和先减后增等多种形式。假定4(正态性假定):即随机扰动项U服从均值为零方差为常数的正态分布。用式子表示即:
Ui~N(0,σ2)
这一假定表明,随机扰动项U在回归直线两旁分布的基本规律是,越是靠近回归直线其分布的密度就越大,越是远离回归直线,其分的布密度就越小。换言之,即U的较小值比较大值观测到的概率要大,极端值观测到的概率更小,甚至不可能。这一假定可分别用图2-7中的a、b、c予以说明。
图2-7基本假定(4)
§2.3最小平方估计方法2.3.1一元线性回归模型的几种不同表达方式
一般的一元线性回归模型是:Y=α+βX+U一.X与Y的真实关系式Y=α+βX+U也叫总体方程式二.真实的回归直线
E(Y)=α+βX也叫总体回归直线三.由样本估计的关系式也叫样本方程式其中e是…四.由样本估计的回归直线
也叫样本回归直线其中是…根据样本方程式应有:一元模型的几种表达2.3.2回归的几种可能途径一.使残差总和最小
也就是使最小。这一准则的显著缺点是,无法反映观测点的离散程度。如图2-8所示。图2-8二.使残差的绝对值之和最小回归的几种可能途径三.使残差的平方和最小2.3.3最小平方准则及其特点
最小平方准则即:
求偏微分有:也就是:最小平方准则还可以采用另一中表达式来计算:解之,得到:证明从略证明:①-②得到(该式称作关于的斜率方程)(该式称作残差
的离差表达式)于是有:令则有回归系数离差式证明(2)
最小平方估计式具有如下重要特点:
一.回归直线过X和Y的样本均值点,如图2-9所示。
二.估计值的均值等于观测值的均值。
也就是图2-9
三.残差的均值为零。
最小平方估计值的特点§2.4最小平方估计值的性质2.4.1线性特性所谓线性特性是说,估计值分别是样本观测值的线性组合或线性函数。线性特性表明了最小平方估计值与样本观测值的关系。证(1)证(2):同理可证
2.4.2无偏性无偏性是指,参数估计值的期望值分别等于总体参数或真实参数α和β。
证明:假定样本是随机抽取的,则有:因此得到:同理,可证得:且因此应由:2.4.3有效性或最佳性有效性或最佳性是说,在所有的线性无偏估计量中,最小平方估计量具有最小方差特性,因而是最佳的。一.的方差二.的方差三.具有最小方差的证明这种证明可以采用反证法或比较证明法。显然,只有同时成立才有:显然,在di≠0的条件下,必有:同理可证,亦具有最小方差。2.4.4高斯-马尔可夫定理高斯-马尔可夫定理:在满足所有关于随机扰动项基本假定的条件下,最小平方估计值必然是最佳线性无偏估计量。§2.5最小平方估计值的标准误差与区间估计2.5.1的标准误差由特定样本所得到的参数估计值与总体参数究竟是否接近?这就需要用某一种“可靠性指标”来度量是否接近总体真实参数和。在统计上,衡量一个随机变量是否接近其期望值,一般都采用随机变量的标准误差。由最小平方估计值的方差公式容易得到标准误差分别为:关于(2-13)式和(2-14)的证明从略(详细证明参考教材38~39页):残差平方和既可以直接计算,亦可以用下式计算:即:残差平方和=总评方和—回归平方和2.5.2总体真值α和β的区间估计
一.依正态分布进行估计
图2-10P(-z≤x≤z)=1-2×P(x≥z)二.依t-分布估计§2.6最小平方估计值的拟合优度与假设检验2.6.1拟合优度所谓拟合优度,是指样本回归直线对观测数据拟合的优劣程度。反映拟合优度的总体性指标,称作可决系数。总变差=条件变差+随即误差2-16式亦可以表示为:
TSS=RSS+ESS
(a)(b)(c)图2-11一般地,-1≤r≤1或者0≤|r|≤12.6.2假设检验一.的假设检验
假设检验的必要性是由抽样的随机性所决定的,这可以用上一节中的图2-11来说明。假设检验的基本原理可通过图2-12予以说明。图2-12二.假设检验中的两类错误
这两类错误可以标列如下:接受H0(拒绝H1)拒绝H0(接受H1)H0真H1假无误错误Ⅰ:弃真(5%)H0假H1真错误Ⅱ:存伪(95%)无误三.相关系数的假设检验
H0:=0H1:≠0注意,使用相关系数临界值进行假设检验,显著性水平不必除2。§2.7预测区间与弹性估计2.7.1点预测
点预测,也称作条件预测。即点预测通常都假定,Y与X间的关系在预测期间与样本期间保持相同,即所有参数在预测期间不发生变化。这就保证了为预测期间因变量观测值YF的期望E(YF)的无偏估计量。
2.7.2区间预测区间预测,其实质是根据已知的点预测值来为它的期望值作区间估计。这主要分两种情况:一.关于E(YF)的置信区间因为证明参考教材50页因此,根据区间估计的原理,应有:二.关于YF的置信区间
实际中我们往往所关心的只是残差的大小,所以,我们总是想要知道误差究竟会落在一个什么范围内。因此必须知道eF的方差。由于与具有独立性,所以,的方差很容易求得:图2-13这种证明的关键是要理解YF与的独立性。YF取决于未来的经济发展,而则与过去的样本有关。于是根据:得到:2.7.3弹性及弹性估计回归系数小于零的情况请同学们自己讨论。§2.8案例分析建国后我国国民经济某部门若干年中生产资料的购买金额X与当年创造的国民收Y的统计数据如下表:年份194952576265707577Yi245364425314435729952948Xi6.714.132.660.380.2129.2224.7258.5现要求:(1)对二变量进行回归分析;(2)预测当X=300时Y的期望区间。解:(1)可先描出散点图,根据资料可算得:总体参数95%的估计区间为:Yi=264+2.853Xir**=0.962(44.7)(0.332)(r0.01=0.834)[154.5,373.5][2.04,3.67]EX=0.522
所以,预测区间就是:
1120-2.45×72.41≤E(YF)≤1120+2.45×72.41即:942.8≤E(YF)≤1297.2案例分析的EXCEL输出结果:运用EXCEL回归分析工具进行回归分析的步骤:1)输入数据(注意:同一变量序列必须按列输入),利用图表向导画散点图;2)打开“工具”菜单;3)选择“数据分析”;4)选择“回归”命令;5)进行输入输出选择。演示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度智慧城市基础设施施工合同范本4篇
- 二零二五年度窗帘布艺批发合作协议4篇
- 2025年度美团商家智能支付与安全防范合同4篇
- 2025年度美容仪器智能化改造与采购合同4篇
- 二零二五年度电子商务平台用户隐私保护及保密协议3篇
- 2025版个人信用贷款抵押合同范本4篇
- 泰康人寿2025年度保险产品开发合同范本3篇
- 城市居民住宅2025年度水电暖承包合同
- 二零二五年度生物科技流动资金借款合同4篇
- 2025年度城市绿化带植被更新与修复合同范本4篇
- 人教版(2025新版)七年级下册英语:寒假课内预习重点知识默写练习
- 艺术品捐赠协议
- 【公开课】同一直线上二力的合成+课件+2024-2025学年+人教版(2024)初中物理八年级下册+
- 高职组全国职业院校技能大赛(婴幼儿照护赛项)备赛试题库(含答案)
- 2024年公安部直属事业单位招聘笔试参考题库附带答案详解
- NB-T 47013.15-2021 承压设备无损检测 第15部分:相控阵超声检测
- 司炉岗位应急处置卡(燃气)参考
- 10KV供配电工程施工组织设计
- 终端拦截攻略
- 药物外渗处理及预防【病房护士安全警示教育培训课件】--ppt课件
- 纸箱检验标准新
评论
0/150
提交评论