




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多元线性回归及应用经济计量学2016年9月主题答疑第1页,共64页。多元线性回归及应用一、多元线性回归模型的概念二、多元线性回归模型的矩阵表示三、多元线性回归模型的参数估计四、多元线性回归模型检验五、多元线性回归的预测六、多元线性回归模型应用实例目录第2页,共64页。一、多元线性回归模型的概念问题的提出:现实生活中引起被解释变量变化的因素并非仅只一个解释变量,可能有很多个解释变量。例如,产出往往受各种投入要素资本、劳动、技术等的影响;销售额往往受价格和公司对广告费的投入的影响等。所以在一元线性模型的基础上,提出多元线性模型解释变量个数 2第3页,共64页。一、多元线性回归模型的概念一元:一个因
2、素X; 多元:多个因素-X1, X2, , X k 被解释变量还是一个:Y比如: 被解释变量:某商品的需求量Y; 解释变量:该商品的价格P、消费者收入DPI、替代商品价格P2; 未考虑的量:消费偏好等;(一)多元线性回归模型的引入第4页,共64页。(二)多元总体线性回归模型总体模型1、分量式2、总量式称之为变量Y关于变量X1, X2, , Xk的k元总体线性回归模型,Y称为被解释变量,X1, X2, , Xk称为解释变量,k 称为解释变量个数,U 称为随机扰动项,或随机项,或扰动项。一、多元线性回归模型的概念第5页,共64页。(三)多元样本线性回归模型由于经济变量的总体分布大多数是未知的,与一
3、元模型类似,我们只能根据样本观察值进行统计推断,以此来估计多元总体回归方程和总体回归参数。这时导出的模型式为: 称为样本回归参数,n 称为样本容量。称e i 为残差项,它是扰动项 u i 的估计量。 总体模型是理论意义上的,是在做定性研究时所使用的,在做定量分析时具体使用的模型也即可操作的是样本模型。一、多元线性回归模型的概念第6页,共64页。(四)多元样本线性回归模型经典假设1、解释变量X1, X2, ,Xk 是非随机的;2 、 E(u i) = 0 3 、 Var(ui)=2 i=1,2, ,n Cov (ui,uj)= 0 ij,i,j=1,2, ,n 4 、解释变量 X1, X2, ,
4、Xk 线性无关;5 、 uiN(0,2 ) 对上述假设条件的理解基本上与一元线性回归模型类似,因此不再赘述。 假设3 中实际上包含了两条假设,这样写的原因是为了以后的多元线性回归模型经典假设的矩阵表示。 以上假设 1 5 合称为多元线性回归模型的经典假设,也称为基本假设。满足经典假设的模型称为经典多元线性回归模型。一、多元线性回归模型的概念第7页,共64页。(五)多元样本线性回归模型解析表达式一、多元线性回归模型的概念第8页,共64页。二、多元线性回归模型的矩阵表示(一)多元总体线性回归模型的矩阵表示第9页,共64页。(二)多元样本线性回归模型的矩阵表示二、多元线性回归模型的矩阵表示第10页,
5、共64页。1、E(U)= 0 2、E(U U)=2In 即扰动项的方差与协方差矩阵等于2 与单位矩阵之积。3、秩(X)= k,且 k n 。 (三)多元模型经典假设的矩阵表示二、多元线性回归模型的矩阵表示第11页,共64页。三、多元线性回归模型的参数估计 对于多元线性回归模型,最常用的参数估计方法也是普通最小二乘方法(OLS)。其原理与一元线性回归模型的普通最小二乘估计的原理类似,也是使拟合误差平方和为最小。第12页,共64页。(一)矩阵式的普通最小二乘估计量设由极值原理可知最后可得:第13页,共64页。上式为多元线性回归模型矩阵式的普通最小二乘估计量(OLS)。由经典假设可知,X 的秩等于k
6、,而(X/X) 为正定矩阵,于是(X/X)可逆,即满足解释变量线性无关的多元线性回归模型的普通最小二乘估计量 有解。上面导出的是矩阵式的普通最小二乘解(OLS),然而有时我们需要用到其分量方程组形式,即正规方程组,下面我们导出正规方程组。 由极值原理可导出多元线性回归模型的正规方程组: (一)矩阵式的普通最小二乘估计量第14页,共64页。 经典一元线性回归模型的OLS估计量满足线性、无偏及方差最小性,即高斯马尔可夫定理,对于经典多元线性回归模型的普通最小二乘估计量,这一性质仍然存在,换言之,对于满足经典假设的多元线性回归模型,采用OLS方法所得估计量 也满足线性、无偏及方差最小性。 1、线性性
7、由OLS估计可知 令 由解释变量的非随机性可知M为非随机矩阵。则 为M 中的第j+1行与Y 的对应元素乘积之和,即 故 为Yi的线性组合,即线性性成立。(二)普通最小二乘估计量的性质第15页,共64页。2、无偏性由零均值及解释变量为非随机可知:(二)普通最小二乘估计量的性质3、有效性(也称方差最小性)首先导出 的方差与协方差矩阵:由于于是OLS估计量 的方差与协方差矩阵为:第16页,共64页。(二)普通最小二乘估计量的性质即 的方差与协方差矩阵为 与 之积,因此估计量 的方差为 与 的第j个对角线元素之积(j=1,2,k)。 令 则由于总体分布未知,于是 也未知, 令可以证明 为总体方差 的无
8、偏估计量。 最小方差的证明省略。第17页,共64页。(三)偏回归系数的含义多元回归模型中的回归系数称为偏回归系数某解释变量前回归系数的含义是,在其他解释变量保持不变的条件下,该变量变化一个单位,被解释变量将平均发生偏回归系数大小的变动第18页,共64页。(三)偏回归系数的含义YX3= 3度量了在保持 X2 不变的条件下, X3 改变一个单位Y的平均改变量。YX2= 2度量了在保持X3 不变的条件下, X2 改变一个单位Y的平均改变量。第19页,共64页。(四)正规方程由最小二乘法得到的用以估计回归系数的线性方程组,称为正规方程第20页,共64页。(四)正规方程Y 被解释变量观测值 n x 1X
9、 解释变量观测值(含虚拟变量n x (k+1) )XX 设计矩阵(实对称(k+1) x (k+1)矩阵 )XY 正规方程右端 n x 1 回归系数矩阵( (k+1) x 1 ) 高斯乘数矩阵, 设计矩阵的逆 残差向量( n x 1 ) 被解释变量的拟合(预测)向量 n x 1正规方程的结构第21页,共64页。(五)、多元回归模型参数估计中样本容量样本是一个重要的实际问题,模型依赖于实际样本。获取样本需要成本,企图通过样本容量的确定减轻收集数据的困难。最小样本容量:满足基本要求的样本容量第22页,共64页。(五)、多元回归模型参数估计中样本容量最小样本容量 n k+1:(XX)-1存在| XX
10、| 0 XX 为k+1阶的满秩阵R(AB) min(R(A),R(B)R(X) k+1因此,必须有nk+1一般经验认为:n 30或者n 3(k+1)才能满足模型估计的基本要求。n 3(k+1)时,t分布才稳定,检验才较为有效满足基本要求的样本容量:第23页,共64页。四、多元线性回归模型的检验(一)估计量的显著性检验及置信区间 对于多元线性回归模型的参数估计量,其在统计上是否显著,也需要作显著性检验,即t-显著性检验,其检验方法与一元线性模型的参数显著性检验基本相同,所不同的是现在要对所有解释变量前的参数进行显著性检验。与一元线性回归模型的原理完全一样可导出: 以 95% 的可能性落在区间(j
11、=1,2,k) 上,称该区间为 的置信区间,或称区间估计,置信度为95%第24页,共64页。(一)估计量的显著性检验及置信区间 很显然,置信区间越小则可信度越高,而置信区间的半径中临界值变化不大,因此估计量的可信度主要取决于其标准差的估计量,标准差越小,则可信度越高,标准差越大,则可信度越低。这与 t - 检验的显著性是等价的,从T 统计量的计算可知,标准差越小,则t - 统计量的绝对值越大,即t -值通过临界值的可能性也大,从而t - 检验显著的可能性也大。另一方面,从标准差的计算公式可知,标准差的大小主要取决于总体方差估计量的大小及 对角线上的元素 ,而 与解释变量的线性相关的程度有关,当
12、总体方差估计量较大以及解释变量的线性相关程度较高时,参数估计量的标准差的估计量也就较大,这时会影响参数的显著性。 第25页,共64页。(二)回归方程的显著性检验1、回归参数的显著性检验(t检验)第26页,共64页。(二)回归方程的显著性检验t-检验的具体过程:第27页,共64页。(二)回归方程的显著性检验2、回归参数的显著性检验(F检验) 回归系数的t检验,检验了各个解释变量Xj单独对应变量Y是否显著;我们还需要检验:所有解释变量联合在一起,是否对应变量Y也显著?这即是下面所要进行的F-检验。第28页,共64页。(二)回归方程的显著性检验2、回归参数的显著性检验(F检验)方差分析表以下用表格的
13、形式列出平方和、自由度、方差:平方和来源平方和自由度均方和源于回归K-1源于残差n-k总平方和n-1第29页,共64页。(二)回归方程的显著性检验2、F检验(单侧检验)的具体过程第30页,共64页。(二)回归方程的显著性检验 F-统计量的计算公式为: 在一般计量软件的参数估计输出结果中均有F-统计量的值,不必用手工计算。当F-值大于临界值时 ,回归方程是显著的,否则,为不显著的。第31页,共64页。(二)回归方程的显著性检验 对于一元线性回归模型,回归参数的显著性与回归方程的显著性是等价的,而对于多元线性回归模型,单个回归参数是显著的并不等于整个回归方程是显著的,因此还要作回归方程的显著性检验
14、。 回归方程的显著性检验也称为F 检验,也是一种假设检验。 F 检验是检验所有解释变量合起来对被解释变量线性影响的显著性,单个解释变量对被解释变量的线性影响是显著的,合起来之后即线性组合对被解释变量的影响未必是显著的,这相当于我们通常所说的整体效率。因此对于多元模型,回归方程的显著性检验与回归参数显著性检验是不能相互替代的, 即使对回归方程中每个参数分别进行的t - 检验都不显著,F 检验也可能是显著的。比如当解释变量之间高度相关时就可能出现这种情况,其结果可能是参数的标准差大而t值小,但整个模型仍然能对数据拟合得很好。 第32页,共64页。(三)拟合优度检验及修正的R2值 在一元线性回归模型
15、中,我们用样本决定系数来衡量回归方程对样本观察值的拟合程度,即拟合优度检验,这一方法对多元线性回归模型仍然适用。 与一元线性模型类似,可以证明: TSS = ESS + RSS 即样本总离差可以分解为回归总离差与残差平方和之和。第33页,共64页。令:称R2为多元线性回归模型的样本决定系数,也称为样本可决系数。R2表示被多元回归方程“解释”的离差占总离差的比重。显然由R2的定义可以看出,当R2越接近于1时,说明ESS 越接近于TSS,即残差平方和越小,也就是说回归方程对样本观察值拟合的越好,因此,我们以R2接近于1的程度来衡量样本回归方程对样本观察值的拟合的优度,即拟合优度检验,用来说明解释变
16、量与被解释变量之间的线性回归关系是否有效。(三)拟合优度检验及修正的R2值第34页,共64页。 然而,在使用R2时也存在一些问题,比如,R2与模型中解释变量的个数有关。在回归方程中加入更多的解释变量会使R2值增大(增加新的解释变量不会改变TSS,但是可以增加ESS),因此,给人一种误解,为提高拟合优度,解释变量越多越好,但事实上并非如此。用R2度量拟合优度的问题在于R2只涉及Y的总离差中被解释的部分和未被解释的部分,没有考虑自由度的个数。为了消除拟合优度对模型中解释变量个数的依赖性,我们定义修正的R2值,记作 :(三)拟合优度检验及修正的R2值第35页,共64页。可以推得: 1 2 可能为负值
17、; 3. 当模型的自由度(n-k)较大时,R2与 比较接近。(三)拟合优度检验及修正的R2值由R2及 的定义可知:第36页,共64页。 比R2更适合于衡量拟合优度。当回归模型中加入新的解释变量时,R2肯定会增加,而 可能增加也可能减少。比如,一个样本容量为25的模型,其R2为0.8,但这个结果只是在模型中包含了17个解释变量时才得到。而该模型的 仅为0.4,这一例子充分说明了R2作为衡量拟合优度指标的局限性。在实际应用中,由于大多数情况下, 与R2之间的差异不太大,故使用R2作为衡量拟合优度的情况也常见。(三)拟合优度检验及修正的R2值第37页,共64页。拟合优度检验与F 检验是有联系的。可以
18、证明:(三)拟合优度检验及修正的R2值由此可知R2越接近于1,则F值越大,反之,若R2越接近于0,则F值越小。因此,一般来说,拟合优度较高,则F检验可以通过,拟合优度较差,则F检验通不过。但是,拟合优度检验与F检验还是有区别的,有例子表明,即使拟合优度只有0.65,F检验也是显著的。因此,虽然二者有联系,但是也不能相互替代。F检验的优越性在于它有临界值,可以断定显著与否,而拟合优度的好处在于它能说明拟合的程度,它的不足之处在于没有拟合好与坏的明确标准,一般来说,拟合的好坏视具体问题而定,但是,一个好的模型首先拟合优度要求比较高,从经验上讲,R20.9。不过拟合优度高并不能断定模型一定可取,较高
19、的拟合优度是一个好模型的必要条件,但不是充分条件。第38页,共64页。(三)拟合优度检验及修正的R2值Eviews软件输出结果中R 2及校正R 2第39页,共64页。(四)各种检验的关系、经济意义检验和其他检验的关系联系: 判断一个回归模型是否正确,首先要看模型是否具有合理的经济意义,其次才是统计检验。第40页,共64页。(四)各种检验的关系2、拟合优度和F检验的关系:(1)都是对回归方程的显著性检验;(2)都是把总平方和分解,以构成统计量进行检验;(3)两者同增同减,具有一致性。区别:(1)F检验中使用的统计量有精确的分布,而拟合优度检验没有;(2)对是否通过检验,判定系数(校正判定系数)只
20、能给出一个模糊的推测;而F检验可以在给定显著水平下,给出统计上的严格结论;第41页,共64页。(四)各种检验的关系、 F检验和t检验的关系:在一元的情形,两者是一致的,等价的。对单个解释变量显著性进行t检验,也就检验了解释变量的整体显著性(F检验);并且可以证明:Ft2 (所以在一元情形,只需要进行一种检验)多元中,不存在以上关系。第42页,共64页。(五)回归模型假设检验的步骤查看拟合优度,进行F检验,从整体上判断回归方程是否成立,如果F检验通不过,无须进行下一步;否则进行下一步查看各个变量的t值及其相应的概率,进行t检验,如果相应的概率小于给定的显著水平,该自变量的系数显著地不为0,该自变
21、量对因变量作用显著;否则系数与0无显著差异(本质上=0),该自变量对因变量无显著的作用,应从方程中删去,重新估计方程。但是,一次只能将最不显著(相应概率最大)的删除。每次删除一个,直至全部显著。第43页,共64页。 与一元模型的预测问题相类似,多元模型的预测也分为条件预测与无条件预测两类,下面介绍的是条件预测,条件预测又分为点预测与区间预测。五、多元线性回归模型的预测第44页,共64页。 设多元线性回归模型的样本回归方程为: 给定解释变量样本以外的观察值X2f, X3f , , Xkf, 令 利用上述回归方程求得被解释变量的预测值:(一)点预测 就是Yf的点预测值,同时也是Yf的均值 E(Yf
22、|Xf)的预测值。就是Yf的点预测值,同时也是Yf的均值 E(Yf|Xf)的预测值。第45页,共64页。由于回归方程代表的是被解释变量的一个主要部分,不是全部,另一部分用扰动项来代表,因此,点预测值 与其真实值Yf之间有误差存在。(二)区间预测令称ef 为预测误差,ef 为随机变量。 由于扰动项为零均值,可以证明 及第46页,共64页。与参数估计量的置信区间的推导过程相类似,可以得出置信度为1-= 95% 的Y0的置信区间为: (二)区间预测预测区间越小,预测精度就越高,因此预测区间越小越好。怎样才能缩小预测区间呢?可以从以下三方面考虑: (1) 增大样本容量n 。在同样的置信水平下,n越大,
23、则从t 分布表中查得的自由度为nk的临界值T/2就越小;同时,增大样本容量,在一般情况下可使减小,因为式中分母的增大是肯定的,但分子不一定增大。第47页,共64页。(2)提高模型的拟合优度,以减小残差平方和 。这一条是提高预测精度的主要方法。(3)减少解释变量之间的线性相关程度。由于解释变量之间的线性相关程度越高, 的取值就越小,(当解释变量完全线性相关时,该行列式取值为0)于是 中元素取值增大,从而增大了预测误差。(二)区间预测第48页,共64页。 例1、 我国居民消费函数的实证分析。 众所周知,从城乡结构上比较,我国居民人均收入的基础水平及其发展速度都存在着很大的差异。按现价计算,1978
24、年城镇居民的可支配收入为343.4元,而同期农村居民的家庭人均纯收入为133.6元,同期我国居民的人均消费水平为184元,1999年此三项指标分别为9421.6元、2936.4元和4552元,显然无论是改革开放的初期还是二十一世纪的今天,农村居民的收入水平与城镇一直存在着很大的差异。 由绝对收入的消费理论假设可知,影响居民消费水平的主要因素为收入水平,下面分析农村与城镇居民收入水平对居民消费水平的影响程度。 选取我国居民年人均消费水平为被解释变量(Y),选取农村居民家庭年人均纯收入(X1)及城镇居民家庭人均可支配收入(X2)为解释变量。依据绝对收入消费理论以及对样本数据的研究,选取线性回归模型
25、:六、多元线性回归模型应用实例第49页,共64页。采用OLS方法,利用Eviews估计回归,所用命令为: CREATE A 1985 2005 DATA Y X1 X2 LS Y C X1 X2 得回归方程(整理之后):六、多元线性回归模型应用实例第50页,共64页。将被解释变量的样本数据与模拟值作图对比(下图)。 作图命令为: FIT YY PLOT Y YY其中,虚线表示拟合值,实线表示样本实际值。 六、多元线性回归模型应用实例第51页,共64页。 模型结果评价:由回归方程可知,城镇居民可支配收入每增加100元(1985年不变价),居民消费水平可增加24.9元(1985年不变价),而农村居民纯收入每增加100元(1985年不变价),居民消费水平可增加89.5元(1985年不变价),显然,农村居民收入水平的提高对全国居民消费水平提高的贡献大于城镇居民。这主要由于农村居民的比重大。 六、多元线性回归模型应用实例第52页,共64页。例:新股发行抑价的实证研究六、多元线性回归模型应用实例第53页,共64页。六、多元线性回归模型应用实例第54页,共64页。六、多元线性回归模型应用实例例3:多元线性回归模型在房地产估价中的应用首先,分别绘制因变量(房产销售价格y)与每个自变量(地产估
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 七年级地理上册 2.4 海陆变迁教学设计2 (新版)湘教版
- 2017-2018学年北师大版七年级生物下册8.2 食物的消化和营养物质的吸收教学设计 (2份打包)
- 任务导入迈腾车辆启动困难运行后发动机故障指示灯点亮仪表发动
- 任务二船舶对大气污染处理方法和装置要求的认知课件
- 金地海景时代公寓项目分析
- 任务利用指针引用数组元素指向数组元素的指针
- 清单01 (3-5章)【考点清单】-2023-2024学年七年级地理上学期期末考点大串讲(商务星球版)
- 2025电子产品买卖合同范本
- 1 读懂彼此的心2023-2024学年五年级下册道德与法治同步教学设计(统编版)
- 期中卷 【期中测试·达标卷】-2023-2024学年八年级地理下册单元精讲·速记·巧练(湘教版)(解析版)
- 文言文双文本阅读:赵襄子被围晋阳(附答案解析与译文)
- 《中医食疗药膳》课件
- 银行业审计服务方案
- 甲亢完整课件完整版
- 2025年湖北省高考数学模拟试卷(附答案解析)
- 电商平台合规管理制度分析
- 数智化转型背景下国企财务管理体系的优化分析
- 四年级语文下册 第16课《海上日出》同步训练题(含答案)(部编版)
- 汽车故障诊断技术教案(发动机部分)
- 《始得西山宴游记》名师课件1
- 2023技规选择题库(内附答案)
评论
0/150
提交评论