第三章多元回归模型_第1页
第三章多元回归模型_第2页
第三章多元回归模型_第3页
第三章多元回归模型_第4页
第三章多元回归模型_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 引子引子:中国汽车的保有量将会达到中国汽车的保有量将会达到1.41.4亿辆吗亿辆吗 ? ? 中国汽车工业协会发布中国汽车工业协会发布:年中国汽车工业迅猛发展,年中国汽车工业迅猛发展,已成为世界第一汽车生产和消费国。已成为世界第一汽车生产和消费国。 中国中国交通部副部长交通部副部长2004年年9月月2日日预测预测 :“2020年年,中国的,中国的民用汽车保有量将比民用汽车保有量将比2003年增长倍,年增长倍,达到达到1.4亿辆左右亿辆左右”。 工信部装备工业司副司长王富昌工信部装备工业司副司长王富昌2010年年9月月5日指出,预日指出,预计到计到2020年中国汽车保有量将超过年中国汽车保有量

2、将超过2亿辆亿辆。 公安部交管局近日公布的数据显示,公安部交管局近日公布的数据显示,截至截至2011年年8月底,月底,全国汽车保有量首次突破全国汽车保有量首次突破1亿辆。亿辆。 是什么因素导致中国汽车数量快速增长是什么因素导致中国汽车数量快速增长? ? 显然显然, ,影响中国汽车行业发展的因素并不单一,经济增长、影响中国汽车行业发展的因素并不单一,经济增长、居民收入、消费趋势、市场行情、业界心态、能源价格、道路居民收入、消费趋势、市场行情、业界心态、能源价格、道路发展、内外环境,都会使中国汽车行业面临机遇和挑战。发展、内外环境,都会使中国汽车行业面临机遇和挑战。2 很明显,很明显,分析中国汽车

3、行业未来的趋势,分析中国汽车行业未来的趋势,只用一个解只用一个解释变量已经很难分析汽车产业的实际发展释变量已经很难分析汽车产业的实际发展, , 还需要去寻求还需要去寻求有更有更多个解释变量情况的回归分析方法多个解释变量情况的回归分析方法。 而且而且, ,在汽车产业发展问题上在汽车产业发展问题上, ,多种因素同时在发挥作多种因素同时在发挥作用用 , ,要分析其中某一个因素的影响作用要分析其中某一个因素的影响作用, ,也必须控制其他也必须控制其他因素不变才行因素不变才行。 显然,简单线性回归模型不能解决这类多因素问题的显然,简单线性回归模型不能解决这类多因素问题的分析。需要把简单线性回归的方法拓展

4、到多个解释变量的分析。需要把简单线性回归的方法拓展到多个解释变量的情况。情况。 怎样分析多种因素对汽车行业的影响呢?怎样分析多种因素对汽车行业的影响呢?3 第三章第三章 多元线性回归模型多元线性回归模型 本章讨论本章讨论: 如何将简单线性回归的的研究方式推广到多元的如何将简单线性回归的的研究方式推广到多元的情况情况 多元线性回归模型多元线性回归模型 多元多元线性回归参数的估计线性回归参数的估计 多元线性多元线性回归模型的检验回归模型的检验 多元线性多元线性回归预测回归预测4 第一节第一节 多元线性回归模型及古典假定多元线性回归模型及古典假定 一、多元线性回归模型的意义一、多元线性回归模型的意义

5、 一般形式:对于有一般形式:对于有K-1个解释变量的线性回归模型个解释变量的线性回归模型 注意:注意:模型中的模型中的 (j=1,2,-k)是是偏回归系数偏回归系数 样本容量为样本容量为n 偏回归系数偏回归系数: 控制其它解释量不变的控制其它解释量不变的条件条件下,第下,第j j个解释变量的个解释变量的单位变动对被解释变量平均值的影响,即对单位变动对被解释变量平均值的影响,即对Y Y平均值平均值“直接直接”或或“净净”的影响。的影响。 ikikiiiuXXXY33221j(1,2,)in5(可视为有可视为有“变量变量” )11iX 对偏回归系数的理解对偏回归系数的理解怎样理解多元线性回归中的参

6、数是偏回归系数呢怎样理解多元线性回归中的参数是偏回归系数呢?例如:例如:若若 与与 相关,并且相关,并且可证明可证明(证明见古加拉蒂证明见古加拉蒂计量经济学计量经济学第三版附录第三版附录7A.5) 结论结论: 虽然虽然 和和 都是都是 的变动对的变动对Y平均值的影响,平均值的影响,但只要但只要 , 与与 是有区别的。是有区别的。 不仅包括不仅包括 对对Y平均值的平均值的“直接直接”影响,还包括由于影响,还包括由于 的变动对的变动对Y平平均值的均值的“间接间接”影响。影响。 12233iiiiYXXu323222iiiXbb Xu1221iiiYXu23223()Eb032b22对比232222

7、23()iiixuuxb(误差项)(误差项)22iX3iX6三个回归之间有什么关系呢三个回归之间有什么关系呢?(解释变量可分为控制变量和关注变量解释变量可分为控制变量和关注变量)222iX2iX3iX多元线性回归中的多元线性回归中的“线性线性”指对各个回归系数而言是指对各个回归系数而言是“线性线性”的,对变量则可的,对变量则可以是线性的,也可以是非线性的以是线性的,也可以是非线性的例如:生产函数例如:生产函数取对数取对数这也是多元线性回归模型,只是这时变量为这也是多元线性回归模型,只是这时变量为lnY、lnL、lnKuKALYuKLAYlnlnlnlnln7 多元总体回归函数多元总体回归函数

8、条件期望表现形式:条件期望表现形式:将将Y Y的总体条件期望表示为多个解释变量的函数,如的总体条件期望表示为多个解释变量的函数,如: :注意:这时注意:这时Y总体条件期望的轨迹是总体条件期望的轨迹是K维空间的一条线维空间的一条线个别值表现形式:个别值表现形式:引入随机扰动项引入随机扰动项或表示为或表示为 kikiikiiiiXXXXXXYE3322132),(ikikiiiuXXXY33221(1,2,)in(1,2,)in23(,)iiiiikiuYE Y XXX8 多元样本回归函数多元样本回归函数 Y 的样本条件均值可表示为多个解释变量的函数的样本条件均值可表示为多个解释变量的函数 或回归

9、剩余(残差):或回归剩余(残差): 其中其中 , 由于有由于有n组样本观测值,而且都满足这样组样本观测值,而且都满足这样 的关系的关系, 象这样的方程事实上有象这样的方程事实上有n个个. iiieYY12323ikiikiYXXX12323kiiikiiYXXXe1,2,in9条件均值形式条件均值形式:个别值形式个别值形式: 二、多元线性回归模型的矩阵表示二、多元线性回归模型的矩阵表示 多元线性回归模型的多元线性回归模型的n组样本观测值,可表示为组样本观测值,可表示为 用矩阵表示用矩阵表示 1131321211uXXXYkk2232322212uXXXYkknknknnnuXXXY33221n

10、kknnkknuuuXXXXXXYYY21212222121211111n1n1kknXYu1012233iiikkiiYXXXu(1,2,)in解释变数据矩阵解释变数据矩阵 总体回归函数总体回归函数 或或样本回归函数样本回归函数 或或 其中:其中: 都是有都是有n个元素的列向量个元素的列向量 是有是有k 个个 元素的列向量元素的列向量 ( k = 解释变量个数解释变量个数 + 1 ) 是第一列为是第一列为1的的nk阶阶解释变量解释变量数据矩阵数据矩阵 , (截距项可视为解释变量总是取值为截距项可视为解释变量总是取值为1) ,Y = X+ u(E Y)= XY,Y,u,e矩阵表示方式Y = X

11、Y = X+eX11 三、多元线性回归中的基本假定三、多元线性回归中的基本假定 假定假定1:零均值假定零均值假定 或 假定假定2和假定和假定3:同方差和无自相关假定同方差和无自相关假定(球型扰动球型扰动): 或或 假定假定4:随机扰动项与解释变量不相关随机扰动项与解释变量不相关 ( )0iE u)()(),(jijjiijiuuEEuuEuuEuuCov2(i=j)(ij)02( ,)()ijCov u uEuuI122)(iiXuVar( ,)()0ijijCov u uE uu或或2222000000I(,)0(2,3, )kiiCov Xukk( )Eu0假定假定5: 无多重共线性假定无

12、多重共线性假定 (多元回归中增加的多元回归中增加的) 假定各解释变量之间不存在线性关系,或各个解释变量假定各解释变量之间不存在线性关系,或各个解释变量观测值之间线性无关。观测值之间线性无关。或解释变量观测值矩阵或解释变量观测值矩阵X的秩为的秩为K(注意注意X为为n行K列列)。 Ran(X)= k Rak(XX)=k 即即 (XX) 可逆可逆 假定假定6:正态性假定正态性假定 或), 0(2Nui2( ,)Nu0I132112222111kknknXXXXXXX 第二节第二节 多元线性回归模型的估计多元线性回归模型的估计一、普通最小二乘法一、普通最小二乘法(OLSOLS)原则:原则:寻求寻求剩余

13、平方和最小的参数估计式剩余平方和最小的参数估计式 充要条件充要条件:求偏导,并令其为求偏导,并令其为0即即 2212323min:()kiiiikieYXXX2()0ije122332()0iiikikiYXXX2122332()0iiiikikiXYXXX122332()0kiiiikikiXYXXX22min:()iiieYY20i iX e 0ki iX e 0ie 14整理后的正规方程组表示为整理后的正规方程组表示为解方程组可得参数的最小二乘估计解方程组可得参数的最小二乘估计:正规方程也可写为正规方程也可写为矩阵形式矩阵形式: :122ikkiinXXY2122222iikikiiiX

14、XX XX Y2122kiikikkikiiXX XXX Y-12k、 、X X = X Y多元回归的正规方程多元回归的正规方程(解释变量多时估计量已经难以用代数式表示解释变量多时估计量已经难以用代数式表示)15Y = X + eXY = XX + XeXe = 0左乘X样本回归函数样本回归函数由最小二乘由最小二乘 OLS OLS估计式估计式 由正规方程由正规方程 多元回归中多元回归中 参数的最小二乘参数的最小二乘估计量估计量为为: 例如只有两个解释变量时:例如只有两个解释变量时: 的代数式可用离差简化地表示为:的代数式可用离差简化地表示为:注意:注意: 为为X、Y的离差的离差23123YXX

15、22332322222323()()()()()()()iiiiiiiiiiiy xxy xx xxxx x23222332222323()()()()()()()iiiiiiiiiiiy xxy xx xxxx xX X = X Yx、y-1 = (XX) XY对比对比简单线性回归中简单线性回归中12YX22iiix yx1612233iiiiiYXXu(),k k无多重共线性是满秩矩阵 其逆存在XX 二、二、 OLSOLS估计量的统计性质估计量的统计性质 1、 线性线性特征 是是Y的线性函数,因的线性函数,因 是非随机或取固定是非随机或取固定值的矩阵值的矩阵 2、 无偏无偏特性 (证明见教

16、材证明见教材P101附录附录3.1) 3、 最小方差最小方差特性 在在 所有的线性无偏估计中,所有的线性无偏估计中,OLS估计估计 具有最小方差具有最小方差 (证明见教材证明见教材P101或附录或附录3.2) 结论:结论:在古典假定下,多元线性回归的在古典假定下,多元线性回归的OLS估计量是估计量是 最佳线性无偏估计量(最佳线性无偏估计量(BLUE)()KKEKK-1(X X) X-1 = (X X) X Y17三、三、 OLSOLS估计的分布性质估计的分布性质基本思想基本思想: 是随机变量,必须确定其分布性质才可能进是随机变量,必须确定其分布性质才可能进行区间估计和假设检验行区间估计和假设检

17、验 是服从正态分布的随机变量,决定了是服从正态分布的随机变量,决定了Y也是也是服从正态分布的随机变量服从正态分布的随机变量 是是Y的线性函数,决定了的线性函数,决定了 也是服从正态也是服从正态分布的随机变量分布的随机变量iu18 的期望的期望 (由无偏性由无偏性) 的方差和标准误差的方差和标准误差: 可以证明可以证明 的方差的方差协方差矩阵为协方差矩阵为(证明见(证明见p81) (其中(其中 是矩阵是矩阵 中第中第 j 行第行第 j 列的元素)列的元素) 所以所以 (j=1,2,-k) ( )E = 2( )Var -Cov1()XX2()jjjVarc()jjjSEcjjc1()X X),(

18、2jjjjcN的期望与方差的期望与方差19这里的这里的111212122212()kkkkkkccccccccc1X X 四、四、 随机扰动项方差随机扰动项方差 的估计的估计 一般未知,可证明多元回归中一般未知,可证明多元回归中 的无偏估计为的无偏估计为:(证明见证明见P103附录附录3.3) 已知时,将已知时,将 作标准化变换:作标准化变换: (0,1)()jjjjjjjjzNSEc22ienk22220回顾简单线性回归中回顾简单线性回归中222nei2( (注意注意: :红色字体是与一元回归不同的部分红色字体是与一元回归不同的部分) ) 未知时未知时 的标准化变换的标准化变换因因 是未知的

19、,是未知的, 可用可用 代替代替 去估计参数的标去估计参数的标准误差准误差: 当为当为大样本时大样本时,用估计的参数标准误差对,用估计的参数标准误差对 作标作标准化变换,所得准化变换,所得 Z 统计量仍可视为服从统计量仍可视为服从正态分布正态分布当为当为小样本时小样本时,用估计的参数标准误差对,用估计的参数标准误差对 作标准作标准化变换,所得的化变换,所得的 t 统计量服从统计量服从 t 分布分布:2222* ()()jjjjjjjttSnkcE21( (注意注意: :红色字体是与一元回归不同的部分红色字体是与一元回归不同的部分) )五、回归系数的区间估计五、回归系数的区间估计 由于由于给定给

20、定 ,查,查t分布表的自由度为分布表的自由度为 n-k 的临界值的临界值2()2()()()1jjjjjn kn kPtSEtSE )1(kj* ()()jjjjjjjttSnkcE2()tnk*22()()1()jjjPtttSnEnkk 222()2()1jn kkjjjjjjncPctt 即即( (注意注意: :红色字体是与一元回归不同的部分红色字体是与一元回归不同的部分) )第三节第三节 多元线性回归模型的检验多元线性回归模型的检验一、多元回归的拟合优度检验 多重可决系数多重可决系数:在多元回归模型中,由各个解释变量联:在多元回归模型中,由各个解释变量联 合起来解释了的合起来解释了的Y

21、的变差,在的变差,在Y的总变差中占的比重,的总变差中占的比重, 用用 表示表示 与简单线性回归中可决系数与简单线性回归中可决系数 的区别只是的区别只是 不同不同多元回归中多元回归中多重可决系数可表示为多重可决系数可表示为 ( (注意注意: :红色字体是与一元回归不同的部分红色字体是与一元回归不同的部分) )2RiY2R22222()1()iiiiYTSYeESSRSSRTSSYYTSSSy 12233iiikkiYXXX23 多重可决系数的特点多重可决系数的特点 可用离差的代数式表达为可用离差的代数式表达为特点特点:分子各项为正数分子各项为正数,多重可决系数是模型中解释变量,多重可决系数是模型

22、中解释变量 个数的个数的不减函数不减函数,这给对比不同模型的多重可决系,这给对比不同模型的多重可决系 数带来缺陷,所以需要修正。数带来缺陷,所以需要修正。 22()iTSSYYnYY Y223322iiiikkiiix yx yx yRy22()iESSYYnY X Y22222()()iiYYESSnYRTSSYYnY X YY Y24修正的可决系数修正的可决系数思想:思想:可决系数只涉及变差,没有考虑可决系数只涉及变差,没有考虑自由度自由度。 如果用自由度去校正所计算的变差,可纠如果用自由度去校正所计算的变差,可纠 正解释变量个数不同引起的对比困难。正解释变量个数不同引起的对比困难。回顾回

23、顾: 自由度自由度:统计量的自由度指可自由变化的样本观统计量的自由度指可自由变化的样本观 测值个数,它等于所用样本观测值的个测值个数,它等于所用样本观测值的个 数减去对观测值的约束个数数减去对观测值的约束个数。25可决系数的修正方法可决系数的修正方法 总变差总变差 TSS 自由度为自由度为n-1 解释了的变差解释了的变差 ESS 自由度为自由度为k-1 剩余平方和剩余平方和 RSS 自由度为自由度为n-k 修正的可决系数为修正的可决系数为 22)(iiyYY2()iYY22()iiiYYe22222()111(1)iiiienkenRynnky 262221iieRy 对比未修正时为对比未修正

24、时为:修正的可决系数修正的可决系数 与可决系数与可决系数 的关系的关系 容易导出:容易导出: 注意:注意: 可决系数可决系数 必定非负,但所计算的修正可决系必定非负,但所计算的修正可决系数数 有可能出现负值有可能出现负值解决办法:解决办法:若计算的若计算的 ,这时规定,这时规定 取值为取值为0 knnRR1)1 (1222R2R2R2R2R02R27二、回归方程的显著性检验二、回归方程的显著性检验(F检验)检验)基本思想:基本思想: 在多元回归中包含的多个解释变量与被解释变量是否有在多元回归中包含的多个解释变量与被解释变量是否有显著关系呢?但为了说明所有解释变量联合起来对被解释显著关系呢?但为

25、了说明所有解释变量联合起来对被解释变量影响的显著性变量影响的显著性, , 或整个方程总的联合显著性,需要对方或整个方程总的联合显著性,需要对方程的总显著性在方差分析的基础上进行程的总显著性在方差分析的基础上进行F F检验。检验。1、方差分析在讨论可决系数时已经分析了被解释变量总变差在讨论可决系数时已经分析了被解释变量总变差TSS的分解:的分解:并且注意到并且注意到: Y的样本方差的样本方差= 总变差总变差/自由度自由度 即即 显然,显然,Y的样本方差也可分解为两部分,可用方差分析表分解的样本方差也可分解为两部分,可用方差分析表分解22()11iiYYYTSSnn28222()()()iiiiY

26、YYYYYTSS=ESS+RSS 即即总变差总变差 TSS= 自由度自由度 n1 模型解释了的变差模型解释了的变差 ESS= 自由度自由度 k1剩余变差剩余变差 RSS= 自由度自由度 nk 变差来源变差来源 平平 方方 和和 自由度自由度 样本方差样本方差归于回归模型归于回归模型 ESS= k-1归于剩余归于剩余 RSS= n-k总变差总变差 TSS= n-1基本思想基本思想: 如果如果多个解释变量联合起来对被解释变量的影响不显著多个解释变量联合起来对被解释变量的影响不显著, , “归于回归于回归的方差归的方差”应该比应该比“归于剩余的方差归于剩余的方差”显著地小(即这应是大概率事件)。显著

27、地小(即这应是大概率事件)。2()iYY2()iiYY2()iYY2)(YYi2()iYY2()iiYY方差分析表2() /(1)iYYk2() /()iiYYnk2() /(1)iYYn292、F检验原假设原假设:(所有所有解释变量联合起来对被解释变量的影响不显著)解释变量联合起来对被解释变量的影响不显著)备择假设备择假设: 不全为不全为0建立统计量建立统计量(可以证明可以证明): 给定显著性水平给定显著性水平 ,查,查F分布表中自由度为分布表中自由度为 k-1 和和 n-k 的的 临界值临界值 ,并通过样本观测值计算,并通过样本观测值计算F值值检验思想检验思想: 如果原假设成立,如果原假设

28、成立, F值较小应是大概率事件值较小应是大概率事件 如果原假设成立,如果原假设成立, F值较大应是小概率事件值较大应是小概率事件0:320kH), 2 , 1(:1kjHj), 1(knkF22() /(11)()() /(,1)()iiiYYkES S kFF knRSS nkYYnkk300H(在原假设在原假设 成立的条件下成立的条件下, F值较小应是大概率事件值较小应是大概率事件)F检验方法如果计算的如果计算的F值大于临界值值大于临界值 (小概率事件发生小概率事件发生) 则拒绝则拒绝 ,说明回归模型有显著,说明回归模型有显著 意义,即所有解释变量联合起来对意义,即所有解释变量联合起来对Y

29、确有显著影响。确有显著影响。如果计算的如果计算的F值小于临界值值小于临界值 (大概率事件发生大概率事件发生) 则不拒绝则不拒绝 ,说明回归模型没有显,说明回归模型没有显 著意义,即所有解释变量联合起来对著意义,即所有解释变量联合起来对Y没有显著影响。没有显著影响。也可以用也可以用p值判断值判断F检验的显著性检验的显著性:当给出当给出F统计量对应的统计量对应的P值值时,可将时,可将P值与显著性水平值与显著性水平 比较,判断比较,判断F检验是否显著。检验是否显著。0:320kH0:320kH), 1(knkF), 1(knkF31修正的可决系数与修正的可决系数与F F检验的关系检验的关系由方差分析

30、可以看出,由方差分析可以看出, F F统计量与修正的多重可决系数都建统计量与修正的多重可决系数都建立在对被解释变量变差分解的基础上,而且都与自由度有立在对被解释变量变差分解的基础上,而且都与自由度有关。关。二者关系:二者关系:可证明可证明 F F与与 同方向变化,同方向变化,F F检验等价于对检验等价于对 的显著性检验的显著性检验。)()1 () 1(22knRkRF211(1)nRnkkF 2R20R 32三、各回归系数的假设检验三、各回归系数的假设检验(t t 检验)检验)注意注意: : 在一元回归中在一元回归中F F检验与检验与 t t 检验等价检验等价, , 且且 (见教材见教材P88

31、证明证明)但在多元回归中,但在多元回归中,F检验显著,不一定每个解释变量都对检验显著,不一定每个解释变量都对Y有显著影响。还需要分别检验有显著影响。还需要分别检验当其他解释变量保持不变当其他解释变量保持不变时时,各个解释变量,各个解释变量X对被解释变量对被解释变量Y是否有显著影响。是否有显著影响。 方法:方法: 原假设原假设 (j=1,2,k) 备择假设备择假设 统计量统计量t为:为: 0:0jH0:1jH2tF * ()()jjjjjjtt nkSEc33( (注意注意: :红色字体是与一元回归不同的部分红色字体是与一元回归不同的部分) )给定显著性水平给定显著性水平 ,查,查t t分布表的

32、临界值为分布表的临界值为如果如果 ( (大概率事件发生大概率事件发生) ) 就不拒绝就不拒绝 ,而拒绝,而拒绝 即认为即认为 所对应的解释变量所对应的解释变量 对被解释变量对被解释变量Y Y的影响不显的影响不显著。著。 如果如果 ( (小概率事件发生小概率事件发生) ) 就拒绝就拒绝 而不拒绝而不拒绝 即认为即认为 所对应的解释变量所对应的解释变量 对被解释变量对被解释变量Y Y的影响是的影响是 显著的。显著的。讨论:讨论:在多元回归中,可以作在多元回归中,可以作F F检验,也可以分别对每个回检验,也可以分别对每个回归系数逐个地进行归系数逐个地进行 t t 检验。检验。 F F 检验与检验与t

33、 t检验的关系是什么?检验的关系是什么?2()tnk*22()()ttnknkt0:0jH0:1jHjjX*22()()ttnkttnk 或0:1jHjjX对各回归系数假设检验的作法0:0jH3435第四节第四节 多元线性回归模型的预测多元线性回归模型的预测 一、被解释变量平均值预测一、被解释变量平均值预测1. Y Y平均值的点预测平均值的点预测 方法:方法:将解释变量的预测值代入估计的方程:将解释变量的预测值代入估计的方程: 多元回归时:多元回归时: 或或注意注意: 预测期的预测期的 是第一个元素为是第一个元素为1 1的的行向量行向量, ,不是矩不是矩 阵阵, ,也不是列向量也不是列向量 1

34、2233FFFKFkYXXXFY FX FX23(1)FFFkXXXFX3536 2. Y Y平均值的区间预测平均值的区间预测 基本思想基本思想: (与简单线性回归时相同)(与简单线性回归时相同) 由于存在抽样波动,预测的平均值由于存在抽样波动,预测的平均值 不一定不一定 等于真实平均值等于真实平均值 ,还需要对,还需要对 作区间估计。作区间估计。 为了对为了对Y作区间预测,必须确定平均值预测值作区间预测,必须确定平均值预测值 的抽样分布。的抽样分布。 必须找出与必须找出与 和和 都有关的统计量都有关的统计量, 并要明确其概率分布性质。并要明确其概率分布性质。FY)(FFXYE)(FFXYE)

35、(FFXYEFYFY3637 服从正态分布,可证明服从正态分布,可证明 即即标准化标准化当用当用 代替代替 时时 ,可构造,可构造 t 统计量统计量FY()()FFE YE YFX2()FVar Y1()FFXX XX2()() ()()FFFFFYE YYEnYtSE Ykt1FFFFX ( XXX ) XX22()ienk2 (),FFYN E YFF1FX ( XX ) XX*()()(0,1)()FFFFFYE YYE YtNSE Y1FFFFX ( XXXX)X37区间预测的具体作法(多元时)区间预测的具体作法(多元时)( (注意注意: :红色字体是与一元回归不同的部分红色字体是与一

36、元回归不同的部分) )38 给定显著性水平给定显著性水平,查,查t分布表,得自由度为分布表,得自由度为 n-k的的临界值临界值 ,则,则或或)(2knt122()()()FFFFFPYE YYtSE YtSE YFX122()FFFP YE YtYtF11FFFFX (XX) XX (X) XXX区间预测的具体作法区间预测的具体作法3822()()()1FFFFYE YXtSE YPtt( (注意注意: :红色字体是与一元回归不同的部分红色字体是与一元回归不同的部分) )39二、被解释变量个别值预测二、被解释变量个别值预测 基本思想:基本思想: (与简单线性回归时相同)(与简单线性回归时相同)

37、 由于存在随机扰动由于存在随机扰动 的影响,的影响,Y的平均值并不等于的平均值并不等于Y的个别值。的个别值。 为了对为了对Y的个别值的个别值 作区间预测,需要寻找与预测作区间预测,需要寻找与预测值值 和个别值和个别值 有关的统计量,并要明确其概率有关的统计量,并要明确其概率分布性质。分布性质。FYFYiuFY40 已知剩余项已知剩余项 是与预测值是与预测值 和个别值和个别值 都有都有关的变量关的变量 并且已知并且已知 服从正态分布,且多元回归时可证明服从正态分布,且多元回归时可证明 当用当用 代替代替 时,对时,对 标准化的标准化的 变量变量 t 为:为: FeFe0)(FeE22()inke

38、FeFY221()FVar e1()FFXXXX() ()()1FFFFFeE eYYtnktSE e1()FFXXXX个别值区间预测具体作法个别值区间预测具体作法FY40FFFeYY( (注意注意: :红色字体是与一元回归不同的部分红色字体是与一元回归不同的部分) )41给定显著性水平给定显著性水平 ,查,查t分布表得自由度为分布表得自由度为 n-k 的临的临界值界值 则则 因此,多元回归时因此,多元回归时Y的个别值的置信度的个别值的置信度1-的预测区间的预测区间的上下限为的上下限为2()tnk22()(1)FFFFFPYYtSE etSE eY 2 1FFtYY1()FFXXXX个别值预测

39、具体作法(续)个别值预测具体作法(续)41( (注意注意: :红色字体是与一元回归不同的部分红色字体是与一元回归不同的部分) )第五节第五节 案例分析案例分析案例案例1:中国税收增长的分析中国税收增长的分析提出问题提出问题改革开放以来,随着经济体制改革的深化和经济的快改革开放以来,随着经济体制改革的深化和经济的快速增长,中国的财政收支状况发生很大变化,为了研速增长,中国的财政收支状况发生很大变化,为了研究影响中国税收收入增长的主要原因,分析中央和地究影响中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋方税收收入的增长规律,预测中国税收未来的增长趋势,需要建

40、立计量经济模型。势,需要建立计量经济模型。42理论分析理论分析:影响中国税收收入增长的主要因素可能有:影响中国税收收入增长的主要因素可能有:(1)从宏观经济看,)从宏观经济看,经济整体增长经济整体增长是税收增长的基本源泉。是税收增长的基本源泉。(2)社会经济的发展和社会保障等都对公共财政提出要求,)社会经济的发展和社会保障等都对公共财政提出要求,公共财政公共财政的需求的需求对当年的税收收入可能会有一定的影响。对当年的税收收入可能会有一定的影响。(3)物价水平物价水平。中国的税制结构以流转税为主,以现行价格计算的。中国的税制结构以流转税为主,以现行价格计算的GDP和经营者的收入水平都和经营者的收

41、入水平都与物价水平有关。与物价水平有关。(4)税收政策税收政策因素。因素。43变量选择变量选择:以各项税收收入以各项税收收入Y 作为被解释变量作为被解释变量 以以GDP表示经济整体增长水平(表示经济整体增长水平(X2); 以财政支出表示公共财政的需求以财政支出表示公共财政的需求(X3); 以商品零售价格指数表示物价水平以商品零售价格指数表示物价水平(X4); 税收政策因素较难用数量表示税收政策因素较难用数量表示, 暂时不予考虑暂时不予考虑.建立模型建立模型数据来源:数据来源:中国统计年鉴中国统计年鉴其中其中: 各项税收收入(亿元)各项税收收入(亿元) 国内生产总值(亿元)国内生产总值(亿元)

42、财政支出(亿元)财政支出(亿元) 商品零售价格指数(商品零售价格指数(%)3XY2X4X数据收集(1978-2007)4445在数据表在数据表“Group” 中点中点 “View/graph/line”,出现序列,出现序列Y、X2、X3、X4的线性图的线性图:可以看出可以看出Y、X2、X3都是逐年增长的,但增长速率有所变都是逐年增长的,但增长速率有所变动,而且动,而且X4在多数年份呈现出水平波动在多数年份呈现出水平波动。说明变量间不一。说明变量间不一定是线性关系,可探索将模型设定为以下对数模型:定是线性关系,可探索将模型设定为以下对数模型:1223443lnlnlntttttYXXXu模型函数

43、形式模型函数形式假定模型中随机项满足基假定模型中随机项满足基本假定,可用本假定,可用OLS法估计法估计其参数。其参数。具体操作:具体操作:用用EViews软件,命令:软件,命令:“LS LS LNY C LNX2 LNX3 X4LNY C LNX2 LNX3 X4”估计结果为估计结果为:参数估计46用用EViews生成对数变量的数据,在生成对数变量的数据,在“Workfile”工作框中点工作框中点“ genr”,分别输入新变量名及生成方式,例如:,分别输入新变量名及生成方式,例如:LN(Y)=LOG(Y)、)、LNX2=LOG(X2)、)、 LNX3=LOG(X3)等,等,回车,生成回车,生成

44、LNY、LNX2、LNX3等对数变量的数据。等对数变量的数据。生成对数变量数据生成对数变量数据:模型估计的结果可表示为模型估计的结果可表示为 拟合优度:拟合优度:可决系数可决系数 较高,较高, 修正的可决系数修正的可决系数 也较高,也较高, 表明模型拟合较好。表明模型拟合较好。模型检验:模型检验:47234ln2.8491 0.4123ln0.6664ln0.0115iYXXX 20.9873R 20.9858R (0.6397) (0.1355) (0.1557) (0.0055) t= (-4.4538) (3.0420) (4.2788) (2.0856) F=673.7521 n=30

45、20.9873R 20.9858R 显著性检验F检验:检验: 针对针对 ,取,取 查自由度为和查自由度为和 的临界值的临界值 由于由于 ,应拒绝,应拒绝 ,说明回归方程显著,即说明回归方程显著,即“国内生产总值国内生产总值”、“财政财政支出支出”、“商品零售物价指数商品零售物价指数”等变量联合起来确等变量联合起来确实对实对“税收收入税收收入”有显著影响。有显著影响。从从P P值也可以对值也可以对F F检验结果作出判断:检验结果作出判断: 0234H :0(3,26)2.98F0.05F(3,2673.75216)2.98F-1=3k=26n-k0H480.05 P 值=0.0000应拒绝应拒绝 0234H :0t检验:检验:给定给定 ,查,查 t 分布表,在自由度为分布表,在自由度为 时临界值为时临界值为 ,因为,因为 的参数对应的的参数对应的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论