计量经济 第三章 多元线性回归模型_第1页
计量经济 第三章 多元线性回归模型_第2页
计量经济 第三章 多元线性回归模型_第3页
计量经济 第三章 多元线性回归模型_第4页
计量经济 第三章 多元线性回归模型_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量经济第三章多元线性回归模型第1页,共77页,2023年,2月20日,星期四

中国汽车的保有量会达到1.4亿辆吗?中国经济的快速发展,使居民收入不断增加,数以百万计的中国人开始得以实现拥有汽车的梦想,中国也成为世界上成长最快的汽车市场。中国交通部副部长在中国交通可持续发展论坛上做出预测:“2020年,中国的民用汽车保有量将比2003年的数字增长6倍,达到1.4亿辆左右”。是什么因素导致中国汽车数量的增长?影响中国汽车行业发展的因素并不是单一的,经济增长、消费趋势、市场行情、业界心态、能源价格、道路发展、内外环境,都会使中国汽车行业面临机遇和挑战。第2页,共77页,2023年,2月20日,星期四分析中国汽车行业未来的趋势,应具体分析这样一些问题:中国汽车市场发展的状况如何?(用销售量观测)影响中国汽车销量的主要因素是什么?

(如收入、价格、费用、道路状况、能源、政策环境等)各种因素对汽车销量影响的性质怎样?(正、负)各种因素影响汽车销量的具体数量关系是什么?所得到的数量结论是否可靠?中国汽车行业今后的发展前景怎样?应当如何制定汽车的产业政策?很明显,只用一个解释变量已很难分析汽车产业的发展,还需要寻求有更多个解释变量情况的回归分析方法。

怎样分析多种因素的影响?第3页,共77页,2023年,2月20日,星期四第三章多元线性回归模型◆学习目的理解多元线性回归模型的矩阵表示,掌握多元线性回归模型的参数估计、检验和预测。第4页,共77页,2023年,2月20日,星期四◆基本要求1)理解多元线性回归模型的矩阵表示,了解多元线性回归模型的基本假设;2)掌握多元线性回归模型的普通最小二乘参数估计方法,了解多元线性回归模型的普通最小二乘参数估计量与样本回归线的性质、多元线性回归模型的随机误差项方差的普通最小二乘参数估计;3)学会对多元线性回归模型进行拟合优度检验,对多元线性回归模型的参数进行区间估计,对多元线性回归模型进行变量显著性检验和方程显著性检验;4)学会进行多元线性回归模型被解释变量的总体均值和个别值的预测;5)学会利用EViews软件进行多元线性回归模型的参数估计、检验和预测。第三章多元线性回归模型第5页,共77页,2023年,2月20日,星期四◆多元线性回归模型的矩阵表示与基本假设◆多元线性回归模型的参数估计◆多元线性回归模型的拟合优度检验◆多元线性回归模型的统计推断第三章多元线性回归模型◆多元线性回归模型的预测第6页,共77页,2023年,2月20日,星期四第一节多元线性回归模型的矩阵表示与基本假设多元线性回归模型的一般形式是

其中,Y为被解释变量,为解释变量,、、、、为待估参数,即回归系数,为解释变量个数,为随机误差项,

为观测值下标,

为样本容量。

待估参数、、、、,反映其他解释变量保持不变情况下,对应解释变量每变化一个单位引起的被解释变量的变化,也被称为偏回归系数。第7页,共77页,2023年,2月20日,星期四第一节多元线性回归模型的矩阵表示与基本假设一、多元线性回归模型的矩阵表示二、多元线性回归模型的基本假设第8页,共77页,2023年,2月20日,星期四一、多元线性回归模型的矩阵表示(3-1)

(3-2)

第9页,共77页,2023年,2月20日,星期四记有(3-3)多元线性总体回归模型的矩阵形式

多元线性总体回归函数可用矩阵形式表示为(3-4)第10页,共77页,2023年,2月20日,星期四二、多元线性回归模型的基本假设包括对解释变量的假设、对随机误差项的假设、对模型设定的假设几个方面,主要如下:1)解释变量是确定性变量,不是随机变量,解释变量之间不相关;2)随机误差项具有0均值、同方差,且在不同样本点相互独立,不存在序列相关性3)解释变量与随机误差项不相关4)随机误差项服从正态分布5)回归模型是正确设定的。第11页,共77页,2023年,2月20日,星期四假定1:零均值假定或假定2和假定3:同方差和无自相关假定

假定4:随机扰动项与解释变量不相关

第12页,共77页,2023年,2月20日,星期四假定5:无多重共线性假定(多元中)假定各解释变量之间不存在线性关系,或各个解释变量观测值之间线性无关。或解释变量观测值矩阵

列满秩(

列)。

即可逆假定6:正态性假定第13页,共77页,2023年,2月20日,星期四第二节多元线性回归模型的

参数估计任务

方法模型结构参数、、、、的估计随机误差项的方差的估计

普通最小二乘法第14页,共77页,2023年,2月20日,星期四一、参数的普通最小二乘估计二、参数的普通最小二乘估计量的性质三、普通最小二乘样本回归函数性质五、样本容量问题四、随机误差项的方差的普通最小二乘估计内容第15页,共77页,2023年,2月20日,星期四一、参数的普通最小二乘估计对于多元线性回归模型(3-7)按照最小二乘法的基本思想,求参数的普通最小二乘估计,就是要求使、、、、达到最小的参数的估计。第16页,共77页,2023年,2月20日,星期四即因为可得多元线性回归模型的普通最小二乘估计为(3-11)(3-10)所以第17页,共77页,2023年,2月20日,星期四

注意到第18页,共77页,2023年,2月20日,星期四

用矩阵表示因为样本回归函数为两边乘有:因为,则正规方程为:第19页,共77页,2023年,2月20日,星期四对于只含有两个解释变量的多元线性回归模型由式(3-8)可直接求得普通最小二乘估计量为(3-13)(3-12)(3-14)其中第20页,共77页,2023年,2月20日,星期四例3-1假设已获得了某商品的销售量、价格、售后服务支出数据如表3-1所示,要通过多元线性回归模型研究价格和售后服务支出对销售量的影响。第21页,共77页,2023年,2月20日,星期四表3-1某商品的销售量、价格、售后服务支出数据序号销售量Y(千个)价格X1(元/个)售后服务支出X2(万元)12345678910111213141516171819202122121133130126131147148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512第22页,共77页,2023年,2月20日,星期四例3-1假设已获得了某商品的销售量、价格、售后服务支出数据如表3-1所示,要通过多元线性回归模型研究价格和售后服务支出对销售量的影响。可得样本回归方程为第23页,共77页,2023年,2月20日,星期四二、参数的普通最小二乘估计量的性质1.线性性因为记矩阵的第j行第i列的元素为aji,则是矩阵的第j+1行与列矩阵Y的乘积,即这就是说,中的任意一个都可以表示为被解释变量的线性组合,

满足线性性。、、、、、、、、第24页,共77页,2023年,2月20日,星期四二、参数的普通最小二乘估计量的性质2.无偏性因为所以第25页,共77页,2023年,2月20日,星期四二、参数的普通最小二乘估计量的性质3.有效性因为的方差-协方差矩阵为(3-16)(3-17)记矩阵的主对角线上的第i个元素为cii,则第26页,共77页,2023年,2月20日,星期四三、普通最小二乘样本回归函数性质1.样本回归线通过样本均值点,即点(,,,,)满足。样本回归函数。3.残差和为零,即。2.被解释变量的估计的均值等于被解释变量的均值,即。4.各解释变量与残差的乘积之和为零,即。5.被解释变量的估计与残差的乘积之和为零,即。第27页,共77页,2023年,2月20日,星期四四、随机误差项的方差的普通最小二乘估计多元线性回归模型的随机误差项的方差的普通最小二乘估计量为(3-18)是一个无偏估计量。容易看出,多元线性回归模型的随机误差项的方差的普通最小二乘估计量,与一元线性回归模型的随机误差项的方差的普通最小二乘估计量一致。因为在一元线性回归模型中k=1。所以,残差平方和可用矩阵表示为(3-19)第28页,共77页,2023年,2月20日,星期四五、样本容量问题样本容量越大,样本观测数据对经济活动的反映越全面,从样本观测数据中发现规律的可能性就越大,计量经济研究的结果就越可靠。参数估计的最小样本容量要求是例如,模型的检验要求有足够大的样本容量,z检验在n<30时不能使用,

因为n<30时构造不出用于检验的服从标准正态分布的统计量;

t检验在时才比较有效,因为时t分布才比较稳定。一般经验认为,当或者至少时,才能满足基本要求。第29页,共77页,2023年,2月20日,星期四第三节多元线性回归模型的

拟合优度检验一、离差分解二、决定系数三、调整的决定系数第30页,共77页,2023年,2月20日,星期四一、离差分解所以,在多元线性回归模型中,依然有(3-20)即(3-21)第31页,共77页,2023年,2月20日,星期四二、决定系数1)多元线性回归模型中,解释变量的数目有多有少,所以不能利用决定系数R2进行解释变量数目不同的模型的拟合优度的比较;2)若以决定系数R2,还会造成通过增加解释变量数目提高模型拟合优度的倾向;缺陷

事实上,解释变量的数目并非越多越好,若增加的解释变量不是被解释变量的重要影响因素,甚至是被解释变量的不相关因素,反而会对模型产生负面影响。调整的决定系数第32页,共77页,2023年,2月20日,星期四三、调整的决定系数(adjustedcoefficientofdetermination)

其中,是残差平方和的自由度,是总体平方和的自由度。平方和与总体平方和得到,计算公式为,通过用自由度调整决定系数R2中的残差调整的决定系数,记作R2由的计算公式,可得调整的决定系数与决定系数R2之间的关系R2R2(3-22)(3-23)第33页,共77页,2023年,2月20日,星期四表3-1某商品的销售量、价格、售后服务支出数据序号销售量Y(千个)价格X1(元/个)售后服务支出X2(万元)12345678910111213141516171819202122121133130126131147148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512例3-2假设已获得了某商品的销售量、价格、售后服务支出数据如表3-1所示,求多元线性回归模型的决定系数R2与调整的决定系数。R2第34页,共77页,2023年,2月20日,星期四析:i

12345678910111213141516171819202122121133130126131147148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512111.6543131.1411127.0208118.1791128.2230147.7098148.3109163.0763158.9560159.5571160.1582160.7593189.6890195.0115190.8912191.4923206.2576202.1373202.7384203.3395232.2692223.42742454.7571409.6651643.9381984.3021563.847554.391508.300133.299111.208211.572241.663183.48171.479340.56989.388155.115989.386867.568927.4771053.2957648.2904026.4743468.1721552.7051894.4002742.2451791.193521.469494.37755.789134.317120.745107.89695.770366.472598.584413.946438.7671275.357998.0431036.3841075.4483809.8142796.50087.3423.4558.87661.1677.7120.5040.09716.6161.09012.65326.60714.132114.25336.138118.61772.11918.1284.5683.0220.115662.075111.779求和375227169.4525788.391381.065平均170.5455表3-2TSS、ESS、RSS计算表第35页,共77页,2023年,2月20日,星期四据表3-2可计算决定系数为调整的决定系数为第36页,共77页,2023年,2月20日,星期四第四节多元线性回归模型的

统计推断一、参数估计量的分布二、参数的区间估计三、参数的假设检验第37页,共77页,2023年,2月20日,星期四一、参数估计量的分布满足基本假设条件下,多元线性回归模型参数的普通最小二乘估计量服从正态分布。已知其中,是矩阵的主对角线上的第个元素。所以

第38页,共77页,2023年,2月20日,星期四进行标准化变换可得记的标准差(standarderror)为

(3-24)第39页,共77页,2023年,2月20日,星期四替代令的样本方差的样本标准差第40页,共77页,2023年,2月20日,星期四服从自由度为n-k-1的t分布替代令(3-25)

将替代后的统计量记为,有

第41页,共77页,2023年,2月20日,星期四参数的区间估计,即是求参数的置信区间,是在给定显著性水平对参数的取值范围作出估计,参数的真实值落入这一区间的概率为。之下,区间

二、参数的区间估计第42页,共77页,2023年,2月20日,星期四由此可得所以,在显著性水平下,参数的置信区间分别为(3-26)容易看出,同一元线性回归模型,增大样本容量、提高模型的拟合优度可以缩小多元线性回归模型参数的置信区间。第43页,共77页,2023年,2月20日,星期四表3-1某商品的销售量、价格、售后服务支出数据序号销售量Y(千个)价格X1(元/个)售后服务支出X2(万元)12345678910111213141516171819202122121133130126131147148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512例3-3假设已获得了某商品的销售量、价格、售后服务支出数据如表3-1所示,的95%的置信区间。求多元线性回归模型的参数第44页,共77页,2023年,2月20日,星期四答案:的95%的置信区间为的95%的置信区间为的95%的置信区间为第45页,共77页,2023年,2月20日,星期四参数的假设检验——检验对模型参数所作的某一个假设是否成立——基础是参数估计量的分布性质——采用的方法是统计学中的假设检验三、参数的假设检验在多元线性回归模型中,常针对参数是否为0的假设进行检验

变量显著性检验(t检验)方程显著性检验(F检验)——针对单个解释变量对被解释变量的影响是否显著所作的检验,检验被检验变量的参数为0是否显著成立;都为0——针对所有解释变量对被解释变量的联合影响是否显著所作的检验,检验是否显著成立。

第46页,共77页,2023年,2月20日,星期四,对第j个解释变量的显著性进行检验,

原假设为,备择假设,根据原假设,有(3-27),如果,接受原假设则拒绝原假设,接受备择假设。利用t分布进行参数的假设检验,称为t检验。1.变量显著性检验(t检验)第47页,共77页,2023年,2月20日,星期四表3-1某商品的销售量、价格、售后服务支出数据序号销售量Y(千个)价格X1(元/个)售后服务支出X2(万元)12345678910111213141516171819202122121133130126131147148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512例3-4假设已获得了某商品的销售量、价格、售后服务支出数据如表3-1所示,对多元线性回归模型进行变量显著性检验,显著性水平取0.01。第48页,共77页,2023年,2月20日,星期四析:首先检验解释变量的显著性。

原假设,备择假设已知,,有所以拒绝原假设,接受备择假设影响显著查t分布表可得,第49页,共77页,2023年,2月20日,星期四接下来检验解释变量的显著性。原假设,备择假设已知,,有影响显著所以拒绝原假设,接受备择假设也可以通过比较显著性水平和参数估计值的P值,判断对应解释变量的显著性

第50页,共77页,2023年,2月20日,星期四2.方程显著性检验(F检验)利用F分布进行参数的假设检验,称为F检验。基础是离差分解在离差分解的基础上,通过构造F统计量,针对原假设备择假设不全为0作出检验。第51页,共77页,2023年,2月20日,星期四表3-1某商品的销售量、价格、售后服务支出数据序号销售量Y(千个)价格X1(元/个)售后服务支出X2(万元)12345678910111213141516171819202122121133130126131147148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512例3-5假设已获得了某商品的销售量、价格、售后服务支出数据如表3-1所示,对多元线性回归模型进行方程显著性检验,显著性水平取0.01。第52页,共77页,2023年,2月20日,星期四析:影响显著原假设,备择假设不全为0已知,查F分布表得拒绝原假设接受备择假设不全为0第53页,共77页,2023年,2月20日,星期四3.变量显著性检验与方程显著性检验的关系1)变量显著性检验是针对单个解释变量对被解释变量的影响是否显著所作的检验,方程显著性检验是针对所有解释变量对被解释变量的联合影响是否显著所作的检验;2)在多元线性回归模型中,变量显著性检验与方程显著性检验都

要进行,不能相互替代;3)在一元线性回归模型中,变量显著性检验(t检验)与方程显著性检验(F检验)是一致的,一般只进行变量显著性检验。第54页,共77页,2023年,2月20日,星期四4.拟合优度检验与方程显著性检验的关系联系:(3-30)(3-31)(3-29)(3-32)第55页,共77页,2023年,2月20日,星期四区别:4.拟合优度检验与方程显著性检验的关系

方程显著性检验可在给定显著性水平下,给出模型总体线性关系是否显著成立的统计意义上的严格的结论。拟合优度检验只是通过决定系数和调整的决定系数模型拟合优度的度量,并没有提供模型是否通过检验的明确界限;

提供了对第56页,共77页,2023年,2月20日,星期四第五节多元线性回归模型的

预测被解释变量的总体均值的点预测被解释变量的总体均值的区间预测被解释变量的个别值的区间预测第57页,共77页,2023年,2月20日,星期四(Why??)将已知或事先测定的样本观察数据以外的解释变量的观察值记为,对应的被解释变量的观察值记为由样本回归函数,对应于解释变量,被解释变量的预测值为(3-33)作为被解释变量的总体均值的点预测

这是被解释变量的总体均值的一个无偏估计

一、总体均值的点预测第58页,共77页,2023年,2月20日,星期四表3-1某商品的销售量、价格、售后服务支出数据序号销售量Y(千个)价格X1(元/个)售后服务支出X2(万元)12345678910111213141516171819202122121133130126131147148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512例3-6假设已获得了某商品的销售量、价格、售后服务支出数据如表3-1所示,求价格为1250元/个、售后服务支出为16万元时销售量的预测值。263.603(千个)第59页,共77页,2023年,2月20日,星期四也可以表示为的线性组合,服从正态分布。

由于所以二、总体均值的预测置信区间第60页,共77页,2023年,2月20日,星期四用的无偏估计量替代,有对于给定的显著性水平

其中由此可得,总体均值的置信度为的预测置信区间为(3-34)第61页,共77页,2023年,2月20日,星期四表3-1某商品的销售量、价格、售后服务支出数据序号销售量Y(千个)价格X1(元/个)售后服务支出X2(万元)12345678910111213141516171819202122121133130126131147148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512例3-7假设已获得了某商品的销售量、价格、售后服务支出数据如表3-1所示,求价格为1250元/个、售后服务支出为16万元时销售量的均值的置信度为95%的预测置信区间。第62页,共77页,2023年,2月20日,星期四已知所以三、个别值的预测置信区间第63页,共77页,2023年,2月20日,星期四用的无偏估计量替代,有其中对于给定的显著性水平由此可得,个别值的置信度为的预测置信区间为(3-35)第64页,共77页,2023年,2月20日,星期四表3-1某商品的销售量、价格、售后服务支出数据序号销售量Y(千个)价格X1(元/个)售后服务支出X2(万元)12345678910111213141516171819202122121133130126131147148159160156155157179189180183202200201203258234150014901480147014601450144014301420141014001390138013701360135013401330132013101300129012151310111413151312111015151312141211101512例3-8假设已获得了某商品的销售量、价格、售后服务支出数据如表3-1所示,求价格为1250元/个、售后服务支出为16万元时销售量的均值的置信度为95%的预测置信区间。第65页,共77页,2023年,2月20日,星期四四、预测置信区间的特征3.样本容量越大、拟合优度越高,预测置信区间越小2.解释变量X的取值偏离X的距离越大,预测置信区

间的宽度越大1.被解释变量总体均值的预测置信区间窄于个别值

的预测置信区间第66页,共77页,2023年,2月20日,星期四案例分析案例:中国税收增长的分析提出问题改革开放以来,随着经济体制改革的深化和经济的快速增长,中国的财政收支状况发生很大变化,为了研究影响中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济模型。第67页,共77页,2023年,2月20日,星期四理论分析影响中国税收收入增长的主要因素可能有:(1)从宏观经济看,经济整体增长是税收增长的基本源泉。(2)社会经济的发展和社会保障等都对公共财政提出要求,公共财政的需求对当年的税收收入可能会有一定的影响。(3)物价水平。中国的税制结构以流转税为主,以现行价格计算的GDP和经营者的收入水平都与物价水平有关。(4)税收政策因素。第68页,共77页,2023年,2月20日,星期四

以各项税收收入

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论