版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第3 3讲讲 多元线性回归模型多元线性回归模型3.1 多元线性回归模型的估计3.1.1 3.1.1 多元线性回归模型及其矩阵表示多元线性回归模型及其矩阵表示 在计量经济学中,将含有两个以上解释变量的回归模型叫做多元回归模型,相应地,在此基础上进行的回归分析就叫多元回归分析。 它是解释变量的多元线性函数,称为多元线性总体回归方程。 假定通过适当的方法可估计出未知参数的值,用参数估计值替换总体回归函数的未知参数,就得到多元线性样本回归方程:它代表了总体变量间的依存规律。3.1.2 3.1.2 多元线性回归模型的基本假定多元线性回归模型的基本假定 假设6: 解释变量之间不存在多重共线性 假设1用矩
2、阵形式表示: 3.1.3 多元线性回归模型的估计1 1参数的最小二乘估计参数的最小二乘估计上述(k+1)个方程称为正规方程。用矩阵表示就是: 即 :将上述过程用矩阵表示如下:根据矩阵求导法则可得:t 例例 3.1.13.1.1 经过研究,发现家庭书刊消费水平受家庭收入及户主受教育年数的影响。现对某地区的家庭进行抽样调查,得到样本数据如表3.1.1所示,其中y表示家庭书刊消费水平(元/年),x表示家庭收入(元月),T 表示户主受教育年数。下面我们估计家庭书刊消费水平同家庭收入、户主受教育年数之间的线性关系。表3.1.1 某地区家庭书刊消费水平及影响因素的调查数据表家庭书刊消费家庭书刊消费 y y
3、家庭收入家庭收入 x x户主受教育年数户主受教育年数 T T450.0450.01027.21027.28 8507.7507.71045.21045.29 9613.9613.91225.81225.81212563.4563.41312.21312.29 9501.5501.51316.41316.47 7781.5781.51442.41442.41515541.8541.81641.01641.09 9611.1611.11768.81768.810101222.11222.11981.21981.21818793.2793.21998.61998.61414660.8660.8219
4、6.02196.01010792.7792.72105.42105.41212580.8580.82147.42147.48 8612.7612.72154.02154.01010890.8890.82231.42231.414141121.01121.02611.82611.818181094.21094.23143.43143.416161253.01253.03624.63624.62020借助于计量经济软件EViews对表3.1.1进行分析,具体步骤为(1)建立工作文件;(2)输入数据;(3)回归分析表3.1.2 回归结果2 2最小二乘估计量的性质最小二乘估计量的性质用最小二乘法得到的
5、多元线性回归的参数估计量具有线性、无偏性、最小方差性。3.1.4 随机误差项方差的估计若记3.2 多元线性回归模型的检验3.2.1 3.2.1 拟合优度检验拟合优度检验拟合优度是指样本回归直线与观测值之间的拟合程度。1多重决定系数 总离差平方和=残差平方和+ 回归平方和 自由度: (n-1)= (n-k-1)+ kESS:由回归直线(即解释变量)所解释的部分,表示x对y的线性影响。RSS:是未被回归直线解释的部分,由解释变量x对y影响以外的因素而造成的。 多重决定系数或决定系数是指解释变差占总变差的比重,用来表述解释变量对被解释变量的解释程度:2修正的决定系数(1)用自由度调整后,可以消除拟合
6、优度评价中解释变量多少对决定系数计算的影响;(2)对于包含的解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低。修正的决定系数与未经修正的多重决定系数之间有如下关系:3.2.2 赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有赤池信息准则(Akaike information criterion,AIC)和施瓦茨准则(Schwarz criterion,SC),其定义分别为 这两个准则均要求仅当所增加的解释变量能够减少AIC或SC值时才能在原模型中增加该解释变量。3.2.3 偏相关系数3.2.3 回归模型的总体显著性检验:F
7、检验 回归模型的总体显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。 检验模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立,即是检验方程:图3.2.1 阴影部分为F检验的否定区域 F 检验的具体步骤为: 借助于计量经济软件EViews对表3.1.1中的样本回归方程作F检验。 F 统计量的值:F =146.2973,n =18,n-k-1=18-2-1=15,在5%的显著性水平下,查自由度为(2,15)的F分布表,得临界值3.2.4 回归参数的显著性检验:t检验 回归参数的显著性检验,目的在于检验当其他解释变量不变时,该回归系数对应的解释变量是
8、否对因变量有显著影响。 由参数估计量的分布性质可知,回归系数的估计量服从如下正态分布:用t统计量进行回归参数的显著性检验,其具体过程如下: 借助于计量经济软件EViews对表3.1.1中的样本回归方程的系数作显著性检验: 至此,我们已全面分析了例3.1.1所提出的问题。现将从例3.1.1的回归分析结果整理如下:3.3 3.3 多元线性回归模型的预测多元线性回归模型的预测3.3.1 点预测 点预测就是根据给定解释变量的值,预测相应的被解释变量的一个可能值。设多元线性回归模型为:3.3.2 区间预测3.4 3.4 非线性回归模型非线性回归模型3.4.1 可线性化模型 在非线性回归模型中,有一些模型
9、经过适当的变量变换或函数变换就可以转化成线性回归模型,从而将非线性回归模型的参数估计问题转化成线性回归模型的参数估计,称这类模型为可线性化模型。 1对数模型 模型形式: 模型适用对象:模型适用对象:对观测值取对数,将取对数后的观测值(lnx,lny)描成散点图,如果近似为一条直线,则适合于对数线性模型来描述x与y的变量关系。 容易推广到模型中存在多个解释变量的情形。例如,柯布道格拉斯生产函数形式: 例3.4.1 根据表3.4.1给出的1980-2003年间总产出(用国内生产总值GDP度量,单位:亿元),劳动投入L(用从业人员度量,单位为万人),以及资本投入K(用全社会固定投资度量,单位:亿元)
10、。表3.4.1 1980-2003年中国GDP、劳动投入与资本投入数据年份GDPLK19804517.842361910.919814862.443725961.019825294.7452951230.419835934.5464361430.119847171.0481971832.919858964.4498732543.2198610202.2512823120.6年份GDPLK198711962.5527833791.7198814928.3543344753.8198916909.2553294410.4199018547.9639094517.0199121617.8647995
11、594.5199226638.1655548080.1199334634.46637313072.3199446759.46719917042.1199558478.16794720019.3199667884.66885022913.5199774462.66960024941.1199878345.26995728406.2199982067.57139429854.7200089442.27208532917.7200195933.37302537213.52002102398.07374043499.92003117251.97443255566.6 利用EViews软件解题如下:首先
12、建立工作文件,其次输入样本数据Q、L、K,再次,在EViews软件的命令窗口,依次键入:GENR lnGDP=LOG(GDP)GENR lnL=LOG(L)GENR lnK=LOG(K)LS lnGDP C lnL lnK输出结果如下(表3.4.2):表3.4.2 回归结果 2半对数模型 在对经济变量的变动规律研究中,测定其增长率或衰减率是一个重要方面。在回归分析中,我们可以用半对数模型来测度这些增长率。 模型形式:模型形式:3倒数模型 4多项式模型 多项式回归模型在生产与成本函数这个领域中被广泛地使用。多项式回归模型可表示为3.4.2 非线性化模型的处理方法 无论通过什么变换都不可能实现线性
13、化,这样的模型称为非线性化模型。对于非线性化模型,一般采用高斯牛顿迭代法进行估计,即将其展开成泰勒级数之后,再利用迭代估计方法进行估计。3.4.3 回归模型的比较 1 1图形观察分析图形观察分析 (1)观察被解释变量和解释变量的趋势图。 (2)观察被解释变量与解释变量的相关图。 2 2模型估计结果观察分析模型估计结果观察分析 对于每个模型的估计结果,可以依次观察以下内容: (1)回归系数的符号和值的大小是否符合经济意义,这是对所估计模型的最基本要求。 (2)改变模型形式之后是否使判定系数的值明显提高。 (3)各个解释变量t检验的显著性。 (4)系数的估计误差较小。3残差分布观察分析 模型的残差
14、反映了模型未能解释部分的变化情况,在方程窗口点击ViewActual,Fitted,ResidualTable(或Graph),可以观察分析以下内容: (1)残差分布表中,各期残差是否大都落在的虚线框内,这直观地反映了模型拟合误差的大小及变化情况。 (2)残差分布是否具有某种规律性,即是否存在着系统误差。 (3)近期残差的分布情况。 另外,利用判定系数比较模型的拟合优度时,如果两个模型包含的解释变量个数不同,则应采用“调整的判定系数”。 除了调整的判定系数之外,人们还使用另外两个指标SC(Schwarz Criterion,施瓦兹准则)和AIC(Akaike lnformation Crite
15、rion,赤池信息准则)来比较含有不同解释变量个数模型的拟合优度。 3.5 3.5 受约束回归受约束回归 在建立回归模型时,有时根据经济理论需要对模型中变量的参数施加一定的约束条件。对模型施加约束条件后进行回归,称为受约束回归(restricted regresslon),与此对应,不加任何约束的回归称为无约束回归(unrestricted regression)。3.5.1 模型参数的线性约束 一般地,估计线性模型时可对模型参数施加若干个线性约束条件。例如,对模型其中式中第二项为一非负标量,于是 式(3.5.9)表明受约束样本回归模型的残差平方和大于无约束样本回归模型的残差平方和,这意味着,
16、通常情况下,对模型施加约束条件会降低模型的解释能力。 约束条件的个数。表3.5.1 无约束条件的C-D生产函数估计结果表3.5.2 有约束条件的C-D生产函数估计结果 在EViews软件中,当估计完C-D生产函数后,在方程结果输出窗口,点击View按钮,然后在下拉菜单中选择Coefficient TestWald Coefficient Restrictions,屏幕出现图3.5.1对话框。 图3.5.1 Wald检验定义对话框 在对话框中输入系数的约束条件,若有多个,则用逗号分开。本例中输入:C(2)+C(3)=1,得检验结果见表3.5.3。表3.5.3 Wald检验输出结果 由表3.5.3
17、可知,在0.05显著性水平下,两个检验均仍然不能拒绝和为1的原假设,原假设为真。这个结果与直观判断差异明显,主要是因为变量LOG(L)的回归系数标准误差较大。 需要指出的是,这里介绍的F检验适合所有关于参数线性约束的检验,32节中对回归模型总体的线性检验,可以归结到这里的F检验上来。 3.5.2 3.5.2 解释变量的选择解释变量的选择 在实际建模时,选取哪些变量作为解释变量引入模型,对模型的优劣有直接的影响作用。模型中,既不能遗漏重要的解释变量,又要防止过多的变量带来的多重共线性问题或对因变量没有什么影响的不必要的解释变量。这里介绍两种有用的用于选择解释变量的检验。 考虑如下两个回归模型:
18、在EViews软件中,要检验冗余变量,选择Equation工具栏中的ViewCoefficient TestRedundant Variable功能。在对话框中输入需要检验的变量。 Testadd 检验用于在方程中检验引入新的解释变量,检验引入引入新的解释变量是否对模型有利。要检验缺失变量,选择Equation工具栏中的ViewCoefficient TestOmitted Variable功能。在对话框中输入需要检验的变量。 在例3.4.1的方程窗口(表3.4.2)输出结果中选择ViewCoefficient TestRedundant Variable-Likelihood Ratio,屏
19、幕出现对话图3.5.2框。图3.5.2 多余变量检验定义对话框 在话框中输入希望减少的序列名。在本例,输入LOG(L),点击OK,计算结果如表3.5.4所示。表3.5.4 Testdrop检验输出结果 与Wald检验类似,EViews也给出F统计量和相伴概率。这里,在0.05显著性水平下,两个检验均拒绝变量LOG(L)不显著的假设,LOG(L)不是多余的变量,说明劳动投入量对GDP有显著影响。3.5.3 参数的稳定性检验:邹氏检验 建立模型时往往希望模型的参数是稳定的,即所谓的结构不变,这将提高模型的预测与分析功能。然而,经济结构的变化往往导致计量经济模型结构也发生变化。例如,例3.4.1我国
20、C-D生产函数例子中,从GDP、L、K散点图的变化上容易判断1992年前后这种结构的变化。下面给出一个结构变化的检验。图3.5.3 中国1980-2003年GDP、L、K散点图 这两个回归方程是否显著的不同?如果这两个回归方程的差别并不显著,说明模型所反映的经济结构在时间上(或截面上)是稳定的。否则是不稳定的。邹至庄(Chow)提出了如下的Chow检验。 因此,对参数稳定性的原假设(3.5.22)的检验步骤为: 首先,分别以两个连续的时间序列作为两个样本运用式(3.5.18)进行回归,得到相应的残差平方和 RSS1与 RSS2; 其次,将两序列并为一个大样本后运用式(3.5.18)进行回归,得
21、到大样本下的残差平方和 RSSR; 最后,通过式(3.5.25)的F统计量,在事先给定的显著性水平下进行假设检验。如果F大于相应的临界值,则拒绝原假设,认为发生了结构变化,参数是非稳定的。该检验方法也被称为邹氏参数稳定性检验(Chow test for parameter stability)。 本例利用EViews软件进行Chow检验。在操作上,首先根据表3.4.1,利用EViews软件可得如下结果(见表3.5.5)。 表3.5.5 回归结果 在方程窗口按View/Stability Tests/Chow Breakpoint Test顺序逐一单击鼠标键,打开Chow Test对话框(图3.
22、5.4)。图3.5.4 打开Chow Test对话框然后在对话框内输入转折点年份,1992(图3.5.5)。图3.5.5 Chow Test 对话框 计算结果如表3.5.6所示。表3.5.6 计算结果 根据F分布表,可得在5的显著性水平下,F临界值为3.55(分子自由度为3,分母自由度为18)。因此,得到F值2.9355小于临界值为3.55,接受原假设。由此可知中国GDP和L、K间的关系(即C-D生产函数),在不同时期(1980-1991与1992-2003)没有什么不同,即中国C-D生产函数结构是稳定的。 在运用Chow检验时,需要注意以下一些限制条件: (1)必须满足上面讲到的古典假定条件
23、。 (2)Chow检验的结果仅仅告诉我们是否存在结构差异,而无法得知导致这种差异的原因。 (3)Chow检验假定知道结构发生变化的时间点。 3.6 3.6 案例分析案例分析中国经济增长影响因素分析中国经济增长影响因素分析 根据表3.6.1给出的1980-2003年间总产出(用国内生产总值GDP度量,单位:亿元),最终消费CS(单位:亿元),投资总额I(用固定资产投资总额度量,单位:亿元),出口总额(单位:亿元)统计数据,试对中国经济增长影响因素进行回归分析。表3.6.1 1980-2003年中国GDP、最终消费、投资与出口总额(单位:亿元)年 份GDP最终消费CS投资总额I出口总额EX198916466.010556.54410.41956.1199018319.511365.24517.02985.8199121280.413145.95594.53827.1199225863.715952.18080.14676.3199334500.720182.113072.35284.8199446690.726796.017042.110421.8199558510.533635.020019.312451.8199668330.440003.922974.012576.4199774894.243579.424941.1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年水泥电杆绿色生产与碳排放交易合同3篇
- 智慧金融服务课程设计
- 早教昆虫主题课程设计
- 互联网医疗行业发展趋势与挑战
- 控制理论课程设计
- 图文书单制作详细课程设计
- 曲轴加工课程设计
- 数量秒杀技巧课程设计
- 上海电影艺术职业学院《高等代数与解析几何上》2023-2024学年第一学期期末试卷
- 二手房购房买卖合同
- 《中国丧葬礼仪》课件
- 中国高血压防治指南(2024年修订版)解读课件
- 国家开放大学《统计与数据分析基础》形考任务1-5答案
- 2024时事政治考试题库(100题)
- 【新教材】统编版(2024)七年级上册语文期末复习课件129张
- 基于汽车发动机飞轮的设计与制造
- 上海市安全生产管理读本试习题(考试专用)
- 实验仪器、器材配备情况统计表
- 课题组内研讨活动及会议记录
- 小学科学实验室仪器名称汇总
- 山东昌乐二中“271高效课堂”教学模式
评论
0/150
提交评论