计量经济学课后习题答案_第1页
计量经济学课后习题答案_第2页
计量经济学课后习题答案_第3页
计量经济学课后习题答案_第4页
计量经济学课后习题答案_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE20PAGE21计量经济学1~9章答案第一章1.计量经济学是一门什么样的学科?答:计量经济学的英文单词是Econometrics,本意是“经济计量”,研究经济问题的计量方法,因此有时也译为“经济计量学”。将Econometrics译为“计量经济学”是为了强调它是现代经济学的一门分支学科,不仅要研究经济问题的计量方法,还要研究经济问题发展变化的数量规律。可以认为,计量经济学是以经济理论为指导,以经济数据为依据,以数学、统计方法为手段,通过建立、估计、检验经济模型,揭示客观经济活动中存在的随机因果关系的一门应用经济学的分支学科。2.计量经济学与经济理论、数学、统计学的联系和区别是什么?答:计量经济学是经济理论、数学、统计学的结合,是经济学、数学、统计学的交叉学科(或边缘学科)。计量经济学与经济学、数学、统计学的联系主要是计量经济学对这些学科的应用。计量经济学对经济学的应用主要体现在以下几个方面:第一,计量经济学模型的选择和确定,包括对变量和经济模型的选择,需要经济学理论提供依据和思路;第二,计量经济分析中对经济模型的修改和调整,如改变函数形式、增减变量等,需要有经济理论的指导和把握;第三,计量经济分析结果的解读和应用也需要经济理论提供基础、背景和思路。计量经济学对统计学的应用,至少有两个重要方面:一是计量经济分析所采用的数据的收集与处理、参数的估计等,需要使用统计学的方法和技术来完成;一是参数估计值、模型的预测结果的可靠性,需要使用统计方法加以分析、判断。计量经济学对数学的应用也是多方面的,首先,对非线性函数进行线性转化的方法和技巧,是数学在计量经济学中的应用;其次,任何的参数估计归根结底都是数学运算,较复杂的参数估计方法,或者较复杂的模型的参数估计,更需要相当的数学知识和数学运算能力,另外,在计量经济理论和方法的研究方面,需要用到许多的数学知识和原理。计量经济学与经济学、数学、统计学的区别也很明显,经济学、数学、统计学中的任何一门学科,都不能替代计量经济学,这三门学科简单地合起来,也不能替代计量经济学。计量经济学与经济学的主要区别在于:经济学一般根据逻辑推理得出结论,说明经济现象和过程的本质与规律,大多是定性的表述。虽然理论经济学有时也会涉及经济现象和过程的数量关系,如产出随投入要素的增减而增减,但不提供这类数量关系的具体度量,不说明随投入要素的增减产出增减多少。计量经济学则要对经济理论所确定的数量关系作出具体估计,也就是对经济理论进行经验的证明。计量经济学与统计学最根本的区别在于:第一,计量经济学是以问题为导向,以经济模型为核心的,统计学则是以数据为核心,常常也是以数据为导向的。虽然现代统计学并不排斥经济理论和模型,有时也会利用它们,但不一定以特定的经济理论或模型为基础和出发点,常常可以通过对经济数据的统计直接得出结论,侧重于数据的采集、筛选和处理;第二,计量经济学对经济理论的实证作用较强。计量经济学从经济理论和经济模型出发,进行分析的过程,实际上是对经济理论证实或证伪的过程。这使得它对经济理论的验证作用很强,比统计学强的多;第三,计量经济学对经济问题有更重要的指导作用。计量经济学通常不仅要对数据进行处理和分析,获得经济问题的一些数字特征,而且要借助于经济理论和数学工具,对经济问题作出更深刻的解剖和解读。经过计量经济分析实证检验的经济理论和模型,能对分析、研究和预测更广泛的经济问题起到重要作用。计量经济学与数学的区别不言而喻,因为数学只是计量经济分析及其理论研究的工具,与实证分析经济问题的计量经济学的区别显而易见。3.经典计量经济学与非经典计量经济学是如何划分的?答:经典计量经济学与非经典计量经济学的划分可从计量经济学的发展时期及其理论方法上的特征来把握。经典计量经济学一般指上世纪70年代以前发展起来的计量经济学,在理论方法上具有以下五个方面的共同特征:第一,在模型类型上,采用随机模型;第二,在模型导向上,以经济理论为导向;第三,在模型结构上,采用线性或可化为线性的模型,反映变量之间的因果关系;第四,在数据类型上,采用时间序列数据或截面数据;第五,在估计方法上,采用最小二乘法或最大似然法。非经典计量经济学一般指上世纪70年代以后发展起来的计量经济学,也称现代计量经济学,与经典计量经济学理论方法上的五个方面的特征相对应,非经典计量经济学包括模型类型非经典计量经济学问题、模型导向非经典计量经济学问题、模型结构非经典计量经济学问题、数据类型非经典计量经济学问题、估计方法非经典计量经济学问题五个方面的内容。4.计量经济研究中如何进行理论模型的设定?答:理论模型的设定,是对经济问题的数学描述或模拟,涉及变量的设定、模型函数形式的设定、参数取值范围的设定三个方面。理论模型设定中变量的设定,主要是解释变量的设定,因为被解释变量是作为研究对象的变量,可由研究问题本身直接确定。解释变量的设定需要通过以下几个方面把握:第一,解释变量应是根据经济理论或实践经验确定的被解释变量的主要影响因素,遗漏了主要影响因素或将次要影响因素甚至不相关因素引入模型,都可能导致研究结果的偏误;第二,若有多个解释变量,需注意避免解释变量之间的相关性。解释变量之间若存在一定的相关关系,可直接影响参数估计量的性质,降低研究结果的可靠性;第三,在设定解释变量的同时,应注意保证与解释变量对应的观察数据的可得性,没有样本观察数据的支持,就得不到模型的参数估计值,进一步的研究也将无法展开。模型函数形式的设定,首先,可以直接采用数理经济学已有的函数形式,另外,也可以根据样本观察数据反映出来的变量之间的关系设定,对于其他事先无法确定模型函数形式的情况,可采用各种可能的函数形式进行模拟,选择模拟结果最好的函数形式。需要指出的是,这里设定的模型函数形式只是模型函数形式的初步设定,在模型参数估计和检验的过程中,大多还会对模型的函数形式进行逐步调整,以得到较为合理的模型函数形式。参数取值范围的设定主要根据经济理论或实践经验给出,参数取值范围的设定可用来检验模型参数估计结果的合理性。5.计量经济学模型中的待估参数有哪些?答:计量经济学模型的参数包括模型的结构参数和随机误差项的分布参数两大类。模型的结构乘数是包含在模型方程中的反映模型结构特征的参数,每一个结构参数以一个字母(多为希腊字母)表示,例如生产函数模型中的参数、、、,消费函数中的参数、,都是模型的结构参数。随机误差项的分布参数主要是随机误差项的均值和方差。6.计量经济学模型的检验包括哪几个方面?为什么要进行模型的检验?答:因为经济现象和过程本身是十分复杂的,理论模型的整个建立过程,从模型设定到参数估计,都可能存在一定的偏误。在模型设定过程中,可能由于所依据的经济理论对研究对象的解释不充分,或者由于自身对研究对象的认识的欠缺,导致变量选择的偏差或模型函数形式设定的错误;在模型参数估计过程中,可能由于样本数据的统计错误、代表性差,或者由于其他信息的不可靠,导致参数估计值与真实值存在较大差距。此外,无论是单方程计量经济学模型,还是联立方程计量经济学模型,都是建立在一定的假设前提下的,如果模型的建立违背了计量经济学的基本假设,也会导致错误的结果。对模型的检验通常包括经济意义经验、统计推断检验、计量经济检验、模型预测检验四个方面。7.如何利用计量经济学模型进行政策评价?答:政策评价是将经济目标作为被解释变量,将经济政策作为解释变量,利用计量经济学模型对各种可供选择的经济政策方案的实施后果进行模拟测算,从中选择较好的政策方案。计量经济学模型用于政策评价,主要有三种方法:1)工具——目标法。给定经济目标,即给定被解释变量的取值,通过对模型求解,确定解释变量的取值,即确定具体的经济政策方案。2)政策模拟。将各种不同的政策方案代入模型,计算各自的目标值,通过对目标值的比较决定经济政策方案的取舍。3)最优控制方法。将计量经济学模型与最优化方法结合起来,选择使目标达到最优的政策或政策组合。8.计量经济学模型中的被解释变量和解释变量、内生变量和外生变量是如何划分的?答:在单方程计量经济学模型中,按照因果差异,将变量分为被解释变量(explainedvariable)与解释变量(explanatoryvariable)。被解释变量是模型的分析研究对象,是具有某种概率分布的随机变量,也称为“因变量”或“应变量”(dependentvariable)、“回归子”(regressand)等。解释变量是分析研究对象的主要影响因素,是确定性的变量,也称为“自变量”(independentvariable)、“回归元”(regressor)等。在联立方程计量经济学模型中,按是否由模型系统决定,将变量分为内生变量(endogenousvariables)和外生变量(exogenousvariables)两大类。内生变量是由模型系统决定同时可能也对模型系统产生影响的变量,是具有某种概率分布的随机变量,外生变量是不由模型系统决定但对模型系统产生影响的变量,是确定性的变量。9.计量经济学模型中包含的变量之间的关系主要有哪些?答:计量经济学模型中变量之间的关系主要是解释变量与被解释变量之间的因果关系,包括单向因果关系、相互影响关系、相互影响关系。1)单向因果关系经济变量之间的单向因果关系是单方程计量经济学模型研究的对象,指经济变量之间存在单向的内在联系,一个(一组)经济变量的水平直接影响或决定另一个经济变量的水平。2)相互影响关系经济变量之间的相互影响关系是联立方程计量经济学模型研究的对象,指变量之间存在双向的因果关系,即一变量的变化既引起另一变量的变化,反过来也受另一变量变化的影响。3)相互影响关系恒等关系是一种特殊的变量关系,实际上通常就是一些变量的定义,例如,储蓄等于可支配收入减去消费。恒等关系是变量之间的确定关系,不需要针对它们进行分析。10.什么是行为方程、技术方程、制度方程、定义方程、平衡方程?各举一例说明。答:方程是关于变量之间关系的表达式,计量经济学模型中的方程分为随机方程、恒等方程两大类。随机方程主要包括行为方程、技术方程、制度方程等,恒等方程主要包括定义方程、平衡方程等。行为方程是反映居民、企业、政府经济行为的随机方程。如描述居民消费与收入等的关系的消费函数方程,反映居民的消费行为,是一个行为方程;技术方程是反映客观经济技术关系的随机方程。如描述产出与投入要素之间关系的生产函数方程,反映一定生产技术条件下投入要素与产出之间的技术关系,是一个技术方程;制度方程是反映政府政策、规定的随机方程。如描述税收与课税对象数额、税率之间关系的税收函数方程,反映政府的税收规定,是一个制度方程;定义方程是反映经济学或经济统计学对经济变量的定义的恒等方程。以宏观经济学对国内生产总值的定义为例,按生产法,国内生产总值等于第一产业、第二产业、第三产业的增加值之和;平衡方程是反映经济变量之间的某种平衡关系的恒等方程。如描述某种产品的供给等于需求的方程,反映该种产品的市场供需均衡,是一个平衡方程。11.什么是单方程模型、联立方程模型、时间序列模型?三者之间的关系如何?答:单方程模型(single-equationmodel)是只含有一个方程的计量经济学模型;联立方程模型(simultaneous-equationmodel)是由多个方程组成的计量经济学模型;时间序列模型(timeseriesmodel)是反映经济变量与时间变量之间关系的计量经济学模型。单方程模型、联立方程模型、时间序列模型分别适用于不同的情况和问题,分析方法也有区别。但这三种模型之间也有联系,联立方程模型是由多个单方程模型有机组合而成,单方程模型在联立方程模型中有很多应用,时间序列模型也是一种单方程模型。12.计量经济学中常用的数据类型有哪些?各举一例说明。答:根据生成过程和结构方面的差异,计量经济学中应用的数据可分为时间序列数据(timeseriesdata)、截面数据(crosssectionaldata)、面板数据(panaldata)和虚拟变量数据(dummyvariablesdata)。时间序列数据是同一观察对象在不同时间点上的取值的统计序列,可理解为随时间变化而生成的数据。根据统计或观察的时间间隔的不同,时间序列数据有“年度数据”、“季节数据”、“月份数据”之分。比如说年度CPI、季节CPI、月份CPI。截面数据是许多不同的观察对象在同一时间点上的取值的统计数据集合,可理解为对一个随机变量重复抽样获得的数据。例如,以某100个居民家庭为样本,研究居民家庭的消费与收入之间的关系,这100个家庭的完整的收入和消费数据就是一个截面数据。面板数据是结合了时间序列数据和截面数据特征的数据,是多个观察对象在不同时间点上的取值的统计数据集合。例如,以某100个居民家庭为样本,研究从1990—2021年居民家庭的消费与收入之间的关系,这16年来的100个家庭的完整的收入和消费数据就是一个面板数据。虚拟变量数据是人为设定的虚拟变量的取值。例如人的性别分为女性和男性,可以用0和1来表示。13.什么是数据的完整性、准确性、可比性、一致性?答:1)完整性,指模型中所有变量在每个样本点上都必须有观察数据,所有变量的样本观察数据都一样多。2)准确性,指样本数据必须准确反映经济变量的状态或水平。数据的准确性与样本数据的采集直接相关,通常是研究者所不能控制的。3)可比性,指数据的统计口径必须相同,不同样本点上的数据要有可比性。4)一致性,指母体与样本即变量与数据必须一致。14.计量经济学作为一门独立的经济学科正式诞生的标志是什么?答:计量经济学作为一门独立的学科,一般认为正式诞生于二十世纪三十年代初,其标志是:1930年挪威经济学家弗里希(R.Frisch)、荷兰经济学家丁伯根(J.Tinbergen)、美国经济学家费歇尔(I.Fisher)等在美国俄亥俄州克里夫兰组织成立世界计量经济学会(EconometricSociety);1933年世界计量经济学会会刊《计量经济学》(Econometrica)创刊。15.试论计量经济学在经济学科中的地位。答:理论与方法的迅速发展和在经济活动实践中的广泛应用,使计量经济学在经济学科中占有了十分突出的地位。一般认为,1969年诺贝尔经济学奖的设立,标志着经济学已成为一门科学。在经济学走向科学化的过程中,计量经济学起了特殊作用,因而1969年的首届诺贝尔经济学奖授予了创立计量经济学的弗里希和丁伯根。据统计,在历届诺贝尔经济学奖获得者中,有2/3以上是计量经济学家,有10位直接因为对计量经济学发展的贡献而获奖;有近20位担任过世界计量经济学会会长;有30余位在获奖成果中应用了计量经济学。为此,第二届诺贝尔经济学奖得主美国著名经济学家萨缪尔森评价说:“第二次世界大战后的经济学是计量经济学时代”;第十二届诺贝尔经济学奖得主美国著名经济学家克莱因评价说:“计量经济学已经在经济学科中居于最重要的位置”。第二章一元线性回归模型1.什么是相关分析?什么是回归分析?相关分析与回归分析的关系如何?答:相关分析(correlationanalysis)是研究变量之间的相关关系的形式和程度的一种统计分析方法,主要通过绘制变量之间关系的散点图和计算变量之间的相关系数进行。回归分析(regressionanalysis)是研究不仅存在相关关系而且存在因果关系的变量之间的依存关系的一种分析理论与方法,是计量经济学的方法论基础。相关分析与回归分析既有联系又有区别。联系在于:相关分析与回归分析都是对存在相关关系的变量的统计相关关系的研究,都能测度线性相关程度的大小,都能判断线性相关关系是正相关还是负相关。区别在于:相关分析仅仅是从统计数据上测度变量之间的相关程度,不考虑两者之间是否存在因果关系,因而变量的地位在相关分析中是对等的;回归分析是对变量之间的因果关系的分析,变量的地位是不对等的,有被解释变量和解释变量之分。2.随机误差项在计量经济学模型中的作用是什么?答:计量经济学是研究经济变量之间存在的随机因果关系的理论与方法,其中对经济变量之间关系的随机性的描述通过引入随机误差项(stochasticerror)的方式来实现。一个经济变量通常不能被另一个经济变量完全精确地决定,需要引入随机误差项来反映各种误差的综合影响,主要包括:1)变量的内在随机性的影响;2)解释变量中被忽略的因素的影响;3)模型关系设定误差的影响;4)变量观察值的观察误差的影响;5)其他随机因素的影响。3.什么是总体回归函数?什么是总体回归模型?答:给定解释变量条件下被解释变量的期望轨迹称为总体回归曲线(populationregressioncurve),或总体回归线(populationregressionline)。描述总体回归曲线的函数称为总体回归函数(populationregressionfunction)。对于只有一个解释变量的情形,总体回归函数为表示对于解释变量的每一个取值,都有被解释变量的条件期望与之对应,是的函数。对于含有多个解释变量、、、的情形,总体回归函数为表示对于解释变量、、、的每一组取值,都有被解释变量的条件期望与之对应,是、、、的函数。引入了随机误差项,称为总体回归函数的随机设定形式,也是因为引入了随机误差项,成为计量经济学模型,称为总体回归模型(populationregressionmodel)。4.什么是样本回归函数?什么是样本回归模型?答:由于总体中包含的个体的数量往往非常多,总体回归函数的具体形式一般无法精确确定,是未知的,通常只能根据经济理论或实践经验对总体回归函数进行合理的假设,然后根据有限的样本观察数据对总体回归函数进行估计。根据样本数据对总体回归函数作出的估计称为样本回归函数(simpleregressionfunction)。引入样本回归函数中的代表各种随机因素影响的随机变量,称为样本残差项、回归残差项或样本剩余项、回归剩余项,简称残差项或剩余项(residual),通常用表示。在样本回归函数中引入残差项后,得到的是随机方程,成为了计量经济学模型,称为样本回归模型。5.线性回归模型中“线性”的含义是什么?答:线性函数和通常意义下的线性函数不同,这里的线性函数指参数是线性的,即待估参数都只以一次方出现,解释变量可以是线性的,也可以不是线性的。例如都是线性回归模型。都不是线性回归模型。6.为什么要对模型提出假设?一元线性回归模型的基本假设有哪些?答:线性回归模型的参数估计方法很多,但各种估计方法都是建立在一定的假设前提之下的,只有满足假设,才能保证参数估计结果的可靠性。为此,本节首先介绍模型的基本假设。一元线性回归模型的基本假设包括对解释变量的假设、对随机误差项的假设、对模型设定的假设几个方面,主要如下:1)解释变量是确定性变量,不是随机变量。2)随机误差项具有0均值、同方差,且在不同样本点之间是独立的,不存在序列相关,即3)随机误差项与解释变量不相关。即4)随机误差项服从正态分布,即5)回归模型是正确设定的。这5条假设中的前4条是线性回归模型的古典假设,也称为高斯假设,满足古典假设的线性回归模型称为古典线性回归模型(classicallinearregressionmodel)。7.参数的普通最小二乘估计法和最大似然估计法的基本思想各是什么?答:普通最小二乘法(ordinaryleastsquares,OLS)是最常用的参数估计方法,其基本思想是使样本回归函数尽可能好地拟合样本数据,反映在图上,就是要使样本散点偏离样本回归直线的距离总体上最小。在样本容量为n的情况下,就是要使n个样本点的被解释变量的估计值与实际观察值的偏差总体上最小。为避免残差的正负抵消,同时考虑计算处理上的方便,最小二乘法以表示被解释变量的估计值与实际观察值的偏差总体上最小,称为最小二乘准则。最大似然法(maximumlikelihood,ML),也称为最大或然法或极大似然法。最大似然法的基本思想是使从模型中取得样本观察数据的概率最大,就是说把随机抽取得到的样本观察数据看作是重复抽取中最容易得到的样本观察数据,即概率最大,参数估计结果应该反映这一情况,使得到的模型能以最大概率产生样本数据。8.普通最小二乘参数估计量和估计值各有哪些性质?答:在满足基本假设情况下,一元线性回归模型的普通最小二乘参数估计量是最佳线性无偏估计量。用普通最小二乘法估计得到的一元线性回归模型的样本回归函数具有如下性质:样本回归线过样本均值点,即点满足样本回归函数;被解释变量的估计的均值等于实际值的均值,即;残差和为零,即;解释变量与残差的乘积之和为零,即;被解释变量的估计与残差的乘积之和为零,即。9.随机误差项方差的普通最小二乘估计和最大似然估计各是什么?是否是无偏估计?随机误差项的方差的普通最小二乘估计量为是一个无偏估计量。随机误差项的方差的最大似然估计量为与普通最小二乘估计量不同,随机误差项的方差的最大似然估计量是一个有偏估计量。10.什么是拟合优度?什么是拟合优度检验?拟合优度通过什么指标度量?为什么残差平方和不能作为拟合优度的度量指标?答:拟合优度指样本回归线对样本数据拟合的精确程度,拟合优度检验就是检验样本回归线对样本数据拟合的精确程度。样本残差平方和是一个可用来描述模型拟合效果的指标,残差平方和越大,表明拟合效果越差;残差平方和越小,表明拟合效果越好。但残差平方和是一个绝对指标,不具有横向可比性,不能作为度量拟合优度的统计量。所以拟合优度检验的度量指标是通过残差平方和构造的决定系数来进行检验的。决定系数公式是:与残差平方和不同,决定系数是一个相对指标,具有横向可比性,因此可以用作拟合优度检验。11.一元线性回归模型的普通最小二乘参数估计量的分布如何?答:由于的普通最小二乘估计量满足线性性,可表示为被解释变量的线性组合,所以也服从正态分布。所以进行标准化变换可得(1)(2)其中,随机误差项的方差的真实值未知,只能用其无偏估计量替代。用无偏估计量替代后得到的的方差和标准差的估计量分别称为的样本方差和样本标准差,样本方差和样本标准差可分别用、表示,即用替代后,式(1)、(2)中的统计量服从自由度为的分布,将替代后的统计量分别记为,有12.什么是变量显著性检验?答:一元线性回归模型中,是否显著不为0,反映解释变量对被解释变量的影响是否显著,所以常针对原假设,备择假设,进行检验,称为变量显著性检验。原假设为,备择假设为时,根据原假设对于给定的显著性水平,查自由度为的分布临界值,并计算的值,如果,接受原假设,认为解释变量对被解释变量的影响不显著;反之,如果则拒绝原假设,接受备择假设,认为解释变量对被解释变量的影响显著。13.为什么被解释变量总体均值的预测置信区间比个别值的预测置信区间窄?答:被解释变量的总体均值的波动,主要取决于样本数据的抽样波动。被解释变量的个别值的波动,除受样本数据的抽样波动的影响外,还受随机误差项的影响。反映在式(2-50)、式(2-51)中,,总体均值的预测置信区间窄于个别值的预测置信区间。14.由1981—2021年的样本数据估计得到反映某一经济活动的计量经济学模型,利用模型对2050年该经济活动的情况进行预测,是否合适?为什么?答:因为在解释变量的样本均值处,样本观察数据的代表性往往较好,即抽样波动往往较小,被解释变量的总体均值和个别值的波动较小。反之,解释变量的取值偏离的距离越大,样本观察数据的代表性往往越差,即抽样波动往往越大,被解释变量的总体均值和个别值的波动越大。由此可见,用回归模型作预测时,解释变量的取值不宜偏离解释变量的样本均值太大,否则预测精度会大大降低。所以利用模型对2050年的经济活动的情况进行预测不合适。15.在一元线性回归模型中,用不为零的常数去乘每一个X值,对参数与的估计值、Y的拟合值、残差会产生什么样的影响?如果用不为零的常数去加每一个X值,又会怎样?解答:记原总体模型对应的样本回归模型为,则有,Y的拟合值与残差分别为记,则有记新总体模型对应的样本回归模型为则有于是在新的回归模型下,Y的拟合值与残差分析分别为可见,用不为零的常数去乘每一个X值,的估计值变为原来的,的估计值、Y的拟合值与模型的残差不变。如果记于是新模型的回归参数分别为在新的回归模型下,Y的拟合值与残差分别为可见,如果用不为零的常数去加每一个X值,的估计值改变,的估计值、Y的拟合值与模型的残差不变。16.在一元线性回归模型中,用不为零的常数去乘每一个Y值,对参数、的估计值会产生什么样的影响?如果用不为零的常数去加每一个Y值,又会怎样?解答:记原总体模型对应的样本回归模型为,则有,Y的拟合值与残差分别为记,则有记新总体模型对应的样本回归模型为则有可见,用不为零的常数去乘每一个Y值,、的估计值会变为原来的倍。如果记于是新模型的回归参数分别为可见,用不为零的常数去加每一个Y值,的估计值比原来增大、的估计值不变。17.(注意:本题的数据有误,需做修改,Y的均值和平方和、X的平方和做了修改)由某公司分布在12个地区的销售点的销售量(Y)和销售价格(X)数据得出如下结果:1)建立销售量对价格的一元线性回归方程;2)求决定系数。解答:1)由已知条件知:故又因为所以所以销售量对价格的一元线性回归方程为:2)由于而,所以所以18.《华尔街日报2021年年鉴》(TheWallStreetJournalAlmanac2021)公布的美国各航空公司业绩统计数据显示,各航空公司航班正点到达比率和每10万乘客投诉次数如表2-9所示。表2-9美国各航空公司航班正点到达比率和每10万乘客投诉次数航空公司名称航班正点率(%)投诉率(次/10万乘客)西南(Southwest)航空公司大陆(Continental)航空公司西北(Northwest)航空公司美国(USAirways)航空公司联合(United)航空公司美洲(American)航空公司德尔塔(Delta)航空公司美国西部(Americawest)航空公司环球(TWA)航空公司81.876.676.675.773.872.271.270.868.50.210.580.850.680.740.930.721.221.25要求:1)画出这些数据的散点图;2)根据散点图确定两变量之间存在什么关系;3)求投诉率对航班正点到达比率的回归方程;4)对回归方程的斜率的意义作出解释;5)如果航班正点率为80%,估计每10万旅客投诉的次数是多少。解答:1)设投诉率为被解释变量y,航班正点达比率为解释变量x,以y为纵轴,以x为横轴作散点图。2)根据散点图可确定两变量之间反向的相关关系,并呈现线性关系。3)可得回归方程:(5.719)(-4.967)4)上述的回归结果的斜率表示,航班正点达比率提高1个百分点,那么投诉率会将下降0.07041(次/10万乘客);5)如果航班正点率为80%,代入到回归方程,可得:19.我国1979—2021年的国内生产总值与财政收入数据如表2-10所示。表2-10我国国内生产总值与财政收入数据单位:亿元年份财政收入Y国内生产总值X年份财政收入Y国内生产总值X19791980198119821983198419851986198719881989199019911146.381159.931175.791212.331366.951642.862021.822122.012199.352357.242664.92937.13149.484038.24517.84862.45294.75934.571718964.410202.211962.514928.316909.218547.921617.819921993199419951996202120212021202120212021202120213483.374348.955218.16242.27407.998651.149875.9511444.0813395.2316386.0418903.6421715.2526396.4726638.134634.446759.458478.167884.674462.678345.282067.589403.697314.8105172.2117390.2136875.9要求:1)建立财政收入随国内生产总值变化的一元线性回归模型;2)对模型进行检验;3)若2021年的国内生产总值为155936.8,求2021年财政收入的预测值和预测置信区间(取=0.05)。解答:1)建立财政收入随国内生产总值变化的一元线性回归模型:(-0.892)(18.411)2)从回归的结果看,模型拟合较好。可决系数为0.9339,表明模型在整体上拟合得非常好。从截距项与斜率项的t检验值看,在5%的显著性水平下,斜率项通过检验,而截距项则不能通过。去掉截距项,重新估计模型,可得新的回归方程:(26.42)并且从斜率项的值看,0<0.1602<1,符合实际经济情况。3)若2021年的国内生产总值为155936.8,则2021年财政收入预测的点估计值:在95%的置信度下,的预测区间为:(20700.16,29269.68)第三章多元线性回归模型1.多元线性回归模型的基本假设有哪些?在多元线性回归模型的参数估计量的无偏性、有效性的证明中各用了哪些?解答多元线性回归模型的基本假设也包括对解释变量的假设、对随机误差项的假设、对模型设定的假设几个方面,主要如下:1)解释变量是确定性变量,不是随机变量,解释变量之间不相关,即矩阵是阶非随机矩阵,矩阵列满秩据此,有矩阵非奇异。2)随机误差项具有0均值、同方差,且在不同样本点相互独立,不存在序列相关性,即用矩阵形式表示为3)解释变量与随机误差项不相关,即4)随机误差项服从正态分布,即用矩阵形式可表示为5)回归模型是正确设定的。同一元线性回归模型,在这5条假设中,前4条假设是古典假设,若前两条假设满足,第3条假设自然满足,并且由第2条假设有在证明参数估计量的无偏性时,利用了解释变量非随机或与随机干扰项不相关的假定;在证明参数估计量的有效性时用到了随机干扰项同方差且无序列相关的假定。2.对于多元线性回归模型,证明(1)(2)(3)证(1)由多元线性回归模型的基本假设可知:那么,(2)证明如下:(3)证明如下:3.在多元模型中,为何要对决定系数进行调整?调整的决定系数与F的关系如何?解答在多元线性回归模型中,因为决定系数随解释变量数目的增加而增大(或至少不变),所以不能利用决定系数进行解释变量数目不同的模型的拟合优度的比较。同时,若以决定系数度量模型的拟合优度,还会造成通过增加解释变量数目提高模型拟合优度的倾向,而事实上,解释变量的数目并非越多越好,若增加的解释变量不是被解释变量的重要影响因素,甚至是被解释变量的不相关因素,反而会对模型产生负面影响。正是由于存在这样的缺陷,决定系数在多元线性回归模型拟合优度评价方面的作用受到了很大的限制。克服决定系数的上述缺陷的方法,是对决定系数进行适当的调整,得到调整的决定系数。调整的决定系数与F统计量存在下列关系:或4.t检验、F检验的关系如何?解答变量显著性检验(t检验)是针对单个解释变量对被解释变量的影响是否显著所作的检验,检验被检验变量的参数为0是否显著成立;方程显著性检验(F检验)是针对所有解释变量对被解释变量的联合影响是否显著所作的检验,检验被解释变量与解释变量之间的线性关系在总体上是否显著成立。5.对于多元线性回归模型(1)求参数的普通最小二乘估计量。(2)对于该模型,参数的普通最小二乘估计量是否依然满足线性性、无偏性、有效性?(3)对于该模型,是否依然有解答(1)(2)依然满足线性性、无偏性、有效性(3)依然有6.证明,在显著性水平下,当时,的置信度为的置信区间不包括0。解答在显著性水平下,当时,即或或而在的置信度下,的置信区间是:当时,的置信区间的下限大于0;当时,的置信区间的上限小于0;的置信度为的置信区间不包括0。7.为研究某地家庭书刊消费与家庭收入、户主受教育程度之间的关系,建立了家庭书刊年消费支出Y(元)、家庭月平均收入(元)、户主受教育年数(年)的模型,用抽样得到的35个家庭的数据估计得(1)从经济意义上考察模型的合理性。(2)在5%的显著性水平上,进行变量显著性检验。(3)在5%的显著性水平上,进行方程总体显著性检验。解答(1)家庭月平均收入越高,家庭书刊年消费支出相应会增加,但不会有收入增加的那么快,所以家庭月平均收入的系数应大于0,小于1;户主受教育年数越多,那么对文化产品的需求也会越多,家庭书刊年消费支出相应会增加,所以其系数大于0。从经济意义上看,模型参数是比较合理的。(2)在5%的显著性水平上,查表得显然,两估计参数计算的t值大于临界值,拒绝它们各自为零的原假设,两变量显著。(3)在5%的显著性水平上,自由度为(2,32)的F分布的临界值为3.294537,计算的F值大于该临界值,所以拒绝原假设,方程总体显著。8.(注意:本题数据有误,需修改,回归平方和、总平方和调换了位置)一个二元线性回归模型的回归结果如表3-5所示。表3-5回归分析结果方差来源平方和自由度来自回归来自残差来自总离差170582678332(1)求样本容量n,残差平方和RSS,回归平方和ESS的自由度,残差平方和RSS的自由度。(2)求决定系数和调整的决定系数。(3)根据以上信息,在给定显著性水平下,可否检验两个解释变量对被解释变量的联合影响是否显著?为什么?(4)根据以上信息,在给定显著性水平下,可否检验两个解释变量各自对被解释变量的影响是否显著?为什么?解答(1)总离差平方和的自由度为n-1,所以样本容量为33。因为回归平方和的自由度为解释变量个数,所以为2。残差平方和的自由度为n-k-1=30。(2)(3)因为联合检验的F统计量为:根据以上信息,在给定显著性水平下,可检验两个解释变量对被解释变量的联合影响是否显著。(4)不能。由于无法计算参数的t值。9.(注意:本题的CES生产函数有误,其中的改为)某地1981-2021年国内生产总值Y、生产资金K、从业人数L的统计数据如表3-6所示。表3-6某地1981—2021年的国内生产总值及相关数据年份GDP(亿元)时间变量生产资金(亿元)从业人数(万人)年份GDP(亿元)时间变量生产资金(亿元)从业人数(万人)1981198219831984198519861987198819891990199119921993123.6125.8128.5132.3138.3140.7147.2155.4167.0180.1213.7309.9385.812345678910111213486.7512.5521.8532.9550.3581.9589.3601.8631.9655.1667.31083.31358.9386.4391.2396.1401.9406.3410.8414.9419.5421.0425.6429.7435.6451.21994199519962021202120212021202120212021202120212021406.2421.3563.5710.6867.9910.31025.41287.61328.11409.11582.31790.51925.7141516171819202122232425261500.81523.71657.82378.52903.73106.73218.53827.64057.14355.24633.64897.45721.3456.3461.1465.4470.2473.9479.4483.5489.1483.1490.2498.4510.1516.2(1)估计C—D生产函数(2)估计线性化后的CES生产函数推算各个参数的估计值。其中,各个参数的含义为:——基期技术水平;——技术进步率;t——为时间变量;——劳动的贡献份额;——资本的贡献份额;——规模效益参数;——分布系数,反映劳动要素的密集程度,;——替代参数,。解答(1)C—D生产函数两边取对数,可得:估计结果为:Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)5.097257.090890.7190.4798T0.032170.013832.3250.0297*ln(L)-1.056351.20352-0.8780.3896ln(K)0.954630.0579416.4757.34e-14***Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:0.05453on22degreesoffreedomMultipleR-squared:0.9974,AdjustedR-squared:0.997F-statistic:2774on3and22DF,p-value:<2.2e-16于是,取对数后的C—D生产函数的样本回归方程为:据此可进一步求得原模型中的参数原模型的估计结果为(2)估计线性化后的CES生产函数EViews估计结果为:DependentVariable:LOG(Y)Method:LeastSquaresDate:10/23/08Time:23:26Sample:19812021Includedobservations:26VariableCoefficientStd.Errort-StatisticProb.C5.6348219.2439490.6095690.5487T0.0330070.0167291.9730470.0618LOG(L)-1.1576631.637611-0.7069220.4874LOG(K)0.9651370.1267107.6168830.0000LOG(K/L)*LOG(K/L)-0.0035080.037374-0.0938670.9261R-squared0.997364Meandependentvar6.006157AdjustedR-squared0.996862S.D.dependentvar0.996194S.E.ofregression0.055802Akaikeinfocriterion-2.762956Sumsquaredresid0.065392Schwarzcriterion-2.521014Loglikelihood40.91843F-statistic1986.622Durbin-Watsonstat1.860419Prob(F-statistic)0.000000可见为此(注:存在多重共线性问题,所以参数估计结果的经济意义不合理)10.某商品的需求函数为其中,Y为需求量,X1为消费者收入,X2为该商品价格。(1)解释参数的经济意义。(2)若价格上涨10%将导致需求如何变化?(3)在价格上涨10%情况下,收入增加多少才能保持需求不变。(4)解释模型中各个统计量的含义。解答(1)由样本方程的形式可知,X1的参数为此商品的收入弹性,表示X2的参数为此商品的价格弹性。(2)由弹性的定义知,如果其它条件不变,价格上涨10%,那么对此商品的需求量将下降1.8%。(3)根据同比例关系,在价格上涨10%情况下,为了保持需求不变,收入需要增加0.46×0.018=0.00828,即0.828%。(4)第一行括弧里的数据0.126、0.032是参数估计量的样本标准差,第二行括弧里的数据3.651、-5.625是变量显著性检验的t值,t值较大,说明收入和价格对需求的影响显著.分别是决定系数、调整的决定系数、方程显著性检验的F值,这三个统计量的取值较大,说明模型的总体拟合效果较好。11.表3-5给出了1960—1982年7个OECD国家的能源需求指数Y、实际GDP指数X1、能源价格指数X2,所有价格指数均以1973年为基准(1973年为100)。表3-71960-1982年7个OECD国家的能源需求指数及相关数据年份能源需求指数实际GDP指数能源价格指数年份能源需求指数实际GDP指数能源价格指数19601961196219631964196519661967196819691970197154.155.458.561.763.666.870.373.578.383.388.991.854.156.459.462.165.969.573.275.779.983.886.289.8111.9112.4111.1110.2109.0108.3105.3105.4104.3101.797.7100.31972197319741975187618771978197919801981198297.2100.097.393.599.1100.9103.9106.9101.298.195.694.3100.0101.4100.5105.3109.9114.4118.3119.6121.1120.698.6100.0120.1131.0129.6137.7133.7144.5179.0189.4190.9资料来源:OrganizationforEconomicCo-operationandDevelopment(1)建立能源需求的对数函数模型,解释各回归系数的意义,用P值检验各解释变量是否显著、方程是否显著。(2)建立能源需求的线性函数模型,解释各回归系数的意义,用P值检验各解释变量是否显著、方程是否显著。(3)比较所建立的两个模型,如果两个模型的结论不同,你将选择哪个模型?为什么?根据你选定的模型,估计实际GDP指数为98.6、能源价格指数为121.5时能源需求指数的数值,构造该估计值的95%的置信区间。解答(1)根据题意,建立能源需求的对数函数模型,回归结果如下:Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)1.549500.0901117.201.89e-13***log(X1)0.996920.0191152.17<2e-16***log(X2)-0.331360.02431-13.631.39e-11***Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:0.01801on20degreesoffreedomMultipleR-squared:0.9941,AdjustedR-squared:0.9935F-statistic:1694on2and20DF,p-value:<2.2e-16根据上面的结果,自由度为(3,20)的F统计量的P值小于2.2e-16,因此在给定显著性水平5%,从整体上看,样本方程总体上的线性关系是显著的。同理ln(X1)和ln(X2)两项参数估计量的P值小于0.05,所以在给定显著性水平5%,均通过变量显著性检验。于是,样本回归方程为:根据回归结果,参数,说明在其他变量不变的条件下,实际GDP指数每上升1%,就会使能源需求指数上升0.997%,与理论模型中描述的实际GDP指数与能源需求指数之间存在正相关关系相一致;参数,说明在其他变量不变的条件下,能源价格指数每下降1%,就会使能源需求指数上升0.331%,与理论模型中描述的能源价格指数与能源需求指数之间存在负相关关系相一致,并且,这理论模型能源产品一般是缺乏弹性的相一致。(2)根据题意,建立能源需求的线性函数模型,回归结果如下:Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)28.255061.4214919.881.21e-14***X10.980850.0194550.42<2e-16***X2-0.258430.01528-16.912.59e-13***Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:1.435on20degreesoffreedomMultipleR-squared:0.9939,AdjustedR-squared:0.9933F-statistic:1627on2and20DF,p-value:<2.2e-16根据上面的结果,自由度为(3,20)的F统计量的P值小于2.2e-16,因此在给定显著性水平5%,从整体上看,样本方程总体上的线性关系是显著的。同理ln(X1)和ln(X2)两项参数的P值小于0.05,所以在给定显著性水平5%,均通过变量显著性检验。于是,样本回归方程为:根据回归结果,参数,说明在其他变量不变的条件下,实际GDP指数每增加1,就会使能源需求指数上升0.981,与理论模型中描述的实际GDP指数与能源需求指数之间存在正相关关系相一致;参数,说明在其他变量不变的条件下,能源价格指数每下降1,就会使能源需求指数上升0.259,与理论模型中描述的能源价格指数与能源需求指数之间存在负相关关系相一致。(3)比较所建立的两个模型,两个模型均通过了方程和变量显著性检验,但是第一个模型的可决系数为0.9941,调整的可决系数为0.9935,比第二个模型都高;并且对数模型的系数有着特殊的经济含义,代表了弹性系数,所以如果两个模型的结论不同,将选择第一个模型。根据所选定的模型,当估计实际GDP指数为98.6、能源价格指数为121.5时,代入到方程中,求得能源需求指数的预测值的估计值,进一步可算得其95%的置信区间为:12.设定模型,研究我国“税收收入”受“国内生产总值”、“财政支出”、“商品零售价格指数”的影响,据《中国统计年鉴》得到的样本数据如表3-5所示。表3-8我国税收收入及相关数据年份税收收入(亿元)国内生产总值(亿元)财政支出(亿元)商品零售价格指数(%)197819791980198119821983198419851986198719881989199019911992199319941995199620212021202120212021202120212021202151953857263070077694720412091214023902727282229903297425551276038691082349263106831258215301176362021724166287793645406345464892532359637208901610275120591504316992186682178226924353344819860794711777897384402886779921510955120333135823159878183085112212821299113812301410170120212205226224912824308433873742464257936824793892341079813188158871890322053246502848733930100.7102.0106.0102.4101.9101.5102.8108.8106.0107.3118.5117.8102.1102.9105.4113.2121.7114.8106.1100.897.497.098.599.298.799.9102.8100.8(1)估计模型参数、随机误差项的方差。(2)检验模型,包括经济意义检验、拟合优度检验、变量显著性检验、方程显著性检验。解答(1)根据题意,建立线性函数模型,回归结果如下:Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)-3.757e+031.181e+03-3.1810.00402**X15.738e-033.233e-031.7750.08863.X28.124e-011.874e-0243.343<2e-16***X33.471e+011.101e+013.1520.00432**Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:348.3on24degreesoffreedomMultipleR-squared:0.9982,AdjustedR-squared:0.998F-statistic:4452on3and24DF,p-value:<2.2e-16由上面的结果知,随机误差项的标准差的最小二乘估计为348.3,所以其方差:(2)模型检验1.经济意义检验根据经济学理论知,国内生产总值的增加,会扩大税基,增加税收收入,二者呈正相关关系,而参数,与理论模型是一致的;对于第二个参数,增加财政支出,根据宏观经济学有关理论,扩张性的财政政策会扩大需求,增加产出水平,继而增加税收收入,但是一般来说,税收的增加不会超过财政支出,所以参数,与理论模型中描述是一致的;对于第三个参数,商品零售价格指数的上升,会扩大从价税,增加税收收入,二者应呈正相关关系,而且一般从价税率不会大于1,所以参数,与实际经济情况是一致的。2.统计推断检验1)拟合优度检验由表中数据可以看出,本例中的决定系数,调整的决定系数为,说明模型对样本的拟合效果较好,解释变量能对被解释变量99.8%的离差做出了解释。2)方程显著性检验——F检验给定显著性水平,F统计量值为4452,p值<2.2e-16,所以拒绝原假设,接受备择假设,认为在5%的显著性水平下,对、和有显著的线性关系,回归方程是显著的,即解释变量“国内生产总值”、“财政支出”、“商品零售价格指数”联合起来对被解释变量“税收收入”有显著影响。3)变量显著性检验——t检验给定显著性水平,由(1)中回归结果可以看出,除了解释变量“国内生产总值”外,其余两个解释变量的p值<0.05。这表明解释变量“财政支出”和“商品零售价格指数”都在95%的置信水平下对被解释变量“税收收入”影响显著,都通过变量的显著性检验。第四章随机解释变量问题1.随机解释变量的来源有哪些?答:随机解释变量的来源有:经济变量的不可控,使得解释变量观测值具有随机性;由于随机干扰项中包括了模型略去的解释变量,而略去的解释变量与模型中的解释变量往往是相关的;模型中含有被解释变量的滞后项,而被解释变量本身就是随机的。2.随机解释变量有几种情形?分情形说明随机解释变量对最小二乘估计的影响与后果?答:随机解释变量有三种情形,不同情形下最小二乘估计的影响和后果也不同。(1)解释变量是随机的,但与随机干扰项不相关;这时采用OLS估计得到的参数估计量仍为无偏估计量;(2)解释变量与随机干扰项同期无关、不同期相关;这时OLS估计得到的参数估计量是有偏但一致的估计量;(3)解释变量与随机干扰项同期相关;这时OLS估计得到的参数估计量是有偏且非一致的估计量。3.选择作为工具变量的变量必须满足那些条件?答:选择作为工具变量的变量需满足以下三个条件:(1)与所替代的随机解释变量高度相关;(2)与随机干扰项不相关;(3)与模型中其他解释变量不相关,以避免出现多重共线性。4.对模型Yt=β0+β1X1t+β2X2t+β3Yt-1+μt假设Yt-1与μt相关。为了消除该相关性,采用工具变量法:先求Yt关于X1t与X2t回归,得到,再做如下回归:Yt=β0+β1X1t+β2X2t+β3+μt试问:这一方法能否消除原模型中Yt-1与μt的相关性?为什么?解答:能消除。在基本假设下,X1t,X2t与μt应是不相关的,由此知,由X1t与X2t估计出的应与μt不相关。5.对于一元回归模型Yt=β0+β1Xt*+μt假设解释变量Xt*的实测值Xt与之有偏误:Xt=Xt*+et,其中et是具有零均值、无序列相关,且与Xt*及μt不相关的随机变量。试问:(1)能否将Xt=Xt*+et代入原模型,使之变换成Yt=β0+β1Xt+νt后进行估计?其中,νt为变换后模型的随机干扰项。(2)进一步假设μt与et之间,以及它们与Xt*之间无异期相关,那么E(Xt-1νt)=0成立吗?Xt与Xt-1相关吗?(3)由(2)的结论,你能寻找什么样的工具变量对变换后的模型进行估计?解答:(1)不能。因为变换后的模型为Yt=β0+β1Xt+(μt-β1)显然,由于与Xt同期相关,则说明变换后的模型中的随机干扰项νt=μt-β1与Xt同期相关。(2)E(Xt-1νt)=E[(Xt-1*+et-1)(μt-β1)]=E(Xt-1*μt)-β1E(Xt-1*)+E(et-1μt)-β1E(et-1et)=0多数经济变量的时间序列,除非它们是以一阶差分的形式或变化率的形式出现,往往具有较强的相关性,因此,当Xt与Xt-1直接表示经济规模或水平的经济变量时,它们之间很可能相关;如果变量是一阶差分的形式或以变化率的形态出现,则它们间的相关性就会降低,但仍有一定程度的相关性。(3)由(2)的结论知,E(Xt-1νt)=0,即Xt-1与变换后的模型的随机干扰项不相关,而且Xt与Xt-1有较强的相关性,因此,可用Xt-1作为Xt的工具变量对变换后的模型进行估计。6.一个对某地区大学生就业增长影响的简单模型可描述如下:gEMPt=β0+β1gMINIt+β2gPOPt+β3gGDP1t+β4gGDPt+μt式中,EMP为新就业的大学生人数,MINI为该地区最低限度工资,POP为新毕业的大学生人数,GDP1为该地区国内生产总值,GDP为该国国内生产总值;g表示年增长率。(1)如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为基础来选择最低限度工资,则OLS估计将会存在什么问题?(2)令MIN为该国的最低限度工资,它与随机扰动项相关吗?(3)按照法律,各地区最低限度工资不得低于国家最低工资,哪么gMIN能成为gMINI的工具变量吗?解答:(1)由于地方政府通常是根据过去的经验、当前的经济状况以及期望的经济发展前景来定制地区最低限度工资水平,但模型中并不包含这些因素,而是被归结到了模型的随机干扰项中,因此gMINI与μ不仅异期相关,而且很可能是同期相关的,这将引起OLS估计量的偏误,甚至当样本容量增大时也不具有一致性。(2)全国最低限度工资的制定主要根据全国整体的情况而定,因此gMINI基本与上述模型的随机扰动项无关。(3)由于地方政府在制定本地区最低工资水平时往往会考虑全国最低工资水乎要求,因此gMINI与gMIN具有较强的相关性。结合(2)知gMIN可以作为gMINI的工具变量使用。第五章多重共线性1.什么是多重共线性?产生多重共线性的经济背景是什么?答:对于多元回归模型:如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。产生多重共线性的经济背景是,经济变量在时间上有共同变化的趋势和经济变量之间较强的相关性。另外,当模型中包含解释变量与其滞后解释变量时,由于解释变量本身前后期相关,也会产生多重共线性。2.多重共线性的危害是什么?为什么会造成这些危害?答:当存在完全的多重共线性时,模型的参数将无法估计,因为参数估计量(X'X)-1X'Y中的(X'X)-1将不存在;当多重共线性程度很高时,(X'X)-1的分母将变得很小,因此参数估计量的方差(X'X)-1将变大,相应的t统计量值变小,显著性检验也失去意义,模型预测失去意义;另外,解释变量的参数不再反映各自与被解释变量之间的关系,而是反映它们对解释变量的共同影响,因而参数失去了应有的经济含义。3.检验多重共线性的方法思路是什么?有哪些克服方法?答:检验多重共线性的思路是通过各种方法来检验解释变量之间是否存在显著的相关关系。多重共线性的克服方法有很多,主要可以由以下几种:利用逐步回归法排除引起共线性的变量、差分法、减少参数估计量的方差、利用先验信息改变参数的约束形式、增加样本容量等。4.在研究生产函数时,得到以下两种结果:1nt=-5.04+0.8871nKt+0.8931nLt(A)S.E.=(1.40)(0.087)(0.137)R2=0.878n=211nt=-8.57+0.0272t+0.4601nKt+1.2851nLt(B)S.E.=(2.99)(0.020)(0.333)(0.324)R2=0.889n=21其中,Y=产量,K=资本,L=劳动,t=时间,n=样本容量。请回答:(1)验证模型(A)中所有的系数在统计上都是显著的(5%);(2)验证模型(B)中t和lnK的系数在统计上不显著(5%);(3)可能什么原因造成了(B)中lnK的系数不显著;(4)如果t与lnK的相关系数为0.98,你将如何判断并能得出什么结论?解答:(1)模型(A)中三个系数对应的t统计量分别为:=-3.6=10.195=6.5182查t分布临界值表得t0.025(18)=2.101,模型(A)中三个系数t统计量的绝对值均大于临界值2.101,因此所有的回归系数在统计上都是显著的。(2)模型(B)中t和lnK的系数对应的t统计量分别为:=1.3333=1.4193查t分布临界值表得t0.025(17)=2.11,模型(B)中t和lnK的系数对应的t统计量绝对值均小于临界值2.11,因此回归系数在统计上不显著。(3)造成模型(B)中lnK系数不显著的原因是由于新变量t的引入,t与lnK之间可能存在严重的多重共线性。(4)t与lnK的相关系数为0.98,表明两者相关程度很高,模型(2)存在严重的多重共线性。5.某地区供水部门利用最近15年的用水年度数据得出如下估计模型:=-326.9+0.305HO+0.363PO–0.005RE–17.87PR–1.123RA(-1.7)(0.9)(1.4)(-0.6)(-1.2)(-0.8)=0.939F=38.9其中,W(Water)—用水总量(百万立方米),HO(House)—住户总数(千户),PO(Population)—总人口(千人),RE(Revenue)—人均收人(元),PR(price)—价格(元/100立方米),RA(rain)—降雨量(毫米)。(1)根据经济理论和直觉,预计回归系数的符号是什么(不包括常量)?为什么?观察符号与你的直觉相符吗?(2)在10%的显著性水平下,请进行变量的t检验与方程的F检验。t检验与F检验结果有相矛盾的现象吗?(3)你认为估计值是①有偏的;②无效的或③不一致的吗?详细阐述理由。解答:(1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越高。所以可期望HO和PO的符号为正;收入较高的个人可能用水较多,因此RE的预期符号为正,但它可能是不显著的;如果水价上涨,则用户会节约用水,所以可预期PR的系数为负;如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望RA的系数符号为负。从估计的模型看,除了RE之外,所有符号都与预期相符。(2)t统计量检验单个变量的显著性,F统计量检验回归方程总体线性显著与否,是联合检验。这里t检验的自由度为15-5-1=9,在10%的显著性水平下的临界值为1.833。可见,所有参数估计值的t值的绝对值都小于该值,所以即使在10%的显著水平下这些变量也不是显著的。这里,F统计值的分子自由度为5,分母自由度为9。10%显著性水平下F分布的临界值为2.61。显然计算的F值大于该临界值,表明回归系数是联合显著的。t检验与F检验结果相矛盾可能是由于多重共线性造成的。HO、PO、RE都是高度相关的,这将使它们的t值降低且表现为不显著。PR和RA不显著另有原因。根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能很好地被度量。通常情况下水价与年降雨量在各年中没有太大变化,所以它们的影响很难度量。多重共线性往往表现的是解释变量间的样本相关现象,在不存在完全共线性的情况下,近似共线并不意味着基本假定的任何改变,所以OLS估计量的无偏性、一致性和有效性仍然成立,即仍是BLUE估计量。但共线性会导致参数估计值的方差大于不存在多重共线性的情况。第六章异方差性判断正误,并说明理由。解答错。当存在异方差时,OLS估计量是无偏的但不具有有效性。对。如果存在异方差,通常的T检验和F检验是无效的。错。实际情况是可能高估也可能低估。对。通过残差对其他相应的变量的观察值描图,了解变量与残差之间是否具有可以观察到的系统模式,可以用来判断数据中是否存在异方差。对。随机误差的异方差性通常与模型中的解释变量相关,因此异方差性检验不能独立于误差项和某一变量相关的假定。对。如果模型存在设定误差,则可能出现随机误差的方差与解释变量相关的情况,OLS残差就会表现出明显的系统模式。2.简述异方差对下述各项的影响。解答由于异方差性的存在,使得OLS估计量仍然是线性无偏但不再有最小方差性,即不再有效;而由于相应的置信区间以及T检验和F检验都与估计的方差相关,因此会造成建立的置信区间以及T检验和F检验都不再是可靠的。3.解答(1)方程(6-40)表明,当N增加一个单位时,平均而言工资W增加0.009个单位.如果用N乘上方程(6-41)两边,结果就类似于(6-40).(2)作者显然担心回归方程存在异方差问题,因为他用N去除原来的方程两边.这意味则作者假定随机误差好项方差与N的平方成比例.因此作者在(6-41)中采用了加权最小二乘估计.(3)方程(6-40)的截距系数就是方程(6-41)中的斜率系数,而方程(6-40)中的斜率系数就是方程(6-41)中的截距系数.(4)不能,因为两个模型中的被解释变量不同.4.解答(1)在一元线性回归模型中,已知有因此有(2)由(1)中结果得到而在同方差下,,它与异方差时的方差相差一个乘子.如果,则该乘子大于1,则这样异方差时随机误差项方差大于同方差时的方差;而如果,则异方差时随机误差项方差小于同方差时的方差.5解答(1)他们假设了随机误差项方差与GNP的平方成比例.他们通过检查各个时期的数据观察到了这种关系.(2)结果基本上是相同的,尽管在第二个回归方程中两个系数的标准差比较低.但这仍然表明对异方差进行转换仍然是合理的.(3)不能,这里的R平方不能直接进行比较,因为两个模型中的被解释变量是不同的.6解答(1)首先建立居民人均消费支出与可支配收入的线性回归模型对该模型OLS估计的结果如下:(1.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论