版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 第一章 满足经典假定下的参数估计1、 基本概念变量、数据与模型(一)、经济变量 具有特定的经济含义影响经济系统的因素,它是构成方程式的最基本要素,变量的基本特征是要求具有可观测和可计量。 1、变量的类型被解释变量(应变量、因变量) 解释变量 (自变量)被解释变量与解释变量之间的关系强调的是单向因果关系,即解释变量影响被解释变量,反之不行。注:被解释变量为服从正态分布的连续随机变量(这是“经典”的核心)。 内生变量(强调其随机性和不可控制性) 外生变量(强调其确定性和可控制性) 内生变量与外生变量的关系:外生变量控制影响内生变量,而内生变量不能控制影响外生变量滞后内生变量(动态变量、能否控制信
2、息)前定变量=外生变量+滞后内生变量 (二)数据1、时间数列数据;2、截面数据;3、面板数据4、虚拟变量数据(离散数据) (三)模型设定1、 模型和方程:方程是模型的基本单位; 决定方程的两要素是变量的个数和方程的函数形式。2、在模型设定过程中应注意的问题基于经济理论的认识;模型的数学形式;变量的取舍。 3、计量经济模型对数据质量的基本要求真实性 可靠性 完整性 一致性 可比性 二、在总体回归函数中引入随机扰动项的原因:初级计量p26-27. 三、经典假定的内容 (一)经典假定 1、零均值假定。2、同方差假定。3、无自相关假定。4、解释变量与随机误差项不相关。5、无多重共线性假定。6、正态性假
3、定。还有:回归模型关于参数线性;在重复抽样中x值是固定的(或x是非随机的);x的值要有变异;模型设定是正确的。 (二)多元线性回归模型的基本假定(用矩阵表示)。 1、零均值假定 2、同方差和无自相关假定 (条件方差不变、条件自相关等于0) 3、随机扰动项与解释变量不相关假定 4、无多重共线性假定。 5、正态性假定 独立同分布,且n(0, 2 ) (三)经典假定的再认识1、零均值(1)对固定的x值,随机扰动项的条件均值为零。由可以得到两个基本含义:一是;二是的均值不依赖于x,这意味着与x,包括x的任何函数都不相关,如等形式。 (2)在固定x值下,对于y的变动总是围绕其均值上下波动,离开均值上下方
4、的距离就是。正的与负的相互抵消,它们对y的平均影响应该为零。(3)假定,也就意味着,只能成立。(4)y值的变动无异常(即无极端值表现)。(5)如果成立,则x具有强外生性。此时,x为非随机的。(6)模型的函数关系无错误设定;没有缺失重要解释变量。2、x与u不相关 该假定保证了获得参数的可靠估计。否则,我们就不能估计出在其它条件不变下的影响程度。(1)该假定意味着,在模型中,x和u对y有各自的影响。(2)如果x与u是相关的,就不能评估它们各自对y的影响。(3)对于,如果x是非随机的,这时有;但如果x是随机的,由于不一定有,所以这时提出该假定就有意义了。(4)在模型中, 如果u中的(其它)因素保持不
5、变,就意味着u的变化为零,即,那么x对y的线性影响为:,y的变化量是和x的变化量的简单乘积。如果没有该假定,上述解释就不成立。(5) 在正态性下,该假定意味着与之间随机独立。 (6)在为强外生的情况下,有: 如果x与u相互独立,则x具有强外生性。通常该假定 只意味着x是外生的。3、同方差(1)在固定x值的条件下,随机扰动项的方差为一固定常数。(2)在这假定下,消费支出方差在所有的收入水平上都保持不变。即表明对应于x值的全部y值都有同样的重要性。(3)同方差性意味着,。4、无自相关(无序列相关)(1)给定x,任意两个y值对其的离差都不会表现为相关关系。(2)在该假定下,只考虑x对y的系统性影响和
6、是否有影响,而不去担心由于u之间的可能相关造成的其它作用于y的影响。5、正态性(1)因为有了正态性假定,就有,也就有,进一步可推导出参数估计的分布。(2)根据中心极限定理,在大样本下,可得到u渐进服从正态分布。6、除了以上假定外,还要注意:(1)x在重复抽样中取固定值(2)x的值要有变异性(3)样本观测次数要大于参数个数(4)正确设定了模型 四、最小二乘估计ols(一)ols估计式的离差形式: (二)ols回归线的性质 1、分别是样本的线性组合,由于y的随机性使得是随机变量,并且是的点估计。2、回归线通过样本均值点; 3、 ; 4、5、; 6、(三)过原点回归定义:设一元线性回归模型为 ; 当
7、时,则称此式为“过原点回归”。特点:由最小二乘法,对表达式: (2) 求使式(2)有最小值。即对式(2)求导数得 (3)令其等于零,并化简得: (4)将代入上式得: (5) 显然,满足,并且,在令式(3)等于零时,即有;对于有截距项的模型,除了这个性质外,还有。但对于无截距项的模型,就不一定成立。事实上,如果成立,则对于样本回归模型有: 由假定 成立,则:解出有: (6)式(6)与式(4)估计的结果矛盾,所以,当模型无截距项时,就不一定成立。进一步还可得到不一定成立。对于无截距项的模型式(1),拟合优度有可能出现负值。事实上,由拟合优度定义可知: 当有截距项时,并且,表明,所以,拟合优度不可能
8、为负值。但对于无截距项的模型,则为如下结果: 并且,当出现时,则将大于(),这时会是负值。 综合上述分析,一般情况下,没有充分的理由,不要轻易去掉截距项。五、最小二乘估计的统计性质1、线性性。 即参数估计是关于被解释变量的线性函数2、无偏性。 即。 3、最小方差性。 即具有最小方差性的无偏估计量,称估计的有效性 4、一致性。 初级计量:p37 无偏性和有效性,在小样本下也行;一致性必须为大样本。 六、多元线性回归模型的检验 (一)拟合优度检验1、拟和优度的度量可决系数: 对tss=rss+ess的说明。tss为总离差平方和,反映了y的样本观测值的平均差异程度;ess为y的估计值与均值的离差平方
9、和,它反映了解释变量的变化所引起的对y的波动大小,即解释变量在模型中存在的重要程度;rss为残差平方和,反映的是y依据回归直线没有得到解释的变差。因此,ess越大说明回归直线拟和效果越好,而rss越小说明回归直线拟和误差越小2、多重可决系数多重可决系数用表示。 3、修正的可决系数。为什么要用修正的可决系数?实际上从的计算可看出:(1)在方程中增加一个解释变量,tss不发生变化,而ess会明显增大,这是因为方程的解释力增强了,这就造成一种错觉,只要增加解释变量就会提高方程的解释力;(2)在样本容量一定的情况下,增加解释变量会使自由度减小,从而降低模型的可靠性。因此,需要对这一情况做适当修正,得到
10、修正的可决系数,即式中k为参数的个数,n为样本容量。 4、与的关系或者, 当k=1时,即只有截距项时,。当k1时,。有时可能会出现负值,这时令=0。 利用修正的可决系数可以判断新增加的解释变量对被解释变量的影响程度,当模型中增加一个解释变量时,如果变小,则会增大,便可认为这个解释变量是对y有显著性影响,这时可将该变量放进模型,否则,应于放弃。(二)回归方程显著性的检验(f检验)1、f检验的意义(1)检验的不足。尽管具有对模型整体拟合状况的判断,但它并不能得到到底要多大时回归方程才算通过了拟合优度检验。虽然r2能够给出评价模型拟合好坏的度量,但它只是对样本的拟合程度进行评价,不能回答总体的真实状
11、况。 (2)f检验的目的。对于总体多元线性回归模型,从整体上看,多个解释变量与被解释变量之间是否存在显著的线性关系,或者说y的变动是否依赖于这些解释变量的变化。;不全为零f(k-1,n-k)由f统计量的构成可以看出(可以证明ess服从自由度为k-1的分布,rss服从自由度为n-k的分布),如果ess显著地大于rss,则表明不能认为所有的全为零,这时在很大程度上要拒绝。则在该意义下,说明回归方程中的所有解释变量对应变量存在显著性影响。 f检验的一般步骤是:(1)构造f统计量,即。(2)给定显著性水平,查f分布表,得临界值,其中k为参数的个数,n为样本容量。(3)比较判断。若f,则拒绝原假使,表明
12、回归函数从整体上看是显著的,即所有解释变量对应变量有显著性影响。(三)回归参数显著性的检验(t检验)1、t检验在多元线性回归模型里与一元的情况是一致的。需要注意的是在多元线性回归模型对参数的t检验中,即t(n-k) (在成立下)这里是服从自由度为(n-k)的t分布。因此,在多元的情况下,运用t检验的操作过程如下(1)提出假设(2)构造检验统计量在h0成立的情况下,有:t(n-k)(3)计算t统计量值,。(4)根据t分布,给定显著性水平,查表得临界值。(5)比较判断,若>,则拒绝h0,同时接受h1。表明第j个解释变量xj对被解释变量y存在显著性影响;否则,表明第j个解释变量xj对被解释变量
13、y不存在显著性影响。2、f检验与t检验的联系与区别(1)联系。在一元回归模型中,有t2=f,即一元回归模型条件下,t检验与f检验是一致的。但在多元回归模型中,则没有这一关系,甚至有的时候它们之间存在完全相反的检验结果。(2)区别:t检验是针对个别参数的显著性,而f检验是针对模型整体的显著性。3、f检验与可决系数r2的关系 根据这一关系式(或初级计量;p87),可知当样本容量较大时,拟合优度可低一些,但当样本容量较小时,则拟合优度要求就高。否则显著性检验难以通过。通过可决系数与f检验的特点,实际上f检验可以看是对r2的显著性检验。 七、一般线性框架下的假设检验 (一)“有约束”与“无约束”检验。
14、 对未知参数有约束限制的模型进行回归后的结果,与对没有约束限制的模型回归后的参数检验的结果是否一致?答案:一致的。(中级计量;p21-p22)(二)三大检验的理解和认识由于三大检验均来自f检验的一般形式(即另一种形式),所以,从理论上讲,如果把f检验放在一起的话,并且,t检验看成是f检验的一个特殊情况,对模型检验(包括系数和函数)的方法应该有四种,即f检验、lr似然比检验、wald检验和lm拉格朗日乘数检验。 1、f检验其中,为参数中非零的个数,k为无约束的参数个数。f检验的思想是当有约束与无约束很接近的时候,f的值应该比较小(小于给定显著性水平下的临界值),这个时候不拒绝约束条件。反过来,当
15、f的值大于给定显著性水平下的临界值,则拒绝约束条件,认为有约束与无约束存在显著性差异。f检验的不足是只能检验线性约束条件2、似然比检验() 检验只适用于对线性约束的检验。该检验的基本思路:如果约束条件成立,则相应的约束条件的对数似然函数的最大值与无约束条件的对数似然函数的最大值应该是近似相等的,这个时候构造的lr似然比应该比较接近1,即。由此得到统计量 计算统计量需要分别拟合无约束模型和有约束模型。在大样本下,统计量服从自由度为假设中约束条件个数的卡方分布。事实上,前面讲的各种检验,如检验、检验等都可以根据似然比原理推导出来。这说明似然比检验是统计检验的理论基础。 3、沃尔德检验()检验适用于
16、线性或非线性约束条件的检验,其优点是只需要估计出无约束模型,当约束模型的估计很困难时,该方法尤其适用。检验的原理是通过测量无约束估计量与约束估计量之间的距离来实现对约束条件的检验。 当约束条件成立时,有约束的估计量的结果与约束条件应该一致。但无约束的估计量是否也是一样?则须构造无约束估计量的统计分布,以此判断约束假设的真伪。 4、拉格朗日乘数检验()检验只需估计有约束模型,当施加约束条件后的模型形式变得简单时,通常使用该检验。检验的具体步骤如下:1、用ols估计约束模型,计算残差序列。2、建立辅助回归式: 其中,为随机误差项,3、用ols估计上式并计算可决系数。4、得到统计量: 5、给定显著性
17、水平,查卡方分布表,得临界值,若,则拒绝原假设,说明无约束模型成立。5、和的比较(一)三种检验方法一致之处1、三种检验方法都由极大似然估计而来。2、三种检验方法都用到了对数似然的函数。3、三种检验方法都是针对模型约束条件进行检验。(二)三种检验方法不一致之处1、检验只适用于线性约束的检验,检验需要计算带约束和无约束的对数似然函数值。2、检验和检验既适用于线性约束也适用于非线性约束的检验。3、检验只需要估计无约束的模型,而检验只需要估计约束模型,所以,当施加约束条件后模型形式变得简单时,使用检验更方便。(三)三种检验方法的关系对于、和三个检验方法的选择应以实际计算难易程度二定,一般来说,和检验优
18、于检验,因为和检验只需估计一个模型即可,而检验需要估计有约束和无约束两种模型。并且,在小样本条件有说明只有当检验的结果为拒绝原假设(约束条件不成立),或者检验的结果为接受原假设(约束条件成立)时,三种检验结果才是一致的。所以,三种检验方法有可能得出相互不一致的结论。总之,当检验拒绝原假设时,其他检验也一样。当检验没有拒绝原假设时,其他检验也不会拒绝原假设。尽管在小样本时三个值可能有所不同,但在大样本情形,这三个检验近似相等。就计算而言,检验最麻烦,其他两种还算简单。另外,在小样本情况下,并且约束条件为线性时,用检验比用这三个检验更可靠。三大检验方法的比较:方法适用范围计算方式以一元线性回归为例
19、的计算及直观意义()只适用线性约束的检验计算带约束和无约束的对数似然值与之间的垂直距离线性约束和非线性约束检验只需估计无约束的模型(检验) 度量与之间的水平距离同上只需估计约束模型考察对数似然函数在处的斜率 第二章 违背经典假定下的参数估计第一节 多重共线性一、多重共线性的定义1、完全多重共线性的定义。对于变量,如果存在不全为零的数使得 成立,则称变量之间存在完全的多重共线性。 2、不完全多重共线性的定义。 解释变量之间的共线性非精确表示,是一种近似的关系,所以在上述表达式中引入随机误差项,即对于变量,如果存在不全为零的数使得成立,其中为随机误差项,或者是线性相关的一种近似关系 则称变量之间存
20、在不完全的多重共线性,或者说是近似的多重共线性。二、多重共线性产生的后果(一)完全多重共线性下的后果如果解释变量之间存在完全的多重共线性,则从结论上看有:1、参数估计值不确定。 2、参数估计值的方差会无限大。 (二)不完全多重共线性下的后果1、有可能求出参数的估计值,但估计值很不稳定。 2、参数估计值的方差会随多重共线性(近似)程度的提高而增大。 3、对总体参数的区间估计将会降低精确度(置信区间变宽)。评价区间估计的两个标准: (1)估计的可靠度。(2)估计的精确度 . 4、对总体参数的显著性检验(t检验)在统计上将会不显著。 三、多重共线性的检验 (一)简单相关系数矩阵法 (二)t检验与f检
21、验的综合判断该方法的思想是,利用对参数的t检验与对模型整体的f检验的不一致,判断模型中解释变量之间存在不完全多重共线性。如果当计算出的或很大,f值显著性地超过给定显著性水平下所对应地临界值,但变量所对应地偏回归系数的t统计量值不显著,则说明该模型中的解释变量存在多重共线性。(三)辅助回归法在k个解释变量中,求每一个对剩余变量的回归,即 式中为随机误差项,并计算出相应的,记为;同时观察对应的f统计量值的大小。如果很大,f统计量值超过给定的临界值水平,则说明模型中解释变量存在不完全多重共线性。(四)方差扩大(膨胀)因子法(五)特征值与病态指数法四、多重共线性的补救措施(一)增加样本容量。 (二)利
22、用先验信息。思路:利用先验信息,实现对变量的降维(即减少解释变量的个数),最终达到修正多重共线性目的。 (三)变换模型的形式:对变量进行差分,还可将变量转换为增量形式 (四)逐步回归法 (五)岭回归1、岭回归是 一种改进最小二乘估计的方法,也叫岭估计。当解释变量之间存在多重共线性时,则会增大,原因在于接近奇异。如果将加上一个正常数对角矩阵ki (k>0,i为单位矩阵),即,使得的可能性比的可能性小,那么接近奇异的程度就会比小得多。由此,建立的如下估计为 (1)称为的岭回归估计量,为岭回归参数。当解释变量之间存在多重共线性时,以作为的估计应比普通最小二乘估计稳定。可以证明,当较小时,回归系
23、数很不稳定,而当逐渐增大时,回归系数将呈现稳定状态。因此,选择合适的值,岭回归参数才会优于普通最小二乘估计参数。当=0时,岭回归估计,实际就是普通最小二乘估计。 2、岭回归估计的性质性质1:岭回归的参数估计是回归参数的有偏估计。 (2)显然,只有当=0时,才有,当0时,是的有偏估计。有偏性是岭回归估计的一个重要性质。性质2:在岭回归参数与无关的情形下,是最小二乘估计的一个线性变换,也是理论值的线性函数。性质3:岭估计量方差比普通最小二乘估计的方差要小。3、岭回归参数k的选择原则上是要选择使均方误差达到最小的,的表达式为而最优值依赖于未知参数和,因而在实际应用中必须通过样本来确定。 根据经验,岭
24、回归参数的选择范围在(0,1)范围内为宜。 第二节 异方差与自相关 一、异方差与自相关的定义1、异方差定义设模型为,如果对于模型中随机误差项,有则称具有异方差性。进一步,把异方差看成是由于某个解释变量的变化而引起的,则。2、自相关定义 (1)如果模型中的随机误差项,满足以下关系式则随机误差项之间存在自相关性。 (2)一阶线性自相关。在中,如果,则并且与之间为线性关系,即,其中满足古典假定,即1。将与的这种线性关系称为一阶线性自相关(或一阶线性自回归)。 二、异方差与自相关对模型的影响在异方差与自相关存在的情况下,ols估计量具有以下统计性质:1、ols估计量是无偏的、一致的。2、ols估计量是
25、非有效的(参数估计的方差不再最小)。3、传统的ols估计量的标准差不正确,以这些标准差为依据建立起来的统计检验无效(t统计量不存在、f和r2检验不可靠)。 三、对异方差与自相关的检验(一)异方差的检验方法图形法、goldfeld-quandt方法、glejser方法、white方法、arch方法、park检验、spearman等级相关检验、breusch-pagan-godfrey检验、koenker-bassett检验等,只需了解前5种检验方法。1、goldfeld-quandt方法(1)前提条件样本容量要充分大。随机误差项正态分布,除异方差以外,其它基本假定成立。(2)检验的基本步骤将解释
26、变量的取值按从小到大排序(也可从大到小,但f统计量的分子于分母需要交换,为什么?)。将排列在中间的约1/4的观察值删除掉,记为c,再将剩余的分为两个部分(根据f检验的原理,保证构造f统计量的分子和分母的相互独立性),每部分观察值的个数为(n-c)/2(根据goldfields和quandt的证实,一元线性模型里当样本容量大于60时,c可取16,而当n=30时,取c为4)。提出假设。即构造f统计量。分别对上述两个部分的观察值求回归模型,由此得到的两个部分的残差平方和为,它们的自由度均为(n-c)/2-k,其中k为参数的个数。(这里如果假定u服从正态分布,并且同方差性假定时真实的,则可证明下式成立
27、,即)于是在原假设成立的前提下,有 判断。给定显著性水平,查f分布表,得临界值,如果 f*则拒绝原假设,接受备择假设,即模型中的随机误差存在异方差。 2、glejser方法 glejser检验的检验条件:变量的观测值为大样本。基本思想:由ols法得到残差,取的绝对值,然后将对某个解释变量回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。该检验的特点是不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。glejser检验的具体步骤:(1)根据样本数据建立回归模型,并求残差序列。 (2)用残差绝对值对的进行回归,由于与的真实函数形式并不知道,只能用样本数据对
28、各种函数形式进行试验,从中选择最佳形式。glejser曾提出如下一些假设的函数形式:式中v为随机误差项。(3)通常可用作为的替代变量,对所选函数形式回归。用回归所得到的、t、f等信息判断,若表明参数显著不为零,即认为存在异方差性。 4、white检验方法(1) 检验条件,要求在大样本下。(2) white检验的基本步骤,以一个二元线性回归模型为例。设模型为,并设异方差与的一般关系为,其中为随机误差项。具体操作如下:求样本回归模型。计算残差,并求。用残差平方作为异方差的估计,并建立对的辅助回归,即。其中,最后一项表示解释变量两两交叉相乘,如果是三个解释变量,则交叉相乘有三项。由此计算统计量,其中
29、n为样本容量,为辅助回归函数的可决系数。提出假设中至少有一个不为零,渐进服从自由度为5(在本例中除了截距项以外,斜率系数有5项)的分布,给定显著性水平,查分布表得临界值。判断,计算值,如果,则拒绝原假设,表明模型中随机误差存在异方差。注意:该检验的功效易受自由度的影响,一般地,当有k-1个解释变量时,分布的自由度为。4、arch检验方法(1) 检验的步骤建立arch过程:,式中为随机误差。提出假设 中至少有一个不为零对原模型进行回归,求残差e,并计算残差平方序列。求辅助回归: 计算辅助回归得可决系数,并且在h0成立下,基于大样本,有渐进服从。给定显著性水平,查卡方分布表得临界值,如果,则拒绝原
30、假设,表明模型中得随机误差存在异方差。(2) arch检验的eviews操作及对结果的解释。white检验与arch检验的共同特点是能比较方便地对异方差进行诊断,但arch检验不能确定是哪一个解释变量以什么形式引起的异方差现象。四、自相关性的检验方法 图示法 d-w检验法 该方法是基于残差序列与之间的相关系数提出检验的d-w统计量。 1、d-w检验的适用条件(1) 解释变量x非随机; (2)随机误差项为一阶自回归,即,且满足基本假定; (3)线性回归模型的解释变量中不包含滞后的被解释变量; 如:不存在如下形式 (4)截距项不为零,即只适用于有常数项的回归模型;(5)数据序列无缺失项;2、d-w
31、统计量的构成 (1)提出假设: (2)构造d-w检验统计量,记为d,即。 3、运用d-w检验判断一阶自相关的区域。 (1)当时,d=2,则无一阶自相关。 (2)当时,d=0,则有完全一阶正自相关。 (3)当时,d=4,则有完全一阶负自相关。 (4)通常情况下,当1时,有0d4。当d落在0到4范围内时,有如下判断区域:(dl和du分别为下限和上限临界值) 当0ddl时,存在一阶正自相关;当dlddu时,不能判定存在自相关;当dud4-du时,不存在一阶自相关;当4-dud4-dl时,不能判定存在自相关;当4-dld4时,存在一阶负自相关。4、运用d-w检验应注意的问题(或局限性)( 在d=2的附
32、近,有一个较大的无自相关区域,所以通常当d在2的左右时,可以判断出随机误差不存在自相关。)(1)d-w检验存在不能判定区域,这时可以用扩大样本容量或改用其它检验方法(通常可用d-w检验的修正方法)。(2)要求样本容量至少为15,否则很难对自相关的存在作出准确判断。 (3)d-w检验不能适用对高阶自相关现象进行检验。 (4)d-w检验有适用条件,只有符合这些条件才是有效的。5、补充检验方法breusch-godfrey(简称bg检验)。 五、对异方差与自相关的修正 1、广义最小二乘估计法(),可对异方差进行修正。 2、异方差与加权最小二乘法加权最小二乘法的基本含义:在异方差性的情况下,由于不同的
33、xi使得ui偏离均值的离散程度不一样,但是,在人们对总体异方差并无信息的情况下,要直接对异方差进行修正是很困难的。基于样本的信息,则存在当的值较小时,残差ei所提供的信息较少,这时需要给予重视,则对信息较少的给予较大的权数;而当的值较大时,残差ei所提供的信息较大,这时需要给予折扣,则对信息较大的给予较小的权数。从而,使得更好地反映对残差平方和的影响程度。 对模型变换的方法与加权最小二乘法是等价的。3、自相关与广义差分(1)广义差分法设模型为,其中满足基本假定。差分过程如下由于满足基本假定,所以对差分后的模型可施用最小二乘法进行参数的估计。 (2)科克兰内-奥克特法 (又称迭代估计法) 该方法
34、是经过反复计算后,以寻找出一个更接近真实的估计值,直到达到修正自相关为止。 (3)德宾两步估计法(durbin) 第一步是寻找估计值。 第二步建立差分模型。 该方法的特点是不仅能有效地修正一阶自相关,而且对高阶自相关也适用。 第三节 测量误差的检验1、外生性检验 (内生性检验) (中计,p39)如果某个解释变量不满足外生性条件,则该变量是内生的。检验变量满足外生性等价于检验变量是否是内生的,通常将此称为内生性检验(testing for endogeneity),常用的检验是武-豪斯曼检验(wu-hausman)。 2、测量误差存在与否的豪斯曼(hausman)检验(初级,p249) 第三章
35、虚拟变量 1、定义设变量d表示某种属性,该属性有两种类型,即当属性存在时d取值为1;当属性不存在时d取值为0。记为 2、虚拟变量引入的规则(1)在模型里有截距项的条件下,如果一个属性存在m个相互排斥类型(非此即彼),则在模型里引入m-1个虚拟变量。否则会出现完全的多重共线性(即虚拟变量陷阱)。在模型无截距项的情况下,如果一个属性存在m个类型,即便引入m个变量,不会出现多重共线性问题。(为什么?)(2)虚拟变量取值为0,意味着所对应的类型是基础类型。而虚拟变量取值为1,代表与基础类型相比较的类型,称为比较类型。例如“有学历”d为1,“无学历”d为0,则“无学历”就是基础类型,“有学历”为比较类型
36、。 第一节 虚拟解释变量一、加法引入规则1、加法引入规则,虚拟解释变量与别的解释变量以相加的关系出现在模型里。加法引入虚拟变量对模型产生的结果是只改变截距项。设模型为,式中为虚拟变量,它与其它解释变量是相加的关系,则称虚拟变量按加法类型引入。2、加法引入虚拟变量的应用 (初级,p213)二、乘法引入规则 1、以乘法形式引入虚拟变量,是在所设定的模型里,将虚拟解释变量与其它解释变量用乘积作为新的解释变量。乘法引入虚拟解释变量将改变模型中的斜率系数。设模型为或者,其中为定量解释变量,均为虚拟变量。按上述形式即为乘法引入。2、乘法引入虚拟解释变量的应用 (初级,p216) 第二节 虚拟被解释变量一、
37、线性概率模型(了解) 二、 logit模型(考大题)1、logit模型的含义 (1)设 (5-2)式中,。并且在该表达式中,有如下变动规律,当时,; 当时,; 当时,。称(5-2)式为logistic分布函数,它具有明显的s型分布特征。 (2)logit模型: 其中为机会概率比(简称机会比),即事件发生与不发生所对应的概率之比。称(5-3)式为logit模型。2、logit模型的特点(1)随着从0变到1,从变到(亦即从变到)。可以看出,在lpm中概率必须在0与1之间,但对logit模型并不受此约束。(2)对为线性函数。(3)当为正的时候,意味着随着的增加,选择1的可能性也增大了。当为负的时候,
38、随着的增加,选择1的可能性将减小。换言之,当机会比由1变到0时,会变负并且在幅度上越来越大;当机会比由1变到无穷时,为正,并且也会越来越大。3、logit模型的估计(1)根据数据类型选用ols方法(2)最大似然估计方法:最大似然估计法是估计logit模型最常用的方法。 (3)logit回归最大似然估计的统计性质(1)参数估计具有一致性,即当样本观测增大时,模型的参数估计值将比较接近参数的真值。(2)参数估计为渐近有效,即当样本观测增大时,参数估计的标准误相应减小。(3)参数估计满足渐近正态性,即随着样本观测的增大,估计的分布近似于正态分布。这意味着,可以利用这一性质对未知参数进行假设检验和区间
39、估计了。 4、logit 回归模型的评价和参数的统计检验(重点)1、模型的拟合优度检验(1)mcfadden mcfadden ,简记为。其计算公式为 式中,为模型中包含所有解释变量的无约束对数似然函数值,为模型中仅含有截距项的有约束的对数似然函数值。从概念上讲,和分别等价于普通线性回归模型中的rss和tss。与一样,也在0到1之间变动。(2)期望-预测表检验 2、参数的显著性检验(1)z检验以一元logit回归模型为例,设模型为 对该模型中的参数的显著性检验的原假设为,即解释变量对事件发生的概率没有显著性影响。根据参数的最大似然估计性质可知,在大样本条件下,渐近服从正态分布,于是,在成立的前
40、提下,检验统计量为,渐近服从标准正态分布。式中,为最大似然估计的标准误差。因此,可按常规查标准正态分布表,对原假设进行判断,从而检验模型中参数的显著性。(2)wald检验 其检验统计量为: 在下,渐近服从自由度为1的分布。因此,可根据分布表,在给定的显著性水平下,得到相应的临界值,从而判断参数的显著性。(3)似然比检验 在大样本情况下,两个模型之间如果具有嵌套关系,则两个模型之间的对数似然值乘以-2的结果之差近似服从分布。这一统计量就是似然比统计量。 其中,为所设定的原模型(即包含了所有解释变量)的最大似然函数的对数值, 为省略模型(即省略了解释变量)的最大似然函数的对数值,两者之间的差乘以-
41、2近似地服从分布,其自由度为省略了的解释变量的个数。接下来,可根据分布表,在给定的显著性水平下,得到临界值,从而判断参数的显著性。3、logit模型回归系数的解释(重点;中级计量,p81)(1)按发生比率来解释logit模型的系数 (2)用概率来解释logit模型的系数(3)预测概率第五章 动态模型第一节 分布滞后模型与自回归模型(了解)一、滞后变量模型的类型 1、分布滞后模型。乘数(又称倍数)的解释。所谓乘数是指,在一个模型体系里,外生变量变化一个单位,对内生变量产生的影响程度。据此进行的经济分析称为乘数分析或乘数效应分析。短期乘数延迟乘数或动态乘数长期乘数 2、自回归模型。如果模型中无滞后
42、解释变量,即则此模型为自回归模型。如果模型无解释变量,则模型就是一个纯粹的关于被解释变量的自回归模型(统计模型),即三、有限分布滞后模型的修正估计方法有限分布滞后模型的估计方法有两种,即经验加权法和阿尔蒙法。三、自回归模型中随机误差项的自相关检验德宾h-检验法1、 h统计量的定义式中,d为dw统计量,n为样本容量,为滞后被解释变量的系数的估计方差。2、 durbin证实了h统计量渐进服从标准正态分布3、 统计量对自回归模型中随机误差项自相关性的检验第二节 平稳性 一、时间序列的平稳性 1、时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。 (平稳性是指时间序列的统计特征不随
43、时间的推移而变化。) 2、经济时间序列进行回归分析,可能出现“伪回归” ,造成“伪回归”的根本原因在于时序序列变量的非平稳性。 3、类型 (1)严平稳序列。 如果对任意正整数()和时间序数,及任意实数,其随机变量的联合分布有满足上述条件的序列称为严平稳时间序列。如:概率论中的独立同分布序列就是严平稳过程。一般来说,所研究的随机过程,若前后的环境和主要条件都不随时间变化,就可以认为它是平稳随机过程。 如果一个随机过程m阶矩以下的矩的取值全部与时间无关,则称该过程为m阶平稳过程。 (2)宽平稳序列。如果满足如下性质则称为平稳的,并称此为宽平稳时间序列。 即宽平稳性序列的均值函数、方差函数均为常数,
44、而自协方差函数仅与时间间隔有关,但也是有限数。 (3)严平稳序列与宽平稳序列的关系。严格说,严平稳序列的分布,随时间的平移而不变;宽平稳序列的均值与自协方差,随时间的平移而不变。一个严平稳序列,对于每个时刻t的随机变量,可以不存在一阶或二阶矩,因此,它也就不一定是宽平稳序列。反之,一个宽平稳序列,它的分布不一定随时间的推移而不变,因此,它也不一定是严平稳序列。当然,在一定条件下,这两种平稳性是可以互相转化的。对于经济现象中的时间序列,通常讨论它的宽平稳性质。如果一个随机时间序列过程的均值和方差,在时间过程上都是常数,并且在任何两时期之间的协方差仅依赖于该两时期间的距离或滞后,而不依赖于计算这个
45、协方差的实际时间,则称它是平稳的。设为一时间序列,由此,可以认为一个平稳的时间序列,它的数学期望和方差均与时间t无关,表明序列将趋于返回它的均值,并以一种相对不变的振幅围绕均值波动;而协方差为一有限数,说明序列只与在变动过程中的间隔有关,与它的具体位置无关。3、时间序列非平稳性的后果 (1)“伪回归现象”。当求两个相互独立的非平稳时间序列的相关系数时,得到的是一个相关系数显著不为零的结论,则称此为虚假相关或伪相关;当用两个相互独立的非平稳时间序列建立回归模型时,得到的是一个具有统计显著性的回归函数,则称此为虚假回归或伪回归。(2)“伪回归现象”的判断。 经验判断规则:当r2dw时,则所估计的回
46、归函数有伪回归之嫌。4、时间序列的差分过程与单整性定义2,若随机过程的一阶差分过程为,并且是平稳的,则称为一单位根过程(单位根过程是非平稳的)。定义2说明了对一个非平稳的序列实现平稳的途径差分。 (1)平稳随机过程的例子,白噪声过程。如果过程满足以下条件:则称为一白噪声过程。 (2)非平稳随机过程的例子,随机游走过程。 如果有其中,为白噪声过程,则称为随机游走过程。由此看出,对随机游走过程进行一次差分就能得到一个白噪生过程(平稳的随机过程)。定义3,随机过程(随机序列)的单整性。对于随机过程,如果必须d次差分之后才能变换成为一个平稳过程,而进行d-1次差分后仍然是一个非平稳过程,则称此过程(序
47、列)具有d阶单整性,记为i(d)。三、单位根过程定义4,随机过程是一单位根过程:若 其中,这里对的假定,意味是平稳序列。由定义可知,单位根过程就是随机游走过程。根据自回归模型的统计特征可知,(1)如果,则是平稳的。(2)如果,则是一个随机游走过程,即非平稳过程。这时,的单整阶数为1,含有一个单位根,但经过一次差分后可变换为平稳过程。(3)如果,则是强非平稳过程,这时它会随着时间t的增加,其方差将快速增大。并且,对一次差分后式中,是由非平稳的和平稳的相加的结果,所以仍是非平稳的。 表1 时间序列模型的统计特征(了解)模型平稳条件可逆条件自相关函数偏自相关函数特征方程的根全在单位圆外无可逆条件拖尾
48、截尾()无平稳条件特征方程的根全在单位圆外截尾()拖尾特征方程的根全在单位圆外特征方程的根全在单位圆外拖尾拖尾 四、平稳性检验(一)单位根检验方法1、adf检验基本原理为,在df检验中,假定随机扰动项不存在自相关,并且只适用于一阶自回归过程(即)。但大多数经济时间序列不满足这个假定,当存在自相关时,直接使用df检验会出现偏误。因此,在df检验的基础上扩展为adf检验,称为增广的迪基富勒检验。过程如下在df检验中, 设检验模型为为了克服上述模型中的自相关问题,这时在模型中引入了多阶自回归过程(即)。检验过程与df检验过程一致,只是需要考虑滞后变量的滞后阶数的选取。adf检验应注意的问题:(1)当
49、样本容量充分大, adf检验的极限分布同df检验的极限分布相同,可以使用df检验的临界值代替adf检验的临界值。但在小样本条件下adf分布与df分布不一样, 两者不能代替。(2)df检验适用于一阶自回归ar(1) 过程的单位根检验。当时间序列为高阶自回归ar(p) 形式,或者由df检验得到的残差序列存在自相关时,df检验无效,应选择adf检验。(3)如果时间序列在均值上下波动,则应该选择不包含常数和时间趋势的检验方程,即(1)式;如果序列具有非0均值,但没有时间趋势,可选择(2)式作为检验方程;若序列随时间变化有上升或下降趋势,采用(3)式。(4)实际检验时可以从模型3开始,然后模型2,最后模
50、型1。何时检验拒绝零假设,即原序列不存在单位根,为平稳序列,何时检验停止。否则,就要继续检验,直到检验完模型1为止。当三个模型的检验结果都不能拒绝零假设时,则认为时序列是非平稳的。(5)选择模型适当的形式。在adf回归式中dw的值较低,说明仍然存在自相关,则应在每个模型中增加滞后差分项,即选取适当的滞后差分项,以使模型的残差项是一个白噪声(不存在自相关)。 (6)选择滞后差分项个数的原则是:一方面,要尽量小,从而节省自由度;另一方面,要尽量大,从而消除误差项中存在的自相关。因此,的选择具有两难。另外,在确定的过程中,还可参考aic准则和sc准则。从经验的角度,年度数据的序列可考虑至少应取1阶滞
51、后;季度数据的序列可考虑至少应取4阶滞后;月度数据的序列至少应考虑取12阶滞后第三节 协整与误差修正模型一、协整的定义:设表示阶时间序列向量。如果第一,所含有的全部变量都是阶的;第二,若存在一个阶向量,使得,则称的各分量存在(d,b)阶协整关系,记为ci(d,b)。b为协整向量,b的元素称为协整参数,b为小于d的正数,即0 < b < d。如果有相同单整阶数的变量之间具有协整关系,则一定会使得该协整关系的组合的单整阶数降低。两个变量协整与多变量协整的区别:对于两个变量,如果存在协整关系,则这种协整关系是惟一的。 两个变量若存在均衡关系,那么这两个变量一定具有相同的单整阶数。 当含有
52、个分量时,有可能存在多个协整向量。 对于多个变量存在协整关系,情况要复杂一些,可以有不同单整阶数的变量组成协整关系。在这种条件下,较高阶的单整变量之间必定存在协整关系,其相应非协整误差序列的阶数应与较低单整序列的阶数相同。例如三个变量的情况,设有其中的单整阶数可以不一样,但是平稳的。如,并且存在协整关系,即它们的线性组合,这样,一定有。协整的经济意义是:两个变量,虽然它们具有各自的长期波动规律,但是如果它们是协整的,则它们之间存在着一个长期稳定的比例关系。 协整的特点:(1)具有协整关系的高阶单整变量组合后可降低单整阶数。(2)当且仅当若干非平稳变量有协整时,由这些变量建立的回归模型才有意义,
53、所以,协整检验也是区别真实回归与虚假回归的有效方法。(3)具有协整关系的非平稳变量才可以建立误差修正模型。常用的协整检验有两种方法,一种是e-g两步法,主要用于单一方程的协整检验,特别是两个变量的协整检验;另一种是johansen方法,主要用于多变量、联立方程组模型。 (1)两个变量的e-g两步法(eg或aeg检验。)设变量为与均是一阶单整变量,即、分别服从。第一步,用ols方法估计如下模型的样本回归模型:得到:,其残差序列为 第二步,检验序列的平稳性。如果序列是平稳的,则与之间存在协整关系;否则,与之间不存在协整关系。协整检验与序列的单位根检验是不一样的,原因是通常的df或adf检验只针对一个序列,而这里的序列是一个线性组合,并含有两个序列与。因此,不能直接用df或adf检验,而应根据麦金农协整检验临界值代入下列计算公式:,(记住公式!) 其中,p是检验的显著性水平,的值从麦金农协整检验临界值表查出(初级,第370页的表6)。 3、误差修正模型 在上述检验协整过程中,两个变量存在协整关系(长期稳定关系),这时可把上述所得到的残差项看作为协整误差,并利用这个误差项把的短期行为和它的长期值联系起来。将此联系起来的“关系”就是误差修正模型(ecm)。 误差修正模型是一种具有特殊形式的计量经济模型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度汽油储备与应急供应服务合同3篇
- 新建蛋制品项目实施方案
- 2024塔吊信号工施工安全教育与培训聘用合同
- 新建气雾消毒机器人项目立项申请报告
- 新学期工作计划九篇
- 黄浦区短途配送合同范例
- 2024年度游戏开发与艺人虚拟形象代言合同2篇
- 2024年标准版离婚双方财产分割详细合同版B版
- 【名校区域大联考】专题01.阅读理解A篇应用文为主(解析版)
- 2024版二手房购房合同范本-房产增值潜力评估与风险提示3篇
- 福建省泉州市安溪县实验小学2023-2024学年三年级上学期素养比赛语文试卷
- 法律逻辑简单学(山东联盟)智慧树知到期末考试答案章节答案2024年曲阜师范大学
- 小学二年级上册数学-数角的个数专项练习
- 园林设施维护方案
- 医疗器械质量安全风险会商管理制度
- 220kV~750kV油浸式电力变压器使用技术条件
- MOOC 生物化学与分子生物学-中国药科大学 中国大学慕课答案
- 第2课+古代希腊罗马【中职专用】《世界历史》(高教版2023基础模块)
- 金属屋面工程防水技术规程
- 《福建省安全生产条例》考试复习题库45题(含答案)
- 人工智能增强战略规划
评论
0/150
提交评论