第9章 特殊因变量的计量经济模型_第1页
第9章 特殊因变量的计量经济模型_第2页
第9章 特殊因变量的计量经济模型_第3页
第9章 特殊因变量的计量经济模型_第4页
第9章 特殊因变量的计量经济模型_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计量经济学计量经济学理论理论方法方法EViewsEViews应用应用 山东工商学院统计学院山东工商学院统计学院袁靖袁靖 博士博士2012.03.10 学习目的与要求学习目的与要求 了解特殊因变量计量经济模型的类型、数学了解特殊因变量计量经济模型的类型、数学表示,掌握模型的参数估计方法与软件操表示,掌握模型的参数估计方法与软件操作,理解特殊因变量计量经济模型的经济作,理解特殊因变量计量经济模型的经济含义。含义。第九章第九章 特殊因变量的计量经济模型特殊因变量的计量经济模型 通常的经济计量模型都假定因变量是连续的,但是在现实的经济通常的经济计量模型都假定因变量是连续的,但是在现实的经济决策中经常面

2、临许多选择问题。人们需要在可供选择的有限多个方案决策中经常面临许多选择问题。人们需要在可供选择的有限多个方案中作出选择,与通常被解释变量是连续变量的假设相反,此时因变量中作出选择,与通常被解释变量是连续变量的假设相反,此时因变量只取有限多个离散的值。例如,人们对交通工具的选择:地铁、公共只取有限多个离散的值。例如,人们对交通工具的选择:地铁、公共汽车或出租车;投资决策中,是投资股票还是房地产。以这样的决策汽车或出租车;投资决策中,是投资股票还是房地产。以这样的决策结果作为被解释变量建立的计量经济模型,称为离散被解释变量数据结果作为被解释变量建立的计量经济模型,称为离散被解释变量数据计量经济学模

3、型(计量经济学模型(models with discrete dependent variables),或),或者称为离散选择模型者称为离散选择模型(discrete choice model, DCM)。 在实际中,还会经常遇到因变量受到某种在实际中,还会经常遇到因变量受到某种限制的情况,这种情况下,取得的样本数限制的情况,这种情况下,取得的样本数据来自总体的一个子集,可能不能完全反据来自总体的一个子集,可能不能完全反映总体。这时需要建立的经济计量模型称映总体。这时需要建立的经济计量模型称为受限因变量模型(为受限因变量模型(limited dependent variable model)。

4、这两类模型经常用于调。这两类模型经常用于调查数据的分析中。查数据的分析中。 当因变量表示事件发生的数目,是离散的整当因变量表示事件发生的数目,是离散的整数,即为计数变量,并且数值较小,取零的数,即为计数变量,并且数值较小,取零的个数多,而解释变量多为定性变量时,应该个数多,而解释变量多为定性变量时,应该考虑应用计数模型(考虑应用计数模型(count models)。例)。例如,一个公司提出申请的专利的数目,以及如,一个公司提出申请的专利的数目,以及在一个固定的时间间隔内的失业人员的数目在一个固定的时间间隔内的失业人员的数目。 基本内容基本内容1 离散因变量模型2 受限因变量模型3 计数模型第九

5、章第九章 特殊因变量的计量经济模型特殊因变量的计量经济模型 一、问题背景一、问题背景 二、二元选择模型二、二元选择模型 三、多元选择模型三、多元选择模型第一节第一节 离散因变量模型离散因变量模型 现实经济决策中经常面临许多选择问题,与现实经济决策中经常面临许多选择问题,与连续型解释变量不同,此时因变量只取有限连续型解释变量不同,此时因变量只取有限多个离散的值。例如:投票、投资、交通。多个离散的值。例如:投票、投资、交通。 以这样的决策结果作为被解释变量建立的计以这样的决策结果作为被解释变量建立的计量经济模型,称为离散因变量模型(量经济模型,称为离散因变量模型(models with discr

6、ete dependent variables)或称)或称离散选择模型(离散选择模型(DCM)。)。一、问题背景一、问题背景 1.问题提出问题提出以收入水平与汽车购买为例,往往存在三个方面的问题:第一,收入水平越高,购买汽车的欲望越高;第二,无法确知每个个体是否买车;第三,预测某个具有给定收入水平的个体买车的可能性。这样,可以假定个体做某一特定选择的概率是个体特征的一个线性函数。二、二元选择模型二、二元选择模型 2.线性概率模型(线性概率模型(LPM)模型形式式中, 为第 i个个体的特征值,例如收入;而为两种状态。二、二元选择模型二、二元选择模型求期望可以得到:随机变量 有两种选择,其分布为两

7、点分布:二、二元选择模型二、二元选择模型-0.20.00.20.40.60.81.01.2330340350360370380XY求期望可以得到:随机变量 有两种选择,其分布为两点分布:二、二元选择模型二、二元选择模型-0.20.00.20.40.60.81.01.2330340350360370380XY二、二元选择模型二、二元选择模型1 1线性概率模型(线性概率模型(LPMLPM) 假设住户是否购买商品房的决定主要依赖于其收入水平。假设住户是否购买商品房的决定主要依赖于其收入水平。那么考虑下列模型那么考虑下列模型01iiiYX (1)其中,其中,Xi为住户的收入;为住户的收入;Yi为一虚拟

8、变量,表示住户购买商品住房的情况为一虚拟变量,表示住户购买商品住房的情况Yi= 1 已购买商品住房已购买商品住房 0 未购买商品住房未购买商品住房问题:问题: 我们前面讨论的回归分析主要是研究我们前面讨论的回归分析主要是研究E(Yi|Xi)=0+1 Xi的问题,的问题,即研究条件均值轨迹的问题,而在上述模型中,被解释变量是某种属性即研究条件均值轨迹的问题,而在上述模型中,被解释变量是某种属性发生与否的状况,怎样把被解释变量某种属性发生与否的概率问题同条发生与否的状况,怎样把被解释变量某种属性发生与否的概率问题同条件均值的轨迹研究联系起来件均值的轨迹研究联系起来? 另外,若概率问题与条件均值轨迹

9、能够联系起来的话,那么,我们另外,若概率问题与条件均值轨迹能够联系起来的话,那么,我们所讨论的线性回归分析会出现什么问题所讨论的线性回归分析会出现什么问题?由于由于E(i)=0,由,由(1),E(Yi|Xi)=0+1 Xi (2)另外,设另外,设Y有下列分布:有下列分布:P(Yi=1)= pi , P(Yi=0)= 1- pi根据数学期望的定义根据数学期望的定义 E(Yi)=0(1-pi) +1pi = pi(3)注意到事件注意到事件Y=1是在给定收入是在给定收入X的条件下发生的,因此的条件下发生的,因此E(Yi)= E(Yi |Xi),于是有,于是有E(Yi |Xi )= i+1X i= p

10、i (4)表明购买商品用房的概率是收入的线性函数。表明购买商品用房的概率是收入的线性函数。 01iiiYX 像像(1)式那样,以虚拟变量作为被解释变量的模型的条件期望实际上等于式那样,以虚拟变量作为被解释变量的模型的条件期望实际上等于随机变量随机变量Yi取值为取值为1的条件概率。的条件概率。 即当住户的收入水平为即当住户的收入水平为X时,其购买商品住房的概率可表示成时,其购买商品住房的概率可表示成X的线性函的线性函数,故数,故(1)式也被称为式也被称为线性概率模型线性概率模型(LPM)。 显然,只要得到显然,只要得到(1)式中式中0和和1的估计量后,就可以估计出不同收入的估计量后,就可以估计出

11、不同收入水平住户购买商品住房的概率。水平住户购买商品住房的概率。0E(Yi|Xi)1 (5)由于由于E(Yi |Xi) =0+1 Xi = pi0,1 ,故在估计,故在估计(4)式时必须式时必须满足约束条件满足约束条件01iiiYX2 2线性概率模型的估计线性概率模型的估计 从形式上看,从形式上看,(1)式与普通的线性计量经济模型相似,是否能够式与普通的线性计量经济模型相似,是否能够运用运用OLS法直接对其进行估计呢?法直接对其进行估计呢? 答案是否定的。答案是否定的。 01iiiYX问题:问题: (1) 随机扰动项随机扰动项i的非正态性的非正态性在线性概率模型中,因为在线性概率模型中,因为显

12、然,关于显然,关于i的正态性假设不再成立。的正态性假设不再成立。i=Yi-0 0-1 1 Xi =1-0-1 Xi 当当Yi=1时时-0-1 Xi 当当Yi=0时时 直接运用直接运用OLS法对线性概率模型进行估计,对参数的估计不会产生法对线性概率模型进行估计,对参数的估计不会产生太大影响。太大影响。说明:说明: (2) 随机扰动项随机扰动项i的异方差性的异方差性Var(i )=Ei -E(i )2=E(i 2) =(1-0-1 Xi )2pi +(-0-1 Xi )2(1-pi ) =(1-0-1 Xi)2(0+1 Xi )+( - 0-1 Xi )2(1-0-1 Xi ) =(0+1 Xi

13、) (1-0-1 Xi ) = pi (1-pi) (6)Yi=1时,时,P(i=1-0-1Xi)=pi;Yi=0时,时,P(i= -0-1 Xi)=1-pi,根据方差的定义得根据方差的定义得根据根据Yi的概率分布,有:的概率分布,有:E(Yi |Xi )= i+1X i= pi 这里利用了式(这里利用了式(4)。)。 Var(i )= pi (1-pi) (6) (8-22)式表明,当式表明,当i满足满足E(i)=0和和E(ij)=0(ij)时,时,i是异方差的。是异方差的。 这时利用这时利用OLS法所得的法所得的LPM的估计量不再具有最小方差的特性,且各的估计量不再具有最小方差的特性,且各

14、参数估计量的标准差也不可信。参数估计量的标准差也不可信。 也就是说,也就是说,LPM参数的参数的OLS法估计量虽仍为线性无偏估计量,但不是法估计量虽仍为线性无偏估计量,但不是最佳估计量。最佳估计量。怎样消除异方差性的影响怎样消除异方差性的影响?思考:思考: 可利用第六章中有关修正异方差的方法,可用加权最小二可利用第六章中有关修正异方差的方法,可用加权最小二乘法修正异方差。乘法修正异方差。提示:提示: 根据前面的讨论,已知根据前面的讨论,已知LPM中中i的方差是的方差是Yi条件期望的函数,条件期望的函数,故选择权重故选择权重i的一种方法为的一种方法为(|)1(|)(1)iiiiiiiE YXE

15、YXpp (7)对对(1)式作变换,有式作变换,有 (8)iiiiiiiXY10(8-24)式中权重式中权重i是未知的,随机扰动项是未知的,随机扰动项i/i也是未知的也是未知的 在实践中为了估计在实践中为了估计i,进而估计,进而估计LPM模型,可采取以下步骤:模型,可采取以下步骤:XYii10ip)1()1(ppYYiiiii第一步,不考虑异方差,用第一步,不考虑异方差,用OLS法估计原模型法估计原模型(1)式,计算式,计算作为作为E(Yi|Xi)=0 0+ +1 1 Xi = pi i的估计值的估计值,取,取作为作为i的估计值。的估计值。第二步,用第二步,用i按照按照(8)式对观察数据进行变

16、换,再用式对观察数据进行变换,再用OLS法估计变换后法估计变换后的模型参数,得的模型参数,得LPM的参数,从而消除异方差。的参数,从而消除异方差。 (3) (3) 不满足不满足00E E( (Y Yi i| |X Xi i)1)1的约束的约束在线性概率模型中,在线性概率模型中,E(Yi|Xi)表示在给定表示在给定X的条件下,事件的条件下,事件Y发生的概率。发生的概率。 解决这一问题的二类方法是:解决这一问题的二类方法是: 从理论上,从理论上,E(Yi|Xi)的取值范围必须为的取值范围必须为01,然而在实证分析中,然而在实证分析中,E(Yi|Xi)的估计量的估计量并不一定在并不一定在0和和1之间

17、,之间, 这是用这是用LPM的的OLS法估计存在的法估计存在的实际问题实际问题。 iYiYiY当当1时,就认定时,就认定=1;当;当0时,就认定时,就认定=0。 iYiY1)选择对数单位模型或选择对数单位模型或Probit模型等能够保证满足模型等能够保证满足0E(Yi|Xi)1约束的非线性模型。约束的非线性模型。2)3 3非线性概率模型非线性概率模型 应当指出的是,虽然我们可以采用应当指出的是,虽然我们可以采用WLS解决异方差性问题、增大样本容解决异方差性问题、增大样本容量减轻非正态性问题,通过约束迫使所估计的事件量减轻非正态性问题,通过约束迫使所估计的事件Y发生的概率落入发生的概率落入01,

18、但,但LPM与经济意义的要求不符:随着与经济意义的要求不符:随着X的变化,的变化,X对对pi的的“边际效应边际效应”保持不变。保持不变。 (如如1000元元),拥有,拥有商品住房的概率恒等地增加商品住房的概率恒等地增加0.1。这就是说,无论住户的收入。这就是说,无论住户的收入水平为水平为8000元,还是元,还是20000元,拥有商品住房的概率都以相同的增量增加。在线元,拥有商品住房的概率都以相同的增量增加。在线性概率模型中,不论性概率模型中,不论X的变化是在什么水平上发生的,参数都不发生变化,显然的变化是在什么水平上发生的,参数都不发生变化,显然这与现实经济中所发生的情况是不符的。这与现实经济

19、中所发生的情况是不符的。 在住户是否购买商品房的例子中,当在住户是否购买商品房的例子中,当 1=0.1时,表明时,表明X每变化一个每变化一个1单位单位因此,表现概率平均变化比较理想的模型应当具有这样的因此,表现概率平均变化比较理想的模型应当具有这样的特征特征:(1)概率)概率pi=P(Yi=1|Xi) 随随X的变化而变化,但永远不超出的变化而变化,但永远不超出01区间。区间。(2)随着)随着Xi-,pi0;Xi+,pi1。 符合这些特征的函数可用符合这些特征的函数可用图图1形象地刻画。形象地刻画。-1P+0 图图1非线性概率函数德图形非线性概率函数德图形 图图1的模型满足的模型满足0E(Yi|

20、Xi) 1以及以及pi是是Xi非线性函数的假设,呈现非线性函数的假设,呈现出出S型的曲线特征。型的曲线特征。 因此可以设法找到符合这种因此可以设法找到符合这种S型曲线特征的函数形式来作为二元选择型曲线特征的函数形式来作为二元选择计量经济模型的设定形式。计量经济模型的设定形式。 原则上,任何适当的、连续的、定义在实轴上的概率分布都将满足上述两个原则上,任何适当的、连续的、定义在实轴上的概率分布都将满足上述两个条件。条件。 对于连续随机变量来说,密度函数的积分代表概率的大小,也就是说,连续随对于连续随机变量来说,密度函数的积分代表概率的大小,也就是说,连续随机变量的机变量的(累积累积)分布函数分布

21、函数(CDF)可以满足上述两个要求。可以满足上述两个要求。 通常选择逻辑斯蒂和正态分布的累积分布函数去设定非线性概率模型。当选用通常选择逻辑斯蒂和正态分布的累积分布函数去设定非线性概率模型。当选用逻辑斯蒂分布时,就生成了逻辑斯蒂分布时,就生成了Logit模型。当选择正态分布时,就生成了模型。当选择正态分布时,就生成了Probit模型。模型。 ui*对应的分布分布函数F 相应的二元选择模型标准正态分布Probit 模型逻辑分布Logit 模型极值分布Extreme模型)(x)1 (xxee)exp(1xe二、二、ProbitProbit模型模型 假定假定 累计概率分布函数曲线在累计概率分布函数曲

22、线在0.5附近的斜率最大。对附近的斜率最大。对应应y在实轴上的值,相应概率值永远大于在实轴上的值,相应概率值永远大于0、小于、小于1。但是。但是Probit模型需要假定模型需要假定y服从正态分布。服从正态分布。221()2iiityiiyxpF yedt三、三、LogitLogit模型模型1Logit模型(模型(对数单位模型)对数单位模型)的基本概念的基本概念 当选择用逻辑斯蒂分布函数当选择用逻辑斯蒂分布函数(logistic distribution)去设定二元选择去设定二元选择计量经济模型时,有计量经济模型时,有01011iiXXeeeXi)(1011ezi11P(Yi=1)=pi= (9

23、)其中,其中,Xzii10其特征:其特征: (1) zi+时,时,pi 1;zi-时,时,pi 0;zi=0时,时,pi =0.5。(2) 它有一个拐点,在拐点之前,随它有一个拐点,在拐点之前,随zi或或Xi增大,增大,pi的增长速度越来越快;的增长速度越来越快; 在拐点之后,在拐点之后, 随随zi或或Xi增大,增大,pi的增长速度越来越慢,逐渐趋近于的增长速度越来越慢,逐渐趋近于1。考虑到在估计中便利,我们采用以下变换:考虑到在估计中便利,我们采用以下变换:ppYYLiiiiiPP1ln)0() 1(ln01010101(1)ln1 (1)iiiiXXXXeeee (10)XeiXi1010

24、ln 式中,比率式中,比率pi/(1 pi)通常称为机会比率,即所研究的事件通常称为机会比率,即所研究的事件(或属性或属性)“发发生生”的概率与的概率与“没发生没发生”的概率之比。的概率之比。 机会比率的对数机会比率的对数Li=lnpi/(1 pi)称为对数单位,这里的对数单位称为对数单位,这里的对数单位Li不仅是不仅是 Xi的线性函数,而且也是的线性函数,而且也是的线性函数,所以,的线性函数,所以,(10)式也称为式也称为Logit模型模型。 由于由于pi不仅对不仅对Xi是非线性关系,而且对是非线性关系,而且对0和和1也是非线性关系,不能也是非线性关系,不能直接运用直接运用OLS法估计参数。

25、必须设法把非线性关系转换为可以运用法估计参数。必须设法把非线性关系转换为可以运用OLS法估法估计的线性形式。计的线性形式。2Logit模型的估计模型的估计 由(由(8)式有)式有 1-pi=ezi11 (11)由(由(8)和()和(10)式有)式有eeeppzzziiiii111 (12)于是于是 (13)zeppLiiiiziln1lnXi10上式表明,上式表明,Xi变动一个单位,机会比率的对数平均变化变动一个单位,机会比率的对数平均变化1个单位。个单位。 Logit模型的以下特点:模型的以下特点: 随着随着pi从从0变化到变化到1,或,或zi从从-变化到变化到+,对数单位,对数单位Li从从

26、-变化到变化到+, 即概率即概率pi在在0与与1之间,但对数单位之间,但对数单位Li并不一定在并不一定在0与与1之间。之间。 (2) 虽然对数单位虽然对数单位Li对对Xi是线性的,但概率是线性的,但概率pi对对Xi并不是线性的;并不是线性的; (3) 注意注意Logit模型中参数的意义:模型中参数的意义: 1是是Xi每变动一个单位时,对数单位每变动一个单位时,对数单位Li(机会比率的对数机会比率的对数)的平均变化,的平均变化, 然而我们研究的目的并不是对数单位然而我们研究的目的并不是对数单位Li而是概率而是概率pi。 (4) 如果设法估计出参数如果设法估计出参数0和和1,给定某一水平,给定某一

27、水平Xi=X0,若欲估计,若欲估计pi,可从,可从 (13)式设法计算出要估计的概率。)式设法计算出要估计的概率。从计量经济学的角度引入随机扰动项,将从计量经济学的角度引入随机扰动项,将(8-29)式改记为式改记为LiiiX10(15) 如何得到如何得到0 0和和1 1的估计量呢?的估计量呢? (14)zeppLiiiiziln1lnXi10问题:问题: 对对(15)式直接估计会遇到以下困难:式直接估计会遇到以下困难:(1)当事件发生时,)当事件发生时,pi=1,L i=ln(1/0);当事件没有发生时,;当事件没有发生时,pi=0,Li=ln(0/1), 机会比率机会比率pi/(1 pi)的

28、对数都无意义,不能直接用的对数都无意义,不能直接用OLS法估计模型,而只能采法估计模型,而只能采 用极大似然法用极大似然法(ML)估计参数。当样本容量估计参数。当样本容量n较大,可选用加权最小二乘法进较大,可选用加权最小二乘法进 行估计。行估计。 (2)估计参数需要的机会比率的对数)估计参数需要的机会比率的对数Li的数据无法观测。解决办法是对应于每的数据无法观测。解决办法是对应于每 个个 Xi,样本观测值个数,样本观测值个数n较大时,可利用整理汇总的数据,用相对频率作较大时,可利用整理汇总的数据,用相对频率作 为对为对pi的估计,并估计机会比率对数的估计,并估计机会比率对数Li。对对(15)式

29、直接估计会遇到以下困难:式直接估计会遇到以下困难:(3)(15)式模型的随机项式模型的随机项i为异方差,可以证明,为异方差,可以证明,n足够大时足够大时)1 (1, 0(ppiiinN (16)2ipi为了估计为了估计i的方差的方差,可通过用相对频率,可通过用相对频率代替代替pi去估计,有去估计,有)1 (12ppiiin (17)估计出估计出i的方差以后,可用加权最小二乘法去估计参数,权数的方差以后,可用加权最小二乘法去估计参数,权数i为为)1 (1ppiiiin (18) 二元选择模型一般采用极大似然估计。似然函数为二元选择模型一般采用极大似然估计。似然函数为 (9.1.11)即即 (9.

30、1.12) 对数似然函数为对数似然函数为 (9.1.13) 01)()(1 iiyyiiFFLxxNiyiyiiiFFL11)(1 )(xxNiiiiiFyFyL1)(1ln)1 ()(lnlnxx 对数似然函数的一阶条件为对数似然函数的一阶条件为 (9.1.14)其中:其中:fi 表示概率密度函数。那么如果已知分布函数和密度表示概率密度函数。那么如果已知分布函数和密度函数的表达式及样本值,求解该方程组,就可以得到参数的函数的表达式及样本值,求解该方程组,就可以得到参数的极大似然估计量。例如,将上述极大似然估计量。例如,将上述3种分布函数和密度函数代种分布函数和密度函数代入式入式(7.1.14

31、)就可以得到就可以得到3种模型的参数极大似然估计。但是种模型的参数极大似然估计。但是式式(7.1.14) 通常是非线性的,需用迭代法进行求解。通常是非线性的,需用迭代法进行求解。 二元选择模型中估计的系数不能被解释成对因变量的边二元选择模型中估计的系数不能被解释成对因变量的边际影响,只能从符号上判断。如果为正,表明解释变量越大,际影响,只能从符号上判断。如果为正,表明解释变量越大,因变量取因变量取1的概率越大;反之,如果系数为负,表明相应的的概率越大;反之,如果系数为负,表明相应的概率将越小。概率将越小。 NiiiiiiiiFfyFfyL10)1 ()1 (lnx 考虑考虑Greene 给出的

32、斯佩克特和马泽欧(给出的斯佩克特和马泽欧(1980)的例子,在例子中分析了某种教学方法对成绩的有效的例子,在例子中分析了某种教学方法对成绩的有效性。因变量(性。因变量(GRADE)代表在接受新教学方法后成)代表在接受新教学方法后成绩是否改善,如果改善为绩是否改善,如果改善为1,未改善为,未改善为0。解释变量。解释变量(PSI)代表是否接受新教学方法,如果接受为)代表是否接受新教学方法,如果接受为1,不,不接受为接受为0。还有对新教学方法量度的其他解释变量:。还有对新教学方法量度的其他解释变量:平均分数(平均分数(GPA)和测验得分()和测验得分(TUCE),来分析新),来分析新的教学方法的效果

33、。的教学方法的效果。 估计二元选择模型,从估计二元选择模型,从Equation Specification对话框中,对话框中,选择选择Binary估计方法。在二元模型的设定中分为两部分。首估计方法。在二元模型的设定中分为两部分。首先,在先,在Equation Specification区域中,键入二元因变量的名区域中,键入二元因变量的名字,随后键入一列回归项。由于二元变量估计只支持列表形字,随后键入一列回归项。由于二元变量估计只支持列表形式的设定,所以不能输入公式。然后,在式的设定,所以不能输入公式。然后,在Binary estimation method中选择中选择Probit,Logit,

34、Extreme value选择三种估计选择三种估计方法的一种。以例方法的一种。以例1为例,对话框如图为例,对话框如图2所示。所示。 例例1的估计输出结果如下:的估计输出结果如下: 参数估计结果的上半部分包含与一般的回归结参数估计结果的上半部分包含与一般的回归结果类似的基本信息,标题包含关于估计方法(果类似的基本信息,标题包含关于估计方法(ML表示极大似然估计)和估计中所使用的样本的基本表示极大似然估计)和估计中所使用的样本的基本信息,也包括达到收敛要求的迭代次数。和计算系信息,也包括达到收敛要求的迭代次数。和计算系数协方差矩阵所使用方法的信息。在其下面显示的数协方差矩阵所使用方法的信息。在其下

35、面显示的是系数的估计、渐近的标准误差、是系数的估计、渐近的标准误差、z- -统计量和相应统计量和相应的概率值及各种有关统计量。的概率值及各种有关统计量。 在回归结果中还提供几种似然函数:在回归结果中还提供几种似然函数: log likelihood是对数似然函数的最大值是对数似然函数的最大值L(b),b是是未知参数未知参数 的估计值。的估计值。 Avg. log likelihood 是用观察值的个数是用观察值的个数N去除以对去除以对数似然函数数似然函数L(b) ,即对数似然函数的平均值。,即对数似然函数的平均值。 Restr. Log likelihood是除了常数以外所有系数被是除了常数以

36、外所有系数被限制为限制为0时的极大似然函数时的极大似然函数L(b) 。 LR统计量检验除了常数以外所有系数都是统计量检验除了常数以外所有系数都是0的假的假设,这类似于线性回归模型中的统计量,测试模型整体的设,这类似于线性回归模型中的统计量,测试模型整体的显著性。圆括号中的数字表示自由度,它是该测试下约束显著性。圆括号中的数字表示自由度,它是该测试下约束变量的个数。变量的个数。 Probability(LR stat)是)是LR检验统计量的检验统计量的P值。值。在零假设下,在零假设下,LR检验统计量近似服从于自由度等于检检验统计量近似服从于自由度等于检验下约束变量的个数的验下约束变量的个数的 2

37、分布。分布。 McFadden R-squared是计算似然比率指标,正是计算似然比率指标,正像它的名字所表示的,它同线性回归模型中的像它的名字所表示的,它同线性回归模型中的R2是类似是类似的。它具有总是介于的。它具有总是介于0和和1之间的性质。之间的性质。分布函数采用标准正态分布,即分布函数采用标准正态分布,即Probit模型,例模型,例1计算结果为计算结果为(1) z = (-2.93) (2.34) (0.62) (2.39) 利用式利用式(1)的的Probit模型的系数,本例按如下公式给出新教模型的系数,本例按如下公式给出新教学法对学习成绩影响的概率,学法对学习成绩影响的概率, 当当P

38、SI = 0时:时: 当当PSI = 1时:时: 式中测验得分式中测验得分TUCE取均值取均值(21.938),平均分数,平均分数GPA是按从是按从小到大重新排序后的序列。小到大重新排序后的序列。 iiiiPSITUCEGPAy4263. 10517. 06258. 14523. 7*Prob(0)( 7.4523 1.62580.051721.938)GradeGPA )42. 1938.210517. 06258. 14523. 7() 1Prob(GPAGrade0.00.20.40.60.81.02.02.22.42.62.83.03.23.43.63.84.0PSI=1PSI=0Pr

39、ob(Grade=1)GPA 通过通过Procs/Make Reidual Series选项产生下面三种残差选项产生下面三种残差类型中的一种类型。类型中的一种类型。普通残差(Ordinary)标准化残差(Standardized)广义残差(Generalized)iiipye0)1(iiiisipppye)1 ()()(iiiiigippfpyex 当因变量不止是两种选择时,就要用到多元选择模型当因变量不止是两种选择时,就要用到多元选择模型(multiple choice model)。多元离散选择问题普遍存在于。多元离散选择问题普遍存在于经济生活中。例如:经济生活中。例如: (1) 一个人面

40、临多种职业选择,将可供选择的职业排一个人面临多种职业选择,将可供选择的职业排队,用队,用0,1,2,3表示。影响选择的因素有不同职业的表示。影响选择的因素有不同职业的收入、发展前景和个人偏好等;收入、发展前景和个人偏好等; (2) 同一种商品,不同的消费者对其偏好不同。例如,同一种商品,不同的消费者对其偏好不同。例如,十分喜欢、一般喜欢、无所谓、一般厌恶和十分厌恶,十分喜欢、一般喜欢、无所谓、一般厌恶和十分厌恶,分别用分别用0,1,2,3,4表示。而影响消费者偏好的因素有表示。而影响消费者偏好的因素有商品的价格、性能、收入及对商品的需求程度等;商品的价格、性能、收入及对商品的需求程度等; (3

41、) 一个人选择上班时所采用的方式一个人选择上班时所采用的方式自己开车,自己开车,乘出租车,乘公共汽车,还是骑自行车。乘出租车,乘公共汽车,还是骑自行车。 上述上述3个例子代表了多元选择问题的不同类型。个例子代表了多元选择问题的不同类型。前两个例子属于排序选择问题,所谓前两个例子属于排序选择问题,所谓“排序排序”是指是指在各个选择项之间有一定的顺序或级别种类。而第在各个选择项之间有一定的顺序或级别种类。而第3个例子只是同一个决策者面临多种选择,多种选择个例子只是同一个决策者面临多种选择,多种选择之间没有排序,不属于排序选择问题。与一般的多之间没有排序,不属于排序选择问题。与一般的多元选择模型不同

42、,排序选择问题需要建立排序选择元选择模型不同,排序选择问题需要建立排序选择模型模型(ordered choice model)。下面我们主要介绍排。下面我们主要介绍排序选择模型。序选择模型。 与二元选择模型类似,设有一个潜在变量与二元选择模型类似,设有一个潜在变量 yi*,是不可观,是不可观测的,可观测的是测的,可观测的是 yi ,设,设 yi 有有0,1,2,M等等M+1个取值。个取值。 (7.2.1)其中:其中:ui*是独立同分布的随机变量,是独立同分布的随机变量,yi 可以通过可以通过 yi*按下式得按下式得到到 (7.2.2) *iiiuyxNi,2,1*3*22*11*210iMii

43、iiycMcyccyccyy如果如果如果如果 设设ui*的分布函数为的分布函数为F(x),可以得到如下的概率,可以得到如下的概率 (7.2.3) 和二元选择模型一样,根据分布函数和二元选择模型一样,根据分布函数F(x)的不同可以有的不同可以有3种常见的模型:种常见的模型:Probit模型、模型、Logit模型和模型和Extreme value模模型。仍然采用极大似然方法估计参数,需要指出的是,型。仍然采用极大似然方法估计参数,需要指出的是,M个个临界值临界值c1, c2, , cM 事先也是不确定的,所以也作为参数和事先也是不确定的,所以也作为参数和回归系数一起估计。回归系数一起估计。 )(1

44、)()()()2()()() 1()()0(23121xxxxxxiMiiiiiiiiicFMyPcFcFyPcFcFyPcFyP 在调查执政者的支持率的民意测验中,由于执在调查执政者的支持率的民意测验中,由于执政者执行了对某一收入阶层有利的政策而使得不同政者执行了对某一收入阶层有利的政策而使得不同收入的人对其支持不同,所以收入成为决定人们是收入的人对其支持不同,所以收入成为决定人们是否支持的因素。通过调查取得了市民收入否支持的因素。通过调查取得了市民收入(INC)与支与支持与否持与否(Y)的数据,其中如果选民支持则的数据,其中如果选民支持则Yi取取0,中,中立取立取1,不支持取,不支持取2。

45、我们选取。我们选取24个样本进行排序选个样本进行排序选择模型分析。择模型分析。 与二元选择模型类似,从主菜单中选择与二元选择模型类似,从主菜单中选择Objects/New Object,并从该菜单中选择,并从该菜单中选择Equation选项。从选项。从Equation Specification对话框,选择估计方法对话框,选择估计方法ORDERED,标准估计标准估计对话框将会改变以匹配这种设定。在对话框将会改变以匹配这种设定。在Equation Specification区域,键入排序因变量的名字,其后列出回区域,键入排序因变量的名字,其后列出回归项。排序估计也只支持列表形式的设定,不用输入一

46、归项。排序估计也只支持列表形式的设定,不用输入一个明确的方程。然后选择个明确的方程。然后选择Normal,Logist,Extreme Value三种误差分布中的一种,单击三种误差分布中的一种,单击OK按钮即可。对话按钮即可。对话框如图所示。框如图所示。 例例2估计结果如下:估计结果如下: 有两点需要指出:首先,有两点需要指出:首先,EViews不能把常数项和临界不能把常数项和临界值区分开,因此在变量列表中设定的常数项会被忽略,即有值区分开,因此在变量列表中设定的常数项会被忽略,即有无常数项都是等价的。其次,无常数项都是等价的。其次,EViews要求因变量是整数,要求因变量是整数,否则将会出现

47、错误信息,并且估计将会停止。否则将会出现错误信息,并且估计将会停止。 估计收敛后,估计收敛后,EViews将会在方程窗口显示估计结果。将会在方程窗口显示估计结果。表头包含通常的标题信息,包括假定的误差分布、估计样本、表头包含通常的标题信息,包括假定的误差分布、估计样本、迭代和收敛信息、迭代和收敛信息、y的排序选择值的个数和计算系数协方差的排序选择值的个数和计算系数协方差矩阵的方法。在标题信息之下是系数估计和渐近的标准误差、矩阵的方法。在标题信息之下是系数估计和渐近的标准误差、相应的相应的z-统计量及概率值。然后,还给出了临界值统计量及概率值。然后,还给出了临界值LIMIT_1:C(2),LIM

48、IT_2:C(3)的估计及相应的统计量。的估计及相应的统计量。 选择选择Proc/Make Residual Series产生广义残差序列,输产生广义残差序列,输入一个名字或用默认的名字,然后单击入一个名字或用默认的名字,然后单击OK按钮。一个排序按钮。一个排序模型的广义残差由下式给出:模型的广义残差由下式给出: (7.5.2)其中:其中:c0 = - ,cM+1 = 。,)()()()(11xxxxigigigiggicFcFcfcfe 现实的经济生活中,有时会遇到这样的问题,因变量现实的经济生活中,有时会遇到这样的问题,因变量是连续的,但是受到某种限制,也就是说所得到的因变量是连续的,但是

49、受到某种限制,也就是说所得到的因变量的观测值来源于总体的一个受限制的子集,并不能完全反的观测值来源于总体的一个受限制的子集,并不能完全反映总体的实际特征,那么通过这样的样本观测值来推断总映总体的实际特征,那么通过这样的样本观测值来推断总体的特征就需要建立受限因变量模型体的特征就需要建立受限因变量模型(limited dependent variable models)。本节研究两类受限因变量模型,即审查。本节研究两类受限因变量模型,即审查回归模型回归模型(censored regression models)和截断回归模型和截断回归模型(truncated regression models)

50、。 考虑下面的潜在因变量回归模型考虑下面的潜在因变量回归模型 (7.3.1)其中:其中: 是比例系数;是比例系数;y*是潜在变量。被观察的数据是潜在变量。被观察的数据 y 与潜与潜在变量在变量 y* 的关系如下:的关系如下: (7.3.2)iiiuyx*000*iiiiyifyyify 换句话说,换句话说,yi*的所有负值被定义为的所有负值被定义为0值。我们称这些数值。我们称这些数据在据在0处进行了左截取(审查)(处进行了左截取(审查)(left censored)。而不是把)。而不是把观测不到的观测不到的 yi* 的所有负值简单地从样本中除掉。此模型称的所有负值简单地从样本中除掉。此模型称为

51、规范的审查回归模型为规范的审查回归模型,也称为也称为Tobit模型。模型。 更一般地,可以在任意有限点的左边和右边截取(审更一般地,可以在任意有限点的左边和右边截取(审查),即查),即 (7.3.3)其中:其中: , 代表截取(审查)点,是常数值。如果没有左截代表截取(审查)点,是常数值。如果没有左截取取( (审查审查) )点,可以设为点,可以设为 。如果没有右截取。如果没有右截取( (审查审查) )点,点,可以设为可以设为 。规范的。规范的Tobit模型是具有模型是具有 和和 的一个特例。的一个特例。 *iiiiiiiiiiiycifccycifycyifcyicicicic0icic 与前

52、边介绍的几个模型类似,可以采用极大似然法估计与前边介绍的几个模型类似,可以采用极大似然法估计审查回归模型的参数,对数似然函数为审查回归模型的参数,对数似然函数为 (7.3.4)求式求式(7.3.4)的最大值即可得参数的最大值即可得参数 , 的估计。这里的估计。这里f , F分别分别是是u的密度函数和分布函数。的密度函数和分布函数。 )()(/ )(ln)/ )(lnlniiiiicyciiicyiiiyfcFLxx)()/ )(lniicyiiicFx 特别地,对于特别地,对于Tobit模型,设模型,设uN(0,1),这时对数似然,这时对数似然函数为函数为 (7.3.5) 式式(7.3.5)是

53、由两部分组成的。第一部分对应没有限制的观测是由两部分组成的。第一部分对应没有限制的观测值,与经典回归的表达式是相同的;第二部分对应于受限制值,与经典回归的表达式是相同的;第二部分对应于受限制的观测值。因此,此似然函数是离散分布与连续分布的混合。的观测值。因此,此似然函数是离散分布与连续分布的混合。将似然函数最大化就可以得到参数的极大似然估计。将似然函数最大化就可以得到参数的极大似然估计。 )(1ln)(ln)2ln(21ln00222iiyiyiiyLxx 本例研究已婚妇女工作时间问题,共有本例研究已婚妇女工作时间问题,共有50个调查数据,个调查数据,来自于美国国势调查局来自于美国国势调查局U

54、.S.Bureau of the Census(Current Population Survey, 1993),其中,其中y 表示已婚妇女工作时间,表示已婚妇女工作时间, x1 x4分别表示已婚妇女的未成年子女个数、年龄、受教分别表示已婚妇女的未成年子女个数、年龄、受教育的年限和丈夫的收入。只要已婚妇女没有提供工作时间,育的年限和丈夫的收入。只要已婚妇女没有提供工作时间,就将工作时间作零对待,符合审查回归模型的特点。就将工作时间作零对待,符合审查回归模型的特点。 截断问题,形象地说就是掐头或者去尾。即在很多实际截断问题,形象地说就是掐头或者去尾。即在很多实际问题中,不能从全部个体中抽取因变量

55、的样本观测值,而只问题中,不能从全部个体中抽取因变量的样本观测值,而只能从大于或小于某个数的范围内抽取样本的观测值,此时需能从大于或小于某个数的范围内抽取样本的观测值,此时需要建立截断因变量模型。例如,在研究与收入有关的问题时,要建立截断因变量模型。例如,在研究与收入有关的问题时,收入作为被解释变量。从理论上讲,收入应该是从零到正无收入作为被解释变量。从理论上讲,收入应该是从零到正无穷,但实际中由于各种客观条件的限制,只能获得处在某个穷,但实际中由于各种客观条件的限制,只能获得处在某个范围内的样本观测值。这就是一个截断问题。截断回归模型范围内的样本观测值。这就是一个截断问题。截断回归模型的形式

56、如下:的形式如下: (7.3.7)其中:其中:yi 只有在只有在 时才能取得样本观测值,时才能取得样本观测值, ,为两个常数。为两个常数。 对于截断回归模型,仍然可以采用极大似然法估计模型对于截断回归模型,仍然可以采用极大似然法估计模型的参数。的参数。 iiiuyxNi,2,1iiiicucxicic 为估计审查模型,打开为估计审查模型,打开Equation对话框,从对话框,从Equation Specification对话框所列估计方法中选择对话框所列估计方法中选择CENSORED估计估计方法。在方法。在Equation Specification区域,输入被审查的因变区域,输入被审查的因变

57、量的名字及一系列回归项。审查回归模型的估计只支持列量的名字及一系列回归项。审查回归模型的估计只支持列表形式的设定表形式的设定(图图7.5)。 在三种分布中选择一种作为误差项的分布,在三种分布中选择一种作为误差项的分布,EViews提供提供三种可供选择的分布三种可供选择的分布(表表7.8)。 Standard normalLogisticExtreme value (欧拉常数 ) 1)var(,0)(uuE3/)var(,0)(2uuE5772. 0)(uE6/)var(2u 还需要在还需要在Dependent Variable Censoring Points一栏提供一栏提供关于被检查因变量的

58、临界点的信息。临界点可以是数值、表关于被检查因变量的临界点的信息。临界点可以是数值、表达式、序列,还可以是空的。达式、序列,还可以是空的。按照要求在编辑栏的左编辑区(按照要求在编辑栏的左编辑区(Left)和右编辑区()和右编辑区(Right)输入临界点表达式。注意如果在编辑区域留下空白,输入临界点表达式。注意如果在编辑区域留下空白,EViews将假定该种类型的观测值没有被审查。将假定该种类型的观测值没有被审查。 例如,在规范的例如,在规范的Tobit模型中,数据在模型中,数据在0值左边审查,在值左边审查,在0值右边不被审查。这种情况可以被指定为:值右边不被审查。这种情况可以被指定为: 左编辑区

59、:左编辑区: 0 右编辑区:右编辑区: blank 而一般的左边和右边审查由下式给出:而一般的左边和右边审查由下式给出: 左编辑区:左编辑区: 右编辑区:右编辑区: EViews也允许更一般的设定,这时审查点已知,但在观也允许更一般的设定,这时审查点已知,但在观察值之间有所不同。简单地在适当的编辑区域输入包含审查察值之间有所不同。简单地在适当的编辑区域输入包含审查点的序列名字。点的序列名字。icic例例7.3的估计结果如下:的估计结果如下: 通过选择通过选择Procs/Make Residual Series,并从残差的,并从残差的3种类型种类型中进行一种,可以产生审查模型的残差序列。审查模型

60、的中进行一种,可以产生审查模型的残差序列。审查模型的残差也有残差也有3种类型,与前述类似。种类型,与前述类似。 估计一个截断回归模型和估计一个审查模型遵循同样的估计一个截断回归模型和估计一个审查模型遵循同样的步骤,从主菜单中选择步骤,从主菜单中选择Quick/Estimate Equation,并在,并在Equation Specification 对话框中,选择对话框中,选择CENSORED估计方法。估计方法。出现估计审查和截断回归模型对话框。在出现估计审查和截断回归模型对话框。在 Equation Specification区域键入截断因变量的名称和回归项的列表,并区域键入截断因变量的名称

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论