




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章离散选择模型在初级计量经济学里,我们已经学习了解释变量是虚拟变量的情况,除此之外, 在实际问题中,存在需要人们对决策与选择行为的分析与研究,这就是被解释变量为 虚拟变量的情况。我们把被解释变量是虚拟变量的线性回归模型称为离散选择模型, 本章主要介绍这一类模型的估计与应用。本章主要介绍以下内容:1、为什么会有离散选择模型。2、二元离散选择模型的表示。3、线性概率模型估计的缺陷。4、Logit模型和Probit模型的建立与应用。第一节模型的基础与对应的现象一、问题的提出在研究社会经济现象时,常常遇见一些特殊的被解释变量,其表现是选择与决策 问题,是定性的,没有观测数据所对应;或者其观测到的是
2、受某种限制的数据。1、被解释变量是定性的选择与决策问题, 可以用离散数据表示,即取值是不连续 的。例如,某一事件发生与否,分别用1和0表示;对某一建议持反对、中立和赞成 5 种观点,分别用0、1、2表示。由离散数据建立的模型称为 离散选择模型。2、被解释变量取值是连续的,但取值的范围受到限制,或者将连续数据转化为类 型数据。例如,消费者购买某种商品,当消费者愿意支付的货币数量超过该商品的最 低价值时,则表示为购买价格;当消费者愿意支付的货币数量低于该商品的最低价值 时,则购买价格为00这种类型的数据成为 审查数据。再例如,在研究居民储蓄时,调 查数据只有存款一万元以上的帐户,这时就不能以此代表
3、所有居民储蓄的情况,这种 数据称为截断数据。这两种数据所建立的模型称为受限被解释变量模型。有的时候, 人们甚至更愿意将连续数据转化为上述类型数据来度量,例如,高考分数线的设置, 就把高出分数线和低于分数线划分为了两类。下面是几个离散数据的例子。例5.1 研究家庭是否购买住房。由于,购买住房行为要受到许多因素的影响, 不仅有家庭收入、房屋价格,还有房屋的所在环境、人们的购买心理等,所以人们购买 住房的心理价位很难观测到,但我们可以观察到是否购买了住房,即我们希望研究买房的可能性,即概率 P(Y 1)的大小。例5.2 分析公司员工的跳槽行为。员工是否愿意跳槽到另一家公司,取决于薪资、 发展潜力等诸
4、多因素的权衡。员工跳槽的成本与收益是多少,我们无法知道,但我们 可以观察到员工是否跳槽,即例5.3 对某项建议进行投票。建议对投票者的利益影响是无法知道的,但可以观 察到投票者的行为只有三种,即研究投票者投什么票的可能性,即 P(Y j), j 1,2,3。从上述被解释变量所取的离散数据看,如果变量只有两个选择,则建立的模型为 二元离散选择模型,又称二元型响应模型;如果变量有多于二个的选择,则为 多元选 择模型。本章主要介绍二元离散选择模型。离散选择模型起源于Fechner于1860年进行的动物条件二元反射研究。1962年, Warner首次将它应用于经济研究领域,用于研究公共交通工具和私人交
5、通工具的选择 问题。70-80年代,离散选择模型被普遍应用于经济布局、企业选点、交通问题、就业 问题、购买行为等经济决策领域的研究。模型的估计方法主要发展于20世纪80年代初期。(参见李子奈,高等计量经济学,清华大学出版社,2000年,第155页-第156页)二、线性概率模型对于二元选择问题,可以建立如下计量经济模型。1、线性概率模型的概念设家庭购买住房的选择主要受到家庭的收入水平,则用如下模型表示 其中,Xi为家庭的收入水平,丫为家庭购买住房的选择,即显然从而由于Y是取值为0和1的随机变量,并定义取Y值为1的概率是p,则Y的分布为 即随机变量Y服从两点分布。根据两点分布,可得 Y的数学期望为
6、Y01概率1-PPE(Y|Xi)12Xi p(5-1)上述数学模型的经济学解释是,因为选择购买住房变量取值是1,其概率是p,并且这 时对应p的表示是一线性关系,因此,Y在给定Xi下的条件期望E(YX)可解释为在给定Xi下,事件(家庭购买住房)将发生的条件概率为P(Y 1X),亦即家庭选择购买住房的概率是家庭收入的一个线性函数。我们称这一关系式为 线性概率函数由于,Y服从两点分布,所以,Y的方差为2、线性概率函数的估计及存在 | 口|的问题对线性概率函数直接运用 OLS概率 估计,会存在以下困难。(1)随机误差项的非正态性表现 表明Ui服从两点分布。而在经典计量经济学中,假定 Ui服从正态分布(
7、2) Ui的异方差性。事实上,根据5服从两点分布则Ui的方差为Var(Ui) Pi(1 Pi) o表明Pi随着i的变动是一个变量,则口的方差不是 一个固定常数。(3)利用加权最小二乘法修正异方差取权数为可以证明 法 具有同方差。在具体估计线性概率模型时,用 ?作为p的估计来计算权 QW数w的估计W。3、可决系数R2的非真实性。由于,被解释变量Y只取值1或0,不可能有估计的线性概率模型能很好地拟合这些点,所以,这时计算的R2会比1小许多,在大多数例子中,R2介于0.2与0.6之间。4、0&E(Y XJ01不成立。克服这一问题可直接从对线性概率模型的估计,求出V,用人工的方法定义当 吊1时,取Y?
8、=1;当寸0时,取吊=0。但要比较好地解决这类问题,只能考虑采用新的估计方法,这就是将要介绍的Logit模型和Probit模型第二节Logit 模型一、Logit模型的产生1、产生Logit模型的背景由上述介绍可知,对于线性概率模型来说,存在一些问题,有的问题尽管可以用 适当的方法加以弥补,但并不完善和理想。(1)古典假定不再成立,如存在异方差性,可用加权 OLS方法加以弥补。(2)在线性概率模型中,对于不满足 0& E(Y Xi)W1的情况,用人工的方法处 理,即当丫1时,取丫=1当丫0时,取丫=0虽然能够弥补不足,但仍然具有较强的主观因素。(3)经济意义也不能很好地得到体现。在线性概率模型
9、E(Y| Xi) 1 2Xi p中,概率P(Y 1)会随着Xi的变化而线性变化,但这与实际情况通常不符。例如购买 住房,通常收入很高或很低,对于购买住房的可能性都不会有太大的影响,而当收入 增加很快时,对购买住房的影响将会很大。所以,购买住房的可能性与收入之间并不是线性关系,有可能是一种非线性关系。2、Logit模型的含义综合上述讨论,我们所需要的是具有如下二分性质的模型。(1)随着Xi的减小,Pi趋近0的速度会越来越慢;反过来随着 Xi的增大,Pi接近1的速度也越来越慢,而当Xi增加很快时,Pi的变化会比较快。故Pi与Xi之间应呈 非线性关系。(2)并且由概率的属性,R的变化应始终在0和1之
10、间。因此,一个很自然的想法是采用随机变量的分布函数来表示 Pi与Xi的这种非线性 关系。从几何图形看,所需要的模型有点像图 5.1那样,概率位于0与1之间,并随 着Xi非线性地变化。图5.1一个累积分布函数的图形形如图5.1所示的S型曲线,就是随机变量的一个累积分布函数(CDF。因此,当回归中的被解释变量是取0和1的二分变量时,并且概率值的变化与解释变量 Xj之 间有上述变化特征,则可用 CDF去建立回归模型。在二分被解释变量的研究中可使用多种分布函数(Cox, 1970)来表示。但最常用的是Logistic 分布函数和标准正态分 布函数,前者导出Logit模型,后者导出Probit模型(3)
11、 Logistic 分布函数PiF(Zi)1 e (12Xi)(5-2)式中,乙 12 Xi。并且在该表达式中,有如下变动规律,当 Zi时,Pi1;当 Zi时,Pi0;,1当 Z i 0 时,Pi 02称(5-2)式为Logistic 分布函数,它具有明显的 S型分布特征。(4) Logit 模型以下是由Logistic 分布函数导出Logit模型。其中,一p为机会概率比(简称机会比,下同),即事件发生与不发生所对应的概率1 Pi之比。称(5-3)式为Logit模型。3、Logit模型的特点(1)随着P从0变到1, ln(R一)从变到 (亦即Zj从 变到)。可以看出,1 P在LPMfr概率必须
12、在0与1之间,但对Logit模型并不受此约束。(2) In(九)对Xi为线性函数。(3)当ln(a)为正的时候,意味着随着Xi的增加,选择1的可能性也增大了。1 P当In(旦)为负的时候,随着”的增加,选择1的可能性将减小。换言之,当机会比1 p由1变到0时,m(产_)会变负并且在幅度上越来越大;当机会比由1变到无穷时,ln(金)为正,并且也会越来越大。1 P4、Logit模型与线性回归模型的区别(1) Logit模型为非线性模型,尽管等式右端看上去是线性形式,而普通回归模 型是线性模型。(2)线性回归模型研究被解释变量 Y的均值E(Y| Xi)与解释变量Xi之间的依存关系,而Logistic
13、 分布函数研究的是事件发生的概率 P(Y 1|Xj与解释变量Xj的依存 关系。(3)线性回归模型中包含随机误差项Ui ,对Ui的要求是要满足基本假定,而Logistic分布函数没有出现随机误差项,对模型没有这样的要求。(4)在估计Logit模型时,要求数据必须来自于随机样本,即各观测值相互独立, 或者说要求样本分布与总体分布具有同一性,而对线性回归模型一般情况下并无这样 严格的要求。止匕外,Logit模型与线性回归模型的一个相同的要求是, 解释变量之间要无多重共 线性,否则,会导致参数估计的方差变大和不稳定。二、Logit模型的估计为了估计Logit模型,除了 Xi外,我们还应有In(-p-)
14、的数值。由于Pi只取值为1 P1和0 (即事件发生或不发生,如买房或不买房),使得ln(卫)无意义,通常情况下,1 PPi没有具体的数据,所以直接对 Logit模型进行估计有困难。这时,可有以下估计方 法。1、根据数据类型选用OLS方法可通过市场调查获得分组或重复数据资料,用相对频数自 立作为Pi的估计。以n购买住房为例,将购买住房的情况分组,假设第 i组共有n个家庭,收入为Xi,其中有n个家庭已购买住房,其余未购买。则收入为 Xi的家庭,购买住房的频率为将其作为Pi的估计,并代入对数机会比,有于是,样本回归函数为对上式可直接运用OL砂估计未知参数了。具体应用可参见DamodarN. Guja
15、rati计 量经济学基础(第四版)下册,中国人民大学出版社,2005年。第559页-第560页。2、最大似然估计方法在线性回归中估计总体未知参数时主要采用OLS方法,这一方法的原理是根据线性回归模型选择参数估计,使被解释变量的观测值与模型估计值之间的离差平方值为 最小。而最大似然估计方法则是统计分析中常用的经典方法之一,它是建立在由联合 密度函数所导出的似然函数,并对其求极值而得到参数估计的一种方法。在线性回归 分析中最大似然估计法可以得到与最小二乘法一致的结果。但是,与最小二乘法相比, 最大似然估计法既可以用于线性模型,又可以用于非线性模型,由于 Logit回归模型 是非线性模型,因此,最大
16、似然估计法是估计Logit回归模型最常用的方法。下面,以单变量为例,说明该方法的运用。假设有n个样本观测数据(Xi,Y) i 1,2,L ,n,由于样本是随机抽取,所以,在给定Xi条件下得到的Y 1和丫 0的概率分别是R和1 R。于是,一个观测值的概率 为其中,Y 1或Y 0。因为,各项观察相互独立,则 n次观察所得的样本数据的联合 分布可表示为各边际分布的连乘积称上式为n次观察的似然函数。由最大似然估计法的原理知,最大似然估计就是求解 出具有最大可能取所给定的样本观测数据的参数估计。于是,最大似然估计的关键是 估计出?和?2 ,使得上述表达式取得最大值。将上式两端取对数得称上式为对数似然函数
17、。为了估计能使ln L( 1, 2)有最大的总体参数估计 Z和马,先分别对1, 2求偏导数,然后令其为0,得在线性回归中,似然函数是通过把偏离差平方和分别对1, 2求偏导数得到,它对于未知参数都是线性的,因此,很容易求解。但是对于 Logit回归中的上述两个方程是关 于1, 2的非线性函数,求解十分困难。随着现代计算机技术的发展,许多计量经济学 和统计学的软件包均有Logit回归的参数最大似然估计值,常用的EViews软件就含有 该估计方法。3、Logit回归最大似然估计的统计性质(1)参数估计具有一致性,即当样本观测增大时,模型的参数估计值将比较接近 参数的真值。(2)参数估计为渐近有效,即
18、当样本观测增大时,参数估计的标准误相应减小。(3)参数估计满足渐近正态性,即随着样本观测的增大,估计的分布近似于正态 分布。这意味着,可以利用这一性质对未知参数进行假设检验和区间估计了。有关证明可参见 Aldrich, John & Forrest D. Nelson. 1984. Linear Probability, Logit, and Probit Models. Newbury Park, Sage Publications.三、Logit回归模型的评价和参数的统计检验与一般线性回归模型一样,在得到 Logit回归模型的参数估计后,还应对模型进 行评价和相应的统计检验。1、模型的拟合
19、优度检验模型估计完成以后,需要对模型是否有效地描述了模型与观测数据的匹配程度进 行评价。如果模型的预测值(拟合值)能够与对应的观测值有较高的一致性,就认为 该模型能拟合数据,否则,将不接受这一模型。对 Logit回归模型的评价有多种方法, 不同的计算软件给出的评价结果也有差异。这里,我们将根据 EViews软件,介绍模型 拟合优度的检验方法。(1) McFadden R2在前面的介绍中,已经提到对于离散选择模型,通常的拟合优度R2没有多大意义。在EViews软件里,有一种方法即 McFadden R2 ,简记为kcf。其计算公式为式中,LIFur为模型中包含所有解释变量的无约束对数似然函数值,
20、LIFr为模型中仅含有截距项的有约束的对数似然函数值。从概念上讲,LIF ur和LIF,分别等价于普通线性回归模型中的RSSffi TSS RLf与R2一样,也在0到1之间变动。(2)期望-预测表检验该方法的原理是,在模型参数估计后,选取适当的截断值p(0 p 1),将观测数据分成两组,一组为1/(1 eZ)&p,另一组为1/(1 eZ)p,其中,乙 ? Xi。 如果样本中的一个观测数据 Y的数值为0,并且该样本属于第1组,同时另一个观测数 据Y的数值为1,并且属于第2组,就称这个观测数据是分组恰当的,否则就称这个观 测数据是分组不恰当的。该方法的思想是利用分组恰当与否,得到观测数据占总样本
21、的比重来检验模型的拟合优度。如果模型估计与实际观测数据比较一致,则大多数的 观测数据应该是分组恰当的,反之,如果分组不恰当的观测数据所占的比重很大,说 明模型估计与实际观测数据的拟合程度较差,模型就需要调整。利用软件EViews进行期望-预测表检验的步骤如下:第一步,在估计好模型的窗口中按此路径选择View/Expectation PredictionTable。第二步,出现一个对话框,在对话框里输入一个截断值p(0 p 1),系统默认的截断值是0.5。通常情况下,可取Y为1的次数在总观测次数中所占的比例作为截断值 的估计值o第三步,点击OK后可生成对应的期望-预测表。这时便可利用该表进行拟合
22、优度 的判断。有关Logit回归模型的拟合优度其它检验方法,如皮尔逊2检验、偏差检验、Hosmer Lemeshow拟合优度指标和信息测量指标等。 可参见相关文献,如 王济川、郭 志刚,Logistic回归模型一一方法与应用,高等教育出版社,2001年,第58一一第89页。2、参数的显著性检验对模型中参数的显著性检验,就是决策判断某个解释变量对事件的发生(即选取 Y 1)是否有显著性影响。如果检验结果表明该解释变量对选取Y 1的发生有显著性影响,则认为将该解释变量放入 Logit回归模型中是恰当的。否则,需要对模型进行适当的调整。(1) Z检验以一元Logit回归模型为例,设模型为对该模型中的
23、参数 2的显著性检验的原假设为Ho: 2 0,即解释变量Xi对事件Y 1发生的概率没有显著性影响。根据参数的最大似然估计性质可知,在大样本条件下,2渐近服从正态分布,于是,在 Ho: 2 0成立的前提下,检验统计量为渐近服从标准正态分布。式中,se(N)为最大似然估计?2的标准误差。因此,可按常 规查标准正态分布表,对原假设进行判断,从而检验模型中参数的显著性。(2) Wald检验对模型中参数显著性检验还可使用Wald检验,具检验统计量为在Ho: 2 0下,W渐近服从自由度为1的2分布。因此,可根据 2分布表,在给定 的显著性水平 下,得到相应的临界值,从而判断参数的显著性。可参阅 Hauck
24、, W. W. & A. Donner.1977. Wald s tests as applied to hypotheses in logit analysis. Journal of the American Statistical Association,Vol.72:851-853.(3)似然比检验统计学上已经证明,在大样本情况下,两个模型之间如果具有嵌套关系,则两个 模型之间的对数似然值乘以-2的结果之差近似服从 2分布。这一统计量就是似然比统 计量。该检验的思想是,假设一个模型记为Model1中有解释变量Xj,另一个模型记为Model2包含了 Model1中所有其它解释变量,而没有
25、包含Xj ,则称Model2嵌套于Model1 ,亦即Model1中包含了 Model2。通过这一模型之间嵌套关系,我们实际上需 要判断的是Xj出现在模型Model1中是否合适。Hanushek & Jackson ,1977; Aldrich & Nelso, 1984; Greene, 1990; Long, 1997分别证实了似然比统计量为其中,ln(Model1)为所设定的原模型(即包含了所有解释变量有约束”)的最大似然函数的对数值,ln(Lmodel2)为省略模型(即省略了解释变量Xj “无约束”)的 最大似然函数的对数值,两者之间的差乘以-2近似地服从2分布,其自由度为省略了 的解
26、释变量的个数。接下来,可根据2分布表,在给定的显著性水平 下,得到临界值,从而判断参数的显著性。例分析某种教学方法对成绩影响的有效性,被解释变量GRAD的接受新教学方法后成绩是否改善,如果改善取 1,否则取0; GPA平均 分数;TUC助测验得分; PSI为是否接受新教学方法,如果接受取1,否则取00运用EViews软件中Logit模型 估计方法得到如下结果I Ti Ei le Edit Q1j ec t Ji ew ,r ii ck Otti bns 丁悟n |由口仁|苑靶m 1由0%日m R mwrE I/电I 4口Feu11 Etdt日IDependent Variable GRADEM
27、ethod! LIL - Sinai Login (Quadratic hill climbing) 06/04/06 Tiire 22:11Sample 1 32liicluded obse Ratio ns. 32C oiive rgenic c.hieYsd wftier 6 HeraOonsCgrwdriMnci e曰1打H coiTipiilcd liningsoccnd d9rivcitiwfrVariableCnefficientStd Error z-StabsLicProbC GPA TUCE PSI-13 02135 2.82S113 0.0515B 2 370608931
28、317 熠 6403-H 1.2629402.2377260-1416&4 0.6 7 2215 1 064S63 2 234420 OOQ3 0.0252D.60140 0266Mean dependent var 菖 E of i egressian Sum- aquHved re9id Log likelihoodRe str. Ilog NikelihoodLR statistic (3 df) Pnpbibility(LR 际W)0 343750 04 144171-12 9963-20 591715.40119 0 OQ1&03S D dependent var Aloike i
29、nt dnteriDii Schtvorz crit&iion Hsnn9n9Quiinin enter Avg. log 1 likelihood McFadden R-squaredD482559 t dsseos 1 23810 1 116333 -Q i02e0则e2.8261 1 ,因此,在其它条件不变的情况下, 平均分数每增加一个单位,将导致接受新教学方法后成绩有所改善的发生比会相应提 高。同理,对于变量TUC曲可作类似的讨论;由于PSI为虚拟解释变量,表示是否接 受新教学方法,如果接受取1,否则取0,因此,在其它条件不变的情况下,当 PSI=1 时,则将会使接受新教学方法后,学习
30、成绩改善的发生比有所提高,而当 PSI=0时, 则将会使接受新教学方法后,学习成绩改善的发生比保持不变。2、用概率来解释Logit模型的系数除了解释变量对于对数发生比的偏作用外,有时也用事件发生的概率来解释模型 中系数的偏作用。对事件发生概率的偏作用可以通过对Logit模型求Xi的偏导数来加以解释。其求导结果如下于是,变量Xi对事件发生概率的偏作用就等于该解释变量的系数2与P(1 P)的乘积。因为p(1 p)永远为正值,所以偏作用的符号由2决定,作用的幅度依赖于2的幅度和对应于Xi特定值的概率,而它与模型中所有其它解释变量有关。因此,不同于对发生比作用的解释,对事件发生概率的偏作用是随p值的变
31、化而变化的。这就需要在讨论变量Xi对事件发生概率的偏作用时,应将概率p值计算出来后,才能解释其偏作用。3、预测概率与一般线性回归模型一样,根据 Logit模型也可以获得事件发生的预测概率。以 一个解释变量的Logit模型为例,如果我们知道参数估计 ?和马,并确定某一事件的 Xi(i 1,2,L ,n),便可将其代入Logit模型,计算预测概率。计算公式为在计算预测概率的基础上,还进一步计算在解释变量发生离散变化时预测概率的 变化,这种方法被称为概率离散变化法。其计算公式是另外,与一般线性回归模型一样,由一个解释变量的 Logit模型也可扩展到多个 解释变量的Logit模型,见下式 相应的对数发生比为类似多元线性回归模型,在 Logit模型中,由于多个解释变量可能会以多个不同的尺 度加以测量,这个时候要直接对比不同解释变量对发生比的影响是不行的,因此,需 要对解释变量进行标准化变换,将解释变量和被解释变量由非标准化变量转换为标准 化变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论