




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章第七章 离散变量计量经济模型离散变量计量经济模型7.1 7.1 二元选择模型二元选择模型 一、二元离散选择模型的经济背景一、二元离散选择模型的经济背景 二、二元离散选择模型二、二元离散选择模型 三、二元三、二元ProbitProbit离散选择模型及其参数估计离散选择模型及其参数估计 四、二元四、二元LogitLogit离散选择模型及其参数估计离散选择模型及其参数估计 五、二元离散选择模型的检验五、二元离散选择模型的检验 在经典计量经济学模型中,被解释变量通常被假在经典计量经济学模型中,被解释变量通常被假定为连续变量。定为连续变量。 离散被解释变量数据计量经济学模型(离散被解释变量数据计量
2、经济学模型(Models Models with Discrete Dependent Variableswith Discrete Dependent Variables)和离散)和离散选择模型选择模型(DCM, Discrete Choice Model)(DCM, Discrete Choice Model)。 二元选择模型二元选择模型(Binary Choice Model)(Binary Choice Model)和多元选和多元选择模型择模型(Multiple Choice Model)(Multiple Choice Model)。 研究选择结果与影响因素之间的关系。研究选择结果与
3、影响因素之间的关系。选择结果:选择结果:0 0、1 1影响选择结果的因素包括两部分:影响选择结果的因素包括两部分:决策者的属性决策者的属性和和备备选方案的属性选方案的属性。实际经济生活中的二元选择问题实际经济生活中的二元选择问题一、二元离散选择模型的经济背景一、二元离散选择模型的经济背景 两种方案的选择两种方案的选择由由决策者的属性决策者的属性和和备选方案的属性备选方案的属性共同决定。共同决定。 例如,选择利用公共交通工具还是私人交通工具,取例如,选择利用公共交通工具还是私人交通工具,取决于两类因素。一类是公共交通工具和私人交通工具决于两类因素。一类是公共交通工具和私人交通工具所具有的属性,诸
4、如速度、耗费时间、成本等;一类所具有的属性,诸如速度、耗费时间、成本等;一类是决策个体所具有的属性,诸如职业、年龄、收入水是决策个体所具有的属性,诸如职业、年龄、收入水平、健康状况等。平、健康状况等。 从大量的统计中,可以发现选择结果与影响因素之间从大量的统计中,可以发现选择结果与影响因素之间具有一定的因果关系。具有一定的因果关系。 单个方案的取舍单个方案的取舍一般由一般由决策者的属性决策者的属性决定。决定。 例如,对某种商品的购买决策问题。决定购买与否,例如,对某种商品的购买决策问题。决定购买与否,取决于两类因素。一类是该商品本身所具有的属性,取决于两类因素。一类是该商品本身所具有的属性,诸
5、如性能、价格等;一类是消费者个体所具有的属性,诸如性能、价格等;一类是消费者个体所具有的属性,诸如收入水平、对该商品的偏好程度等。诸如收入水平、对该商品的偏好程度等。 对于所有的决策者,商品本身所具有的属性是相同的,对于所有的决策者,商品本身所具有的属性是相同的,在模型中一般不予体现。在模型中一般不予体现。二、二元离散选择模型二、二元离散选择模型1 1、原始模型、原始模型 对于二元选择问题,可以建立如下计量经济学模对于二元选择问题,可以建立如下计量经济学模型。其中型。其中Y为观测值为为观测值为1和和0的决策被解释变量;的决策被解释变量;X为解释变量,包括选择对象所具有的属性和选择为解释变量,包
6、括选择对象所具有的属性和选择主体所具有的属性。主体所具有的属性。 YXyiXii0)(iEiX)(iyEiiiipyPyPyE) 0(0) 1(1)(E yP yii()()1Xi) 0(1) 1(iiiiyPpyPp左右端矛盾左右端矛盾 由于存在这两方面的问题,所以原始模型不能作由于存在这两方面的问题,所以原始模型不能作为实际研究二元选择问题的模型。为实际研究二元选择问题的模型。 需要将原始模型变换为效用模型。需要将原始模型变换为效用模型。 这是离散选择模型的关键。这是离散选择模型的关键。 iiiyy1101XXXXiiii当,其概率为当,其概率为具有异具有异方差性方差性 2 2、效用模型、
7、效用模型 作为研究对象的二元选择模型作为研究对象的二元选择模型Uiii11X1Uiii000X UUiiiii1010X10()()yii*Xi第第i个个体个个体 选择选择1的效用的效用第第i个个体个个体 选择选择0的效用的效用P yP yPiii()()()*10Xi 注意,在模型中,效用是不可观测的,人们能够注意,在模型中,效用是不可观测的,人们能够得到的观测值仍然是选择结果,即得到的观测值仍然是选择结果,即1和和0。 很显然,如果不可观测的很显然,如果不可观测的U1U0,即对应于观测,即对应于观测值为值为1,因为该个体选择公共交通工具的效用大,因为该个体选择公共交通工具的效用大于选择私人
8、交通工具的效用,他当然要选择公共于选择私人交通工具的效用,他当然要选择公共交通工具;交通工具; 相反,如果不可观测的相反,如果不可观测的U1U0,即对应于观测值,即对应于观测值为为0,因为该个体选择公共交通工具的效用小于,因为该个体选择公共交通工具的效用小于选择私人交通工具的效用,他当然要选择私人交选择私人交通工具的效用,他当然要选择私人交通工具。通工具。3 3、最大似然估计最大似然估计 欲使得效用模型可以估计,就必须为随机误差项欲使得效用模型可以估计,就必须为随机误差项选择一种特定的概率分布。选择一种特定的概率分布。 两种最常用的分布是标准正态分布和逻辑两种最常用的分布是标准正态分布和逻辑(
9、logistic)分布,于是形成了两种最常用的二元)分布,于是形成了两种最常用的二元选择模型选择模型Probit模型模型和和Logit模型模型。 最大似然函数及其估计过程如下:最大似然函数及其估计过程如下:yii*XiFtF t()( ) 1P yP yPPFFiiii()()()()()()* 1011XXXXiiiiP yyyFFnyyii(,)()()12011XXiiLFFin()()XXiyi1yii11标准正态分布或逻标准正态分布或逻辑分布的对称性辑分布的对称性似然函数ln(ln()() ln()LyFyFiiinXXii111ln()()Ly fFyfFiiiiiiin111X0
10、i 在样本数据的支持下,如果知道概率分布函数在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模和概率密度函数,求解该方程组,可以得到模型参数估计量。型参数估计量。 1阶极值条件1 1、标准正态分布的概率分布函数、标准正态分布的概率分布函数 F txdxt( )()exp()22122f xx( )()exp()22122三、二元三、二元ProbitProbit离散选择模型及其参数估计离散选择模型及其参数估计2 2、重复观测值不可以得到情况下二元、重复观测值不可以得到情况下二元ProbitProbit离散选择模型的参数估计离散选择模型的参数估计 0XXXXXXiii
11、niiniiiiiiyiiiyiiqFqfqFfFfLii1110)()(1ln12iiyq其中 关于参数的非线性函数,不能直接求解,需采用关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。完全信息最大似然法中所采用的迭代方法。这里所谓这里所谓“重复观测值不可以得到重复观测值不可以得到”,是指对每个,是指对每个决策者只有一个观测值。如果有多个观测值,也将决策者只有一个观测值。如果有多个观测值,也将其看成为多个不同的决策者。其看成为多个不同的决策者。 例例.2 贷款决策模型贷款决策模型 分析与建模:分析与建模:某商业银行从历史贷款客户中随机某商业银行
12、从历史贷款客户中随机抽取抽取78个样本,根据设计的指标体系分别计算它个样本,根据设计的指标体系分别计算它们的们的“商业信用支持度商业信用支持度”(CC)和)和“市场竞争地位市场竞争地位等级等级”(CM),对它们贷款的结果(),对它们贷款的结果(JG)采用二)采用二元离散变量,元离散变量,1表示贷款成功,表示贷款成功,0表示贷款失败。表示贷款失败。目的是研究目的是研究JG与与CC、CM之间的关系,并为正确之间的关系,并为正确贷款决策提供支持。贷款决策提供支持。 样样本本观观测测值值CC=XYCM=SC该方程表示该方程表示,当,当CC和和CM已知时,代入方程,可以计算贷款成已知时,代入方程,可以计
13、算贷款成功的概率功的概率JGF。例如,将表中第。例如,将表中第19个样本观测值个样本观测值CC=15、CM=1代入方程右边,计算括号内的值为代入方程右边,计算括号内的值为0.1326552;查标准正态;查标准正态分布表,对应于分布表,对应于0.1326552的累积正态分布为的累积正态分布为0.5517;于是,;于是,JG的预测值的预测值JGF=10.5517=0.4483,即对应于该客户,贷款,即对应于该客户,贷款成功的概率为成功的概率为0.4483。输出的估计结果累计正态分布密度函数模拟预测 预测:预测:如果有一个新客户,根据客户资料,计算如果有一个新客户,根据客户资料,计算的的“商业信用支
14、持度商业信用支持度”(XY)和)和“市场竞争地位等市场竞争地位等级级”(SC),代入模型,就可以得到贷款成功的),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。概率,以此决定是否给予贷款。3 3、重复观测值可以得到情况下二元、重复观测值可以得到情况下二元ProbitProbit离离散选择模型的参数估计散选择模型的参数估计 思路思路 对每个决策者有多个重复(例如对每个决策者有多个重复(例如10次左右)观测值。次左右)观测值。 对第对第i个决策者重复观测个决策者重复观测ni次,选择次,选择yi=1的次数比例为的次数比例为pi,那么可以将那么可以将pi作为真实概率作为真实概率Pi的一个估
15、计量。的一个估计量。 建立建立 “概率单位模型概率单位模型” ,采用广义最小二乘法估计,采用广义最小二乘法估计 。 对第对第i个决策者重复观测个决策者重复观测n次,选择次,选择yi=1的次数比例为的次数比例为pi,那么可以将那么可以将pi作为真实概率作为真实概率Pi的一个估计量。的一个估计量。 pPeFeiiii()XiE eVar eppniiiii()()()01vFpFPeiiii11()()FPeFPef FPiiiii111()()()vFPuiii1()E uVar uPPnfFPiiiiii()()()()0112定义“观测到的”概率单位 泰勒展开,只保留一阶项 V的观测值通过求
16、解标准正态分布的概率分布函数的反函数得到的观测值通过求解标准正态分布的概率分布函数的反函数得到 vuiiXVXUiFPi1()Xi()XXXV111iiFP)(iXptdtivi()exp()22122实际观测得到的 采用广义最小二乘法 其中为U的方差-协方差矩阵,在实际估计过程中用它的估计量代替,该估计量是由Pi的估计量pi构成。四、二元四、二元LogitLogit离散选择模型及其参数离散选择模型及其参数估计估计1 1、逻辑分布的概率分布函数、逻辑分布的概率分布函数 F tet( ) 11f teett( )()12F teettt( )( )1f teetttt( )()( )( )112
17、.00.00.25.30510152025303540F0.00.81.0510152025303540DFB Brsch-Supanrsch-Supan于于19871987年指出年指出: : 如果选择是按照效用最大化而进行的,具有极限如果选择是按照效用最大化而进行的,具有极限值的逻辑分布是较好的选择,这种情况下的二元值的逻辑分布是较好的选择,这种情况下的二元选择模型应该采用选择模型应该采用Logit模型。模型。 2 2、重复观测值不可以得到情况下二元、重复观测值不可以得到情况下二元logitlogit离散选择模型的参数估计离散选择模型的参数估计 关于参数的
18、非线性函数,不能直接求解,需采用关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。完全信息最大似然法中所采用的迭代方法。 应用计量经济学软件。应用计量经济学软件。 ln()()()Ly fFyfFyiiiiiiiniin1111XXX0iiiProbit0.9999991.0000000.4472330.0000003 3、重复观测值可以得到情况下二元、重复观测值可以得到情况下二元logitlogit离离散选择模型的参数估计散选择模型的参数估计 思路思路 对每个决策者有多个重复(例如对每个决策者有多个重复(例如10次左右)观测值。次左右)观测值。 对第对第i个决策
19、者重复观测个决策者重复观测ni次,选择次,选择yi=1的次数比例为的次数比例为pi,那么可以将那么可以将pi作为真实概率作为真实概率Pi的一个估计量。的一个估计量。 建立建立“对数成败比例模型对数成败比例模型” ,采用广义最小二乘法估计,采用广义最小二乘法估计 。 用样本重复观测得到的用样本重复观测得到的pi构成构成“成败比例成败比例”,取对数并进行,取对数并进行台劳展开,有台劳展开,有 ln()ln()()ppPPePPiiiiiii111F tet( ) 11F tF tet( )( )1 iXePPii1ln()ln()ppeuuiiiiii1XXvuiiXVXUi()XXXV111逻辑
20、分布的概率分布函数 采用广义最小二乘法 由Pi的估计量pi构成,为了提高估计量的质量,可采用迭代法反复求得Pi的估计量 五、二元离散选择模型的检验五、二元离散选择模型的检验主要的检验包括拟合优度检验、总体显著性检验、变量显著性检验、预测(回代)效果检验、异方差性检验和省略变量检验。1 1、计量经济学模型中的两类检验统计量、计量经济学模型中的两类检验统计量 基于基于LSLS (其统计量大多是基于残差平方和而构建(其统计量大多是基于残差平方和而构建的)的) R2 总体显著性总体显著性F检验检验 约束回归的约束回归的F检验检验 基于基于ML(其统计量大多是基于似然函数值而构建其统计量大多是基于似然函
21、数值而构建的的) Wald LR (likelihood ratio) LM (lagrange multiplier) 原理相同原理相同2 2、拟合、拟合优度优度检验检验 P:样本观测值中被解释变量等于1的比例。 L:模型估计得到的似然函数值。 R2=1,即L=1,完全拟合。 R2=0,所有解释变量完全不显著,完全不拟合。02lnln1LLR)1ln()1 (ln(ln0PPPPnL设设L L0 0为模型中所有解释变量的系数都为为模型中所有解释变量的系数都为0 0时的似然函时的似然函数值,则有数值,则有LnL=1.639954LnL0=52.80224R2=0.9689423 3、 总体显著
22、性检验总体显著性检验 例中,例中,lnL=1.639954,lnL0= 52.80224,LR=102.3246。 20.01(2)=9.21。 可见,在可见,在0.01的显著水平上,该模型拒绝总体不的显著水平上,该模型拒绝总体不显著的显著的0假设。假设。 0:210kH)()ln(ln220kLLLR4 4、回代检验、回代检验 当二元离散选择模型被估计后,将所有样本的解释变当二元离散选择模型被估计后,将所有样本的解释变量观测值代入模型,计算得到每个样本的被解释变量量观测值代入模型,计算得到每个样本的被解释变量选择选择1的概率,与每个样本被解释变量的实际观测值进的概率,与每个样本被解释变量的实
23、际观测值进行比较,以判断模型的预测(回代)效果,是一种实行比较,以判断模型的预测(回代)效果,是一种实际有效的模型检验方法。际有效的模型检验方法。 4 4、回代检验、回代检验4 4、回代检验、回代检验 概率阈值概率阈值 朴素选择:朴素选择:p=0.5 (1、0的样本相当时)的样本相当时) 先验选择:先验选择:p=(选(选1的样本数的样本数/全部样本)(全样本全部样本)(全样本时)时) 最优阈值:犯第一类错误最小原则最优阈值:犯第一类错误最小原则例例7.2.2 如果按照朴素原则如果按照朴素原则,例中,除了,例中,除了2个样本外,所个样本外,所有样本都通过了回代检验。没有通过回代检验的有样本都通过
24、了回代检验。没有通过回代检验的2个样本中,第个样本中,第19个样本的选择结果为个样本的选择结果为1,回代算,回代算得的选择得的选择1的概率为的概率为0.4472;第;第45个样本的选择个样本的选择结果为结果为0,回代算得的选择,回代算得的选择1的概率的概率0.5498。 但是,该例中,选择但是,该例中,选择1和选择和选择0的样本数目分别为的样本数目分别为32和和46,差异较大,不适合采用该方法。,差异较大,不适合采用该方法。 如果按照先验方法如果按照先验方法,即以全部样本中选择,即以全部样本中选择1的样的样本所占的比例为临界值。例中,选择本所占的比例为临界值。例中,选择1的样本的的样本的比例为
25、比例为0.41。以此为临界值,只有第。以此为临界值,只有第45个样本不个样本不能通过检验。能通过检验。 但是,该方法适合于以全部个体作为样本的情况但是,该方法适合于以全部个体作为样本的情况,而该例中的,而该例中的78个样本仅是贷款客户的极少部分个样本仅是贷款客户的极少部分,所以也不适合采用该方法。,所以也不适合采用该方法。 如果按照最优方法如果按照最优方法,即以,即以“犯第一类错误最小犯第一类错误最小”为为原则确定临界值的方法。在例中,如果以原则确定临界值的方法。在例中,如果以0.50为为临界值,则有临界值,则有2个样本发生个样本发生“弃真弃真”,即犯第一类错,即犯第一类错误;如果以误;如果以
26、0.41为临界值,则发生为临界值,则发生“弃真弃真”的样本的样本只有只有1个。所以以个。所以以0.41作为临界值比较合适。作为临界值比较合适。 7 7. .2 2 多元选择模型多元选择模型 一、社会经济生活中的多元选择问题一、社会经济生活中的多元选择问题二、一般多元离散选择二、一般多元离散选择LogitLogit模型模型三、嵌套三、嵌套LogitLogit模型模型四、排序多元离散选择模型四、排序多元离散选择模型 可以将社会经济生活中的多元选择问题分为三类:可以将社会经济生活中的多元选择问题分为三类: 一般多元选择问题一般多元选择问题 排序选择问题排序选择问题(Ordered Multivari
27、ate Choice ) 嵌套选择问题嵌套选择问题(Nested Multiple Choices) 一、社会经济生活中的多元选择问题一、社会经济生活中的多元选择问题 一般多元选择问题一般多元选择问题 决策者按照效用最大原则在多个可供选择的方案中进行决策者按照效用最大原则在多个可供选择的方案中进行选择。选择。 一类问题是决策者面临多项选择一类问题是决策者面临多项选择 一类问题是决策者对同一个选择对象的偏好程度一类问题是决策者对同一个选择对象的偏好程度 排序选择问题排序选择问题 决策者作出某种选择并不意味实现了效用最大,而是在决策者作出某种选择并不意味实现了效用最大,而是在条件制约下的无奈选择。
28、条件制约下的无奈选择。 一个典型的例子是商品的满意度调查。一个典型的例子是商品的满意度调查。 将对商品的满意度分为将对商品的满意度分为5等:十分满意、一般满意、等:十分满意、一般满意、无所谓、一般不满意、十分不满意,对已经购买了该无所谓、一般不满意、十分不满意,对已经购买了该商品的居民进行调查,会有不同的满意程度,该调查商品的居民进行调查,会有不同的满意程度,该调查结果就是一个排序选择问题。结果就是一个排序选择问题。 嵌套选择问题嵌套选择问题 选择对象是分层次的,决策者必须逐层进行选择。选择对象是分层次的,决策者必须逐层进行选择。 在多元离散选择模型中,应用最多的是在多元离散选择模型中,应用最
29、多的是Logit模型。模型。在多元离散选择模型中,因为在多元离散选择模型中,因为ProbitProbit模型需要对多元正模型需要对多元正态分布的整体进行评价,所以它的应用受到限制。态分布的整体进行评价,所以它的应用受到限制。逻辑分布更适合于效用最大化时的分布选择,所以应用逻辑分布更适合于效用最大化时的分布选择,所以应用最多的多元离散选择模型是最多的多元离散选择模型是LogitLogit模型。模型。LogitLogit模型的似然函数能够快速可靠地收敛,当方案或模型的似然函数能够快速可靠地收敛,当方案或者决策个体数量较大时,计算比较简便。者决策个体数量较大时,计算比较简便。 二、一般多元离散选择二
30、、一般多元离散选择LogitLogit模型模型1 1、一般多元选择、一般多元选择LogitLogit模型的思路模型的思路 如果决策者如果决策者i在(在(J+1)项可供选择方案中选择了)项可供选择方案中选择了第第j项,那么其项,那么其效用模型效用模型为:为: UijXijijP UUkJkjijik(), , ,012 P yjeeijJ()XXijij0当且仅当(J+1)个随机误差项互不相关,并且服从Weibul类极值分布 )exp()(ijeFij选择j的概率 效用模型的解释变量中包括所有影响选择的因素,效用模型的解释变量中包括所有影响选择的因素,既包括既包括决策者所具有的属性,也包括备选方
31、案所决策者所具有的属性,也包括备选方案所具有的属性。具有的属性。 备选方案所具有的属性是随着方案的变化而变化的。备选方案所具有的属性是随着方案的变化而变化的。 决策者所具有的属性中一部分是随着方案的变化而变决策者所具有的属性中一部分是随着方案的变化而变化的,而一部分是不随着方案的变化而变化的。化的,而一部分是不随着方案的变化而变化的。 用用Zij表示随着方案的变化而变化的那部分解释变量,表示随着方案的变化而变化的那部分解释变量,Wi表示不随着方案的变化而变化的那部分解释变量。表示不随着方案的变化而变化的那部分解释变量。 P yjeeeeeeijJjJ()ZWZWZWZWijiijiijiiji
32、00P yjeeeeeeijJjJ()ZWWZZZijiiijijij00P yjeeijJ()XXijij0 实用的一般多元实用的一般多元Logit选择模型又分选择模型又分3种情况。种情况。 一是研究选择某种方案的概率与决策者的特征变量之一是研究选择某种方案的概率与决策者的特征变量之间的关系;间的关系; 二是研究选择某种方案的概率与决策者的特征变量以二是研究选择某种方案的概率与决策者的特征变量以及方案的特征变量之间的关系;及方案的特征变量之间的关系; 三是考虑到不同方案之间的相关性的情况。三是考虑到不同方案之间的相关性的情况。 Multinomial Logit Model多项多项Logit
33、模型模型名义名义Logit模型模型Conditional Logit Model 条件条件Logit模型模型 Nested Logit模型模型嵌套模型嵌套模型 2 2、多项、多项LogitLogit离散选择模型及其参数估计离散选择模型及其参数估计 P yjeeijJjj()XXii0X中未包含备选方案所具有的中未包含备选方案所具有的属性变量,而参数向量属性变量,而参数向量B对不对不同的选择方案(即不同的方程)同的选择方案(即不同的方程)是不同的。是不同的。 P yjeeikJjk()XXii11P yeikJk()0111Xi令令B0=0,j=1,2,Jlnln()LdP yjijijJin0
34、1 由对数似然函数最大化的一阶条件,利用由对数似然函数最大化的一阶条件,利用Newton 迭代方法可以迅速地得到方程组的解,得到模型迭代方法可以迅速地得到方程组的解,得到模型的参数估计量。的参数估计量。 ln(), ,LdPjJijijijiX1 2 21ln( ()LPjlPijiliiinjl1X X 1()jljljl10如果如果 另一种估计方法另一种估计方法 可以计算相对于基准方案的可以计算相对于基准方案的“对数成败比对数成败比”为:为: ln()PPiji0 Xijln()()PPijikXijk 将上式对将上式对Xi微分,可得微分,可得的经济意义。有对概率的边际贡献率从上可知,模型
35、参数具)()(0BBPBPBPXPjjlkkkjijjj3 3、例题、例题 将某商业银行从历史贷款客户中随机抽取的78个样本进一步细分,贷款结果2表示贷款成功,1表示延滞还款,0表示呆坏账。目的是研究贷款结果(JG)与“商业信用支持度”(XY)和“市场竞争地位等级”(SC)之间的关系。为此建立三元选择多项Logit模型。 采用采用Stata估计模型,估计结果估计模型,估计结果 以JG=0为基准,对于JG=1和JG=2,“商业信用支持度”的系数为负,即当客户的财务状况越差(该变量观测值越大)时,获得贷款成功的概率越小,而且对JG=2的影响远大于对JG=1的影响。类似地,“市场竞争地位等级”的系数
36、为正,即当客户的市场状况越好(该变量观测值越大)时,获得贷款成功的概率越大;而且对JG=2的影响远大于对JG=1的影响。模型有较高的拟合优度和总体显著性;解释变量在5%的显著性水平下显著。利用估计结果对样本客户贷款结果分别取0、1和2的概率进行预测,除了个别样本客户外,预测结果和实际结果具有一致性 。对于多元选择模型,需要检验选择结果之间的独立性,以及是否可以对于多元选择模型,需要检验选择结果之间的独立性,以及是否可以将某些选择结果合并。将某些选择结果合并。 独立检验显示,选择结果1与选择结果0、2之间是独立的;选择结果2与选择结果0、1之间也是独立的。选择结果合并检验显示,选择结果1和2、1
37、和0、2和0是不能合并的,即0、1、2选项均不可合并,也验证了IIA假设成立。 4 4、条件、条件LogitLogit离散选择模型及其参数估计离散选择模型及其参数估计 选择某种方案的概率不仅与决策者的特征变量有选择某种方案的概率不仅与决策者的特征变量有关,而且也与方案的特征变量有关关,而且也与方案的特征变量有关,模型为:,模型为: JjijjeejyP1)(iiXX区别在于X的下标lnln()LdP yjijijJin11其微分方程为 由对数似然函数最大化的一阶条件,利用由对数似然函数最大化的一阶条件,利用Newton 迭代方法可以迅速地得到方程组的解,迭代方法可以迅速地得到方程组的解,得到模
38、型的参数估计量。得到模型的参数估计量。ln()LdijjJiniji11XX211ln()()LPijjJijiijiin XXXXXXiijjJijP11 1、问题的提出、问题的提出 (J+1)个不同的选择方案之间具有相关性,而且必个不同的选择方案之间具有相关性,而且必须考虑这种相关性,表现为模型随机误差项相关。须考虑这种相关性,表现为模型随机误差项相关。 可行的思路是将(可行的思路是将(J+1)个选择方案分为)个选择方案分为L组,在组,在每组内部的选择方案之间不具有相关性,而组间每组内部的选择方案之间不具有相关性,而组间则具有相关性。则具有相关性。 就是将条件就是将条件Logit模型中隐含
39、的齐次方差性条件放模型中隐含的齐次方差性条件放松,允许方差在组间可以不同,但在组内仍然是松,允许方差在组间可以不同,但在组内仍然是同方差的。同方差的。 这样的模型被称为这样的模型被称为Nested Logit模型。模型。 三、嵌套三、嵌套LogitLogit模型模型 2 2、Nested LogitNested Logit模型模型P j lPeejljJlLl( , ) XZXZj llj ll11Zl表示对选择第l组产生影响的变量 Xj|l表示在第l组内对选择第j种方案产生影响的变量PPPeeeeeeejlj lljJlLjJlLjJlLlllXXZZXZXZj lj lllj llj ll
40、111111 定义第定义第l组的组的“内值内值”(Inclusive Value) IeljJllnXj l1Peej ljJlXXj lj l1PeellLllZIZIllll1 可利用Tl=1的约束重新描述条件Logit模型,然后再放松约束得道嵌套Logit模型3 3、估计方法、估计方法 两阶段最大似然法两阶段最大似然法,是一种有限信息估计方法。,是一种有限信息估计方法。其具体步骤是:其具体步骤是: 在组内,作为一个简单的条件在组内,作为一个简单的条件Logit模型,估计参数;模型,估计参数; 计算每组的计算每组的“内值内值”; 将每组看成是一种选择方案,再进行简单的条件将每组看成是一种选
41、择方案,再进行简单的条件Logit模型的估计,得到参数模型的估计,得到参数和和T的估计量。此时用到的贡的估计量。此时用到的贡献变量是献变量是Zl和和Il。 完全信息最大似然法完全信息最大似然法。将对数似然函数写为:。将对数似然函数写为: lnln()LPPj lliin1比两阶段最大似然法更有效四、排序多元离散选择模型四、排序多元离散选择模型1 1、问题的提出、问题的提出 作为被解释变量的(作为被解释变量的(J+1)个选择结果本身是排)个选择结果本身是排序的,序的,J优于(优于(J1),),2优于优于1,1优于优于0。 决策者选择不同的方案所得到的效用也是排序的。决策者选择不同的方案所得到的效
42、用也是排序的。 一般多元离散选择模型中的效用关系不再适用。一般多元离散选择模型中的效用关系不再适用。 2 2、效用关系、效用关系 选择不同方案的效用关系:选择不同方案的效用关系:yyyuuyuJuyJ001021121如果如果如果如果*3 3、模型、模型为了保证所有的概率都是正的,必须有为了保证所有的概率都是正的,必须有 :y*XP yP yuP yuuP yJuJ()()()()()()()()()()01211211XXXXXX假定服从正态分布,并且标准化为服从期望为0、方差为1的正态分布。那么可以得到选择各个方案的概率 为正态分布的概率函数0121uuuJ4 4、估计、估计 可以看作二元
43、可以看作二元Probit模型的推广;模型的推广; 采用最大似然法估计;采用最大似然法估计; 得到参数估计值;得到参数估计值; 计算每个样本选择各个方案的概率。计算每个样本选择各个方案的概率。5 5、排序模型问题举例、排序模型问题举例 为了研究各种不同的养老模式对老年人健康水平和为了研究各种不同的养老模式对老年人健康水平和幸福感的影响,利用幸福感的影响,利用2002年、年、2005年中国老年人年中国老年人口健康状况调查数据,建立多元排序选择模型。口健康状况调查数据,建立多元排序选择模型。 将客观健康状况分为将客观健康状况分为5个等级:非常健康、较健康、较不个等级:非常健康、较健康、较不健康、很不
44、健康、死亡,显然这是一个排序多元选择问健康、很不健康、死亡,显然这是一个排序多元选择问题。题。 将主观幸福感分为将主观幸福感分为6个等级:非常好、好、一般、差、非个等级:非常好、好、一般、差、非常差、死亡,显然这也是一个排序多元选择问题。常差、死亡,显然这也是一个排序多元选择问题。 影响因素包括居住模式(即养老模式,包含独居、只影响因素包括居住模式(即养老模式,包含独居、只与配偶居住、多代合住、住养老院与配偶居住、多代合住、住养老院4种)以及其它因素种)以及其它因素,包含主要生活来源、医疗状况、初始健康水平、社,包含主要生活来源、医疗状况、初始健康水平、社会经济地位、健康行为,以及人口统计信息
45、等,所有会经济地位、健康行为,以及人口统计信息等,所有这些因素都属于决策者属性。这些因素都属于决策者属性。 因为本例重点考察养老模式对老年人健康水平和幸福因为本例重点考察养老模式对老年人健康水平和幸福感的影响,考虑到养老模式和经济来源的二维性,进感的影响,考虑到养老模式和经济来源的二维性,进一步将养老模式细分,即每种模式下又分为经济独立一步将养老模式细分,即每种模式下又分为经济独立、子女供养、政府补助、子女供养、政府补助3种,共种,共12种养老模式。种养老模式。 模型估计结果显示,模型估计结果显示,不同养老模式对老年人客观健康水平不同养老模式对老年人客观健康水平的影响,以子女供养的独居老人为参
46、照组,经济独立或子的影响,以子女供养的独居老人为参照组,经济独立或子女供养情况下生活独立的老年夫妻保持健康(即非常健康女供养情况下生活独立的老年夫妻保持健康(即非常健康或较健康)的概率要比参照组分别高或较健康)的概率要比参照组分别高13%-15%,死亡概,死亡概率要低率要低13%-15%,属于最优的养老模式;其次是经济独,属于最优的养老模式;其次是经济独立但选择多代合住的模式;立但选择多代合住的模式;子女供养的养老院老人、子女供养的养老院老人、依靠补助的独居老人和子女供养的独居老人(参照组)具依靠补助的独居老人和子女供养的独居老人(参照组)具有最差的客观健康水平。有最差的客观健康水平。 模型估
47、计结果显示,模型估计结果显示,不同养老模式对老年人主观幸福感的不同养老模式对老年人主观幸福感的影响,与子女供养的独居老人相比,经济与生活均独立的影响,与子女供养的独居老人相比,经济与生活均独立的老年夫妻和依靠补助的养老院老人对生活最满意,感到非老年夫妻和依靠补助的养老院老人对生活最满意,感到非常幸福和幸福的概率要高出常幸福和幸福的概率要高出14%;其次是子女供养但生活;其次是子女供养但生活独立的老年夫妻和经济独立的养老院老人;独立的老年夫妻和经济独立的养老院老人;子女供养子女供养的养老院老人、依靠补助的独居老人和子女供养的独居老的养老院老人、依靠补助的独居老人和子女供养的独居老人(参照组)仍然
48、具有最差的主观幸福感。人(参照组)仍然具有最差的主观幸福感。 7.3 面板数据模型分析面板数据模型分析一、面板数据和模型概述一、面板数据和模型概述(一一)面板数据面板数据 利用横截面数据的回归分析和时间序列数据分析是经济研究中的常用方法。 只采用时间序列分析时,则不能反映不同截面数据之间的联系和区别。 只利用横截面数据,又不能反映数据随时间变化的特性。 因而,在经济研究和实际应用中,经常需要同时分析和比较横截面数据和时间序列数据相结合的数据,这种数据既包含时间序列数据,同时又包含横既包含时间序列数据,同时又包含横截面数据的复合数据称为面板数据截面数据的复合数据称为面板数据(panel data
49、)例例1 表1就是一个面板数据的例子,其中每一列是华东地区各省市的GDP(横截面数据),而不同行则是每个省市的GDP(时间序列数据)。 表1 华东地区各省市GDP历史数据 (单位:亿元) 研究目的的需要研究目的的需要 通过建立计量经济学模型进行经济分析,经常发现,通过建立计量经济学模型进行经济分析,经常发现,只利用截面数据或者只利用时间序列数据不能满足分只利用截面数据或者只利用时间序列数据不能满足分析目的的需要。析目的的需要。 例如,如果分析生产成本问题。例如,如果分析生产成本问题。 例如,分析目前我国的结构性失业问题。例如,分析目前我国的结构性失业问题。 数据信息的充分利用数据信息的充分利用
50、 在计量经济分析中,利用信息越多越有效。在计量经济分析中,利用信息越多越有效。 利用利用Panel Data比仅利用截面数据或者时间序列数据比仅利用截面数据或者时间序列数据更有效。更有效。(二二) 面板数据模型面板数据模型(panel data model) 研究和分析面板数据的模型称为面板数据模型面板数据模型。 一般的线性模型只单独分析横截面数据或时间序列数据,而面板数据则可以同时分析横截面数据和时间序列数据。 面板数据模型已成为近年来计量经济学理论和方法的重要发展之一。二、一般面板数据模型介绍二、一般面板数据模型介绍 先引入各变量的表示法:),2,1(Kjxjit表示因变量在横截面 i 和
51、时间 t的观察值; 第 j 个解释变量在横截面 i 和时间 t 的观察值。),2,1;,2,1(TtNiyit各变量的表示法各变量的表示法于是第 i 个横截面的数据为iTiiiKiTiTiTKiiiKiiiiiTiiiuuuuxxxxxxxxxXyyyy2121222121211121;),2, 1;,2, 1(TtNiuit其中 为横截面i和时间t的随机误差项。面板数据模型的矩阵形式面板数据模型的矩阵形式记uXy则面板数据的矩阵形式为KNNNuuuuXXXXyyyy21212121; (1) 是一个最基本的面板数据模型,对(1)中参数和随机误差项u的不同假设,则产生不同的面板数据模型。(1)
52、单方程单方程Panel Data模型常见的三种情形模型常见的三种情形 情形情形1:变系数模型:变系数模型( i j, ij)。在横截面上有。在横截面上有个体影响,有结构变化。即除了存在个体影响外个体影响,有结构变化。即除了存在个体影响外,在横截面上还存在变化的经济结构,因而结构参在横截面上还存在变化的经济结构,因而结构参数在不同横截面单位上是不同的。数在不同横截面单位上是不同的。itiitiituxyni, 1 Tt, 1面板数据模型分类面板数据模型分类 情形情形2:变截距模型:变截距模型( i j, i=j)。在横截面上有。在横截面上有个体影响,无结构变化。即个体影响表现为模型个体影响,无结
53、构变化。即个体影响表现为模型中被忽略的反映个体差异的变量的影响,又分为中被忽略的反映个体差异的变量的影响,又分为固定影响和随机影响两种情况。固定影响和随机影响两种情况。ititiituxyni, 1 Tt, 1 情形情形3:在横截面上无个体影响,无结构变化:在横截面上无个体影响,无结构变化( i= j, i=j)。则普通最小二乘估计给出了一致有效估计。相当。则普通最小二乘估计给出了一致有效估计。相当于将多个时期的截面数据放在一起作为样本数据。于将多个时期的截面数据放在一起作为样本数据。ititituxyni, 1 Tt, 1 情形情形4:不讨论。:不讨论。ni, 1 Tt, 1itiititu
54、xy 情形情形5:在时间序列上有个体影响,有结构变化。:在时间序列上有个体影响,有结构变化。在理论方法方面与情形在理论方法方面与情形1相同,不讨论。相同,不讨论。ni, 1 Tt, 1ittittituxy 情形情形6:有实践,无理论:有实践,无理论。itittiituxyni, 1 Tt, 1二、二、Panel Data Panel Data 模型的设定模型的设定F F检验检验 研究面板数据的第一步是检验刻画被解释变量研究面板数据的第一步是检验刻画被解释变量y的参数是否在所有横截面样本点和时间上都是常的参数是否在所有横截面样本点和时间上都是常数,即检验所研究的问题属于上述数,即检验所研究的问
55、题属于上述3种情况中的种情况中的哪一种,以便确定模型的形式哪一种,以便确定模型的形式。 广泛使用的检验是协变分析检验,即广泛使用的检验是协变分析检验,即F检验。检验。F检验主要检验以下两个假设:检验主要检验以下两个假设:假设假设1:斜率在不同的横截面样本点上和时间上都相同,但:斜率在不同的横截面样本点上和时间上都相同,但截距不相同。(情形截距不相同。(情形2) H1: yit= i+xit+uit 假设假设2:截距和斜率在不同的横截面样本点和时间上都相同。:截距和斜率在不同的横截面样本点和时间上都相同。(情形(情形3) H2: yit= +xit+uit 如果接收了假设如果接收了假设2,则没有
56、必要进行进一步的检验。如果拒,则没有必要进行进一步的检验。如果拒绝了假设绝了假设2,就应该检验假设,就应该检验假设1,判断是否斜率都相等。如果,判断是否斜率都相等。如果假设假设1被拒绝,就应该采用情形被拒绝,就应该采用情形1的模型。的模型。F F检验检验 F检验的思路是:将情形检验的思路是:将情形2、3分别视为对情形分别视为对情形1施施加了参数约束。加了参数约束。 经典模型中的约束检验:经典模型中的约束检验:) 1,() 1/()/()(URUUURUURknkkFknRSSkkRSSRSSFitiitiituxyititiituxyititituxy F统计量的计算方法统计量的计算方法 Tt
57、itiyTy11TtitixTx11)()(1,iitTtiitixxxxxxW)()(1,iitTtiitixyyyxxWTtiitiyyyyW12,)(ixyixxixyiyyiWWWWRSS,1,niiRSSS11第i群的残差平方和 的残差平方和 itiitiituxyiiiiixyixxiitiitiitxyWWOLSuxy ,1,为参数的niixxxxWW1,niixyxyWW1,niiyyyyWW1,xyxxxyyyWWWWS12的残差平方和 ititiituxy. ,1wiiixyxxwititiitxyWWOLSuxy为参数的niitTtitxxxxxxT11)()(niitT
58、titxyyyxxT11)()(niTtityyyyT112)(niTtitynTy111niTtitxnTx111xyxxxyyyTTTTS13的残差平方和 ititituxy ,1xyTTOLSuxyxyxxititit为参数的 检验假设检验假设2的的F统计量统计量)1(),1)(1()1(/)1)(1/()(1132KTnKnFKnnTSKnSSF从直观上看,如从直观上看,如S3S1很小,很小,F2则很小,低于临界则很小,低于临界值,接受值,接受H2。 S3为截距、系数都不变的模型的残差为截距、系数都不变的模型的残差平方和,平方和,S1为截距、系数都变化的模型的残差平方为截距、系数都变化
59、的模型的残差平方和。和。 检验假设检验假设1的的F统计量统计量从直观上看,如从直观上看,如S2S1很小,很小,F1则很小,低于临界则很小,低于临界值,接受值,接受H1。 S2为截距变化、系数不变的模型的残为截距变化、系数不变的模型的残差平方和,差平方和,S1为截距、系数都变化的模型的残差平为截距、系数都变化的模型的残差平方和。方和。)1(,) 1()1(/) 1/()(1121KTnKnFKnnTSKnSSF Eviews Eviews 不能自动进行不能自动进行F F检验,需要单独进行检验。检验,需要单独进行检验。 从理论上讲,模型设定检验是不可缺少的。从理论上讲,模型设定检验是不可缺少的。 在实际应用中,最容易被忽视。在实际应用中,最容易被忽视。三三、固定影响变截距模型、固定影响变截距模型1. LSDV1. LSDV模型及其参数估计模型及其参数估计 ititiituxyiiiiuXeyuXdddyn,21uXDy1111TennTneeeddd000000,21T阶向量(Tn)阶
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2031年中国电磁门吸行业投资前景及策略咨询研究报告
- 2025至2031年中国工业橡胶帆布行业投资前景及策略咨询研究报告
- 2025至2031年中国2.4二氨基苯磺酸钠行业投资前景及策略咨询研究报告
- 2025至2030年中国静电喷漆喷粉主机数据监测研究报告
- 2025至2030年中国防水浆料数据监测研究报告
- 2025至2030年中国药用沙棘油数据监测研究报告
- 湖州商场暖通工程施工方案
- 2025至2030年中国环型灯盘数据监测研究报告
- 四川新建钢烟囱施工方案
- 2025至2030年中国双炉数据监测研究报告
- 语文版九年级下册课外阅读练习
- 【课件】第11课+美术的曙光-史前与早期文明的美术+课件高中美术人教版(2019)美术鉴赏
- 高中化学人教版一轮复习-晶体结构与性质(复习课件)
- GB/T 22919.3-2008水产配合饲料第3部分:鲈鱼配合饲料
- 船舶涂装课件
- 【薪酬】国有企业中长期股权激励课件
- 《新闻摄影教程(第五版)》第三章 新闻摄影工作者的职责与素养
- 学前儿童行为观察第一章观察概述课件
- 化学品防范说明编码
- 轨道检测列车介绍课件
- 二年级阅读导航(下)
评论
0/150
提交评论