版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多元选择模型多元选择模型 2 第十章 多元选择模型 (Multiple-choice models) 3 本章内容本章内容 一、无序多元选择模型一、无序多元选择模型 二、有序因变量模型二、有序因变量模型(Ordered data) 三、计数模型三、计数模型(Count data) 4 一、基本概念 v对于多元选择模型,可以根据因变量的性质分为有序选择模对于多元选择模型,可以根据因变量的性质分为有序选择模 型和无序选择模型两种类型。型和无序选择模型两种类型。 (一)无序模型:(一)无序模型:因变量因变量Y表示观察对象的类型归属。表示观察对象的类型归属。 例1:交通问题(走路、骑自行车、乘公共汽车
2、、打出租 车、开私家车) 例2:就业问题:农民工就业行业选择;农村劳动力转移 (小城镇、县级市、地级市、 省级城市、大城、) 例3:农户借贷(国有银行、信用社、民间借贷) 例4:超市购物选择 例5:农户土地流转(转包、出租、互换、转让、股份合 作) 5 (二)有序模型:(二)有序模型:观察到的因变量Y表示出按数值大 小(ordered)或重要性 (ranked)排序的分类结果: 例例1:个人达到的教育水平分文盲、小学、初中、高中、:个人达到的教育水平分文盲、小学、初中、高中、 大学、研究生等大学、研究生等 例例2:考试成绩分优秀、良好、及格和不及格等:考试成绩分优秀、良好、及格和不及格等;学生
3、奖;学生奖 学金等级;学金等级; 例例3:评价意见调查分非常不满意、不满意、一般、满意、:评价意见调查分非常不满意、不满意、一般、满意、 非常满意等非常满意等 例例4:住房选择:租房、小户型、大户型、别墅:住房选择:租房、小户型、大户型、别墅 例例5:银行信誉等级:银行信誉等级 6 二、无序多元选择模型 v无序的Probit计算复杂,故考虑有三种选择的Logit模型 v即每个方程都假定,任两个选择的机会比对数是特征X的线 性函数。 v由于所有概率之和等于1,因而机会比相互依赖,上述限制 使需要估计的参数由6个减少到4个。 2 2121 1 3 3131 1 3 3232 2 log log l
4、og P X P P X P P X P 7 v对于无序选择模型,其行为选择假定出于优化一个对于无序选择模型,其行为选择假定出于优化一个 随机效用函数。随机效用函数。 v考虑第i个消费者面临着k种选择,假定选择j的效用 为: v如果消费者选择了j,那么我们假定消费者由这一选 择获得的效用高于其他选择。 v考虑效用比较的概率函数 v就误差分布形式做出假定后得到可以估计的选择行 为模型。 ijijij Uze Pr ijik UUkj所有的 8 v产生系数限制的原因: v这意味着以下限制条件: v即只需要估计系统中的两个方程便可以得到所有参 数。 XXX P P P P P P P P P P 2
5、131213121213131 1 2 1 3 2 1 1 3 2 3 logloglogloglog 213132213132 9 无序多元选择模型 v如果样本属于重复试验,那么可以计算出与每 个组相联系的概率rij/ni,然后计算出机会比的对 数,与X做回归。 式中rij表示组i中选择j的次数占该组观察对象 总数ni的比例 v如果没有足够多的重复,则需要利用最大似然 法进行估计。 10 举例 v用多元Logit模型分析农户合作医疗方式选择 v数据:6个省的2505个农户的问卷调查,有951户做 出了选择。分析只利用此子样本。 v合作医疗方式分为三类 福利型:每人年交5-10元,减免挂号、诊
6、断、注射、处 理费; 福利风险型:每人年交20-100元,报销大病和小病的部 分医疗费用; 风险型:每人年交20-50元,报销大病的部分医疗费用。 11 因变量Log(P1/P3)Log(P2/P3) 系数标准差系数标准差 河北-1.3070.23-0.9130.26 江苏-0.8590.26-2.5690.51 广东-0.3230.290.4530.32 四川0.2360.31-0.7160.42 甘肃-1.6170.29-0.6890.29 最低收入组-0.4740.280.1740.33 低收入组0.2350.280.5310.34 中收入组-0.3150.280.2600.33 高收入
7、组-0.3030.270.1360.31 常数项0.9370.24-0.1930.29 12 13 二、有序因变量模型 v同二元选择模型一样,我们可以考虑隐变量y*的值取决于一组 自变量X,即: v观察到的Y由Y*决定,即如果连续性随机变量Y*超过某个临界 值 ,则对应Y的一个确定性选择。两者的关系是: v需要注意的是,反映类型差异的数字是任意的,但必须保证当 v有序因变量模型也有probit、logit 、extreme value三种形式可 供选择,用极大似然法(ML)进行参数估计。 v 事先也不确定,需要与一起作为参数进行估计。 * 3 * 2 2 * 1 1 * 2 1 0 iM i
8、i i i YM Y Y Y Y 如果 如果 如果 如果 jiji YYYY时有 * iii uXY * 有序因变量模型 v假设残差项u服从标准正态分布或logit分布,则可得 排序选择模型的概率形式。每个Y的概率为: v式中F为残差项的累积分布函数。 )(1)Pr()Pr(),Pr( )()()Pr()Pr(),1Pr( )()Pr()Pr(),0Pr( 122121 111 iMMMiii iiiiii iiiii XFuXYXMY XFXFuXYXY XFuXYXY 在有序因变量模型中,因变量的值仅仅反映排序, 因而对其数值及间隔并无特殊要求。 例:序列(1,2,3,4)等同于序列(1,
9、10,30,100) 因变量必须是整数,可以利用EVIEWS的函数功能 做转换(Round, Floor, Ceil) 15 有序因变量模型有序因变量模型 v参数估计:分类临界值和参数 v估计方法:极大似然法 极大似然函数: v式中函数I(.)是一个指标函数,当括号中的逻辑关系 为真时等于1,反之等于0。 v为了保证概率为正值,所有的必须满足 0 1 2 M 。 10 ,|, NM iii ij LLog Pr Yj XI Yj 16 有序Probit模型的概率 XX 1 X 2 X 3 0 0.1 0.2 0.3 0.4 Y=0 Y=1Y=2Y=3 Y=4 )(uf u 选择一种估计方法(P
10、robit, Logit, Extreme value) 确定估计模型所使用的样本区间 按OK后EVIEWS利用迭代求解法得出估计结果,包括 各自变量的参数及相应的统计值,各临界点和其统计 值,其他统计检验指标等。 若模型收敛,那么报告的内容具有意义。 v需要注意的问题有: 由于EVIEWS有估计参数数量限制,因而因变量的取值 不能太多(使用大样本时需要特别注意)。 若某一类别中的观察值过少,此时会造成识别困难。 在可能的情况下,应考虑将其合并到其他类别。 估计该方程时的步骤为: 选择QuickEstimate equation 在随后出现的对话窗口中,先选择模型设定窗口, 给出Y和X(不需要
11、截距项: 18 v有序因变量模型不能用于预测因变量数值的大小, 但可以用于预测属于每个类别的可能性; 选择Procs/Make model EVIEWS打开一个文件,其中包括由每个类别的概率函数 组成的方程组。 打OK后,EVIEWS计算出每个观察值落入任一类别的可 能性,并将其储存在与因变量同名但附加上类别识别码 和模拟方案(Scenario)码的变量下。 19 举例:有序因变量模型估计 某政策出台后对居民收入有影响,由此对市民的政策支 持情况进行调查。通过调查取得了市民收入(X)、支持与否 (Y)的数据,其中如果选民支持则 Yi 取0,中立取1,不支持 取2。获得了24组数据,进行排序选择
12、模型估计分析。 1模型的估计 2 * 2 * 1 1 * 2 1 0 i i i i Y Y Y Y 待估计的三元选择模型:待估计的三元选择模型: 待估计的潜回归模型:待估计的潜回归模型:uXY * 待估计参数:待估计参数:21 收入收入 X 态态 度度 Y 收入收入 X 态态 度度 Y 收入收入 X 态态 度度 Y 55004.81332385017.4387721250210.93937 60005.25089895018.3139221350211,81452 65005.688473105019.1890721450212.68967 70006.126048110019.626647
13、1500213.12725 75006.5636231150110.064221550213.56482 80007.0011981200110.501801600214.00240 90007.8763471300111.376951650214.43997 100008.7514971400112.252101700214.87754 Y Y Y 注意:注意: (1)估计式中列出或者不列出无常数项是等价的。 (2)EViews要求因变量Y是整数,否则将会出现错误信息, 并且估计将会停止。然而,由于我们能够在表达式中使用 round、floor 或 ceil函数自动将一个非整数序列转化成 整
14、数序列,因此这并不是一个很严格的限制。 与二元选择模型类似,执行命令与二元选择模型类似,执行命令: : Proc/make equation/, 在Equation Specification对话框中选 择估计方法ORDERED,然后选择Normal,Logit,Extreme Value三种误差分布中的一种,单击OK按钮即可。 22 排序模型的输入对话框排序模型的输入对话框 23 2 2、估计结果、估计结果 估计收敛后,EViews将会在方程窗口显示估计结果。 表头包含通常的标题信息,包括假定的误差分布、估计样 本、迭代和收敛信息、Y的排序选择值的个数和计算系数 协方差矩阵的方法。在标题信息
15、之下是系数估计和渐近的 标准误差、相应的z-统计量及概率值。然后,还给出了临 界值LIMIT_1:C(2),LIMIT_2:C(3)的估计及相应的统计量。 24 25 4、 因为排序选择模型的因变量代表种类或等级数据,所以 不能从估计排序模型中直接预测。 选择Procs/ Make Model,打开一个包含方程系统的没有标 题的模型窗口,单击模型窗口方程栏的Solve按钮。例中因变 量y*的拟合线性指标,拟和值落在第一类中的拟合概率被命 名为Y_0_0的序列,落在第二类中的拟合概率命名为Y_1_0的 序列中,落在第三类中的拟合概率命名为Y_2_0的序列中, 等等。注意对每一个观察值,落在每个种
16、类中的拟合概率相 加值为1。Y_0_0,Y_1_0,Y_2_0分别是支持、中立、不支 持的概率,Y,INC是实际样本。 Procs “ Make MODEL” 按“solve” 59779.11 093075. 8 008751. 0 21 * uXY 可得潜回归模型为:可得潜回归模型为: 注意:因为对政府支持等级与叙述成反方向变化,即序数 越大,支持度越低;序数越小,支持度越高。支持态度的 分布: 59779.112 59779.11093075. 81 093075. 80 * * * i i i i Y Y Y Y Y 的取值的取值Y的取值的概率的取值的概率 0 1 2 )008751.
17、 0093075. 8(XF )008751. 0093075. 8 ()008751. 059779.11(XFXF )008751. 059779.11(1XF 或:态度或:态度Y的分布列:的分布列: 31 Make Ordered Limit Vector产生一个临界值向量c,此向 量被命名为LIMITS01,如果该名称已被使用,则命名为 LIMITS02,以此类推。 Make Ordered Limit Covariance Matrix产生临界值向量c 的估计值的协方差矩阵。命名为VLIMITS01,如果该名称 已被使用,则命名为VLIMITS02,以此类推。 32 4 4产生残差序
18、列产生残差序列 选择选择Proc/Make Residual SeriesProc/Make Residual Series产生广义残差序列,产生广义残差序列, 输入一个名字或用默认的名字,然后单击输入一个名字或用默认的名字,然后单击OKOK按钮。一个排按钮。一个排 序模型的广义残差由下式给出:序模型的广义残差由下式给出: 其中:其中:c c0 0 = - = - ,c cM+1 M+1 = = 。 , ) () ( ) () ( 1 1 xx xx igig igig gi cFcF cfcf e 33 三、计数模型 v在计数模型中,因变量为某事件发生的次数。 例1:学生在校期间取得优秀成绩
19、的课程数 例2:年内农户家庭外出就业的劳动力数 例3:家庭生育的小孩数 v计数模型虽然可以使用最小二乘法估计,但由于因 变量存在下限0,并且其取值为离散的,因而能够 考虑这些特点的估计方法有助于改善估计结果。 v实践中Poisson回归模型应用较为广泛。 Poisson模型的弱点是误差分布的均值等于方差。 34 计数模型 vPoisson回归模型假定观察值Yi来自于由某个 Poisson分布抽取的样本,该分布的参数为i,其数 值取决于解释变量xi。 v模型形式为: v通常将i表示为对数线性函数形式: v根据Poisson,每个时期事件发生次数的期望值为: v因而有: Pr,0,1,2,. !
20、ii y i iii i e Yyy y X iiiii eXYVarXYE i i ii X XYE XLn i 计数模型 vPoisson回归模型是一个参数非线性模型,可以用 NLS方法估计; v但用ML方法估计也非常简便,似然函数为 v若我们认为Poisson回归模型关于均值与方差相等 的约束不合理,那么应选择其他统计分布。 35 1 ! N iiii i LnLy LnLn y 举例:计数模型估计 研究轮船发生事故的次数与轮船的特征属性、运行时间 之间的关系。因变量 y 表示平均每月轮船发生事故数。解释 变量是轮船特征属性,包括轮船类型、建造时间、使用时期 等。轮船类型有5种,分别用x
21、1x5表示,4个建造时间,分别 用y1y4表示,z1、z2表示两个使用时期,da表示运行时间。 本例数据符合计数模型的条件,故采用泊松模型建模。注 意到定性数据较多,为防止多重共线性,在引进虚拟变量时, 需要人为地去掉一个。例如,轮船类型有5种x1x5,去掉x1, 在模型中只用其余4个变量x2x5;同样, 4个建造时间y1y4, 在模型中只用其余3个变量y2y4;两个使用时期在模型中只用 z2。模型如下: iii uyx)ln( Ni,2,1 37 . 计数模型估计: 选择Quick Estimate equation Count 在随后出现的窗口中给出模型设定、估计方法选择、样本 区间和其他选项。 按OK后得到估计结果。 v基于不同误差分布,基于不同误差分布,EViews提供了提供了5种计数模型估计方法种计数模型估计方法: PoissonML and QML; ExponentialQML; Normal/NLSQML; Negative binomialML; Negative b
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 航空公司客服招聘协议
- 农业科技园区停车场建设合同
- 泌尿外科护理毕业设计
- 垃圾处理工程承包合同
- 软件技术授权使用协议
- 涂料施工安全协议
- 服装店保洁人员招聘协议
- 电子工厂易燃易爆品处理
- 农村公路升级施工协议
- 企业监事规范管理指南
- 小学数学苏教版六年级上册《认识比》课件(公开课)
- 旅行社计调业务套课件幻灯片完整版ppt教学教程最全电子讲义(最新)
- 广东开放大学风险投资(本2022春)-形成性考核3答案
- GB∕T 32218-2015 真空技术 真空系统漏率测试方法
- 安全交底模板(完整版)
- WS-T 390-2012 医院急诊科规范化流程
- 心源性卒中诊断和治疗
- 钢栈桥及平台检查验收标准
- 污水处理工程监理大纲(附多图)
- 人教版八年级上册英语全册教案(完整版)教学设计含教学反思
- 保洁服务技能比武方案
评论
0/150
提交评论