




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十三章事件史分析本章将对事件史分析的基本概念和模型进行介绍。首先我们将讨论什么是事件史分析,然后介绍几种广泛使用的事件史分析模型,特别着重介绍的是离散时间logit模型和Cox比例风险模型(Coxproportionalhazardsmodel)。我们将用1988年中国千分之二生育节育抽样调查的数据来示范如何使用这两种模型,并强调一些应该注意的问题。本章附录中提供了使用SPSS软件进行数据处理和估计的步骤。课外链接事件史分析/s?src=3×tamp=1530971890&ver=1&signature=dQVo2Dm5Et3ji*356EumNdpfjhA3pZnzBl904v8h0FA7gRC5g9kS3Qy-J-CBb-nq*-M9s2Q4zgEIcCQhYXt9o3GYp4vZtG3HJDf7Tr*paDii4r78-bJ0LWA3Bovf8Jfczna*GdiPXaCbjf6QZiqkZYt-8lNzPXhQ43knRCeWsZM=课外链接事件史分析:概述及Stata操作/s?src=11×tamp=1530971890&ver=984&signature=JYPPjbAPet9jXmFKo*rpO0pNmFVEwC1DNn61L8lXPBKWLTdtmW9Y3xBSCgehqoCEenHZNZ-2RTRMtwkNwqKcfrE-8uvB*SKs24Pdhh5z72liWBWCIbAUeW7JUIlVg0QB&new=1一、什么是事件史分析近年来,事件史分析方法在社会科学研究领域中越来越流行。使用这种方法的研究论文发表得越来越多,并且关于事件史分析技术的社会科学方法教材也越来越多,由此大大提高了这种方法的普及程度。出现这一情况的原因在于两个方面。第一,事件史分析有很多特点优于传统的统计分析方法;第二,社会科学研究人员能够得到越来越多的事件史类型的数据资料。顺序,因此事件的因果关系就能够被更为确定地建立起来。事件史分析技术的应用并不仅仅局限于社会科学。事实上,这一技术早已在生物医学研究和工程研究中(如检测产品)得到发展和运用,只不过叫法有所不同而已。在生物医学研究领域(例如一位癌症患者能活多久),人们把它称为“生存分析”。类似地,在工程研究领域(例如研究一个灯泡的寿命,或一个弹簧在不同压力作用下能够经历多长时间不折断),人们通常用“对失败的统计分析”这一术语。尽管所用术语不同,但从统计分析的角度看,其实质是相同的。(一)传统OLS回归模型的局限性事件史分析在许多方面优越于人们所熟悉的回归模型。事件史分析的突出优点就在于它可以令人满意地解决这两个问题,即删截和随时间变化的解释变量的问题。(二)事件史分析概述如果读者对于生命表技术比较熟悉的话,那么从生命表的角度来阐述,会有助于对事件史分析的理解。事实上,生命表技术与事件史分析之间有着内在的联系;两者之间的联系可以从DavidCox(1972)关于比例风险模型的论文题目中看出,其论文题目为《回归模型与生命表》。在生命表中,我们的兴趣是考察一个在阶段初始时活着的人生存到某一年龄的概率(Namboodiri,1991);并且,在一定假设条件下,最后能推导出年龄别生存(或死亡)的概率。如果我们把年龄看成自变量,那么生存(或死亡)就是因变量。生命表分析的一个局限在于很难包括许多自变量,主要是因为计算工作太复杂。例如,研究在控制教育变量的条件下,死亡概率如何随职业而变化,那么计算工作将会非常令人厌倦。(三)删截的类型如前所述,事件史分析的一个优点是它能够处理删截。尽管我们已经介绍了删截主要是指那些在观察结束时事件尚未发生的情况,但是实际上删截的情形十分复杂。删截可以分成两大类:右删截和左删截。(四)一些统计关系为了对不同风险模型的统计讨论作准备,我们先要以统计形式介绍一些重要函数,并揭示它们之间的关系。这些函数包括风险函数、生存函数、概率密度函数、和分布函数。了解并熟悉这些函数可以帮助我们理解本章介绍的事件史分析,并有利于将来更深入的学习。(五)估计生存函数Kaplan-Meier方法在操作分析时,最好先检查一下根据实际数据计算的分布形态,然后再决定拟合哪种理论分布类型。如果我们的目的是为数据寻找一种模型,事先检查生存分布及其图形可以给我们一些选择分布模型的线索。二、事件史分析模型在这一节,我们介绍事件史分析方法的一系列统计模型,并侧重介绍离散时间logit模型和Cox比例风险模型,因为这两种模型在社会科学中使用最广泛。(一)离散时间logit模型(二)cox比例风险模型(三)其他一些连续时间模型1.指数模型2.Gompertz模型3.Weibull模型4.加速失效时间模型(四)关于模型的选择在社会科学研究经常应用的估计生存模型的常用软件有:SPSS、SAS和STATA等。对它们的功能简介如下:SPSS:十分友善。它具有KaplanMeier估计功能,可估计离散时间logit模型和带有依时间变化协变量的Cox比例风险模型。SAS:也比较友善。在其PROCLIFETEST程序中具有KaplanMeier估计功能,其PROCLIFEREG程序可以做加速失效时间模型分析,其PROCPHREG程序可估计带有依时间变化协变量的Cox回归分析。STATA:对于初学者有点难度。可以进行KaplanMeier估计,以及许多关于生存模型的统计检验。STATA也可以估计带有依时间变化协变量的Cox回归模型,还可以估计Weibull和指数模型。三、事件史分析的示范例题对事件史数据应用最多的有两种模型:一种是离散时间logit模型,一种是Cox比例风险模型。在本节,我们将通过六个示范例子(三个假设的例子、三个实际社会研究的例子)来示范这两种模型的实际应用。其中有四个例子只有较少的案例(例2、例3、例6和例7),这样读者可以比较容易地在SPSS中进行实验;此外,因为案例较少,读者可以观察实际数据本身,获得对事件史数据的认识。另外两个例子(例4和例5)是用中国1988年千分之二生育节育调查数据的10%的再次抽样数据所进行的研究,由于这两个例子的原始数据量很大,我们只讨论操作步骤和对分析结果的阐释,不再给出原始数据。(一)例2:职位晋升分析---离散时间风险模型1.例2的背景情况和数据2.SPSS中离散时间模型的操作步骤及分析例2的原始数据已经给出,估算离散时间模(二)例3:初育间隔分析¾¾犆狅狓比例风险模型1.例3的背景情况及数据2.SPSS中Cox比例风险模型操作步骤及分析(三)例4:省际迁移分析———离散时间风险模型例4是关于如何应用离散时间模型的例子,取自于一个对中国省际迁移的实际研究。在这里,我们想了解中华人民共和国成立以来迁移的长期趋势,特别是我们想考察中国的迁移模式在多大程度上反映了政府的政策和战略考虑。(四)例5:初育间隔分析——cox比例风险模型在这一部分,我们将示范一个运用Cox比例风险模型的实例作为例5。前面说过,Cox比例风险模型是社会科学中分析生存数据时广泛使用的一个模型。这个模型之所以被广泛使用,其中一个原因是它的灵活性,它不需要对风险函数的具体形式进行准确定义所述:“即使在违反了比例风险的假设的时候,也常常还是一个可以令人满意的近似估算。”(五)例6和例7:初职流动分析---含随时间变化自变量的犆狅狓比例风险模型1.例题的背景情况及数据2.例6:只含一个随时间变化的自变量的Cox风险模型3.例7:含多个随时间变化的自变量的Cox风险模型小结在进行事件史分析时,除了对数据的要求之外,还应对模型的具体设定小心处理。我们借用Yamaguchi(1991)的一个例子加以说明。假设一位研究人员想要研究已婚夫妇的离婚问题,并决定用是否有孩子作为一个协变量(与时间无关)来预测离婚的风险率。这种做法并不妥当,因为婚龄较长的夫妇有孩子的概率就会较高。处理这个问题的一种方法是将是否有孩子作为一个依时间变化的协变量,而这就要求我们知道生育孩子的具体时间。小结我们还需要指出的是关于离散时间风险模型的一个局限性。由于数据是为进行离散时间模型研究建立的,在准备数据时通常会产生庞大的数据组,这一点在使用很长时期的个人行为观察资料时尤其明显,上述研究中国1950年至1988年之间的迁移就是一个例子。对于Unix工作站或其他大型主机系统来说,处理这样一套数据并不成问题,但是个人电脑使用者可能会遇到一些内存方面的限制或其他计算方面的困难。一种解决方法是加大个人电脑的内存,另一种方法是在我们已知事件发生的月份或星期方面信息(而不仅仅是年份)的条件下,转为应用连续时间模型。STATA软件用户还可以通过特定设置来扩大软件所使用的内存。小结最后应该注意的是,正如Allison(1984)曾指出的,许多社会学家对于连续时间风险过程却采用离散时间风险模型进行分析,这样的做法存在着潜在的不足,即离散时间风险模型的结果(如系数)在不同时间间隔长度的研究之间是没有可比性的,因为概率是按时间间隔长度设定的(Peterson,1991)。不过,可以从数量上证明,如果每个单位时间的概率很小的话,由离散时间logit模型产生的参数与连续时间比例风险模型中所得到的参数是十分接近的。基本概念事件史纵贯数据回顾性调查追踪调查时变变量删截风险集持续期风险率风险函数生存函数概率密度函数分布函数离散时间模型人年数据logit模型连续时间模型参数模型非参数模型半参数模型cox比例风险模型基准风险函数时间变量状态变量协变量时变协变量本章要点1.事件史分析服务于对事件发生的方式及其相关因素的研究。2.与一般横贯统计研究不同,事件史分析采用纵贯数据,也就是说这一方法能够很好地将随时间变化的动态变量纳入分析。3.事件史分析的另一个优点在于能够纳入和处理删截案例,避免了信息的损失及其由此产生的统计偏差。4.两种社会科学研究中使用最广泛的事件史分析方法是用于离散时间数据的logit模型和用于连续时间数据的cox比例风险模型。参考
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园活动方案-玩具交易会
- 25年公司、项目部、各个班组安全培训考试试题答案可打印
- 2025年新员工入职安全培训考试试题附参考答案【考试直接用】
- 2025购销合同范本模板
- 2025年版个人住房公积金借款合同样本
- 2025装修合同书附加协议
- 2025第三次结构混凝土工程合同
- 2025年地震前兆观测仪器合作协议书
- 2025年个体司机劳务合同
- 2025外卖配送服务合同模板
- JJG 168-2018立式金属罐容量
- GB/T 26314-2010锆及锆合金牌号和化学成分
- GB/T 21244-2007纸芯
- DB51-T 2985-2022竹林经营碳普惠方法学
- 初中语文中考试卷(含答案)
- disc与亲子沟通没有任何身份比为人父母更高贵
- 柳青《创业史》-全-课件
- 2001年考研英语真题及解析
- 安川变频器培训二:应用技术(安川)课件
- ICRU62号报告详细完整
- 介绍家乡 贵州长顺课件
评论
0/150
提交评论