倾向性评分匹配的原理及软件操作_第1页
倾向性评分匹配的原理及软件操作_第2页
倾向性评分匹配的原理及软件操作_第3页
倾向性评分匹配的原理及软件操作_第4页
倾向性评分匹配的原理及软件操作_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、周权 常德市第一人民医院 科教科 Email: 二O一七年五月 The First Peoples Hospital of Changde City 倾向性评分匹配的原理及软件操作 常德一医 临床科研青年骨干小组培训班课件 倾向性评分匹配的原理介绍01 倾向性评分匹配的软件操作02 倾向性评分匹配应用的注意事项03 目录 CONTENTE The First Peoples Hospital of Changde City 倾向性评分匹配的原理介绍01 X是否人为分配?Assigned exposure X? 观察性 Observational实验性 Experimental Analytic

2、 Cross sectional 横断面 Case-control 病例对照 Cohort studies 队列 Randomized controlled trials (RCT) No Yes 临床研究常见的类型 1.RCT研究简介 Study Population Treatment Group Control Group Outcomes Outcomes Randomize Comparison Blindness ? RCT研究的基本流程 1.RCT研究简介 RCT研究被称为是临床防治性研究的“金标准”,是因为在RCT研究中试验组和 对照组可以通过“随机分配”的方式平衡混杂因素,比

3、如研究一种药物治疗哮喘的疗效, 研究者在招募一些哮喘患者后,将其随机分为试验组和对照组,试验组接受药物治疗, 对照组接受安慰剂治疗,治疗一段时间后,如果两组患者的有效率不同,则我们可以认 为两组有效率的差异完全是由该药物引起的。因为从理论上说试验组和对照组相比除了 该药物外,其他的临床特征都是相同的,或者说是具有可比性。 1.RCT研究简介 药物临床试验(GCP)采用的就是严格按照RCT研究标准进行的 1.RCT研究简介 有些研究无法解决伦理问题。如吸烟和肺癌,就不能做RCT研究 RCT研究也有其不可避免的缺陷: RCT研究是在理想条件下对特定人群的干预结局,并不能很好的外推到真实的临 床环境

4、中,如:药物的RCT一般都会限制研究人群,年龄有限制,小孩不要,老人 不要,有基础疾病的不要,但在真实的临床环境中,如果遇到了这些人群,究竟用 不用这个药,用多少,有什么风险,这些都不清楚。 RCT研究对试验条件要求高,投入也大,一般的小医院很难开展高质量、大样本 的RCT。 1.RCT研究 上市后药物扩大适应症的研究 属于药品补充注册的一种,需要研 究者进行药物临床研究, 再上报国家 食品药品监督管理局,审批通过后 才允许在说明书上面增加新适应症。 2.观察性研究简介 上面的时髦名词“真实世界研究”,其实也就是观察性的临床研究,相对于RCT研 究,观察性临床研究的研究对象所具有的各种特征是客

5、观存在的,研究者不能对其进 行干预,其研究结果更接近实际情况,同时因其较宽的纳入排除标准,使其研究结果 更具外推性,实用性更好。 2.观察性研究简介 2.观察性研究 但相对于RCT研究,观察性的研究就比较“尴尬”了,因为没有随机分组,所以 实验组和对照组除了要研究的暴露因素X外,两组基线特征还存在很多差异(也就是 混杂因素),因此,两组结局事件的发生就不一定完全由暴露因素X所引起的。 2.观察性研究 某项研究探讨基线胆固醇增高的个体是否更容易发生急性心肌梗死。在这个课题中, 研究者根据受试者的胆固醇水平,将队列人群分为胆固醇增高组和胆固醇正常组,并对 两组人群进行随访观察,20年后,观察结果发

6、现:基线胆固醇增高组人群发生急性心肌 梗死的比例高于基线胆固醇正常组,是否能认为胆固醇增高就是急性心肌梗死的危险因 素? 答案是:不能,有可能这种表象是因为在基线胆固醇增高组中其他可能引起急性心 肌梗死的相关因素与胆固醇正常组分布不一致,有可能在观察人群中,基线胆固醇增高 组甘油三酯和高血压水平也高于基线胆固醇正常组,到底是胆固醇增高引起的急性心肌 梗死还是混杂因素甘油三酯、高血压引起的急性心肌梗死还说不清楚? 3.倾向性评分匹配的原理介绍 混杂偏倚可能改变着研究结果的真实性,从而使观察性临床研究结果的实际运用价 值受到相应的限制。观察性临床研究中,是否有效控制偏倚成为其成功与否的关键,在 这

7、种情况下,倾向性评分匹配就横空出世了。 20世纪80年代Rosenbaum和Rubin首次提出了了倾向性评分法这一概念。倾向性 评分法是运用倾向性评分值来综合所有的观察变量信息从而达到均衡变量、减少偏倚的 目的。 倾向性评分匹配SCI论文的写作套路 近年来,倾向性评分的应用越来越火爆,pubmed数据库在2010年专门为使用这 一类方法的论文指定了一个主题词。本人2017年5月16日在PUBMED数据库中共检索 发现应用倾向评分法的论文为11469篇。 propensity scoreMeSH Terms OR (propensity score matchingTitle/Abstract)

8、 OR (propensity- matched analysisTitle/Abstract) OR (propensity- matched studyTitle/Abstract) OR (propensity score based analysisTitle/Abstract) OR propensity scoreTitle/Abstract 倾向性评分匹配SCI论文的写作套路 各年发表的倾向性评分相关论文分布情况如下图所示: 3.倾向性评分匹配的原理介绍 倾向性评分匹配是倾向性评分法应用的一个方面,英文名为“Propensity score matching, PSM”,就是指通

9、过一定的统计学方法对实验组与对照组进行筛选,使筛选出 来的研究对象在临床特征(潜在的混杂因素)上具有可比性,此时,实验组与对照组的 结局存在差异,就可以完全归结果实验因素也就是暴露因素了。 3.倾向性评分匹配的原理介绍 倾向性评分匹配的研究步骤: 根据临床经验和实际要求,以处理因素为应变量(Y),混杂因素为自变量(X)来构建 回归模型; 由大量观察性数据拟合回归模型的参数; 根据拟合的回归模型计算每个个体的倾向指数,指数范围为0-1之间,反映个体被分到 实验组的概率; 以倾向指数为依据,通过倾向评分匹配方法来均衡组间协变量的分布; 3.倾向性评分匹配的原理介绍 倾向性评分匹配的软件操作02 1

10、.实例介绍 下面我们以我院杨浩洁医生撰写的一篇SCI论文数据为例,来演示如何利用统 计软件来实现倾向性评分匹配。 1.实例介绍 示例为该论文的部分数据:共483个病人样本,采集的变量分别为:患者的ID 号、性别、HBsAg、Child评分、Album等指标。 2.软件准备 采用的软件是易侕统计软件,该软件由美国&solutions公司研究的一套全新 设计的数据分析软件。该软件后台程序以软件为平台,受国际认可。于2013年底面 向中国科研人员开发了中文版本。 该软件以科研分析思路设计的全新设计理念,融合现代计算机软件技术,采用可 视化数据挖掘与分析操作界面。自动选择统计方法,自动编程,自动摘录统

11、计结果、 制作图表,用户只需集中精力思考统计分析思路,使临床研究数据统计分析变得更深 入和全面。 2.软件准备 下面介绍软件的下载、安装和登陆方法。 百度“易侕统计”进入第一条网页 2.软件准备 下载 “易侕统计”到电脑上并安装 2.软件准备 进入软件登陆界面,点击右上角“注册新账号”,只要填写一个电子邮箱即可免 费使用本软件一个月 2.软件准备 该软件不同到传统的SPSS软件、SAS软件,可以在网上找到所谓的破解版,而是 采用于在线登陆方式访问,下载并安装软件后,每次登陆时都需要在联网的情况下 输入用户名和密码才能访问。 2.软件准备 登陆后的软件界面如上所示 3.实例操作 下面开始利用“易

12、侕软件”来实现PSM: 导入数据 打开EXCEL表格文件,将 其另存为“文本文件(制 表符分隔)”并命名。 3.实例操作 导入数据 打开“易侕软件”,点击菜单“分析项目”“创建新项目”,读入刚刚 保存的文本文件(制表符分隔)NLR2,再点击下方“读取数据文件”。 3.实例操作 数据读取成功 3.实例操作 进行PSM操作 点击软件上方“数据操作”菜单, 选择“病例对照配对”。 3.实例操作 进行PSM操作 进入“病例对照配对”界面后,病例对照分组变量处选择研究的分组变量NLR,研究对象编号处选择原始研 究编号变量id,用于配对的变量选择需要调整的混杂因素(下图右方蓝色部分)变量,再在“计算倾向性

13、评分再 按评分配对”处打勾,1:n配对处选择n=1,最后点击下方的“查看结果”。 3.实例操作 结果解读 3.实例操作 结果解读 软件同时还生成了一张图,形象的展 示了原始数据中118个病例和365个对照的 倾向性评分分布情况。 可以看出,软件算出的倾向性评分值在 0到0.8之间。两组在各评分值区间重合越 多,越容易匹配成功。 3.实例操作 匹配后数据展示 在软件左侧“病例对照配对”分支树里的“PROJ1_1tbl.htm”处单击右键,选择图 中第一个xls表格再单击,在弹出的对话框中选择“是”,软件将会自动打开EXCEL表格。 3.实例操作 匹配后数据展示 打开EXCEL后PP.score变

14、量展示的是所有记录的倾向性评分。 3.实例操作 匹配后数据展示 再回到软件左侧“病例对照配对”分支树里的“PROJ1_1tbl.htm”处单击右键,选 择PROJ1_1_tbl_NLR_pps_match_ddxls表格再单击,在弹出的对话框中选择“是”, 软件将会自动打开EXCEL表格。 3.实例操作 匹配后数据展示 打开的EXCEL表格中有五个变量, group.id表示病例对照配对组号, group.n表示每组有多少人,如只 有1个人表示没有找到对照,如有2 个人表示找到1个对照。 ID为原始数据的编号 NLR为原始数据中的分组变量 pp.Score为倾向性评分值 3.实例操作 匹配后数

15、据展示 将软件生成的匹配数据与原始研究数据,利用vlookup函数进行比对,去掉没有 配对成功的3个病例数据和对照组数据,生成一个新的表格。 3.实例操作 下面是匹配后的数据展示,将其另存为NLRpsm 匹配后数据展示 3.实例操作 匹配效果展示 既然匹配是为了使两组的基线特征相似,那么有必要检验一下匹配后的数据 是否达到了预期的效果。 我们先利用易侕软件统计一下匹配 前的原始数据基线情况。 第一步:在软件的“数据分析”菜 单下选择“研究人群描述”模块。 3.实例操作 匹配效果展示 第二步:在“研究人群描述”模块中,列分层变量选NLR,分析变量选下图所蓝色的 混杂变量。 小数点处选择0.01,

16、再点击下面的“查看结果”。 3.实例操作 匹配效果展示 从生成的结果可以看出, 原始研究中有4个混杂因 素在两个组间的分布还是 有差别的。 3.实例操作 匹配效果展示 第三步:利用易侕软件读取匹配后的数据表格NLRpsm 3.实例操作 匹配效果展示 第四步:在易侕软件“研究人群描述”模块中设置相应的参数。 3.实例操作 匹配效果展示 从生成的结果可以看出, 匹配后所有的基线特征变 量都配平了。 倾向性评分匹配应用的注意事项03 倾向性评分匹配应用的注意事项 倾向性评分匹配相关论文的有其基本的报道要求,下面以一篇2015年 发表在中华内科杂志上的论文为例进行讲解: 倾向性评分匹配应用的注意事项

17、1.需要对匹配前后研究对象基本特征进行描述(代表性) 倾向性评分匹配应用的注意事项 2.需要对匹配前后混杂因素组间差异进行描述,以观察匹配效果。 对混杂因素变量的匹配效果通常采用标准差异(standardized difference)指标 进行测量,比较组间混杂变量的标准差异在匹配前后的改变,匹配后的标准差异越接近 0,匹配结果越令人满意,当标准差异小于10时,认为组间变量的均衡性较好。 连续性变量计算公式 分类变量计算公式 倾向性评分匹配应用的注意事项 2.需要对匹配前后混杂因素组间差异进行描述,以观察匹配效果。 倾向性评分匹配应用的注意事项 3.敏感性分析 基于现有的资料的分析鼓励采用不

18、止一种统计学分析方法,若结果相互支持,则证 据可信度增加。 图2匹配前后校正了年龄、性别及所有临床因素后两组生存曲线.2A匹配前低白蛋白组院 内累积生存率显著低于白蛋白正常组(HR 3.048,95CI 1.649-5.634;P0.001)2B匹 配后低白蛋白组院内累积生存率显著低于白蛋白正常组(HR 2.246,95,1.213 4.159:P=0010) 倾向性评分匹配应用的注意事项 倾向性评分的优缺点: 优点: 倾向性评分综合了相应危险因素等多个协变量的信息; 可以利用倾向性评分作为一个单独的变量应用到各种分析模型中; 可以将倾向性评分进行回归、分层和匹配等多种用途。 缺点: 较大的依赖于选择的协变量是否合适; 需要相对大的样本量; 可能导致Power降低(因为丢失样本) 局限性: 对未知的/未测量的混杂因素无效 对时间依赖性混杂变量无效。 参考文献 1周支瑞,胡志德.聪明统计学M.长沙:中南大学出版社,2016:3841. 2王永吉

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论