




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于数据挖掘的地震创伤患者入院后结局预测模型描述:目的模式识别技术(PRT)是一种挖掘重要信息的新型工具,可以从海量数据中提取新的知识。基于汶川特大地震中创伤患者的数据,笔者采用PRT建立地震伤员结局预测模型,旨在为提高灾难医学救援水平提供一种新【摘要】目的模式识别技术(PRT是一种挖掘重要信息的新型工具,可以从海量数据中提取新的知识。基于汶川特大地震中创伤患者的数据,笔者采用PRTS立地震伤员结局预测模型,旨在为提高灾难医学救援水平提供一种新的方法。方法采用回顾性数据挖掘方法,数据来自于四JI省医学科学院创伤数据中心2008年5月12日至20日收治的2316例住院地震伤患者病例信息。将患者资
2、料按照生存与死亡、是否发生多器官功能不全综合征(multipleorgandysfunctionsyndrome,MODS分组。根据正态性分布检验结果,计量资料以均数土标准差(xs)或者中位数(四分位数)表示,统计检验采用StudentT检验或者Wilcox检验;计数资料采用构成比表示,2统计检验米用X检验或者Fisher检验。多兀统计分析米用偏最小二乘法判别分析(partialleastsquare-discriminantanalysis,PLS-DA。多元聚类图采用二维主成分的PLS的投影图,并采用重要性投影指标值(variableimportantprojection,VIP)筛选与临
3、床结局相关的重要变量,工效曲线(receiveroperatingcharacteristiccurve,ROC作变量灵敏性分析。结果经数据清理后1919例患者的病例资料纳入研究;筛选出31项人口学指标、生理-生化指标以及干预因素作为暴露参数;获得36例院内死亡病例和17例MODSI伤tMODS1关病死率为47.1%。经过PLS-DA分析,二维主成分得分图可以辨识出生存、MODS口死亡模式。对病死率和MODSS行预测,ROC线下面积(areaundercurve,AUC分另为0.882和0.979cPLS-DA的重要性投影指标值(VIP)确定了8项生理指标(pH,BE,PaCO,PaO,HCQ
4、SBHCOCr和首日补液量)构成了与院内死亡和MODS1:生的相关模型。结论研究建立了一项可以预测特大地震创伤入院患者预后模型(由入院接受创伤治疗的生理-生化指标集合和液体复苏干预构成)。基于该模型,将有助于开发帮助医务人员在特大灾难医学救援中早期预判高危患者的计算机辅助诊断系统。2008年5月12日发生的四川汶川地震为例(里氏8.0级),参与救治的现场医疗队多达上千支,动员了数千家现场和后方医疗机构接收多达300万患者。尽早发现导致伤员死亡的相关因素,建立预后预测模型,进而对于提高地震伤救治成功率,挽救生命,具有重要意义目前的研究大多数是描述性的伤员流行病学特征分析,往往采用单因素分析技术对
5、影响患者结局相关的临床指标进行逐项筛选。欲全面、准确地获取地震伤致死相关因素,进而开发具有较高实用性的预后预测模型,必须引入新的思想和数学方法。模式识别技术已经开始应用于临床大数据分析和构建预后预测模型。模式识别的核心思想是将患者的病情(就创伤而言,包括受伤时情况、特定时点的生理生化指标)视为不同的、可区分的模式,随着治疗干预措施的实施,伤情模式随之发展、变化,最终导致患者出现生或者死的最终结局。在这个意义上,由各种指标共同组成的伤情模式较之单一指标更能提供多维度、立体的预后预测信息。本研究拟基于模式识别技术,通过对汶JI特大地震后一组住院伤员的大数据挖掘,发现影响患者病死的伤情相关因素组合模
6、式,进而提出一种对大地震后伤员病死预后的预测模型。1资料与方法研究对象来源于四川省医学科学院四川省人民医院2008年5月12日至5月20日期间收治入院的所有汶川地震伤员,总计2316例。对病例资料数据的使用,经四川省医学科学院四川省人民医院医学伦理委员会批准。通过该数据库中的数据,笔者在94项入院临床记录中进行数据筛选和清理。其中整理出了包括患者的年龄、性别以及入院时的首日临床资料共计31个临床指标作为特征用于进行与预后相关结局(死亡和发生MODS的模式识别。本组病例患者多于短时间内由地震灾区送入本院,其中60豚源于地震发生后2do短时间内大量患者涌入,除创伤科外,其他外科及内科专科医师均被动
7、员参加伤员救治,大多数患者来院时未常规进行ISS评分。结局指标:院内死亡及发生MODSMOD畛断标准参考2004严重感染和感染性性治疗指南)。统计学方法:首先按照本实验室建立的临床数据挖掘操作手册对数据进行常规数据清理,基线数据按照生存与死亡分组,计量资料以均数土标准差(xs)或者中位数(四分位数)表示,统计检验采用Studentt检验或者Wilcox检验;计数资料采用构成比表示,统计检验采用/2检验或者Fisher检验。多元统计分析采用偏最小二乘法判别分析(PLS-DA,多元聚类图采用2主成分的PLS的投影图,并采用重要性投影指标值(variableimportantprojection,V
8、IP)筛选重要变量,ROC曲线作变量灵敏性分析。计算平台:CPUIntelXEONE7-8870X4,Memory512GhGPUTESLAK20.计算的运行环境采用Ubuntu12.04.3操作系统,统计软件为R(ver2.15.2)。2结果2316例病例中,397例由于信息不全而被剔除,资料整理后一共有1919例被纳入。预后良好(未死亡,且未发生MODS共计1875例,发生MODS17例,死亡36例。MOD患者中8例死亡,MODS1死率47.1%。表1给出了本研究病例资料生存组与非生存组的基线特征。研究中包含938名男性和945名女性,平均年龄为44.4岁。生存组和非生存组之间年龄和性别差
9、异无统计学意义,转运方式主要为非救护车转运,差异无统计学意义。单一临床指标中,生存组与非生存组相比在以下几项指标中差异差异具有统计学意义:非生存病例的GLASCOW分显著低于生存组;WBCS生存组显著低于非生存组;BUNCr、BK差异具有统计学意义;首次手术时间差异具有统计学意义。采用PLS-DA进行多元回归聚类分析。PLS-DA方法可以利用提取主成分的思想建立影响患者预后的因素与患者预后数值之间的线性方程组。我们发现,当提取第一主成分和第二主成分的线性方程组的时候,预后良好患者、MODSI者、MOFB者和死亡患者计算出的结果在平面中的分布最具明显区别。见图1。A:横轴表示第一主成分得分,纵轴
10、表示第二主成分得分,红色表示死亡患者,绿色表示生存患者,蓝椭圆区域表示T2检验95%CI;B:生存组和死亡组模式分类概率结果,横轴表示病例标号,纵轴表示PLS预测其患者死亡的概率值;C:PLSDA1一和第二成分得分图,横轴表示第一主成分得分,纵轴表示第二主成分得分,绿色表示无MODS1生存患者,蓝色表示MODSI者,蓝椭圆区域表示T2检验95%CID:生存组和MODSI模式分类概率结果,横轴表示病例标号,纵轴表示PLS预测其患者发生MODS勺概率值不同因素对于疾病预后的影响不同,PLS方法的优点之一是对各变量的预后具有很强的解释能力,并且能够起到重要的变量筛选作用。为了获得影响疾病预后各因素的
11、重要程度,笔者以死亡、MOD的结局分别获取影响疾病预后的各因素的VIP值,见表2和表3。3讨论地震伤或重大突发公共卫生事件后,对患者进行分类筛选,将具有病死、MODS/MOF或其他严重并发症风险的患者尽速选出加以治疗,是医疗救援中首要的任务。这个任务的完成依赖于对重大突发公共卫生事件产生的大量数据进行有效地挖掘。作为大规模地震伤医疗救援的首个大数据挖掘研究,本研究的一个重要发现是,基于一组入院诊疗指标,可以前瞻性的将地震伤员的结局模式进行预判一在主成分得分图中表现为预后不良因素主要集中在第一象限,随第一主成分和第二主成分增大更加容易发生预后不良。本研究中PLS-DA通过特征提取发现的死亡结局和
12、发生MODS相关因素包括:pH,BE,PaC02,Pa02,实际HCOJ,标准HCOJ,Cr,首日补液。就诊断和预警意义而言,这意味着酸碱环境、氧合状态、肾脏功能以及作为院前/现场干预手段的液体复苏共同构成了对此批患者预后具有决定性影响的因素集。让熟闻给避计上述几乎每一个单一因素都曾经在单个研究中被单独筛选出来,但将之作为一个集合用以构成预后预测的定量预测模型,是本研究的首次发现。换言之,这组指标构成了特征性的,可用于预测病死风险的“死亡签名”。进一步采集更多断面形成队列资料库后将有望获得上述因素集及入院后有关干预(手术方式、药物治疗、营养治疗等)共同构成的动态监测模型。笔者对提取出的11个因
13、素进一步分析发现首日补液量VIP值为14.79,表明该特征变量是具有重要意义的影响因素。进一步考察该特征变量在本数据集中的情况,发现首日未补液的患者占97.7%,若以是否接受补液这一特征变量将数据集重新分组,本数据集中所有病死/MODS结局患者均接受了首日补液处理。显而易见的,入院时即必须接受补液的患者其病情更重。而创伤科医师的经验和已有证据均表明,危重伤患者入院时的补液方式和种类正是一影响预后的重要因素。同时,PLS-DA对病死和MODS的ROC曲线下面积分别为0.882和0.979预测效能较好(图3)。偏最小二乘法是一种新型的多元统计数据分析方法,它于1983年由Wold和Albano等首
14、次提出。长期以来,计算机模式识别和统计学上的相关分析方法之间的界限非常清楚。而偏最小二乘法则把它们有机地结合起来了,在一个算法下,可以同时实现回归建模(多元线性回归)、数据结构简化(主成分分析)以及两组变量之间的相关性分析(典型相关分析)。对于地震伤后死亡风险因素分析,长期以来研究者多把注意力集中在各种单一指标与临床结局之间的关系上。但真实的临床结局是受到多种因素的复杂影响,依靠单一因素不能对临床结局做无法做出准确的预测,甚至连合理的推断也很难。如果将影响临床结局的诸变量视为不同的模式组合,则预测的精度将得到极大提高。模式识别的基本思想是对复杂现象进行影响因素抽提,利用数学方法对复杂变量进行压
15、缩和聚类,从而将直觉/感觉经验难以把握的复杂现象进行恰当分类,最终实现预测。就地震伤预后预测而言,是通过特征提取的方法从创伤伤情变化、院前处理措施等纷繁因素中提取最重要的变量特征(即主成分),从而利用主成分构造特征空间,进而发掘对于临床结局(病死、MODS/MOF或其他终点结局)最具影响的创伤伤情模式。从数据科学的角度看,重特大地震发生后大量的伤员和复杂的伤情本质上意味着突然爆发的数据涌入,医生在此时往往缺乏处理如此多的数据的经验,从而造成不能迅速做出正确的临床决策,更何况大地震状况下,震区医疗机构遭受摧毁,大量经验不足的非急诊/创伤医务人员不得不参与处理自己所不熟悉的创伤问题。因此利用计算机
16、模式识别的思想将影响患者预后的变量进行压缩、降维并且可视化就成为现代急救医学发展的一种必然方向。就伤亡人数、医疗机构动员范围而言,2008年发生的中国汶川特大地震属规模最大的一次地震救援。此次地震后,就医疗救援问题,中国国内和国际医学期刊上已经发表了数十篇论文。到目前为止,笔者发现绝大多数论文仅仅简单表述了地震伤及其并发症的流行病学特征,还未见将临床测量指标作为危险因素进行定量分析的报道。事实上,迄今为止,对于大地震后医疗救援数据进行的数据挖掘意义上的研究尚属罕见。检索MEDLINE和ISI数据库(检索词earthquake,“datamining”),仅发现Aoki等于2007年发表的一篇报告。该研究采用了372例1995年神户大地震挤压伤患者资料,利用Logistic回归方法对挤压综合征发生风险建立了预测模型。从方法技术而言,该研究并未利用到目前计算机数据挖掘领域的成熟技术,且样本量也较小。在这个意义上,本研究首次将PLS-DA这一系统生物医学数据挖掘模型引入大规模地震数据分析,成功地建立了对地震伤员进行预后预测的模型。更为重要的,是本研究开创
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度澳大利亚大学本硕连读合同
- 二零二五年度劳动合同解除协议
- 二零二五年度农村合作社乡村旅游开发合作协议
- 铲车劳务承包合同铲车合同书
- 社交网络运营合作合同
- 公司内外部往来文书规范手册
- 小熊维尼的友情世界读后感
- 生物技术在农村综合利用项目协议
- 新能源汽车充电站投资协议
- 企业数字化转型解决方案手册
- 公有云技术应用PPT高职完整全套教学课件
- 养老专题:养老理念
- 艺术概论PPT全套完整教学课件
- 幼儿园多媒体PPT课件制作PPT完整全套教学课件
- 《苏东坡传》阅读汇报
- 2023离婚协议模板下载
- 特殊需要儿童的鉴定与分类
- 《正常人体结构》考试参考题库(大学复习)
- 装饰员工薪资工资表
- 怒江水电开发的工程伦理案例分析
- 2023新疆中考数学试卷及答案解析
评论
0/150
提交评论