医疗互操作性平台的数据应用_第1页
医疗互操作性平台的数据应用_第2页
医疗互操作性平台的数据应用_第3页
医疗互操作性平台的数据应用_第4页
医疗互操作性平台的数据应用_第5页
免费预览已结束,剩余39页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医疗互操作性平台的数据应用技术创新,变革未来提纲 依靠医学数据分析才能产生价值,服务人类。有价值的医学数据分析的基础是高质量数据。满汉全席的根基是高质量卫生新鲜的食材在连结健康Connected Health的主流概念之下,如何取得高质量数据?讨论的主题:大数据 vs 小数据:大数据由时髦的名词趋向平静,对数据的态度回归到以价值论英雄。医学数据的质量堪虑。医学分析复杂度高,需要高质量的全数据。高质量的全数据是基础;数据分析是关键;专业知识是中心。医疗卫生事业发展的主轴Government health IT Conference & Exhibition 2013.6.11-12, Washi

2、ngton DC. USA美国政府医疗信息大会 /event/government-health-it-conference-exhibition-01. 在各类医疗机构,区域与国家建立平台,让各个子系统之间具备互操作性;2. 医疗卫生数据的有价值使用;3. 创造出新而有效率的医疗模式与方法,增加人类福祉、降低社会成本。医疗大数据如何产生价值?优质全数据的获取(有意义的原料)需要有合适的: 模型算法+临床调优过程+模型评价机制研究小组=医学(因果)+统计(相关)+数据(原料)复合型人才的珍贵与培养医学数据分析才能产生价值,服务人类Data as Medicine数据 即 药方 UC Berke

3、ley 加州大学伯克利校区:以后,所有医学实验室的总和成绩也无法超过医学数据分析的成果。Universitat Leipzig 莱比锡大学生化研究院:DNA测序项目需要:1%的精力放在实验室;99%的精力放在分析、算法、编程能力、数据库。数学分析与计算机能力不强的人,是无法入行的。A lot of data, but limited information很多数据,缺乏信息 学习型的医疗系统 (数据分析学+AI+机器学习)来源:加拿大卫生部确认个人化精准治疗方案使用模拟模型,学习模型,数据挖掘来建立预测模型标准化静态的深入分析数据,以了解底层原因规范性分析预测性分析描述与诊断性分析高端分析的成

4、熟度水准没有大进展因为数据质量是障碍来源:加拿大Health Infoway 来源:加拿大Health Infoway 数据挖掘与统计分析法医学数据分析的类别 来源: 加拿大卫生部临床分析人口健康分析研究分析卫生系统分析 医学数据分析的类别 - 改善医疗服务 来源: 加拿大卫生部数据分析需要具备的能力 来源: 加拿大卫生部Infrastructure 基础建设Interoperable Data warehouse 具备互操作性的数据仓库Solution scalability for large data set(s) 容纳大量数据的扩展能力Natural language processi

5、ng tools 处理自然语言的能力Master data management tools to identify and link patient data from multiple sources能够将病人数据由不同数据源关联的主数据管理工具Data quality tools 数据质量清理工具Analysis and Reporting 分析与报告Business intelligence tools for analysis and reporting 商业智能的分析与报告工具Dynamic analysis reporting (e.g., complex analyses on

6、 multiple data dimensions) 动态分析(多维度的复杂分析)Query, analysis and reporting on unstructured data 非结构性数据的搜索、分析与报告Benchmarking to peer practices (e.g., process, outcome indicators) 同侪表现的比较Advanced analytical capabilities (e.g., predictive, prescriptive) 高级的分析能力(预测性、规范性分析)Visualization 可视化Ability to integra

7、te report output with other related objects (e.g., maps for geolocation)产生的报告能够与其他软件交互,产生可视化报告(如与地图集成)目前医疗数据的质量如何?不完整!不正確!不可用! 医院每天产生最多的是什么?数据技术 - 搜集、整合、关联、清洗、优化人工智能 AI,机器学习,分析学临床决策支持 CDSS,循证医学新世代的医学与医疗方案 人工智能、机器学习的主要学派都依赖优质数据 符号学派(Symbolists) 将学习看作逆向演绎,并从哲学、心理学、逻辑学中寻求洞见;主算法是逆向演绎(Inverse deduction)。

8、联结学派(Connectionists) 对大脑进行逆向分析,灵感来源于神经科学和物理学;主算法是反向传播算法(Backpropagation)。进化学派(Evolutionaries) 在计算机上模拟进化,并利用遗传学和进化生物学知识;主算法是遗传编程(Genetic programming)。贝叶斯派(Bayesian) 认为学习是一种概率推理形式,理论根基在于统计学;主算法是贝叶斯概率推理(Probabilistic inference)类推学派(Analogizer) 通过对相似性判断的外推来进行学习,并受心理学和数学最优化的影响。主算法是向量机(Support Vector Kern

9、el machines)。惨不忍睹的数据可用性Hogan ,Wagner教授的论文指出,临床数据的 正确性是44%100%;完整性是 1.1% 100%Hogan WR Wagner MM . Accuracy of data in computer-based patient records. J Am Med Inform Assoc 1997 ; 4:34255.Thiru K, Hassey A, Sullivan F. 教授的论文指出,医院电子数据的正确率是 26% 100%。Thiru K Hassey A Sullivan F . Systematic review of sco

10、pe and quality of electronic patient record data in primary care. BMJ 2003 ; 326:1070.Chan KS, Fowles JB,Weiner JP 教授的论文指出,电子健康档案中,血压数据的准确率是 0.1% 51%。Chan KS Fowles JB Weiner JP . Review: electronic health records and the reliability and validity of quality measures: a review of the literature. Med

11、Care Res Rev 2010 ; 67:50327.Methods and dimensions of electronic health record data quality assessment: enabling reuse for clinical research Weiskopf ,Weng, J Am Med Info Ass. Jan 2013, Pages 144151科研数据质量评估准则:完整性 completeness * 黄金标准 gold standards for data quality正确性 correctness * 数据元素匹配一致 data ele

12、ment agreement一致性 concordance * 数据元素存在检查 element presence合理性 plausibility 数据源一致 data source agreement当前有效性 currency 分布对比 distribution comparison 正确性检查 validity checks 日志审查 log review深入调查44篇论文与相关文献51篇,共计95篇论文所使用的数据发现:数据的重复性严重影响数据挖掘的算法结果解释。疾病进展记录中54%是重复的,出院记录的30.7%和登记记录完全一样。我们的实验中纳入了390万个病人信息,只有50%左右的

13、病例满足其中一种标准;25%满足更严格的数据要求;仅有小部分有充分信息或有研究价值;只有0.6%的病历完全符合4种数据完整性定义。临床试验行吗?数据质量关键纽约时报 2013/07/13大数据 vs. 小数据小数据是经人工处理过的数据,包括人工填报或更新、核对等。大数据是机器自动记录的、来自互联网为主的数据。大数据(完整的样本) vs. 随机抽样 Random SamplingHadoop,Spark,MapReduce,NoSql大数据名词的出现1980年未来学家托夫勒(Alvin Toffler)在The Third Wave第三次浪潮书中将“大数据”称颂为 “第三次浪潮的华彩乐章”。自然

14、杂志在2008年9月推出了名为“Big Data大数据”的封面专栏。2009年开始“大数据”成为互联网技术行业中的热门词汇。大、小数据的比较大数据小数据数据源数据由企业外部非传统的数据源:社交媒体 social media传感器 sensor data日志数据 log data器械数据 device data视频,影像 video,images,etc传统企业数据:ERP交易数据客户关系管理系统网上交易财务数据,会计总帐数据数量Terabytes 1012, Petabytes1015, Exabytes 1018, Zattabytes 10 21Giagbytes 109,Terabyte

15、s 1012速度复杂,先进,用来预测分析与洞悉隐藏信息批量或是近时性通常不需要立刻回应类型结构化, 非结构化, 复合型结构化, 非结构化价值复杂,先进,用来预测分析与洞悉隐藏信息商业智能分析与报告忘了大数据,小数据是真正的革命国际开源知识网 Rufus Pollock,2013年4月22日谈论大数据好像谈论大软件一样,好像大小成了它们的价值。重要的是数据要能够解决问题。对于许多事情,问题本身就是小数据。家庭用电量,当地公共汽车的排班,政府的开支,都是小数据。在Excel中做有意义与有价值处理与分析的都是小数据。下一个十年属于分布式模式,是小数据的天下,不是大数据。Small Data vs.

16、Big Data : Back to the basics 2014 年 7 月 3 日Ahmed Banafa,San Jose State University,Lehigh University大数据通常指结构化与非结构化数据的组合,以PB或TB为单位测量。大数据通常被认为有3V4V的特征:数据量,数据类型、精密度和速度。 这让大数据难以管理。发展大数据的思路是令人信服的,想发现行为的隐藏模式;隐藏在医疗后面的生理与心理反应;选举的预测;广告的投放;战场上的生存法则。等等小数据是将及时、有意义的观察(源于大数据和/或“本地”来源)连接在一起,经可视化的组织和打包,以便日常工作可访问,可理

17、解和可操作。小数据包括我们目前所拥有的数据,以及将大数据集转换为可操作的小数据的最终用户应用程序和分析工具。这里的关键“行动”是指连接,组织和包装,“价值”植根于使所有(可访问),易于应用(易于理解)的洞察力,并专注于手头的任务(可操作)。然而,从大数据炒作出来的所有烟雾似乎掩盖了我们对全局的看法:在许多情况下,大数据是过度的。大多数的人不是数据科学家,无法直接使用大数据,我们需要的是小数据。(使用过度的技术支持,而效益却很小)。忘了大数据-小数据引领物联网 福布斯 2015/02/15小数据由当前状态和条件,或由分析较大的数据集来生成。为什么小数据很重要?小数据是根据现在发生的情况來呈現数据

18、。这些事件可以与从大数据数据集运行的机器学习算法得出的行为或趋势信息相结合。少量变数的当前状态正是了解事件所需的全部。譬如在药瓶上使用智能标签smart labels,使用小数据来确定药物所在的位置,余药的的保质期,防止变质的当前的温度条件。优化业务流程可以通过分析相对较小的数据集来为公司节省数百万美元。小数据能知道跟踪对象在做“什么”。大数据能想了解“为什么”。康奈尔大学医学院小数据实验室开发应用程序来监测患者的健康问题开发了一系列应用程序,不仅在于收集病历数据,还追踪病人购物习惯。例如收集类风湿性关节炎病人出现不符合周期的耀斑flare和缓解,从基于行为的微小变化,来预测何时再度可能出现耀

19、斑。监控病人在超市的购物信息来调整营养师的处方,或由病人与医院的电子邮件来监控病人的“认知表现,疲劳,药物副作用、波动性的睡眠不良,以及其他病人自我报告和自我补救的调整和治疗“。数据质量属性的测量标准(1)可近性 Accessibility 使人和机器能够按照企业的需求规则提取数据retrieved as needed,以符合组织的最大利益;准确性 Accuracy准确和精确的确认数据与原始的来源是否权威、真实、有效。包括审视从组织外部收到数据的格形式、文档、影像等电子数据的一致性的程度;完整性 Completeness是否能满足用户正式的要求和期望,没有差距。衡量所有要求的数据能被识别,定义

20、,存在和记录以满足业务需求的程度;一致性、唯一性、同步性 Consistency、Concurrency衡量一组数据在冗余系统或分布式数据库中是否同步与一致。数据质量属性的测量标准(2)及时性 Timeliness数据是当前而不是过时与可用的,在规定期限内衡量系统可用性的程度或百分比。及时性应始终从数据使用者的角度来衡量;诚正性 Integrity 所获得的和期望的数据是相同的,衡量最初获得的数据的形式或质量与正在运行的数据的形式或质量之间的连续性是一致的(取下来的数据与在系统中正在运行的数据是一致的);合法性 Validity数据是通过核准的程序获得的有效数据。符合业务规则,获得授权的抽取,

21、创建,读取,更新/删除数据(如:由接口获取而非直接由数据库抽取)相关性 Relevance 是否适合预期用途,由用户输入和输出的使用数据来定义数据的使用、业务流程是否与原需求相关吻合。如何解决数据质量的问题?医疗数据属性复杂,质量管控困难多样性结构性与非结构性数量速度精确性能见度可视化价值 不论大数据、小数据,具备互操作性的医疗信息交换平台HIE是控制数据的质量十大要求的国际标准基础建设可近性 Accessibility完整性 Completeness一致性 consistency,(同步性Concurrency) 连贯性 coherent,相关性 relevance,有效性 validity,安全性 security准确性 accuracy实时性 timeliness诚正性 IntegrityHIE平台在欧美医疗体系中的位置所有应用必须以医院为主体!数据必须来自医院的HIE信息平台!医

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论