《医疗大数据》读书笔记_第1页
《医疗大数据》读书笔记_第2页
《医疗大数据》读书笔记_第3页
《医疗大数据》读书笔记_第4页
《医疗大数据》读书笔记_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、在我国,由于国家信息化战略的侧重与新一轮医疗制度改革的催生,从历史沿革角度看,医疗设备和医疗服务的信息化是被涵盖在医疗机构信息化之内。结合国际上统一的医疗信息化划分标准与我国特色,医疗机构信息化由以下部分组成。1)医院管理信息系统。医院管理信息系统,指以收费为中心,对门急诊的挂号、划价、收费、配药,住院患者的医嘱、配药、记账,以及医院的人、财、物等工作,实施计算机网络管理,对由各信息点采集的数据进行初步统计分析,并提供管理人员查询、管理和决策。临床信息系统,指以患者为中心,使用影像存档和传输系统(PACS)、放射信息系统(radiologyinformationsystem,RIS)、检验信息

2、系统(laboratoryinformationmanagementsystem,LIS)、病理信息系统(pathologyinformationsystem,PIS)、手术室信息系统(operatingroominformationsystem,ORIS)等,用来全面收集患者的临床信息,并通过医生工作站提供给医生。医生可使用电子医嘱录入系统(computerizedphysicianorderentry,CPOE)录入处方、医嘱和检查申请单,查询检查结果,以医疗文件“无纸化”来提高诊治的“三长一短”现象:挂号、候诊、收费队伍长,看病时间短。电子病历并非是患者传统纸质病历单纯的电子化,而是实现

3、病历信息的采集、存储、传递、表现和加工利用。挖掘电子病历数据,能从临床路径上用数据循证医学证据,建立起有关临床治疗的多种常规模式,并最终起到规范医疗行为的作用,减少变异、降低成本、提高质量,这无疑是有重要价值的。上医治未病之病,谓之养生;中医治欲病之病,谓之保健;下医治已病之病,谓之医疗”,医疗大数据的来源主要有以下4个方面:(1)制药企业、生命科学药物研发所产生的数据是相当密集的,对于中小型的企业也在百亿字节(TB)以上的。(2)临床医疗、实验室数据临床和实验室数据整合在一起,使得医疗机构面临的数据增长非常快,一张普通CT图像含有大约150MB的数据,一个标准的病理图则接近5GB。(3)费用

4、、医疗保险、利用率患者就医过程中产生的费用信息、报销信息、新农合基金使用情况等。(4)健康管理、社交网络随着移动设备和移动互联网的飞速发展,便携化的生理设备正在普及,如果个体健康信息都能连入互联网,那么由此产生的数据量将不可估量。医院信息系统(HIS)数据、检验信息系统(LIS)数据、医学影像存档和传输系统(PACS)数据和电子病历(EMR)数据。HIS是医院的核心系统,是对医院及其所属各部门的人流、物流、财流进行综合管理的系统,围绕着医疗活动的各个阶段产生相关数据,包括各门诊数据及病房数据两大主流数据流。LIS是HIS的一个重要组成部分,其主要功能是将实验仪器传出的检验数据经分析后,生成检验

5、报告,通过网络存储在数据库中,使医生能够方便、及时地看到患者的检验结果。PACS数据主要是将数字化医院影像科室日常核磁、CT、超声、各种X线机、各种红外仪等设备产生的图像存储起来。EMR不同于以医疗机构为中心的门诊或住院病历,是真正以患者为中心的诊断和其他检验数据的“数据池”,它将患者诊断过程中生成的影像和信号,如X线检查、CT扫描等纳入电子病历中,并以统一的形式组织起来。医疗大数据定义如下。随着医疗卫生信息化建设进程的不断加快,医疗数据的类型和规模正以前所未有的速度快速地增长,以至于无法利用目前主流软件工具,在合理的时间内达到撷取、管理并整合成为能够帮助医院进行更积极目的经营决策的有用信息。

6、规模巨大的临床实验数据、疾病诊断数据以及居民行为健康数据等汇聚在一起形成了医疗大数据,并呈现出大数据的特性:(1)数据规模大(volume)(2)数据结构多样(variety)(3)数据增长快速(velocity)(4)数据价值巨大(value)除了大数据所具有的特征(即volume,variety,value,velocity)外,医疗大数据还具有多态性、不完整性、时间性及冗余性等医疗领域特有的一些特征。根据大数据在医疗行业的主要应用场景医疗大数据可分为以下3类。1)医药研发大数据大数据技术的战略意义在于对各方面医疗卫生数据进行专业化处理,可以使对患者甚至大众的行为和情绪的细节化测量成为可能

7、,挖掘其症状特点、行为习惯和喜好等,找到更符合其特点或症状的药品和服务,并针对性地调整和优化。医药公司在新药品研发阶段,可以通过大数据建模和分析,确定最有效的投入产出比,从而配备最佳资源组合。除了研发成本,医药公司还可以更快地得到回报。同样通过数据建模和分析,医药公司可以将药物更快推向市场,生产更有针对性的药物,获得更高潜在市场回报和治疗成功率的药物。2)疾病诊疗大数据采集健康数据,居民可以随时查阅,了解自身健康程度。同时,提供专业的在线专家咨询系统,由专家对居民健康程度做出诊断,提醒可能发生的健康问题,避免高危患者转为慢性病患者,避免慢性病患者病情恶化,减轻个人和医保负担,实现疾病科学管理。

8、另外,通过对大型数据集(如基因组数据)的分析提供个性化医疗方案。个性化医疗可以改善医疗保健效果,如在患者发生疾病症状前,就提供早期的检测和诊断。3)公共卫生大数据大数据可以连续整合和分析公共卫生数据,提高疾病预报和预警能力,防止疫情爆发。公共卫生部门则可以通过覆盖区域的卫生综合管理信息平台和居民健康信息数据库,快速检测传染病,进行全面疫情监测,并通过集成疾病检测和响应程序,进行快速响应,这些都将减少医疗索赔支出,降低传染病感染率。通过提供准确和及时的公共健康咨询,将会大幅提高公众健康风险意识,同时也将降低传染病感染元数据描述数据的产生、并随时间推移而演化的整个过程的信息,为数据提供了一个参考框

9、架,用于让使用者更好地获取、使用和管理信息资源。元数据与传统关系数据库的数据字典类似,它描述所属数据集的物理组织、数据模型、表结构、用户权限等信息。但元数据的描述功能远不止这些,它包括了来自内外部的所有物理的和知识性的信息,包括物理数据的格式、技术和业务规则、数据组成和约束以及所使用的数据结构等方面。元数据分为技术元数据、业务元数据和过程元数据。元数据犹如数据集合的DNA,它描述了数据集中各要素的组成、结构、来源以及彼此之间如何协作。采用元数据知识库进行存储是目前公认的元数据收集组织方式。在医疗信息化的过程中,主要面临的问题是如何实现区域内异构医疗机构间医疗卫生数据互联互通,以及医疗卫生信息语

10、义互操作,即两个或多个医疗机构间交换信息和对所交换信息进行使用的能力。被公认是医疗大数据主要来源的有3种,分别是电子病历数据、基因数据和互联网数据。医学领域内的数据资源,按照类型来分大致有电子病历、医学影像、临床检验和医患行为这4种。这些医疗行业相关数据资源应包括医保政务、医学文献、制药行业和医药销售等4部分内容。生命科学现在有两个分支,即计算生物学和生物信息学,前者是模拟生物系统怎样运转,如一个细胞的代谢路径,或是一个蛋白生成的方法;而后者则从许多不同的实验中收集和分析数据。凭借大数据技术分析基因数据,是未来医学个性化医疗模式和“治未病的起点。这是因为,数据挖掘无需假设,是一种无预先假设(h

11、ypothese-free),这种研究有着特别的作用,即能让某一个特定的基因或一组“候选”基因无偏向性地让这些基因数据自己“阐述”自身的作用。电子健康纪录(electronichealthrecord,HERs)整合了不同来源的病患健康资讯,包括病患所有的电子病历,理想的电子健康记录应该具有互动性、互用性、安全性、持续性和即时更新的特性。非结构化和半结构化数据现在主要包括医生医嘱、出院小结和各种描述性质的分析报告。针对这些数据,首先需要进行分词,之后再利用医学领域的知识库对分词结果进行概念的识别,最终形成一个机器可读的数据。这个流程中,系统对数据的处理并不是完全自动化的过程。一些不能自动识别的

12、文本将由人工进行识别处理,之后作为一个用户字典规则,加入到系统标准识别过程中。用到的工具包括:(1)文本分词在医疗卫生领域,需要结合医疗卫生领域的本体知识库的建模,建立业务词典,提高分词的准确率。(2)文本挖掘(3)语义分析医疗数据的共享、整合成为迫切需要。第一阶段是以传统的数据交换整合,即基于EAI/ETL技术来实现,主要实现在广域网范围内医疗卫生数据采集和交换,实现在区域的整合,形成区域级别的健康档案,主要在数据层面实现整合;第二阶段在此基础上以面向服务的架构(serviceorientedarchitecture,SOA)为中心,从数据整合上升到应用整合和业务协同;第三阶段在前两个阶段的

13、基础上基于HL7和IHE等国际标准实现开放性和可互操作的信息共享和业务协同。数据清洗(ETL),是英文extracttransformload的缩写,用来描述将资料从来源端经过抽取(extract)、转换(transform)、装载(load)至目的端的过程。数据抽取具体包含如下几种实现方式。(1)全量抽取(2)增量抽取面向医疗大数据应用的逻辑参考架构主要分为五个层次,分别是医疗大数据管理层、医疗大数据整合层、医疗大数据处理层、医疗大数据应用支撑管理层及医疗大数据应用服务层。医疗大数据资源种类繁多、结构复杂,主要包括:1)诊疗数据2)药品数据3)健康数据4)医疗知识库5)外源数据多源数据汇集后

14、,还需进行有效的融合处理,才能进行有序组织,构成医疗大数据核心资源。1)医疗大数据主数据管理2)患者身份交叉索引(PIX)处理患者标识号(patientidentifier,PID)3)融合诊疗事件形成医疗事件时间序列目前的大数据服务技术主要针对结构化数据和基于KeyValue的文本数据,而对于序列数据、图数据这些类型没有很好的支持技术。针对不同的数据源、不同的数据格式、不同的数据逻辑关系,医疗健康大数据处理平台提供了实时数据库、关系数据库、NoSQL数据存储、HDFS文件存储等多种专用的存储服务和系统,为数据的高效存储和有效管理提供了保障。1 )离线批处理计算方式(MapReduce)2)在

15、线实时分析计算框架(Spark)3)流式计算框架(Storm)在医疗大数据分析层,将着重解决两个层面的分析工作。一是面向医疗大数据分析的分析挖掘,将传统的通用数据挖掘工具进行优化改造及并行化实现,在医疗领域本体的支持下,为医疗大数据应用服务提供专用的分析模型库。二是对医疗大数据挖掘利用的基础上,辅以领域知识构建技术,建立生物医学本体知识库模型。( 1)研究构建生物学和临床医学融合的生物医学本体知识库,使之成为能与临床电子病历应用集成的多本体融合模型。医疗大数据应用支撑管理层包括了以下几部分功能支撑。( 1)医疗大数据服务总线(2)医疗大数据数据安全服务(3)医疗大数据数据管理服务为通用分析服务提供数据的访问控制、数据资源目录管理、元数据管理、大数据分析任务的托管运行服务以及托管运行任务的查看和访问服务支撑。(4)运营管理服务系统对大数据应用支撑平台上运行的分析服务提供公共服务资源发现、查找、调用、回调的支撑,并提供对分析服务运行状态的监管监控功能。通过医疗领域大数据的整合和深度分析利用,针对居民、医生、科研和卫生管理机构,开

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论