版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 医疗大数据分析应用平台医疗大数据分析应用平台产品解决方案(初稿)本应用平台产品的总体方案思路是:基于目前医疗服务机构及相关机构已有的HLI、NHLI、HIS等有关系统形成并积累的医药医疗大数据和信息,采用最新的大数据技术、云计算技术、BI和数据挖掘技术,形成对医疗行业具有新视角、全方位、智能性、预测性、可视性的深层次展示分析效果(Insight),揭示医疗行业整体规律和内在发展趋势,揭示患者个体的独有特质并形成个性医疗,将医疗行业的宏观大势与每个患者的微观个体定性定量描述有机结合,达到支撑和形成医疗行业新应用场景和新服务模式。“医药医疗大数据”是具有更强的决策力、洞察发现力和流程优化能力的海
2、量、高增长率和多样化的信息资产,但需要新计算处理模式。1. 背景介绍根据国际著名分析机构Gartner给出的定义:大数据就是那些具有规模大、速度快、种类多三大特征的数据资产。大数据分析从海量数据中筛选出有用的信息,然后通过各种手段将信息转化为洞察力,从而做出正确决策,并最终推动业务发展。通过一系列分析处理,大数据可以帮助企业制定明智且切实可行的战略,获取前所未有的客户洞察,支持客户购买行为,并构建新的业务模式,进而赢得竞争优势。随着人们的生活水平不断提高,健康也越来越受到家庭的关注。2009 年2 月27 日,我国卫生部公布的第四次国家卫生服务调查结果显示,截止至2008 年,我国居民脑血栓,
3、糖尿病,高血压等慢性病病例数达到2.6亿,占全国总人数的20%,其中高血压病人对自身疾病的知晓率只有30%,同时这些病人中的治疗率只有25%,控制率仅为6%,糖尿病病人中,能坚持做到规范治疗的也只有33%。由此我们可以看出,建立科学、规范、高质量的慢性病管理策略,实现对人体慢性病的监护具有重大的意义。通过慢性病的早期诊断和监护,不仅能提前预防和控制各种疾病,还能帮助他们合理用药,减少医药开支。另一方面,我国公共医疗卫生资源紧缺,城乡医疗卫生资源的差距比较大,城市人口平均拥有的医疗卫生资源是农村人口的2.5倍以上,比如,占全国总人口近70%的农村拥有全国医疗卫生资源的30%,而占全国总人口30%
4、的城市却占有全国医疗卫生资源的70%,优质的医疗卫生资源集中分布在城市,尤其是大城市。因此,实现城乡之间的医疗卫生资源共享成为丞待解决的重要问题。同时,随着国家积极倡导“3521”医疗系统建设,我国医疗领域信息化程度得到了很大的提高,预计在全国会出现上百个医疗数据中心,每个数据中心都将承载近1000 万人口的医疗数据,数量多、更新快且类型繁杂,使医院数据库的信息容量不断膨胀,这就产生了医疗大数据。医疗大数据通常具有以下特征:(1) 数据巨量化: 区域医疗数据通常是来自于拥有上百万人口和上百家医疗机构的区域,并且数据呈持续增长的趋势。依照医疗行业的相关规定,患者的数据通常至少需要保留50 年。(
5、2) 服务实时性: 医疗信息服务中会存在大量在线或实时数据分析处理的需求。例如: 临床中的诊断和用药建议、健康指标预警等。(3) 存储形式多样化: 医疗数据的存储形式多种多样,例如各种结构化数据表、非( 半) 结构化文本文档、医疗影像等。(4) 高价值性: 医疗数据对国家乃至全球的疾病防控、新药研发和顽疾攻克都有着巨大的作用。因此,如何在海量的医疗大数据中提取信息的能力正快速成为战略性发展的方向,通过大数据分析挖掘出有价值的信息,将对疾病的管理、控制和医疗研究都有着非常高的价值。大数据将给医疗卫生带来的益处强化管理,降低成本,提高效益为医疗卫生事故防控,赢得时间实现对医疗卫生早期预警有助于实现
6、医疗卫生溯源从大数据中发现科学,提升决策能力和水平目前,大数据、云计算是已经普及并成为IT 行业的主流技术。国内外都已经进入了大数据、云计算的研究热潮,同时大数据、云计算技术也逐渐成熟,大规模区域医疗信息系统和大型数据中心的建立也在同时进行。而云计算是大数据成长的驱动力,与此同时,由于医药医疗大数据越来越多,对云计算的需求日益增长,所以二者是相辅相成的。随着医疗数据的急剧增长,如何充分利用这些数据,运用大数据、云计算技术,搭建合理先进的数据云服务平台,为广大患者、医务人员、科研人员提供服务和协助,必将成为未来信息化工作的重要方向。“大数据时代”已经降临,“大数据”正在对每个领域都造成影响。在商
7、业、经济及其他领域中,决策行为将日益基于数据和分析的结果,而非基于经验和直觉;而在公共卫生、经济发展和经济预测等领域中,“大数据”的预见能力也已经崭露头角。2012年3月,美国政府公布了“大数据研发计划”(Big Data Research and Development Initiative)。该计划的目标是改进人们从现有的海量和复杂的数据中获取知识的能力。其中,与医疗卫生领域相关的有生物传感2.0、虚拟实验室环境(VLE)、癌症基因组图谱(TCGA)、神经科学信息框架(NIF)、患者报告结果测量信息系统(PROMIS) 等10 余项。2014年美国的公共数据开放项目OpenFDA上线之后,
8、先导项目开放了“300万份药物不良反应报告”,这些数据是2004至2013年间被提交给FDA的药物不良反应和医疗过失记录。对医疗机构来说,不良反应和医疗过失记录起到的是长远的贡献作用,能减少医疗悲剧的重现。根据我国居民第三次死因调查报告显示,脑血管病已成为居民的第一死因。脑卒中发病率正以每年8.7%的速率上升,我国每年用于治疗脑血管病的费用约在100亿元以上。2014年,GE医疗中国联合国家卫生计生委脑卒中防治工程委员会(脑防委)启动了“脑卒中行动”合作战略。GE医疗“脑卒中行动”的法宝之一就是大数据。尤其是GE构建的三级筛查网络,对双侧内膜增厚的高危人群检出率提升了近10%。GE搭建的脑卒中
9、信息管理系统可以与医院Lis和His系统全面对接,记录患者的基本信息、初筛信息、复筛信息、用药信息、实验室检查、体格检查信息及其随访信息等,全面跟踪患者的诊治流程。还可以与PACS系统对接,全面记录患者的影像学信息,实现患者影像信息的共享。同时,可对患者全流程疾病影像信息回顾,减少患者重复检查的负担,协助医生对患者疾病信息的全面判断。在上述这些大背景下,本公司提出并计划研发“医疗大数据分析应用平台”(以下简称“本平台”)产品,以期为我国医疗卫生实现数字医疗、智慧医疗、健康医疗发挥重要作用。从而达到:服务模式(以患者为中心,形成居民健康全过程服务),从被动到主动;医疗模式(以预防为主,人人享有基
10、本医疗卫生服务,将医疗卫生工作重点由后治前移到预防保健),从治病到防病;诊疗模式(避免各自为政,实行上下联合,专业分工),从排斥到联动;数据模式(从业务系统数据向整体数据转变,改变过去的数据不统一、不互通、不共享),从隔离到整体;技术模式(采用各种新技术手段,包括大数据、云计算、物联网、移动互联等,形成技术合力),从简单到综合的转变。2. 产品愿景形成充分发挥大数据技术的,针对医疗医药行业的,能充分适应医疗卫生信息特征的大数据分析应用支撑平台,通过大数据分析,达到发现知识、发现规律、预测未来,将医疗卫生行业推进进入大数据时代提供技术可行性。3. 产品定位本平台以医疗卫生行业的整体数据架构(数据
11、模型、数据构成、数据关系)为基础和标准,以对应的医疗卫生业务数据为输入,通过大数据技术,形成针对医疗卫生行业中不同机构、角色和业务活动的智能化应用,因此本平台不是代替已有医疗卫生信息化系统,而是在多个方面强化已有医疗卫生信息化系统,包括任意查询、即兴分析、业务增强、规则约束、预测未来、发现知识,并提供互动性、及时性、预知性、洞察性,从而达到实现智慧医疗的目标。3.1解决的问题当前医疗卫生信息化建设的主要问题是各个区域内不同医疗机构中患者的基础信息和各种临床信息资源分散、重复、孤立,导致有效信息闲置、信息重复或不一致,很难得到有效利用。通过本平台实现国家医疗卫生信息化规划中“4631-2”的三大
12、基础数据库,即电子健康档案数据库、电子病历数据库和全员人口个案数据库的应用落地;通过本平台实现智慧医疗的核心部分,即医疗卫生服务体系的智能化,使医疗卫生的各种应用提升水平;通过本平台为“看病难、看病贵”的解决提供科学定量判断依据、对比分析依据和方案效果评价依据;3.2达到的效果本平台预期部署到云平台上运行,采用SOA的理念进行架构开发,通过分层将公共大数据算法模型封装为服务,对业务应用提供服务,同时平台业务应用也是服务的形式存在,即应用单位不再需要购买部署自己的服务器硬软件环境,只需要开通相应服务就可以了。各个应用单位根据自己的业务需要定制服务,平台支持“开通即用”服务模式,为实现业务应用集成
13、,本平台将对外支持Web Service方式的接口服务。本平台希望将医疗卫生的智慧功能应用普及到业务角色和过程的方方面面,包括医生(包括专科医生、全科医生、保健医生等)、患者(包括慢性病患者、潜在患者等)、管理者(包括医疗管理者、医疗保险管理者、医药监管管理者、公共卫生管理者等)、医药经营者(药品研发、药品生产、药品物流、药品零售等)以及商业医疗保险经营者(健康险、大病险、医疗意外险等)。4. 产品理念医疗卫生、健康保健、医药器械形成的海量数据就象一座待开发的金矿,利用大数据技术、云计算技术、物联网技术和便携设备技术的最新成果,将给医疗卫生事业带来全新革命性的改变,明显解决看病难和看病贵的问题
14、,达到医疗卫生资源配置分布合理、大病小病治疗各司其职、疾病预防治疗有机结合、公民健康保健全过程覆盖。5. 总体思路通过建立医疗卫生大数据的统一标准和规范,形成可被相关业务应用所利用的医疗卫生大数据源和交互机制,在此基础上,首先形成专题大数据应用,这些应用具有跨部门和组织机构的通用性,并具有良好的稳定性,因为这些应用是面向医疗卫生专题的;基于专题大数据应用,根据医疗卫生相关部门和组织机构的业务要求,可开发形成各种业务大数据应用,并且随着平台的推广,积累的医疗卫生业务大数据应用的实例将会越来越多,并最终形成不同方向的最佳应用样例。5.1对接数据源,获取医疗卫生大数据医疗卫生大数据中心为本平台进行医
15、疗卫生大数据分析提供数据源,但不在本平台范围内,并平台只是开发提供一套与该数据中心的数据读取接口,并具有监控数据读取情况汇总统计和异常提示功能。该数据中心的定位:整合区域内不同医疗机构中患者/健康人群的各种临床诊疗数据、健康数据,在相对集中的逻辑/物理环境中,构建一个以存储和处理患者/健康人群诊疗信息为核心,覆盖多学科、多专业的面向区域内主要卫生行政主管部门、临床医疗机构和社会公众的医学(医药、医疗、健康)信息资源共享机制-区域性医学数据中心。区域性医学数据中心的建设以行政业务处理、医疗、预防、保健、康复为服务主线,以健康人群和患者的医疗活动需求为基础。区域卫生数据中心通过制定标准的数据接口,
16、建立基于广域网的信息交换、数据采集和传输机制,对区域内医疗卫生信息数据进行采集、传输、清洗和汇总,将医院、社区、医药企业以及公共卫生机构的各类数据、系统有机地整合起来,生成区域的卫生大数据。5.2对获取的医疗卫生大数据预处理机制医疗卫生大数据预处理主要完成对已接收数据的辨析、抽取、清洗等操作,目的是将数据按统一的格式提取出来,然后再转化,集成,载入数据仓库的工具 (ETL) 包括:抽取:因获取的数据可能具有多种结构和类型,数据抽取过程可以帮助我们将这些复杂的数据转化为单一的或者便于处理的构型,以达到快速分析处理的目的;清洗:对于大数据,并不全是有价值的,有些数据并不是我们所关心的内容,而另一些
17、数据则是完全错误的干扰项。 因此要对数据通过过滤“去噪”从而提取出有效数据。5.3建立医疗卫生大数据的存储机制虽然关系型数据库系统(RDBMS)在安装和使用上仍然占有主要地位,但毋庸置疑,非关系型数据库NoSQL技术已经成为今天发展最快的数据库技术。NoSQL是对数据库系统的总称,在某种程度上,它的性能和用途可能完全不同。目前除了关系型数据库外,还主要存在有以下四种NoSQL数据管理系统:键值数据库:当数据以键的形式访问时,比如通过国际标准书号ISBN找一本书,键值数据库是最理想的。在这里,ISBN是键,书籍的其他信息就是值。必须知道键才能查询,不过值是一堆无意义的数据,读取之后必须经过翻译。
18、文档数据库:该数据库以文档的形式管理和存储数据。有点类似于键值数据库,但文档数据库中的数据有结构。与键值数据库中值是一堆无意义的数据不同,文档数据库中数据以文档的结构被描述,典型的是JavaScript Object Notation (JSON)或XML。文档存储数据库中的数据可以通过定义的任何模式进行查询,但键值数据库只能通过它的键进行查询。列式数据库:也被称为列式存储或宽列存储,一改之前行式存储的方式,对数据进行列式存储。在传统关系型数据库中,数据经常以行来访问。以列式管理记录的NoSQL数据库可以管理大规模的动态列。因为没有固定的模式,所以列名和键可以变换。列式数据库适用于不经常写的情
19、况,要满足ACID(原子性、一致性、隔离性和持久性)的要求并不难,而且模式是变化的。图型数据库:图型数据库关注值与值之间的关系,用图型的数学概念存储数据。图型数据库用带有点、边缘和属性的图的结构表示和存储数据。在图型数据库中,每一个元素都包含一个直接的指向它毗邻元素的点,所以也就不需要索引查找。每个种类的NoSQL数据库都有适用的不同类型的应用程序和用例,这就涉及到一个NoSQL社区常用的一个话题,即多样持久性,或者说根据数据库处理应用程序需求的不同,使用不同的数据库系统,用于不同的应用程序和用例。5.4医疗卫生大数据的处理和分析算法分类和形成l 技术分类方法 根据挖掘任务:分为分类或预测模型
20、发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等; 根据挖掘对象:可分为关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及环球网Web; 根据挖掘方法:可分为:机器学习方法、统计方法、神经网络方法和数据库方法。l 主要处理和分析技术 预言处理:用历史预测未来; 挖掘规律处理:了解数据中潜在的规律; 关联分析:查找存在于项目集合或对象集合之间的频繁模式、关联、相关性、或因果结构; 序列模式处理:给定一个由不同序列组成的集合,其中,每个序列由不同的元素按顺序有序排列,每个元素由不同项目组成,同时给定一
21、个用户指定的最小支持度阈值,序列模式挖掘就是找出所有的频繁子序列,即该子序列在序列集中的出现频率不低于用户指定的最小支持度阈值; 分类(预言)分析:预测分类标号(或离散值),根据训练数据集和类标号属性,构建模型来分类现有数据,并用来分类新数据。建立连续函数值模型,比如预测空缺值; 聚类分析:聚类是一种无监督分类法: 没有预先指定的类别。在同一个类中,对象之间具有相似性;不同类的对象之间是相异度分析;把一个给定的数据对象集合分成不同的簇。将物理或抽象对象的集合分组成为由类似的对象组成的多个类;聚类在不同的应用领域,用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中;聚类是将数据
22、分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性;聚类与分类不同,聚类所要求划分的类是未知的; 异常检测分析:异常检测是数据挖掘中一个重要方面,用来发现”小的模式”(相对于聚类),即数据集中间显著不同于其它数据的对象; 可视化分析。数据可视化可以让数据自己说话,让用户直观的感受到结果; 数据挖掘算法。分割、集群、孤立点分析还有各种算法让我们精炼数据,挖掘价值。这些算法要能够应付大数据的量,同时还具有很高的处理速度; 语义引擎。人工智能从数据中主动地提取信息。包括机器翻译、情感分析、舆情分析、智能输入、问答系统等; 数据质量和数据管理。透过标
23、准化流程和机器对数据进行处理可以确保获得一个预设质量的分析结果。5.5开发专题大数据分析,形成专题大数据应用面向医疗卫生专业所特有的专题,开发形成一系列的专题大数据应用。在充分调研和分析医疗卫生行业的业务特性基础上,研发形成具有我国医疗卫生行业特征的分类专题大数据分析,并根据专题组成和业务功能要求形成满足该业务专题的大数据应用,如心脏病专题的大数据应用,包括其成因的大数据分析、其日常行为对病情影响的大数据分析等,为有关机构进行心脏病的有关活动(预测、预防、治疗、恢复)提供支撑。5.6开发机构大数据分析,建立机构大数据应用面向不同的医疗卫生机构和部门及其相关企业机构,开发形成针对不同机构和部门业
24、务的机构大数据应用,如医疗卫生机构应用、医疗卫生管理机构应用等。在上述专题大数据应用基础上,结合所承担的相关医疗卫生及其相关机构项目,进行机构大数据应用定制开发。5.7建立平台应用实施推广组织机制在本平台开发和部署基础上,逐步形成基于本平台开发应用项目的实施推广组织机制,包括市场宣传、营销推广、实施维护和售后服务等。5.8建立平台产品优化升级服务组织机制本平台作为公司的主打产品系列,要建立严格的版本控制,并根据市场反馈和内部技术发展,进行有计划的平台版本升级,并将新版本升级信息和文档,按规定要求通知已有用户,并及时进行产品升级,并提供维护服务。6. 医疗卫生信息的大数据建模描述和分析伴随着中国
25、医疗卫生服务的信息化进程推进,将产生大量的数据。这些数据主要来源于医疗业务活动、健康体检、公共卫生等9项医疗卫生服务。数据内容包括来自医院的大量电子病历、区域卫生信息平台采集的居民健康档案等。其中大量充斥着非结构化/半结构化的数据,包括图像,office文档,以及XML结构文档等。医疗大数据的应用,关键是整合所有可能得到的这些数据,为机构和政策制定者来找到如何刺激经济并降低共享数据的技术门槛。6.1 我们给出的相关数据模型我国医疗卫生行业涉及的数据实体对象种类非常众多,包括医疗机构科室医生(门诊、住院)、大众群体患者、医疗管理部门卫生局疾控中心医保中心发改委中医药管理局、医药管理部门药监局、医
26、药研发医药生产医药经营药品(处方药、ODC药)、医疗器械研发医疗器械生产医疗器械经营医疗器械、商业医疗保险公司、体检中心体检医生、APP服务等。如下图所示。6.2 卫计委给出的相关数据模型2010 年底,原卫生部完成了“十二五”卫生信息化建设工程规划编制工作,初步确定了我国卫生信息化建设路线图,简称“3521-2工程”,即建设国家级、省级和地市级3级卫生信息平台,加强公共卫生、医疗服务、新农合、基本药物制度、综合管理等5项业务应用,建设健康档案和电子病历2 个基础数据库和1 个专用网络建设,进行医疗卫生信息标准化体系和安全保障体系2个体系建设。2013年11月,卫生部和计生委合并后,信息化建设
27、工程规划的顶层设计规划又调整为“4631-2工程”,其中,“4”代表4级卫生信息平台,分别是:国家级人口健康管理平台,省级人口健康信息平台、地市级人口健康区域信息平台及区县级人口健康区域信息平台;“6”代表6项业务应用,分别是:公共卫生、医疗服务、医疗保障、药品管理、计划生育、综合管理;“3”代表3个基础数据库,分别是:电子健康档案数据库、电子病历数据库和全员人口个案数据库;“1”代表1个融合网络,即人口健康统一网络;最后一个“2”是人口健康信息标准体系和信息安全防护体系。依托中西医协同公共卫生信息系统、基层医疗卫生管理信息系统、医疗健康公共服务系统打造全方位、立体化的国家卫生计生资源体系。卫
28、计委规划的三大基础数据库相互关系和包括的主要数据如下图所示。电子健康档案的数据架构是以人的健康为中心,以生命阶段、健康和疾病问题、卫生服务活动(或干预措施)作为三个纬度构建的一个逻辑架构,用于全面、有效、多视角地描述健康档案的组成结构以及复杂信息间的内在联系。通过一定的时序性、层次性和逻辑性,将人一生中面临的健康和疾病问题、针对性的卫生服务活动(或干预措施)以及所记录的相关信息有机地关联起来,并对所记录的海量信息进行科学分类和抽象描述,使之系统化、条理化和结构化。个人健康档案的三维概念模型,可以清晰地反映出每个个人不同生命阶段、主要疾病和健康问题、主要卫生服务活动三者之间的相互联系。同时,坐标
29、轴上的三维坐标连线交叉所圈定的空间位置(域),表示了人在特定生命时期、因特定健康问题而发生的特定卫生服务活动所需记录的特定记录项集。由于三维空间中的任意一个空间位置都对应着某个特定的健康记录,从而构成了一个完整、立体的健康记录,这些健康记录全面地反映了个人健康档案内容的全貌。l 第一维(X轴):生命阶段按照不同生理年龄可将人的整个生命进程划分为连续的若干生命阶段,如:婴儿期(01岁)、幼儿期(13岁)、学龄前期(36岁)、学龄期(612岁)、青春期(1220岁)、青年期(2145岁)、中年期(4660岁)、老年期(60岁以上)等八个生命阶段。也可以根据基层实际工作的需要,将人群化分为:儿童、青
30、少年、育龄妇女、中年和老年人。l 第二维(Y轴):健康和疾病问题每一个人在不同生命阶段所面临的健康和疾病问题不尽相同。确定不同生命阶段的主要健康和疾病问题及其优先领域,是客观反映居民卫生服务需求、进行健康管理的重要环节。l 第三维(Z轴):卫生服务活动(或干预措施)针对特定的健康和疾病问题,医疗卫生机构开展一系列预防、医疗、保健、康复、健康教育等卫生服务活动(或干预措施),这些活动反映了居民健康需求的满足程度和卫生服务利用情况。 居民健康档案新生儿疾病筛查出生缺陷监测学生健康监测婚前保健服务疾病控制医疗服务免疫接种传染病报告结核病防治门诊诊疗青春期青年期中年期老年期出生医学登记妇女病普查计划生
31、育技术服务体弱儿童管理儿童健康体检五岁以下儿童死亡报告学龄前期幼儿期婴儿期出生学龄期孕产期保健服务与高危管理产前筛查与诊断孕产妇死亡报告慢性丝虫病病人管理职业病报告职业性健康监护伤害监测报告中毒报告成人健康体检疾病管理高血压病例管理糖尿病病例管理肿瘤病病例管理精神分裂症病例管理艾滋病综合防治血吸虫病病人管理儿童保健妇女保健 个人基本信息 主要疾病和 健康问题摘要 主要卫生 服务记录老年人健康管理住院诊疗死亡医学登记死亡行为危险因素监测个人健康档案(EHR)基本结构6.3 相关数据特征对比分析从医药医疗健康大数据分析应用角度,本平台需要一个尽可能全和细的数据集合,所以理想状态是结合上两部分数据内
32、容形成的超集集合,甚至包括一些非医疗健康数据,如考察研究某种药对某种疾病的医疗效果时,如果能获得当地的气象天气信息,可能分析出的结果将明显不同。另外可以看出目前所给数据都是结构化数据,如果从大数据分析应用角度,理想的数据还应该包括图像、图形、文本等半结构和非结构数据,以及非关系数据(多维数据),才能构成满足医药医疗健康大数据分析应用的需求。2000 年以来,我国的医疗数据的生成和采集主要局限于各大医院。近几年,随着社区系统、新农合系统、村卫生室系统等基层医疗卫生信息系统逐步上线,医疗卫生数据源头也越来越多,数据量越来越大。从卫生服务的类型看,区域卫生信息的类型主要有:医疗服务类、公共卫生服务类
33、、社区卫生服务类、卫生业务类、卫生管理服务类数据。根据估算,中国一个中等城市(1千万人口规模)50 年所积累的医疗卫生数据量就会达到10PB级。随着各地区域卫生信息平台的建设,存储于各医疗卫生机构的数据将逐步通过各种方式实现整合与共享。多维数据由于医疗数据是多种数据源数据的汇总,数据之间的关系非常复杂。如下图所示:以患者为中心的服务需要把一个患者的全周期数据按照时间轴排列,并分析诊断、用药和患者生命体征、检验检测值之间的关联;以医生为中心的服务又需要把与医生相关的患者数据挑拣出来,并进行分类;以科室为中心的服务可能需要既从科室所属医生的角度,又要从在该科室就诊患者的角度进行分析;针对社区的服务
34、可能需要统计整个社区居民某项指标(比如血压、血糖)的达标率。医疗数据的多维度、多粒度为各种信息服务的多角度、多层次分析提供了可能,但同时也为大数据分析带来了挑战。因为不可能为每一种信息服务存储一份特定的优化模式的数据,况且也无法枚举出所有可能的信息服务需求。这就需要医疗数据的存储模型能够适应灵活多变的多维统计分析需求。7. 大数据分析应用平台支持的业务主题场景本平台支持的业务主题应用场景将尽量以国务院发布的全国医疗卫生服务体系规划纲要(20152020年)内容和目标为依据,即“优化医疗卫生资源配置,构建与国民经济和社会发展水平相适应、与居民健康需求相匹配、体系完整、分工明确、功能互补、密切协作
35、的整合型医疗卫生服务体系,为实现2020年基本建立覆盖城乡居民的基本医疗卫生制度和人民健康水平持续提升奠定坚实的医疗卫生资源基础。”最终形成我国医疗卫生服务体系的总体布局,如下图。本平台将以患者个人生命全周期、个人疾病全周期、医疗卫生服务、医药供应链所产生的大数据源为主,以支持个人、医疗卫生服务机构、医药生产经营企业、医疗卫生管理机构、医疗保险机构、公共卫生服务机构、医药监管机构等的业务大数据应用为主要应用场景。以个人为中心全生命周期的阶段划分,如下图:医疗卫生服务也从局限于医院内部的检查、诊断和治疗,扩展到未病、病前和病后的全过程医疗卫生活动。这些活动如下图:7.1 医疗卫生服务机构应用医疗
36、卫生服务机构要实现业务信息智慧洞察的目标,必须使用适当的技术架构平台来支持业务数据分析系统。方法包括应用大数据、数据仓库和商业智能技术,集成医院各类数据资源,实现医疗服务机构各类管理指标的预警监控,并提供多维综合分析平台。从而应用大数据处理和商业智能技术,分析挖掘医院运营各个方面的信息数据,通过预警监控、多维联机分析等技术手段,能够有效地提升医院的医疗质量,提高医院科学管理水平,辅助管理层决策。7.1.1各级医院自身应用医院核心业务每天产生大量的医疗数据,具有丰富的价值,通过数据挖掘等手段的分析,构成指导决策的数据,这对医院的发展、决策非常重要。“现在的一个医生,最多能管理30个糖尿病患者,但
37、是大数据研究一做出来,一个医生能管理200个糖尿病患者,光这一个应用,我们就可以增加七倍的生产力。”通过全面分析患者特征数据和疗效数据,然后比较多种干预措施的有效性,可以找到针对特定患者的最佳治疗途径。通过对在患者档案方面的大数据分析,可以确定哪些人是某类疾病的易感人群,使他们尽早接受预防性干预。这些方法也可以帮助患者选择恰当的治疗方案。 临床决策支持分析:大数据分析将使临床决策支持系统更智能,这得益于对非结构化数据分析能力的日益加强.例如:可以使用图像分析和识别技术,识别医疗影像数据,或者挖掘医疗文献数据建立医疗专家数据库,从而给医生提出诊疗建议此外,临床决策支持系统还可以使医疗流程中大部分
38、的工作流向护理人员和助理医生,使医生从耗时过长的简单咨询工作中解脱出来,从而提高诊疗效率。l 就诊人数及走势分析,使医院管理人员及时准确地了解各科室的工作量,有效地指导计划、人员计划及药品材料计划,大大增进对未来工作量的把握度;l 药品材料消耗及供应商分析,指导医院的采购行为;l 医疗能力分析:医院各级领导及时准确地了解各科室的医疗能力情况,治愈率和好转率;l 医疗效率分析,分析人均住院时间、人均治疗时间等,对各科室的效率进行分析;l 库存分析,用于了解西药、中药、材料的库存情况,指导资源使用;l 医疗质量分析,包括对门诊质量、住院质量、检验质量等的分析。 医疗数据可视化分析:根据医疗服务提供
39、方设置的操作和绩效数据集,可以进行数据分析并创建可视化的流程图和仪表盘,促进信息透明流程图的目标是识别和分析临床变异和医疗废物的来源,然后优化流程。仅仅发布成本! 质量和绩效数据,即使没有与之相应的物质奖励,往往也可以促进绩效的提高,使医疗服务机构提供更好的服务,从而更有竞争力。公开发布医疗质量和绩效数据还可以帮助病人做出更明智的健康护理决定,这也将帮助医疗服务提供方提高总体绩效,从而更具竞争力。 医学图像挖掘分析:医学图像(如CT,!MRI,PET等) 是利用人体内不同器官和组织对X 射线! 超声波! 光线等的散射、透射、反射和吸收的不同特性而形成的它为对人体骨骼、内脏器官疾病和损伤进行诊断
40、! 定位提供了有效的手段 医学领域中越来越多地使用图像作为疾病诊断的工具。 DNA分析:随着人类基因组计划的开展产生了巨量的基因组信息,区分DNA序列上的外显子和内含子成为基因工程中对基因进行识别和鉴定的关键环节之一。使用有效的数据挖掘方法从大量的生物数据中挖掘有价值的知识,提供决策支持 目前已有大量研究者努力对DNA数据分析进行定量研究,从已经存在的基因数据库中得到导致各种疾病的特定基因序列模式。一些DNA分析研究的成果已经得到许多疾病和残疾基因,以及新药物! 新方法的发现。 合理用药应用分析:为临床医药卫生技术人员提供了一个有效掌握、方便查询、可利用价值高的权威信息源,为临床医药卫生技术人
41、员节省大量时间、实现医疗专业人员对临床药物信息的有效掌握和利用、提高临床人员的合理用药专业水平、减少用药差错,避免医疗纠纷。 医药药品分析:分析医院用药情况,包括税金占比、处方用药、大处方(500元-1000元的处方、1000元以上的处方)、抗生素使用、医嘱用药等详尽的分析,可以具体查到每个医生每张处方的用药情况,以及医院的药品使用排名、医生的用药排名信息。为医院的合理用药、抗生素滥用管理、药商促销控制等提供直接有效的管理数据。 医疗质量/效率分析:分析全院医疗质量、医疗效率的完成情况。包括各项指标的同比、环比、差异值等完成情况及趋势情况的对比分析,通过智能下钻分析,可以详细查看每个科室、每个
42、员工各项指标的同比、环比、差异率、增长率等完成情况。让院领导了解每个科室、每个员工的工作完成情况,加强管理,推动医疗质量与医疗安全工作的稳步提升,为患者提供优质、满意的医疗服务。 不同病种分析:分析医院某个病种治疗的各项指标信息,包括治疗人次、治疗人次占比、总费用、药品费用、人均费用、药占比、平均住院天数等信息。为医院学科研究、临床路径优化等提供详细的数据。 临床路径优化分析:利用大数据分析手段对医院自身的临床路径进行优化分析,对医院常见的疾病建立一套标准化治疗模式与治疗程序,对疾病治疗、检验检査项目、顺序和时限等进行规范。简单来说就是同一种诊断相关分类病人均按同样的标准付费,这不仅能够给患者
43、提供最新的治疗手段与最优化的治疗方案,同时又能保证治疗的精细化、标准化、程序化,减少治疗过程的随意化,规范医疗行为、服务;避免过度医疗,降低医疗费用。7.1.2 基层医疗机构自身应用目前社区医疗服务中心的一个医生,最多能管理30个糖尿病患者,但是大数据研究一做出来,一个医生能管理200个糖尿病患者,光这一个应用,就可以增加七倍的生产力。通过全面分析患者特征数据和疗效数据,然后比较多种干预措施的有效性,可以找到针对特定患者的最佳治疗途径。通过对在患者档案方面的大数据分析,可以确定哪些人是某类疾病的易感人群,使他们尽早接受预防性干预。这些方法也可以帮助患者选择恰当的治疗方案。电子病历系统以电子化方
44、式记录患者就诊的信息,包括病程记录、检查检验结果、医嘱、手术记录、护理记录等,可以将患者历次在医院诊疗过程的信息全部记录下来。当数百万、千万的病历汇集在一起,利用大数据进行挖掘后,其应用前景十分惊人。7.1.3 区域卫生医疗联合体应用对于医疗卫生行业,医疗卫生的改革与创新将进入深水区,一方面是由于社会的发展,另一方面来自民众的新需求,再有一个,疾病谱的改变也迫使我们必须做出改革和调整。过去医院和医生看的病都是疾病,是以烈性传染病为主,而现在的疾病谱则以慢性疾病为主,其特点是终身疾病,一辈子都需要治疗。一辈子都需要治疗的病人,谁不希望找一个自己信任、并且熟悉自己病情的医生,一辈子老找他(她)。慢
45、性疾病又叫生活方式疾病,治疗糖尿病这样的病,光吃药是治不好的,必须干预病人的生活方式。慢性疾病是基因把子弹推上膛,生活方式控制扳机,所以慢性疾病的治疗首先应由管理生活方式开始,这就要求我们的医生不仅能够开药物处方,还要学会开饮食处方、运动处方,减压助眠心理调试综合治疗,才能把慢性病控制好,才能完成时代赋予我们的这种新使命,即狙击不良生活方式,这也是世界卫生组织向全球发出的号召,世界卫生组织明确指出,世界正经历从急性疾病向慢性健康问题转型的时代,而我们的医护人员还依赖20世纪初的模式,把精力集中在急性疾病的诊断和治疗上。大数据助力区域医疗联合体服务模式创新,一方面要把信息技术用于慢性病人的跟踪管
46、理服务,另一方面要利用信息技术对疾病预防提供有效的帮助,对疾病管理与健康管理提供丰富的手段和方法。把先进的理念,先进的理论模式和先进的技术手段方法三位一体地融合,帮助国民不生病、少生病、晚生病。在目前的医学条件下大多数疾病都是可防可控的,完全可以通过医疗技术手段避免或减缓糖尿病、高血压、肿瘤这些疾病。区域医疗联合体的健康管理和疾病管理应该涵盖人类生命周期从生到死无缝隙的健康,大医院只做疾病诊断治疗是不够的,必须进行医疗服务模式创新。区域医疗联合体是实现全国医疗卫生服务体系规划纲要(2015-2020年)(以下简称规划纲要)中建立分级诊疗模式的重要形式,医联体是指区域医疗联合体,是将同一区域内的
47、医疗资源整合在一起,通常由一个区域内的三级医院与二级医院、社区医院、村医院组成的一个医疗联合体。目的是小病在一二级医院解决,大病能够及时转往三级医院。 建立区域统一的医疗卫生资源:信息化的医疗模式以病患为中心,使不同层级医院、医疗管理部门以及患者之间能够在信息资源共享的条件下,实现跨组织、高效率的网络交流和协调配合。通过统一的信息化平台,消费者、医疗服务提供者和政府管理机构可以逐步建立起相互信赖的关系,进而降低成本,优化医疗服务资源配置。 实现区域信息协作与多方共赢:通过信息服务平台,各卫生机构可以更加便利地进行信息共享和分工协作。对医疗机构而言,方便了医生诊疗,有利于提高医疗质量;对科研机构
48、而言,对医学科学专题研究等提供了有效的信息获取来源;对于卫生管理机构而言,在降低市民医疗支出的同时也减少了大型检查设备重复投资造成的浪费;对公共卫生应急保障机构,由于系统能及时监控到异常及突发病历情况,使得卫生管理机构能对类似情况进行预防与管理。 减少重复投资和建设成本:通过区域医疗信息共享打破了传统的条块分割,为医疗卫生资源共享开辟一条新路。经过授权的各医院及卫生机构可以从统一的平台提取、更新、保存信息。这种以“区域政府主导、第三方平台共享式”的医疗协同模式的好处是以区域为中心,直接共享,影响范围大,减少了重复投资和建设成本。 提高医疗机构的服务质量:区域医疗信息信息化的深入人心,必将医疗机
49、构业务流程信息化、医疗机构业务管理信息化、患者服务信息化三条线满足医疗机构业务的发展需求。第一,提升医疗机构业务的整体形;第二,开源节流,查漏补缺,实现人、财、物规范化管理;第三,提供辅助决策支持,降低管理成本;第四,医疗行为得到规范,在加速培养高水平医务人员上起到了极大的作用;第五,使业务更加透明化,从而杜绝许多管理中的“猫腻”现象,减少了医疗纠纷。 解决区域内看病难和贵:远程会诊、远程预约挂号、远程代理检验、远程查询、远程医疗咨询等可为百姓就医大大提供方便,从而缓解“难”的问题;对市民来说,可以对自己的健康档案进行管理与利用,为市民自我保健提供了强有力的支持,可有效避免重复检查治疗,从而有
50、效缓解“贵”的问题;双向转诊、信息共享给患者带来更多的便利和实惠,把医护人员更多的时间还给了病人。大数据解决方案在区域医疗平台中主要的定位在于对健康档案的管理和服务,它将伴随着区域医疗平台的建设而实施。一方面采集来自基层的医疗相关数据,另一方面又为基层医疗机构提供全局的数据服务,这些服务的内容经过整合到医生,管理人员及病患的业务系统的界面中,使得用户在日常操作中平滑的获得数据服务。大数据解决方案在区域医疗中的功能包括基本服务,数据分析及依从性管理三个层次。基本服务内容包括提供基本的存储,查询,浏览。 分析服务将针对主题,对临床数据,公共卫生管理数据,绩效考核数据以及农合付费管理等不同领域进行分
51、析,在海量的不同结构的数据中找到可能的趋势和风险。 依从性管理应该是大数据服务的高级阶段,它利用业务系统中的业务活动,触发数据服务请求,数据服务经过对大数据集的调阅,分析给出特定性结果。从而控制和导引业务操作的路径。建立并完善分级诊疗模式,建立不同级别医院之间,医院与基层医疗卫生机构、接续性医疗机构之间的分工协作机制,健全网络化城乡基层医疗卫生服务运行机制,逐步实现基层首诊、双向转诊、上下联动、急慢分治。以形成分级诊疗秩序为目标,积极探索科学有效的医联体和远程医疗等多种方式。智慧分级诊疗作为智慧医疗的重要组成,将充分利用信息化手段,促进优质医疗资源纵向流动,建立医院与基层医疗卫生机构之间共享诊
52、疗信息、开展远程医疗服务和教学培训的信息渠道。为支持支撑分级诊疗模式,即以信息新技术为基础,以全科医生辅助决策系统为支持,结合大数据分析、远程医疗和可穿戴设备监测,打通“院前预防”、“院内临床路径”与“社区康复路径”,实现“以患者为中心”的社区、医院间互联互通,形成医患主动参与疾病诊疗与健康管理的全新型分级诊疗模式。7.1.4医疗卫生机构的合规应用在现今医疗保障仍为政府医保为主导的环境下,商业保险对医疗机构的话语权不大,对医疗机构的管控仍以政府医保为主。人社部于 2012 年出台的关于开展基本医疗保险付费总额控制的意见,将“逐步建立以保证质量、控制成本、规范诊疗为核心的医疗服务评价体系与监管体
53、系”作为任务目标。但实际操作中,由于缺乏有力的临床分析能力,政府医保对医疗机构的管理仍停留在粗放型,力度欠缺且效果欠佳。总额控制的支付方式使医保将超出预算的财务风险全部或者部分转移给医疗机构,在收入既定的情况下,医疗机构有可能通过减少必要服务,尤其是拒绝成本消耗较高的患者或者项目来降低医疗成本,从而出现推诿重病人、增加自费费用等问题,与原本“保障质量、规范诊疗”的目标背道而驰。而且, 总额控制支付方式下的总额基数和调整系数的确定在很大程度上参考历史数据和变化趋势,也就是在往年的额度基础上简单地加上增长空间,超值分担、结余分享的比例和调节过于依赖经验而非科学测算,导致医疗机构对于总额控制的认可度
54、不高。大数据精细化分析可以应用于科学合理的评估医疗费用及质量,从而为包括总额控制在内的多种支付方式提供支持。医疗费用评估的一大难点在于医疗服务缺乏标准化。以心脏支架手术为例,确诊需要什么样的检查化验,手术过程中需要什么样的麻醉方式,需要使用什么样的支架及放置的数量,术后康复期需要住院多久,出院后复诊需要做些什么等,在不同患者间差异巨大,所以仅比较单一的诊疗项目或药品费用与总费用并无相关性,意义不大。所以,技术上的难点在于将解决同一问题的所有相关诊疗项目及将用药情况链接起来,这就涉及专业的分组方法,如用于住院费用的 DRG 分组,或用于门诊费用的 ETG 事件系列等,以此作为费用比较的单位。医疗
55、费用分析中另一重要概念为“危重风险调整”。患者个体的差异,包括年龄、性别、并发症等,会对费用有很大的影响。举例来说,医疗机构收治糖尿病患者,三级医院的人均医疗费用往往比一级医院的高很多,但是据此得出结论说明三级医院的费用指标比一级医院差是不合适的,因为这里没有考虑到患者的危重情况。事实上,三级医院由于医疗水平高,收治的危重患者较多,导致治疗同一疾病的费用比一二级医院偏高的现象是正常的。那么在这种情况下,应该如何比较不同级别医院的费用?又如何比较同级别的不同医院的费用?这就需要引入“危重风险调整” ,即根据年龄、性别、合并症等诸多因素评估患者的危重程度,然后根据危重风险因子对医疗费用进行调整,经
56、过危重风险调整后得到的医疗费用才有可比性。费用评估对医疗保险机构而言固然重要,但单一的费用指标本身不能作为衡量医疗机构的唯一标准。与费用评估相辅相成的是医疗质量的评估,高质量的医疗服务除了对患者疾病管理及健康维护至关重要外,在从根本上控制今后长期的医疗费用上也是缺之不可的。健康人群医疗费用低是众所皆知的常识。医疗质量的衡量可以包括两大方面:一是对医疗过程的评估,需要庞大的临床规则知识库,准确判定在不同疾病管理中该做什么,不该做什么,用药合理性分析中的药物间相互反应的监测、用药剂量及用药相关检查的指标也可以归为医疗过程评估这一大类;二是对医疗结果的评价,比如手术不良事件发生率,及可避免再住院率等
57、。有了科学合理的评估医疗费用与质量的手段 , 使得政府医保机构与商业保险公司能有效对医疗机构进行综合管理 , 同时支持包括总额控制、单病种付费、按绩效付费等各类支付方式改革的实施 , 真正达到在保证质量的基础上控制费用的目的 . 这也正是医疗保险在产品服务缺乏标准化 , 信息高度不对称的医疗领域中的重要价值之一。7.2患者医疗治疗应用患者在医疗治疗过程中,既是一个按照医生医嘱要求按时吃药换药并注意有关事项的活动集合,同时也是一个与医生主动配合、积极参与和和同病患者信息交流的过程,另外患者也特别关心自己的治疗过程、治疗效果和常规恢复时间,有关应用包括以下方面。7.2.1患者就医过程提示服务患者可
58、以得到治疗过程中全部治疗活动内容、时间、地点和注意事项,并及时通知提示有关内容,如果加入天气、交通情况等信息,还可以提示就医过程穿衣指数、交通工具等信息。7.2.2患者服药提示服务患者在治疗过程中,根据医生处方和药品服用方法可以按时、按量得到服药提示,并可以对药品不足情况进行提示以便提前到医院或药店购买,也可以主动送药上门,另外对服药过程中自我身体不适反应情况及时与家庭医生进行沟通,在医嘱指导下增减药品服用。7.2.3患者饮食、运动、习惯注意事项服务患者在治疗过程中,根据大数据分析得出的最佳饮食、运动、习惯内容,对患者进行注意事项提示,也可以根据患者身体体征数据,形成具有针对患者个体的饮食、运动方案,并及时调
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 杜绝校园欺凌共建和谐校园演讲稿范文(3篇)
- 北京市海淀区2024-2025学年高二上学期9月月考 数学试题(含解析)
- DB12-T 1110-2021 企业开办登记规范
- 贡献社会主题班会教案
- 上海市市辖区(2024年-2025年小学五年级语文)统编版小升初模拟((上下)学期)试卷及答案
- 上海市县(2024年-2025年小学五年级语文)统编版专题练习(上学期)试卷及答案
- 浙江省台州市台州十校联考2024-2025学年高一上学期11月期中日语试题含答案
- 人教版九年级语文上册教案全集
- 辽宁省沈阳市沈河区沈阳市第七中学协作体2024-2025学年八年级上学期期中地理试卷(含答案)
- 广东省揭阳市2025届高三上学期第一次月考数学试题(含答案)
- QC成果提高混凝土搅拌机计量合格率
- 群文阅读(三年级下册第一单元)
- 坚持总体国家安全观走中国特色强军之路模板课件
- 矿井火灾防治安全技术措施
- 大一新生的学业规划书(6篇)
- 腾讯秘书职业发展规划书
- 线缆敷设隐蔽验收记录
- 0-高压蒸汽管线焊缝返修施工方案
- 一年级上册道德与法治课件-10吃饭有讲究-人教(新版) (2)(共24张PPT)
- GB/T 16571-1996文物系统博物馆安全防范工程设计规范
- GB/T 11618.1-2008铜管接头第1部分:钎焊式管件
评论
0/150
提交评论