版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、健康大数据分析应用平台解决方案 TOC o 1-5 h z 背景介绍1产品愿景1产品定位23. 1解决的问题23. 2达到的效果3产品理念3总体思路55.1对接数据源,获取健康大数据分析应用平台62对获取的健康大数据分析应用平台预处理机制75. 3建立健康大数据分析应用平台的存储机制75.4健康大数据分析应用平台的处理和分析算法分类和形成.95. 5开发专题大数据分析,形成专题大数据应用115. 6开发机构大数据分析,建立机构大数据应用117建立平台应用实施推广组织机制 115.8建立平台产品优化升级服务组织机制 11健康大数据分析应用平台建模描述和分析 121我们给出的相关数据模型 136.
2、2卫计委给出的相关数据模型146.3相关数据特征对比分析 17健康大数据分析应用平台支持的业务主题场景 191医疗卫生服务机构应用21健康大数据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.07. 11.37. 11.3商业医疗保险的保障设计和精算定价60健康大数据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.07. 11.37. 11.3商业医疗保险的保障设计和精算定价60健康大数据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.07. 5.37. 5.3政府医疗规划结构进行居民健康保健决策应用421. 1各级医院自身应用211.2基层医疗
3、机构自身应用267.1.3区域卫生医疗联合体应用271.4医疗卫生机构的合规应用327.2患者医疗治疗应用347.2.1患者就医过程提示服务347. 2.2患者服药提示服务347. 2.3患者饮食、运动、习惯注意事项服务357.2. 4患者体征和治疗效果服务357. 2.5患者交流交往服务357. 3个性化医疗服务应用353. 1基因测序分析应用363.2个性化药物应用367. 3.3个人健康管理应用377. 4慢性病预防治疗应用(疾控中心)387.4. 1慢性病检测、发现、预警服务397.4.2慢性病诊断服务407.4.3慢性病防控治疗服务407. 5居民健康保健应用(疾控中心) 417.5
4、.1居民自我健康保健应用417.5.2政府卫生管理部门进行居民健康管理应用 427.6医疗卫生管理机构应用(卫生局)427.7医疗保险管理机构应用(医保局) 437. 1基本医疗保险的决策支持分析 457.2基本医疗保险费用单据的智能化审核 467.3基本医疗保险的有效支付和治理应用477. 4基本医疗保险和服务监管应用477.5降低看病率提升医疗效果应用487.8医药监管机构应用(药监局)527.9医药研发生产经营应用(医药企业) 521医药研发企业应用527.9.2医药生产企业应用537.9.3医药流通企业应用537.9.4医药零售企业应用567. 10医疗卫生资源配置管理规划应用(政府主
5、管部门)577. 10. 1医疗卫生资源服务现状分析 577.10.2医疗卫生资源财务供给能力分析 587. 10.3医疗卫生资源规划指标对比587. 10. 4医疗卫生资源政策建议597. 11商业医疗保险应用(保险公司) 597. 11. 1获得新客户和保留已有客户的分析应用597. 11.2有效控制医疗费用的分析应用60健康大数据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.08. 4.98. 4.9患者特征-诊断结论分类分析81健康大数据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.08. 4.98. 4.9患者特征-诊断结论分类分析81健康大数据分
6、析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.08.1.18.1.1患者数据预处理767. 11. 4商业医疗保险的理赔运营管理应用 617. 11.5商业医疗保险的市场和销售拓展应用647. 12公共卫生服务应用(卫生防疫中心) 6412. 1传染病预警预报657. 12.2公共卫生舆情监测预警6612.3疾控和保健应用677. 13政府监管应用(政府主管部门)6713. 1医药监管应用677. 13.2医疗监管应用687. 13.3医保监管应用697.13. 4医疗服务机构和医生监管应用707. 14新型医疗卫生服务应用(政府主管部门)707. 14. 1远程医疗717.
7、14.2移动医疗717. 14.3互联网医疗737. 14.4数字医疗737. 14.5大数据医疗737. 14.6智慧医疗747. 14. 7精准医疗74健康大数据分析应用平台支持的专题大数据应用758.1患者分析(基于电子病历EMR) 761. 2患者个体(个性)分析771.3患者群体(统计)分析778.2疾病分析(基于电子病历EMR和电子健康档案EHR) 77& 2. 1常见疾病分析77& 2. 2慢性疾病分析77& 2. 3疾病诱因分析78& 2. 4疾病统计分析78& 2. 5临床路径分析788.3医生及医护人员分析(基于医疗卫生资源数据) 78& 3.1医生及医护人员资历资格分析7
8、8& 3.2医生及医护人员行医记录分析78& 3. 3医生及医护人员培训进修分析784处方分析(基于电子病历EMR) 78& 4. 1医生用药分析79& 4. 2患者用药分析79& 4. 3处方用药分析80& 4. 4医院科室用药分析80& 4. 5安全用药分析80& 4. 6处方符合性分析80& 4. 7处方用药-诊断结论关联分析81& 4. 8诊断结论-处方总价聚类分析81健康大数据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.09.9.关键核心技术和算法97健康大数据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.09.9.关键核心技术和算法97健康大数
9、据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.08. 7.28. 7.2医学影像图像分析95& 4. 10患病时间-诊断结论序列分析 818.5居民人口分析(基于电子健康档案EHR) 82& 5. 1居民个体健康分析82& 5. 2人口群体健康分析82& 5.3人口亚健康相关因素关联分析82& 5.4人口健康相关因素关联分析82& 5.5人口健康时间空间分布分析82& 5. 6人口健康预测分析828.6药品分析(基于医药产业链数据)82& 6.1药品种类分析83& 6.2药品研发分析84&6.3药品生产分析87& 6.4药品销售分析87& 6.5药品物流分析88& 6.6药
10、品资金流分析89& 6.7药品信息流分析89& 6.8药品库存分析89&6.9药品质量偏差分析94&6. 10药品不良反应&药品群体不良事件分析 947医疗健康检验检测分析(基于电子健康档案EHR) 941生理信号检测分析947. 3 DNA检测和DNA序列分析958.7.4重要人体征数据分析 957.5远程自助健康医疗检测分析958医疗安全风险分析(基于电子病历EMR) 951医疗安全分析958.8.2医疗风险分析958.8.3假药、过期药、成分异常药的使用分析968.8.4医疗事故诱因分析968.8.5医疗安全风险统计分析968.9医疗卫生资源分析(基于政府的医疗卫生资源数据).961医生
11、护理人员分析968.9.2医院床位分析968.9.3医疗检测检验能力分析968.9.4医疗卫生资源需求分析968.9.5医疗卫生资源匹配度分析968.9.6医疗卫生资源对比分析 9710医疗卫生效果分析(基于电子健康档案HER和医疗卫生资源数据)9710. 1医疗卫生满意度分析9710.2医疗卫生问题诱因分析9710.3医疗卫生规划符合度分析 97健康大数据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.01大数据分析能力982大数据分析技术983大数据存储技术和系统994大数据业务模型建模1005大数
12、据的实时查询1036大数据的复杂分析104用健康大数据分析应用平台为业务服务 1081核心理念10810.2管理闭环109健康大数据分析应用平台解决方案V3. 健康大数据分析应用平台解决方案V3. 0第第 页库系统不适合存储非结构化数据。一种解决方案是采用两套系统分 别存储结构化与非结构化数据,但这为两种数据之间进行联接查询 (join)带来了困难。例如,当要寻找某科室患者的所有CT影像图 片时,需要首先在业务数据库中查询到该科室所有患者的II),然后 再到非结构化数据库中查找图片。这种跨数据库的联接查询的执行 效率不高。因此,就医疗健康大数据而言,需要研究一种基于混合 数据模型的数据管理系统
13、,能够高效管理结构化数据与非结构化数据, 并支持异构数据之间的高效混合查询。5大数据的实时查询医疗服务对时效性的要求很高,很多查询都要求得到实时响应。 智慧医疗中涉及实时查询的可大致分为:与时间有关的查询,如检索监护对象某一时间段内的全部信 息;与空间有关的查询,例如检索监护对象在某个区域(如某个 医院)内的全部信息;与特定属性有关的查询,例如检索监护对象的血压变化历史 和用药记录等;综合查询,例如检索监护对象在某段时间和某个区域内的某 项生命体征数据。高效实时查询的关键是必须预先了解查询类型并建立所需的索 引。当数据规模非常大时,现有数据库采用的索引技术基本能够满 足数据检索的实时性需要,但
14、在索引的创建与更新的性能方面有较大 不足。例如,我们的测试结果表明,用一台运行PostgreSQL的服务 器为200万条数据(约1GB)在一个空间属性上创建R-tree索引,用 时约为20分钟;在此基础上再次插入40万条数据(约0. 2GB),用时 约为60分钟。根据这个结果,当数据产生的速度大于960万条/天 时,即使服务器的全部计算资源都用于维护索引,索引的更新速度仍 将落后于数据产生的速度。而如果1个医疗传感器每15秒产生1条 测量数据,1万个这样的传感器每天将产生超过5000万条数据。这 意味着现有的索引更新方法无法胜任医疗健康大数据处理的需求。 此外,是一种常用的避免更新索引的方法是
15、在插入新数据之前删除索 引并在之后重新创建索引,但这种方法不能从根本上解决问题,因为 随着数据不断累积,重新创建索引所用的时间越来越长,最终会比更 新索引的速度更慢。为满足大数据实时查询的需要,必须对现有的索引技术必须加以 改进,将索引的创建与更新速度提高至少一个数量级。索引更新速 度慢的一个重要原因是数据逐条添加时引发了多次随机小量写操作, 因此首先需要重新设计索引结构,使其能够批量添加数据 (bulk-insertion),尽量用顺序写入大块数据取代随机写入小块数据。 另外,需要设计索引的并行创建与更新算法,使索引的创建与更新能 够在无共享架构中水平扩展。6大数据的复杂分析在智慧医疗中,有
16、很多复杂的数据分析查询,以下仅举几例:(1)医疗数据统计,如统计历年慢性病比例变化和各地区心脑血管疾病分布等;相似联接查询(similarity join),如根据CT成像图片, 寻找相似的病例与诊断,寻找骨髓移植匹配等;医疗数据挖掘与预测,如寻找亚健康状况与职业、性别、年 龄等因素的联系和预测下一个月各类药品的需求等。这些复杂分析 查询的主要特点有:需要读取大量数据,所需计算时间长;查询灵活多变,难以预测;涉及多学科交叉,需要医疗、统计、计算机等各领域的专业 人士协作完成。传统关系数据库与NoSQL数据库难以胜任复杂的数据分析,其原 因主要有两个。首先,它们在维护数据库的原子性、一致性、分离
17、 性和持久性方面花费了巨大的开销,而在进行复杂的数据分析时,数 据往往是静态的,因此这些开销是不必要的。第二,它们的存储与 索引结构是为数据的随机读写与频繁更新而设计,没有为大量数据的 读取进行专门优化。目前,对大数据进行复杂分析的工具主要有两大类。一类是并 行分析型数据库,另一类是基于MapReduce的数据分析工具。分析型数据库基于关系数据模型,与传统关系数据库相比,其存 储结构与查询算法为数据读取进行了专门优化,如用列式存储 (column-store)替代行式存储(row-store)。目前主流的并行分析型 数据库的有Vertica和Greenplum等。这些数据库提供的用户接口 是与
18、传统关系数据库相同的结构化查询语言(SQL) o这种实现方式降 低了用户的学习成本,但也带来了两个问题。首先,虽然关系数据 模型能够进行扩展以表示非结构化数据,但由于数据种类繁多,目前 缺少足够有效的理论与工具将非结构化数据转化为结构化数据;第 二,一些复杂的数据分析难以直接用SQL描述,即使能够用SQL描 述,其执行效率也比专门编写的过程化分析程序要低得多。MapReduce是Google于2003年提出的一种新的基于无共享架构 的并行计算范式。与传统并行计算范式(如MPI)相比,MapReduce 简化了并行数据处理算法的设计与实现,使用者仅需根据查询需要定 义map和reduce两个函数
19、,无需关心并行执行过程中的任务调度、 资源管理以及出错处理等问题。MapReduce最初是为处理Google的 海量文本数据的简单分析算法而设计。随着Apache Hadoop项目提 供的MapReduce开源实现在学术界与工业界广泛使用,MapReduce编 程模型被证明十分灵活。我们不仅可以在其上构建分析型数据库(如 Hadoop Hive),而且能够实现常用的数据挖掘与机器学习算法程序库 (如 Apache Mahout)。从大数据分析性能的角度看,数据库专家们对并行分析型数据库 与MapReduce的优劣曾经有过长达数年的争论。随着对两者研究的 深入,目前已取得的主要共识有:对于简单的
20、结构化查询,当计算节点较少时(100台或以下),并 行分析型数据库由于采取了更优化的存储结构与查询算法,性能明显 优于 MapReduce;当计算节点较多时,此时计算节点出错的概率很高,并行分析型 数据库在出错时往往需要重新执行整个查询,性能会受到较大影响, 而MapReduce的设计从一开始就将常态化的出错问题纳入考虑,因此 能够轻松扩展到数千台节点;并行分析型数据库必须预先加载数据,而数据加载的时间通常十 分漫长,因此对于日志分析等仅需读取一次数据的任务并不合适; MapReduce比并行分析型数据库的应用更广泛,如能够处理非结 构化查询,实现复杂的数据挖掘算法;尽管编程模型简单,但Map
21、Reduce仍需要专业人员进行编程工作, 并行分析型数据库的使用成本比MapReduce低。从严格意义上看,并行分析型数据库与MapReduce并不具备直接 可比性。前者是包含查询语言、逻辑数据模型、并行执行引擎、物 理存储结构等一整套机制的实现,而后者仅与前者中的并行执行引擎 的角色类似。整合二者的优点,可以构建出更为强大的数据分析工 具,这也是数据库领域一个活跃的研究方向。例如,为了保证髙容 错性,MapReduce将计算的中间结果保存在磁盘上,这样做带来了巨 大的开销,影响了查询的执行效率。并行分析型数据库为了保证高 效,采用pipeline机制,即上一步的结果在内存中产生后直接通过 网
22、络推送到下一步的计算单元。由此可以得出一个构建高效可扩展 的分析型数据库的思路,即在pipeline机制的基础上,同时将中间 结果写入磁盘。事实上,二者的融合已经在目前最新的数据分析工 具(如Google Tenzing)中得到体现。无论是并行数据库还是MapReduce,都致力于解决机器的执行效 率问题。在对医疗健康大数据进行复杂分析时,医疗专家的知识与 智能在整个分析过程中起着至关重要的作用。但是,要求医疗专家 同时精通分析型数据库的使用甚至编写MapReduce程序,是不现实 的。因此,如何在这些复杂的数据分析系统之上,提供一个具备良 好可视化与互动功能的交互界面,是帮助医疗专家发掘医疗
23、健康大数 据价值的关键。用健康大数据分析应用平台为业务服务通过一系列技术处理,大数据可以帮助企业制定明智且切实可行 的战略,获取前所未有的客户洞察,支持客户购买行为,并构建新的 业务模式,进而赢得竞争优势。然而,实践往往会比理论来得更困难, 现实中许多企业管理者盲目收集数据并进行分析,期待能够得到快速 的回报。很遗憾,他们未能如愿。无论整体规划、技术平台还是业务 流程,大多数企业并未针对大数据分析做出特别的调整与变化。企业 要处理好大数据生命周期的每一个环节,就必须采用创新且经济高效 的处理方法,并跳出传统的数据管理思维。10.1核心理念首先,管理者需要问清自己这样一个问题:“大数据如何帮助我
24、 的企业实现发展? ”。如果不能指导行动,那么收集再多的数据也是 毫无意义的。事实上,获得洞察力是一方面,可实践性也是分析的标 志之一。即企业能否从大量历史数据的“噪音”中获得可实践的预测 以及具有前瞻性的决策?其次,需要针对大数据分析来改变传统的业务流程与决策流程。 按照传统企业经营方式,髙层的主观意见会对决策造成决定性影响, 这种现象到现在也还是非常普遍。让真实的数据来说话,这是许多企 业管理者需要进行的观念转变。当然,收集更多的数据并不意味着就 能够将数据转化为洞察,如果没有一个更适应大数据时代的技术架构, 它也会让企业的转型变得难上加难。第三,技术平台不是万能的,但没有技术平台是万万不
25、能的。在 很多情况下,我们会看到各种观点在弱化技术所起到的作用。事实上, 这样的观点是比较片面的。要真正掌握驾驭大数据,我们仍然需要一 个过硬的技术平台来作为支撑。你很难想象用现有的SQL数据库来分 析海量医疗卫生半结构化或非结构化信息,大数据需要我们有一个更 全面、更高效的平台来进行组织、处理和分析数据。同时需要考虑如 何将大数据平台,与原有的数据架构进行最佳集成。10.2管理闭环这里采用一套方法论,帮助思考以下几个问题,并加大数据转化 为实在的收益:1我们是否拥有目前所需的大数据?我们能否获取这些大数据?获取大数据后,我们如何挖掘这些大数据的价值?4业务环境发生变化时,我们如何处理这些大数据?企业在进行数据管理方式转型的时候,需要从四个方面来把握并 健康大数据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.0第口第口0页健康大数据分析应用平台解决方案V3.0健康大数据分析应用平台解决方案V3.0第第in页覆盖数据的全生命周期,即设想、创建、部署和扩展,并以此形成一 个有机的闭环。根据这一方法论,推出了有针对性的大数据服务,帮 助企业从数据中获取全新洞察,进一步扩展业务功能,获得更多业务 机会。在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乙方向甲方购买2024年度插秧机合同书
- 2024年度云计算平台数据中心租赁合同3篇
- 公司总裁聘用合同范本3篇
- 手按揭房屋买卖合同协议2篇
- 正规合同范本
- 2024年度智能可穿戴设备服务合同2篇
- 二零二四年卫星发射与运营合同
- 碗筷回收合同范本
- 维修工程承包合同范本大全
- 2024年度烧烤营业员培训与招聘合同
- 铸牢中华民族共同体意识-形考任务3-国开(NMG)-参考资料
- 《心理健康教育主题班会》主题
- GB 30254-2024高压三相笼型异步电动机能效限定值及能效等级
- 重大事故隐患判定标准与相关事故案例培训课件
- 深圳市中小学生流感疫苗接种知情同意书
- 《中国近现代史纲要》第八章-中华人民共和国的成立与中国社会主义建设道路的探索
- 【最新】八年级历史上册 第八单元 近代经济、社会生活与教育文化事业的发展 第26课 教育文化事业的发展
- 沥青搅拌站建设方案(完整版)
- 电子物料代码编码规则电子物料编码制定编写规则与方法
- Opera操作流程实用教案
- 智力活动、商业方法申报专利技巧漫谈
评论
0/150
提交评论