版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医疗大数据解决方案文档历史日期修订版作者邮件说明参与者2014/03/13v0.1童景文tongj@初稿CONFIDENTIAL2CONFIDENTIAL3目标云中的大数据力助业务和管理的创新分布式存储和分布式计算数据挖掘关系数据库集群快数据数据可视化关键词:云、大数据、数据挖掘、数据可视化、快数据、性能、可靠性、易运维CONFIDENTIAL4云中的大数据力助业务和管理的创新医院康复患者普通人体检正常人院内或者院外康复治疗人群入口出口医生切口进口门诊全预约挂号医导导医导口以人为中心,对全流程中不同阶段产生的数据进行积累、整合、加工;然后进行分析,从而可以从数据中发现数据从而更好地提供服务目标CONFIDENTIAL5目标云中的大数据力助业务和管理的创新患者/消费者医生预防筛查检查治疗预后转归康复教育更好其他医院内部体检/监控疗养宁养残疾死亡理疗随访运动预防诊断保险预约咨询服务随访自我诊断经验提升临床试验数据分析展示呈现美容健美心理养老环境生态饮食运动基因心理免疫疾病诊断病因诊断检查诊断定位诊断试验诊断鉴别诊断症状影像物理实验基因用药(1)用药(2)用药(3)手术理疗基因EHRCIS医患医医患患家庭5类信息体格影像物理实验基因心理生化痊愈进展恶化恶病质扩散转移产业链的延伸意味着数据的消费和产生越来越快、越来越大,并且数据的重要性越来越大。以数据为基础做好对患者的服务更加重要和更加有利于产业链的优化。CONFIDENTIAL6个性化医疗云中的大数据力助业务和管理的创新http://p-medicine.euPersonalized个性化Preventative可预防Predictive可预测Proactive可抢先/先发Participate可参与/协作个性化医疗的5P目标CONFIDENTIAL7云中的大数据力助业务和管理的创新目标企业和财务ERP运营报表医疗行业计划和合并报表成本和利润管理战略管理管理业务诊所关怀协同的电子数据共享、电子关怀管理医疗行业质量管理急诊业务智能提交最佳服务患者服务管理结果和风险医疗行业供应商电子关怀数据连接患者结果和在入院分析运营风险管理人力资源提高生产力医疗行业员工生产力管理HR报表和分析战略人力计划供应链运营有效性供应链绩效管理成本绩效管理供应链生命周期管理供应链InfoNET大数据分析业务能力(运营和管理)CONFIDENTIAL8云中的大数据力助业务和管理的创新目标科学研究和智慧的诊断数据发现决策智慧集成挖掘症状学研究流行病学研究遗传学研究过敏史望闻问切……形态研究病理学*影像学……功能研究肝肾功能神经功能……CONFIDENTIAL9现状医疗信息化背景医学信息不对称民众医学健康、预防、康复知识匮乏缺乏病人的主动参与大病小病都找三甲优质医疗资源有限医生经验与精力有限没有充分发挥医生的价值资源有限利用有限信息缺乏信息不对称行业复杂极难标准化个体差异大医疗疾病种类繁多复合疾病常见,关系复杂很难标准化、自动化医学检查、诊断、治疗不断发展新的疾病不断产生和变化医疗发展水平还有未知领域医疗利益分割三甲医生患者二级医院医生一级医院医生社区医生CONFIDENTIAL10现状一些奇怪但是正常的现象一天吸氧25小时男性出现妇科检查项目“医保害人”住院全套检查不互认检查结果患者有70多种身份医生首要工作是保护自己……技术问题标准问题道德问题责任问题法律问题体制问题CONFIDENTIAL11现状医疗信息化应用体系数字化医院医疗信息化医院信息化建设医院信息管理系统CONFIDENTIAL12现状医疗产业基本矛盾医疗核心矛盾:(1)优质医疗资源稀缺;(2)现有医疗资源没有得到充分发挥。医疗信息化核心矛盾:(1)政策问题;(2)信息孤岛;(3)数据应用。医院利用信息化核心矛盾:(1)效益;(2)效益;(3)效益。政府医疗健康核心矛盾:(1)政策问题;(2)管理问题;(3)监督审计。群众医疗健康需求核心矛盾:(1)医保和医改政策;(2)医疗和健康保障。CONFIDENTIAL13未来将以大数据分析为中心分析能力业务应用程序业务应用程序业务应用程序业务应用程序分析能力分析能力分析能力目前以应用程序为中心现在数据分析的现状现状CONFIDENTIAL14现在数据分析的现状现状分析不仅仅是出一个报表、做些即席查询等,完整的分析需要做更多的事情才更加有助于运营和管理结构化数据&非结构化内容描述性分析说明性分析预测分析每一个人都能消费和存取如果这些趋势继续下去?预测我们怎样才能达到最好的结局和地址变异?随机优化这是怎么回事报表究竟是什么问题呢?多维分析多少,多久,在哪里?即席查询需要采取什么行动?警报会发生什么?模拟我们怎样才能达到最好的结果?优化接下来会发生什么?预测模型提取的洞察力,概念和关系内容分析医疗信息化面临新的挑战CONFIDENTIAL15挑战层面问题层面问题技术层面数字化孤岛与异质异构问题/信息系统架构与设计复杂体系化架构保障安全、稳定与高效信息化信息分享体系与机制(内、外)信息化本身安全(监控、审计)可信任记录、存储、灾备与应急无线与外网安全流控……专业层面基于信息化手段的医疗质量与安全控制细微信息化的整合问题大量信息数据无法得到充分利用特色专科信息化问题(例如保健科、口腔科)业务层面信息对医院盈利几乎没有产生价值医院对于复杂医疗协同问题信息还没有真正用到医院管理与运营缺乏系统化和实用化的决策支持分院、医疗集团、协作医院等新模式临床无法利用信息以辅助管理与医疗信息化未能在院外医疗协同方面发挥作用政策性导致的信息化标准问题其他:医保、等保、ACO、MU、HL7……服务层面信息系统维护质量和速度信息化被绑架与信息化服务公司维护与评估体系分离或缺失信息服务公司无法获得足够商业利益合作模式有待探讨医疗信息化面临新的挑战CONFIDENTIAL16挑战数据量一个典型三甲医院的医疗数据-每年新产生信息系统年数据量HIS30-50GBLIS50-100GBRIS/PACS10-30TB医疗机构的总存储量医疗行业总体数据存储量不是很大,总体上以1TB-50TB为主。各医疗机构之间差异比较大,1TB-20TB的医疗机构比较多,但有个别的达到了300TB-1PB。这主要是由于医疗行业信息化水平差异比较大,各医疗信息化水平不一。医疗机构规模大小与医疗机构数据存储量多少有一定的关系,有部分三级医疗机构达到了100TB以上的规模;但二级医疗机构与三级医疗机构数据存储量在1-50TB的区域都分布较多医疗信息化面临新的挑战CONFIDENTIAL17挑战医疗数据生命周期门诊记录:15年住院病历:30年有条件的医院,病理、影像将无限期保存门急诊记录保存时间不得少于15年,住院病历保存时间还要长(约30年),一些著名人物的病历将无限期的保存。而目前一般的惯例为病历、影像有条件的要无限期保存,一般近2年较为经常调用。病人信息、交易、医属等是每天调用、病案分析等不需要太快。数据的在线时间要求,影像数据在线时间3年,3年前的数据归档到离线服务器存储;HIS生产系统服务器在线时间为5年,5年前的数据归档到历史服务器;电子病历无归档,全部在线。所有的数据中心存储均拥有数据生命周期管理,特别是PACS系统建立了生命周期管理。影像数据在线时间:3年HIS服务器在线时间:5年电子病历无归档,全部在线病历、影像两年内要经常调用医疗档案一般保留时间较长,且在线时间的要求也较其他行业高一些,一个大的三甲医院具体情况如下:PACS系统每年的数据增长量约2TB—30TB不等从应用现状统计情况看,按照惯例各医院的存储系统一般2年扩容或更新一次,服务器系统容量一般3-4年升级或扩容一次。HIS、LIS等系统每年的数据增长量约为200GB归档时间在线时间容量增长在数据和结果之间存在着差距CONFIDENTIAL18我如何随着我的业务调整我的数据?当随时随地需要的时候我如何获得正确有效的数据?我如何通过我的组织以支持做出更好的决策?我是否能够很快而不是要等很长的时间就能够得到结果,并以数据可视化的方式进行展现?数据大爆炸优化的结果挑战各组件/系统上下文关系CONFIDENTIAL19方案业务系统数据源HIS财务LIS资产管理人力EMR非结构化数据数据采集系统集群1.采集2.装载HDFS文件系统集群/Hbase集群数据加工MapReduce计算集群(ETL)3.1ETL关系型数据库集群(Oracle,DB2,MySQL)3.2中间结果数据挖掘MapReduce计算集群(DataMing)4.1数据挖掘4.1数据挖掘4.2中间结果数据可视化应用体系集群(SPSS、Cognos等)SQLOnHadoopSQL各种业务能力应用SQLOnHadoop/APISQL大数据平台CONFIDENTIAL20整体架构概览方案整体架构方案业务应用接入桌面移动虚拟工作空间科学研究、智慧诊断运营和管理业务分析计算物理硬件基础设施基础策略的管理和自动化云自动化云运营云业务软件定义数据中心虚拟基础设施抽象&资源池计算抽象=服务器虚拟化网络网络抽象=网络虚拟化/软件定义网络存储存储抽象=软件定义存储大数据平台数据挖掘MapReduce计算集群(DataMing)关系型数据库集群(Oracle,DB2,MySQL)SPSS集群数据可视化应用体系集群数据采集系统集群HDFS文件系统集群Hbase集群数据加工MapReduce计算集群(ETL)统一数据查询系统个性化医疗、移动医疗系统如何构建CONFIDENTIAL22需要一种性价比高的硬件系统来支撑如此之多的不同集群,手工管理和监控是不可接受的采用物理机方式部署的话,机器和其它资源会被大量浪费整体系统表现出高可靠性、高性能非常重要需求变化大、应用需要快速迭代;从而需要快速部署方案CONFIDENTIAL23硬件基础设施架构规划概述服务器
CPU:x86
DRAM
DISK:HDD+SSD
Architect:机架式Racks(机柜)
10台以上的服务器
万兆以太网交换(光纤)Cluster(服务器集群)
关键字:高速网络、SSD、双冗余、高密度堆叠、低功耗、高性能方案CONFIDENTIAL24方案硬件基础设施架构规划概述-网络虚拟化机柜内的服务器通过相应普通的万兆以太网交换机互联,机柜与机柜之间采用高端点的以太网交换机互联。然后通过SDN(软件定义网络)技术实现网络虚拟化,以达到像管理VM一样管理网络。从而能够敏捷地支撑多变业务所带来多变应用对多变网络的要求InternetExistingPhysicalNetworkNetworkHypervisorVirtualNetworksCONFIDENTIAL25vSphereBigDataExtensions&vSAN
–为Hadoop提供无与伦比的灵活性方案vSphere加强了对大数据工作负载的支持,包括所有主要Hadoop发行版在通用vSphere基础架构上虚拟化Hadoop以实现无与伦比的灵活性通过集成到vCenter的管理工具帮助用户在vSphere上部署、运行及管理Hadoop集群隔离存储和计算以实现弹性扩展和真正的
多租户存储计算当前的Hadoop:组合式
存储/计算存储T1T2VMVMVMVMVM弹性扩展:隔离存储和计算Hadoop堆栈:vSphere加强了对
大数据工作负载的支持物理主机概述优势弹性扩展支持多租用户更高的集群利用率易于使用的界面通过硬件整合实现更低的总体拥有成本利用vSphere增强HA/FTHadoop提倡计算移动而不是数据移动,从而可以大幅提高数据计算性能CONFIDENTIAL26vSphereBigDataExtensions&vSAN
–为Hadoop提供无与伦比的灵活性方案VirtualizationHostOSImage–VMDKHadoopVirtualNode1Task-trackervSAN/SAN/NASLocaldisksOSImage–VMDKVMDKVMDKVMDKVMDKVMDKVMDKVMDKHadoopVirtualNode2DatanodeExt4Ext4Ext4Ext4Ext4Ext4Ext4Ext4Ext4Ext4Ext4Ext4Ext4Ext4Ext4Ext4VMDKVMDKVMDKVMDKVMDKVMDKVMDKVMDKVMDK……CONFIDENTIAL27vSphereBigDataExtensions&vSAN
–为Hadoop提供无与伦比的灵活性方案整合系统资源,提高资源使用效率,灵活资源调度;从而在一个池化、抽象化、自动化的虚拟数据中心中根据用户的需要多租户形态的Hadoop集群,以支撑不同用户的需要。例如形成支撑分布式批量离线计算的Hadoop集群(MapReduce)、支撑分布式内存计算的Hadoop集群(Spark)、支撑分布式实时计算的Hadoop集群(Storm)以支撑不同运营、科研、管理的需要。资源弹性伸缩数据计算的能力得到提高应用自动部署在此平台中会存在采用不同软件平台和相应架构开发的不同应用系统,这样的话我们需要快速自动的部署,实现一定的devopsCONFIDENTIAL28方案传统方式对业务需求的响应速度缓慢应用、环境和更改需要更长等待时间、更多手动任务和更多手动配置测试生产基础架构服务交付数天–数周等待工作等待等待更改应用和更改交付数周–数月等待工作等待等待开发应用发布流程更改我们需要改变应用自动部署在此平台中会存在采用不同软件平台和相应架构开发的不同应用系统,这样的话我们需要快速自动的部署,实现一定的devopsCONFIDENTIAL29方案云应用自动部署:加快应用部署速度和标准化软件体系优化部署和更新流程利用预构建的组件跨环境和云重用应用模型应用蓝本组件组件组件组件避免手动配置以消除不一致、错误和返工通过为应用团队提供标准化应用/中间件/数据库快速获得效益提供复杂、集成的多层应用采用应用策略利用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑涂料工程皮卡租赁合同
- 药物研发学徒技能提升计划
- 贸易余款偿还协议
- 2022年大学能源动力专业大学物理下册月考试卷A卷-附解析
- 结直肠狭窄内镜治疗
- 垃圾问题与学校教育的整合与创新
- 2022年大学电子信息科学专业大学物理二期中考试试卷-含答案
- 2022年大学环境生态专业大学物理二期末考试试卷D卷-含答案
- 消化道疾病的护理常规
- 智能餐厅解决方案
- GB/T 44672-2024体外诊断医疗器械建立校准品和人体样品赋值计量溯源性的国际一致化方案的要求
- 新人教版七年级上册生物全册知识点(期末复习用)
- 2023乌鲁木齐法院书记员真题
- 金属切削原理与刀具夏云才课后参考答案
- 2024年江苏南通市如皋市有线如皋分公司招聘笔试参考题库含答案解析
- 记叙文阅读:小说-2023年中考语文复习练(江苏)(解析版)
- 提高生产流程效率加快产品交付速度
- 2023年高素质农民粮经专业结业试题
- 新三板知识测评答案
- 《会滚的汽车》ppt课件
- 注册物业管理师考试历年真题及答案
评论
0/150
提交评论