《医疗科研大数据平台技术指南 第2部分:平台技术架构》_第1页
《医疗科研大数据平台技术指南 第2部分:平台技术架构》_第2页
《医疗科研大数据平台技术指南 第2部分:平台技术架构》_第3页
《医疗科研大数据平台技术指南 第2部分:平台技术架构》_第4页
《医疗科研大数据平台技术指南 第2部分:平台技术架构》_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1医疗大数据平台技术指南第2部分:平台技术架构本文件规定了医疗大数据平台技术架构的相关要求,包含医疗大数据平台建设的功能架构和技术架构,规定了医疗大数据平台的顶层设计、建设内容、性能指标及服务能力的要求等内容。本文件适用于医疗大数据平台总体架构的建立;医疗大数据平台建设过程的明确,医疗大数据平台建设实施落地的指导;医疗大数据平台相关的软件或解决方案的研发、选型和评价。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T18391.1信息技术元数据注册系统(MDR)第1部分:框架GB/T34960.5信息技术服务治理第5部分:数据治理规范GB/T35295信息技术大数据术语3术语和定义GB/T18391.1、GB/T35295、GB/T34960.5界定的以及下列术语和定义适用于本文件。3.1容器式虚拟化Containerizedvirtualization大数据环境下的一种虚拟化基本形式,按此种形式,在本地裸机上运行操作系统,管理程序功能嵌入操作系统中,应用在内部各个容器中运行,控制和限制对操作系统和物理机器资源的访问。3.2软件定义存储Softwaredefinedstorage利用软件来确定存储器的动态层级分配的一种存储管理技术。[GB/T35295,术语和定义2.1.60]3.3服务器虚拟化Servervirtualization服务器虚拟化是一种对计算资源的抽象,它在物理服务器的基础上构建多个相互独立的虚拟机,从而将CPU、内存、I/O等服务器物理资源转化为一组统一管理,可灵活调度、动态分配的逻辑资源。23.4基础设施即服务(IaaS)Infrastructureasaservice提供给使用者的服务是对所有计算基础设施的利用,包括处理CPU、内存、存储、网络和其它基本的计算资源,用户能够部署和运行任意软件,包括操作系统和应用程序。3.5平台即服务PaaSplatformasaservice提供给使用者的服务是提供开发语言和工具(例如Java,python,.Net等)、中间件、数据库等应用程序部署到云计算基础设施上去。3.6AI即服务AIasaservice提供人工智能服务,就是直接通过平台就可以对AI神经网络模型,机器学习算法的测试、训练和试验,以达到为应用所使用。3.7软件即服务softwareasaservice提供给使用者运行在云计算基础设施上的应用程序,用户可以在各种设备上通过客户端界面访问,如浏览器。消费者不需要管理或控制任何云计算基础设施,包括网络、服务器、操作系统、存储等。4缩略语下列缩略语适用于本文件:HIS:医院信息系统(HospitalInformationSystem);LIS:实验室信息管理系统(LaboratoryInformationManagementSystemRIS:放射信息系统(RadiologyInformationSystem);EMR:电子病历系统(ElectronicMedicalRecord);PACS:影像归档和通信系统(PictureArchivingandCommunicationSystemIaaS:基础设施即服务(InfrastructureasaService);PaaS:平台即服务(Platform-as-a-ServiceAIaS:人工智能即服务(AIas-a-ServiceAIOps:智能化运维(ArtificialIntelligenceforITOperationsSaaS:软件即服务(Software-as-a-Service);KVM:基于内核的虚拟机(Kernel-basedVirtualMachineCPU:中央处理器(centralprocessingunit);GPU:图形处理器(graphicsprocessingunit);RAM:随机存取存储器(RandomAccessMemoryMPP:大规模并行处理技术(MassivelyParallelProcessingHDFS:分布式文件系统(HadoopDistributedFileSystem);CDR:临床数据中心(ClinicalDataRepository);ODR:运营数据中心(OperateDataRepository);3RDR:科研数据中心(ResearchDataRepository);5医疗大数据平台技术架构5.1综述本文件要求医疗大数据平台应支持结构化和非结构化数据、集中式和分布式数据的统一建模;支持大数据清洗、脱敏的数据治理;支持以统一的数据标准对多源异构数据进行归一化处理,对医院海量的非结构化数据进行整合治理,构建符合要求的统一、高性能的共享、利用的平台。5.2总体架构要求医疗大数据平台总体架构应包括五层架构,即数据源层、数据采集层、数据存储层、数据治理层、数据应用层,并应建立医疗数据标准规范管理体系、安全认证体系。总体架构见图1所示。图1医疗大数据平台总体架构图6功能架构要求6.1数据源层数据源层负责完成管理及维护平台对接的源系统,便于梳理数据来源以及后期运维。数据源层应实现包含但不限于:——宜支持对接医院内部医疗业务系统、运营管理系统;——宜支持对接生物样本、影像、基因库等相关数据;——宜支持对接医院物联网设备采集数据;——宜支持对接医院外部相关的医疗健康数据;——宜实现数据源持久化管理;——宜实现数据链接状态监控。46.2数据采集层数据采集层负责数据采集标准及处理流程,对数据进行采集入库,同时对采集数据进行加密脱敏等安全处理和质量控制。采集作业宜实现包括不限于以下:——数据采集管理:宜实现对数据源进行合规管理,遵循最小化权限要求及安全管控原则;——数据采集技术:宜支持对不同数据源采用备份恢复、物化视图、ETL工具、Sqoop、消息队列等不同方式进行数据采集;——数据采集质控:宜实现对不同类型数据进行采集任务数据质量监控,根据任务日志,数据一致性、平衡性检查等方式保障采集任务稳定运行;——数据采集整合:宜支持可编程式数据采集整合,对特定数据在采集过程中进行有效整合;——数据采集安全:宜按照相关数据安全政策法规要求制定数据采集任务,避免采集过程中数据安全。6.3数据存储层数据湖层负责将采集、治理后的数据按照不同来源、不同标准进行分类存储管理。要求包括不限于——宜采用分层分域的存储方式,实现对不同数据层级不同域的数据进行解耦;——宜根据实际需要选择存储架构,包括分布式、集中式存储架构;——宜支持结构化、非结构化、半结构化数据的存储;——宜采用相关数据存储安全技术,建立数据安全防护和管理制度。6.4数据治理层数据治理层负责对采集汇聚的数据进行清洗加工处理,并做标准化整理。宜实现包括不限于以下功——元数据管理功能;——主数据管理功能;——数据质量管理功能;——数据资产管理功能;——数据安全管理功能;——数据标准化功能;——数据结构化功能。6.5数据应用层6.5.1数据资源将大数据中心层治理好的数据资源根据不同标准建立不同的数据资源库,以更好满足数据应用需要。宜实现包括不限于以下功能:——CDR临床应用数据库;——ODR运营应用数据库;——RDR科研应用数据库。6.5.2数据应用数据应用库以高质量的大数据中心数据为基础,建设各种医疗大数据平台智慧应用。具体应用包括但不限于:5——智慧医疗:临床辅助诊断、知识库、单病种管理等;——智慧管理:运营决策分析、智慧后勤、数据驾驶舱等;——医学研究:队列研究、药物临床试验、影像组学、生物组学等;——健康管理:慢病管理、健康照护、健康养老、保险等。7硬件及服务架构要求医疗大数据平台硬件及服务架构主要分五层六大部分,包括:硬件设施、IaaS层、Paas层、AIaas层、Saas层。7.1硬件设施7.1.1硬件设施为技术架构的最底层,主要包括构成大数据平台底层的服务器、存储、网络等硬件资源,具体配置应根据医院生成系统的数据量、医院病人总数、医院病例数及平台可持续性年数进行评估规划。7.1.2从数据安全、应用等角度考虑,大数据平台宜包含以下硬件:表1医疗大数据平台硬件配置推荐表硬件类型用途应用数据服务器主要用于数据治理及应用服务,实现双机热备,避免业务中断问题数据库服务器主要用于数据的存储及分析查询,采用分布式架构万兆交换机作为互备,同时提供内部网络连接流量控制器监控流量、保证数据安全堡垒机拦截非法访问和恶意攻击,内部操作的审计监控防火墙有效监控审计访问、记录网络使用的详细信息、提高内部网络的安全性,降低网络风险IaaS层由高度可扩展和自动化的资源(包括CPU、内存和存储等)组成,对外提供相关计算资源服务。具体要求包括但不限于:——宜通过虚拟化技术、容器化技术构成资源池;——相同类型的的CPU要归入同一资源池或数据区;——宜具有自动发现、自动分配、按需使用、删除后自动归还能力;——宜支持资源平衡,统一管理功能。7.1.4PaaS层6PaaS层宜提供了一个软件中间层,包括提供集成的应用开发框架和环境,集成的PaaS底层技术能力,提供标准的技术附件服务,数据库服务等;同时还应包括业务流程管理。具体能力包括但不限于:——宜采用微服务模式,支持敏捷开发框架;——宜提供标准化组件及统一的数据访问接口——宜支持多租户及细粒度资源隔离;——宜支持多类型数据存储,形成异构、池化、可弹性扩展的数据库及服务;——宜支持多类型的中间件,形成异构、池化、可弹性扩展的中间件及服务;——宜支持资源、组件、服务及应用的统一监控及测量。7.1.5AIaaS层AIaaS层中的人工智能在医疗健康领域中的应用包括虚拟助理、医学影像、药物挖掘、生物技术、医院管理、健康管理等。具体能力包括但不限于:——宜支持使用资源的动态伸缩;——宜支持多租户及资源隔离;——宜支持对资源的监控;——宜支持多机调度优化、性能优化功能;——宜采用相关人工智能技术(如自然语言处理、计算机视觉、知识图谱、自动推理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论