版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
DBXX/TXXX—XXXX
江西省医疗大数据平台技术规范第二部分:平台技术架构
1范围
本规范规定了医疗大数据平台技术架构的相关要求,包含医疗大数据平台建设的功能架构和技术架
构,规定了医疗大数据平台的顶层设计、建设内容、性能指标及服务能力的要求等内容。
本规范适用于医疗大数据平台总体架构的建立;医疗大数据平台建设过程的明确,医疗大数据平台
建设实施落地的指导;医疗大数据平台相关的软件或解决方案的研发、选型和评价。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T14396-2016疾病分类与代码
GB/T18391.1—2009信息技术元数据注册系统(MDR)第1部分:框架
GB/T34960.5—2018信息技术服务治理第5部分:数据治理规范
WS/T303—2009卫生信息数据元标准化规则
WS/T304—2009卫生信息数据模式描述指南
WS/T305—2009卫生信息数据集元数据规范
WS/T306—2009卫生信息数据集分类及编码规则
WS363-2011(所有部分)卫生信息数据元目录
WS364-2011(所有部分)卫生信息数据元值域代码
WS445-2014(所有部分)电子病历基本数据集
WS/T500—2016(所有部分)电子病历共享文档规范
《国家健康医疗大数据标准、安全和服务管理办法(试行)》(国卫规划发〔2018〕23号)
全国医院数据上报管理方案-医疗业务(试行)“国卫办规划函〔2019)380号”
全国医院数据上报管理方案-医疗数据字典(试行)“国卫办规划函〔2019〕380号”
全国医院数据上报管理方案-医疗业务(试行)“国卫办规划函〔2019)380号”
3术语和定义
GB/T18391.1—2009、GB/T34960.5—2018界定的以及下列术语和定义适用于本文件。
3.1
数据架构
数据要素、结构和接口等抽象及其相互关系的框架。
[GB/T34960.5—2018,定义3.5]
3.2
1
DBXX/TXXX—XXXX
医疗大数据
医疗大数据主要是指医生对患者诊疗和治疗过程中产生海量数据的集合,包括患者的基本数据、病
历数据、诊疗数据、医学影像数据、医学管理数据、经济数据、基因数据、医疗设备和智能可穿戴数据
等。
3.3
健康医疗大数据
健康医疗大数据涵盖人的全生命周期,既包括个人健康,又涉及医药服务、疾病防控、健康保障和
食品安全、养生保健等多方面数据的汇聚和聚合。
3.4
容器化
Docker容器是一个允许我们在资源隔离的过程中,运行应用程序和其依赖项的、轻量的、操作
系统级别的虚拟化技术。
3.5
软件定义存储
软件定义存储通过使用虚拟数据层对底层存储进行抽象化,这使得虚拟机、应用和存储基本单元能
够跨异构存储系统进行调配和管理。
3.6
基础设施即服务(IaaS)Infrastructureasaservice
提供给使用者的服务是对所有计算基础设施的利用,包括处理CPU、内存、存储、网络和其它基本
的计算资源,用户能够部署和运行任意软件,包括操作系统和应用程序。
3.7
平台即服务PaaSplatformasaservice
提供给使用者的服务是提供开发语言和工具(例如Java,python,.Net等)、中间件、数据库等
应用程序部署到云计算基础设施上去。
3.8
AI即服务AIasaservice
提供人工智能服务,就是直接通过平台就可以对AI神经网络模型,机器学习算法的测试、训练和
试验,以达到为应用所使用。
3.9
软件即服务softwareasaservice
提供给使用者运行在云计算基础设施上的应用程序,用户可以在各种设备上通过客户端界面访问,
如浏览器。消费者不需要管理或控制任何云计算基础设施,包括网络、服务器、操作系统、存储等。
2
DBXX/TXXX—XXXX
3.10
服务器虚拟化
服务器虚拟化是一种对计算资源的抽象,它在物理服务器的基础上构建多个相互独立的虚拟机,从
而将CPU、内存、I/O等服务器物理资源转化为一组统一管理,可灵活调度、动态分配的逻辑资源。
4缩略语
下列缩略语适用于本文件:
——IaaS:InfrastructureasaService(基础设施即服务);
——PaaS:Platform-as-a-Service(平台即服务);
——AIaS:AIas-a-Service(AI即服务);
——AIOps:ArtificialIntelligenceforITOperations(智能化运维);
——SaaS:Software-as-a-Service(软件即服务);
——KVM:Kernel-basedVirtualMachine(基于内核的虚拟机);
——MPP:MassivelyParallelProcessing(大规模并行处理技术);
——HDFS:HadoopDistributedFileSystem(分布式文件系统);
——CDR:临床数据中心;
——ODR:运营数据中心;
——RDR:科研数据中心。
5医疗大数据平台架构
5.1综述
本文件要求医疗大数据平台应支持结构化和非结构化数据、集中式和分布式数据的统一建模;支持
大数据清洗、脱敏的数据治理;支持以统一的数据标准对多源异构数据进行归一化处理,对医院海量的
非结构化数据进行整合治理,构建符合要求的统一的共享、利用的平台。
5.2总体架构要求
医疗大数据平台总体架构应包括四层架构,即数据源层、数据采集层、大数据湖(数据存储与治理)、
数据应用层,并应具有数据管理、任务调度、数据安全、数据质控等管理模块。总体架构见图1所示。
3
DBXX/TXXX—XXXX
图1医疗大数据平台总体架构图
5.3功能架构要求
本规范的医疗大数据平台架构包括四部分,分别是数据源层、数据采集层、大数据湖(数据存储与
治理)、数据应用层。
图2整体功能架构
5.3.1数据源层
数据源层包括与患者相关就诊及治疗数据,及部分费用经济数据。包含但不限于:
——应包括医院内部的患者诊疗数据、文本病历信息;
——应包括医院的物资、财务、人力资源等相关运营数据;
——应包括生物样本、影像、基因库等相关数据;
4
DBXX/TXXX—XXXX
——应包括医院物联网设备采集数据;
——应包括外部相关的医疗数据。
5.3.2数据采集层
数据采集层负责数据采集标准及处理流程,对数据进行采集入库,同时对采集数据进行加密
脱敏等安全处理和质量控制。
采集作业应实现包括不限于以下功能:
——数据采集管理:应实现对数据源进行合规管理,遵循最小化权限要求及安全管控原则;
——数据采集技术:应支持对不同数据源采用备份恢复、物化视图、ETL工具、Sqoop、消息队列
等不同方式进行数据采集;
——数据采集质控:应实现对不同类型数据进行采集任务数据质量监控,根据任务日志,数据一
致性、平衡性检查等方式保障采集任务稳定运行;
——数据采集安全:应按照相关数据安全政策法规要求制定数据采集任务,避免采集过程中数据
安全。
5.3.3大数据中心层
概述
大数据中心层主要包括数据湖(数据存储层)、数据治理层、数据仓库三层。主要采用基于分布式
数据库来管理非结构化及半结构化的数据,并对数据进行治理;同时利用MPP关系数据库对结构化数据
进行深度分析挖掘。
数据湖(数据存储层)
数据湖层负责将采集或治理后的数据按照不同来源、不同标准进行分类存储管理。要求包括不限于
以下:
——应采用分层的存储架构;
——应采用分布式存储架构;
——应支持结构化、非结构化、半结构化数据的存储;
——应采用相关安全技术。
数据治理层
数据治理层负责对采集汇聚的数据进行清洗加工处理,并做标准化整理。应实现包括不限于以下功
能:
——元数据管理功能;
——主数据管理功能;
——数据质量管理功能;
——数据资产管理功能;
——数据安全管理功能;
——数据标准化功能;
——数据结构化功能。
5.3.4数据应用层
数据应用库
5
DBXX/TXXX—XXXX
大数据中心层治理好的数据资源应根据不同的主题域、不同表结构、不同标准建立不同的数据资源
库。应实现包括不限于以下功能:
——CDR临床应用数据库;
——ODR运营应用数据库;
——RDR科研应用数据库。
有条件时推荐建设
——基因数据库;
——生物样本数据库;
——医学影像数据库。
数据应用库
数据应用层以高质量的大数据中心数据为基础,建设各种医疗大数据平台基础应用。具体应用包括
但不限于:
——智慧医疗:临床辅助诊断、知识库、单病种管理等
——智慧服务:智能预约、智能导诊等;
——智慧管理:运营决策分析、智慧后勤、综合调度等;
——医疗研究:多中心科研项目、队列研究、基因分析、医药研发等
——区域医疗:公共卫生、分级诊疗、医联体、远程医疗等;
——健康管理:慢病管理、健康照护、健康养老、保险等。
5.4技术架构要求
医疗大数据平台技术架构主要分五层六大部分,包括:硬件设施、IaaS层、Paas层、AIaas层、
Saas层。具体参加图3:
6
DBXX/TXXX—XXXX
图3系统技术架构
5.4.1硬件设施
硬件设施为技术架构的最底层,主要包括构成大数据平台底层的服务器、存储、网络等硬件
资源,具体配置应根据医院生成系统的数据量、医院病人总数、医院病例数及平台可持续性年数进行评
估规划。
从数据安全、应用等角度考虑,一个基础的大数据平台应至少包含以下硬件:
表1医疗大数据平台硬件配置推荐表
硬件类型数量用途
至少一台,根据医院数据情
应用数据服务器主要用于数据治理及应用服务
况确定
至少三台,根据医院数据情主要用于数据的分布式存储及分析
数据库服务器
况确定查询
万兆交换机至少一台,建议两台作为互备,同时提供内部网络连接
流量控制器建议一台监控流量、保证数据安全
拦截非法访问和恶意攻击,内部操作
堡垒机建议一台
的审计监控
7
DBXX/TXXX—XXXX
防火墙建议一台有效监控和保证内部网络安全
5.4.2IaaS层
IaaS层由高度可扩展和自动化的资源(包括CPU、内存和存储等)组成,对外提供相关计算资源服
务。具体要求包括但不限于:
——应通过虚拟化技术、容器化技术构成资源池;
——相同类型的的CPU要归入同一资源池或数据区;
——应具有自动发现、自动分配、按需使用、删除后自动归还能力;
——应支持资源平衡,统一管理功能。
5.4.3PaaS层
PaaS层应提供了一个软件中间层,包括提供集成的应用开发框架和环境,集成的PaaS底层技术能
力,提供标准的技术附件服务,数据库服务等;同时还应包括业务流程管理。具体能力包括但不限于:
——应采用微服务模式,支持敏捷开
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 华师大版初中科学熔化和凝固(28课件)
- 信息披露与企业形象管理制度
- 部编版五年级语文下册第一单元各类阅读真题(含小古文、非连续性文本等)名师解析连载
- 2024年杭州道路客运从业资格证模拟考试试题
- 2024年西宁道路运输客运从业资格证考试题库
- 2024年酒泉道路客运输从业资格证理论考题
- 2024年长沙道路运输客货从业资格证考试题库
- 2024年聊城道路客运输从业资格证考试真题保过
- 2024年七台河驾校考试客运从业资格证考试题库
- 2024年北京客运从业资格证考试答题模板
- 幼儿园游戏方案与案例-完整版PPT课件
- 幼儿教师礼仪修养(服饰篇)ppt课件
- 生产安全事故风险评估报告(参考模板)
- 广州某排洪渠工程施工组织设计
- 清华大学弹性力学冯西桥FXQChapter本构关系
- bev tg2cae054整车平顺性仿真分析
- 霍兰德自我探索量表
- 提高零售客户卷烟经营毛利率
- 第07050501导管内穿线和槽盒内敷线检验批质量验收记录
- 采购物资、外协产品质量检验规范
- 第10章 电磁波在波导中的传播
评论
0/150
提交评论