江西省医疗大数据平台技术规范 第四部分数据存储规范_第1页
江西省医疗大数据平台技术规范 第四部分数据存储规范_第2页
江西省医疗大数据平台技术规范 第四部分数据存储规范_第3页
江西省医疗大数据平台技术规范 第四部分数据存储规范_第4页
江西省医疗大数据平台技术规范 第四部分数据存储规范_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

DBXX/TXXX—XXXX

江西省医疗大数据平台技术规范第四部分:数据存储规范

1范围

本规范规定了医疗大数据平台中数据存储的术语、定义进行约束,包含了医疗大数据主题层模型存

储规范、开放表存储、对象存储、过程数据存储、结构化数据存储等技术要求。

本规范适用于医疗大数据平台的设计、开发、选型和实施,可作为医疗大数据平台建设时的评测依

据。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T18391.1—2009信息技术元数据注册系统(MDR)第1部分:框架

GB/T34960.5—2018信息技术服务治理第5部分:数据治理规范

GB/T35294-2017信息技术科学数据引用

GB/T35295-2017信息技术大数据术语

WS445.1-2014电子病历基本数据集第1部分:病历概要

WS445.2-2014电子病历基本数据集第2部分:门(急)诊病历

WS445.3-2014电子病历基本数据集第3部分:门(急)诊处方

WS445.4-2014电子病历基本数据集第4部分:检查检验记录

WS445.5-2014电子病历基本数据集第5部分:一般治疗处置记录

WS445.6-2014电子病历基本数据集第6部分:助产记录

WS445.7-2014电子病历基本数据集第7部分:护理操作记录

WS445.8-2014电子病历基本数据集第8部分:护理评估与计划

WS445.9-2014电子病历基本数据集第9部分:知情告知信息

WS445.10-2014电子病历基本数据集第10部分:住院病案首页

WS445.11-2014电子病历基本数据集第11部分:中医住院病案首页

WS445.12-2014电子病历基本数据集第12部分:入院记录

WS445.13-2014电子病历基本数据集第13部分:住院病程记录

WS445.14-2014电子病历基本数据集第14部分:住院医嘱

WS445.15-2014电子病历基本数据集第15部分:出院小结

WS445.16-2014电子病历基本数据集第16部分:转诊(院)记录

WS445.17-2014电子病历基本数据集第17部分:医疗机构信息

WS446-2014居民健康档案医学检验项目常用代码

WS/T447-2014基于电子病历的医院信息平台技术规范

WS/T448-2014基于居民健康档案的区域卫生信息平台技术规范

WS/T303-2009卫生信息数据元标准化规则

WS/T304-2009卫生信息数据模式描述指南

1

DBXX/TXXX—XXXX

WS/T305-2009卫生信息数据集元数据规范

WS/T306-2009卫生信息数据集分类与编码规则

3术语和定义

GB/T18391.1—2009、GB/T34960.5—2018、GB/T35294-2017、GB/T35295-2017、WS445、WS446、

WS447、WS448界定的以及下列术语和定义适用于本文件。

3.1

主题层存储

为实现数据解耦而设计的数据存储方式,根据数据之间的依赖性和业务关联,进行数据主题域划分,

降低使用时数据跨表查询复杂度。

3.2

结构化数据存储

面向海量分析型数据的存储方式,支持标准SQL接口,采用基于分布式计算的数据仓库技术,可以

实现数据的分布式存储和处理,以及大数据挖掘分析。

3.3

实时数据存储

面向实时性、海量的流式数据的存储方式,采用分布式流式处理技术,可以实现实时流式数据存储

和处理。

3.4

对象数据存储

面向医疗影像数据、文本文件、json对象、XML文件等对象数据的存储方式,采用分布式的、面向

列的、多维的NoSQL数据库系统,可以实现对像数据的快速检索和存储。

4缩略语

下列缩略语适用于本文件:

——TTL:TimeToLive(生存时间价值);

——MPP:MassivelyParallelProcessing(大规模并行处理技术);

——SDK:SoftwareDevelopmentKit(软件开发工具包);

——API:ApplicationProgrammingInterface(应用程序接口);

——ETL:Extract-Transform-Load(抽取、转换、加载);

——HDFS:HadoopDistributedFileSystem(分布式文件系统);

——Redis:RemoteDictionaryServer(远程字典服务);

——SQL:StructuredQueryLanguage(结构化查询语言)。

5数据存储规范

2

DBXX/TXXX—XXXX

5.1数据存储架构

由于医疗大数据平台需要存储的数据量大、类别多且复杂,在存储时应采用分层分域的存储架构,

降低数据之间的耦合性,应建立包含主题层、汇总层、应用层的数据存储架构。

主题层是在接口层采集的原始数据基础上进行主题划分,形成关联性强的主题域表,应包括但不限

于:

——病人信息;

——就诊信息;

——医嘱信息;

——费用;

——诊断;

——过敏;

——检查;

——检验;

——手术;

——护理;

——病案;

——病历文书;

——肿瘤;

——报告卡;

——体检;

——其他。

汇总层是在主题层基础上,根据不同数据使用需求,对不同粒度的数据进行一定汇总处理,提高数

据使用效率,便于后续使用。其设计应满足如下原则:

——应保障汇总数据的共用性;

——应能够提高数据使用效率;

——应与原始事实表维度保持一致;

应用层是在汇总层基础上,通过构建指标集、标签集、应用宽表等数据存储形式,以满足各类数据

应。其在医疗机构主要支撑建立科研大数据应用平台、人工智能应用平台、运营管理系统等基于大数据

的智慧应用。

5.2医疗大数据主题层数据表存储目录

5.2.1数据标准化

5.2.1.1原则

医疗数据中心中的医疗数据应遵循统一的数据标准并优先采用国家、卫生行业已经制定的相关数据

标准作为基准,对非标准数据进行转换处理。若没有相应的国家或卫生行业数据标准可以引用,应按照

国家卫生信息标准制定的有关要求完成数据标准制定工作。

5.2.1.2通用电子病历数据标准

对于医疗机构的主要业务断面和相关数据,应符合WS445-2014(所有部分)《电子病历基本数据

集》里的有关规定。

5.2.1.3未标准数据的标准化

3

DBXX/TXXX—XXXX

对于国家或者卫生行业尚未制定标准的数据,医疗大数据平台数据集应按照WS/T303-2009、WS/T

304-2009、WS/T305-2009、WS/T306-2009的要求形成标准化数据元,并按照附录A要求构建数据集

及标准化存储。

5.3结构化数据存储技术要求

结构化数据存储计算面向的是从结构化数据库采集的海量数据,主要应用于海量结构化数据分析,

应用时需满足以下技术要求:

——结构化数据存储应基于MPP架构实现分布式列式数据仓库;

——应提供标准的SQL接口,减少传统数据应用迁移成本,降低开发运维人员使用门槛;

——应提供准实时的数据插入,以满足用户对实时数据的实时交互式分析;

——应提供压缩存储,以有效节约存储成本,并基于分布式文件系统的多副本机制实现数据安全

存储;

——应提供基于多种编程语言(如python、R、Java等)编写的Map/Reduce程序或自定义函数的

上传接口,支持定制化数据处理需求;

——应支持多租户管理,便于将大数据平台计算存储资源进行合理划分,提高资源使用效率;

——应支持多种计算引擎(如HiveSQL、Spark算子、SparkSQL、Map/Reduce等计算引擎)。

5.4实时数据存储技术要求

实时数据存储主要应用于接收医疗生命体征监测仪器、物联网可穿戴设备采集的海量实时数据,由

于需要的数据吞吐能力、处理能力更高,传统数据库及处理方式难以满足需求,实时数据存储应基于当

前流行的开源大数据处理技术,实现分布式流数据处理服务,使其具有高可靠、高可用、高性能和动态

扩展的特性,以满足医疗大数据的存储要求,应用时需满足以下技术要求:

——应集成通信网关实现数据采集,并通过数据采集网关对接多种医疗/可穿戴监测设备,实现设

备海量数据的自动存取;

——应提供实时数据和历史数据的存储服务,两者均应采用分布式架构,以满足海量数据的存储;

——应通过分布式消息队列和分布式流式计算框架,以确保数据得到快速处理。

5.5对象数据存储技术要求

对象数据存储技术底层是基于分布式的、面向列的、多维的NoSQL数据库系统,它具备高容错性和

高可扩展性。传统的关系型数据库,如Oracle和MySQL等,如果数据记录在亿级别,则查询和写入的性

能都会呈指数级下降,所以更大的数据量级并不适用于传统数据库,而对象数据存储技术对于存储百亿、

千亿甚至更多的数据都不存在任何问题。应用时需满足以下技术要求:

——对象数据存储应提供海量、安全和高可靠的云端对象存储服务,以解决海量图片文件的存储

与检索问题;

——应支持多租户模式,为每个租户提供独立的底层表存储,租户之间应相互隔离;

——应提供基本的分类管理功能,每个租户应可创建若干个不同的Bucket,不同的Bucket存储不

同类型或用途的对象文件;

——每个Bucket中存储的Object数据对象,应以Object和Bucket的名称作为单行记录主键,

并以此作为检索条件;

——每个Bucket中应支持存储百亿级的Object;

——存储Object在纵向维度上支持的数据量级应能弹性扩展;

——用户应可通过调用API,在任何应用、任何时间及任何地点上传和下载图片数据,也可通过

Web控制台管理界面对数据进行管理;

4

DBXX/TXXX—XXXX

——存储在对象存储中的图片文件,应可直接通过图片链接方式进行分享;

——用户应可直接将图片链接嵌入至HTML页面,并作为页面的组成部分进行发布。

5.6数据存储安全技术要求

为保障大数据平台数据存储安全,应按照数据分级分类原则制定不同等级的安全策略,实施时需满

足以下技术要求:

——数据存储应支持多副本备份,保障数据存储安全;

——涉及数据分级分类的,宜按照GB∕T39725-2020信息安全技术健康医疗数据安全指南执行;

——涉及网络和系统安全的,宜按照GB/T22081-2016、GB/T22239-2019执行;

——涉及基础安全和数据服务安全的,宜按照GB/T35274-2017执行;

——涉及云计算安全的,宜按照GB/T31168执行;

——应建立数据存储安全应急处置方案,以应对数据存储突发情况,快速恢复备份数据;

——数据存储应按照最小权限原则管理,对各数据使用用户进行权限管理,降低数据泄露风险。

5.7数据存储管理要求

5.7.1数据存储管理包括数据的分类和标准的命名方法,数据的存储、数据的保密规范和数据的备份

要求等。

5.7.2管理要求应包括以下内容:

——应指定专人负责数据的管理,明确职责;安排专人负责涉密数据资源的传输、存储、共享和

使用;

——应对存储数据的设备及基础设施重点做好安全防护,包括落实数据存储设备的操作终端安全

管控措施及接入鉴权机制;

——应设置访问控制策略,定期实施安全风险评估,配置安全基线、部署必要的安全存储技术手

段等;

——应对不同安全等级的数据采用差异化安全存储;

——应根据数据备份制度和策略,按照操作规程进行系统和数据日常备份,在出现异常时根据备

份策略进行恢复操作;

——应根据维护计划定期进行数据资源目录、数据库系统维护;

——应加强数据备份介质的管理,对各类介质进行控制和保护;

——应根据所承载的数据和软件的重要程度对介质实行分类和标识,并实行存储环境专人管理。

5

DBXX/TXXX—XXXX

A

A

附录A

(规范性)

医疗大数据主题层数据表存储目录

表A.1HDR(HospitalDataRepository)表集合

业务域表名描述

organization机构信息

company公司信息

standard_system标准系统信息

system系统信息

patient_id_type病人标识类型表

standard_class基准分类表

code_domain代码域

code_system代码系统表

code_set通用代码集合

code_map通用代码对照表

department科室信息

dept_category科室分类表

mdm(主数据)employee员工信息

medical_group医疗组信息

medical_group_empl医疗组人员

drug药品字典

item项目字典表

order_item_class开单项目分类表

order_item_relationship开单项目关系表

diagnose诊断字典表

operation手术字典表

bed床位字典表

lis_item检验项目信息

lis_item_map检验项目对照表

mdm_map主数据对照表

6

DBXX/TXXX—XXXX

unit_conversion单位转换表

mdm_drug_property森亿药品属性表

mdm_drug_map药品标准化对照表

patient_master_info病人主信息

patient_identifier病人标识信息

patient(病人信息)

patient_id_relationship病人标识关系表

patient_base_info病人基本信息

visit_record就诊总表

outpatient_record门诊就诊记录

visit(就诊信息)inpat_record住院就诊记录

inpat_baby_info住院婴儿信息

inpat_shift_dept住院转科记录

outpat_recipe门诊处方

outpat_recipe_detail门诊处方明细

orders(医嘱信息)

inpat_drug_order住院用药医嘱

inpat_undrug_order住院非药品医嘱

outpat_fee门诊费用汇总表

outpat_fee_detail门诊费用明细表

fee(费用)

inpat_balance住院结算表

inpat_fee_detail住院费用明细表

diag(诊断)patient_diagnose病人诊断记录

allergy(过敏)patient_allergy病人过敏记录

radiology_report放射学报告

radiology_report_item放射学报告检查项目

ecg_report心电报告

ecg_result_detail心电报告结果明细

checks(检查)

ecg_report_item心电报告检查项目

endoscopy_report内窥镜报告

endoscopy_report_item内窥镜报告检查项目

ultrasound_report超声报告

7

DBXX/TXXX—XXXX

ultrasound_report_item超声报告检查项目

ultrasound_result_detail超声报告检查结果报告

pathology_report病理报告

pathology_report_item病理报告检查项目

other_report其他检查报告

other_report_item其他检查报告检查项目

lab_report检验报告

lab_report_result检验报告结果

microbe_report微生物报告

bacteria_result细菌结果

lab(检验)

antibiotic_result药敏结果

lab_result_show检验结果展示表

lis_report_item检验报告项目

microbe_report_item微生物报告项目

preoperative_visit_record术前访视记录

operation_record手术记录

operation_employee手术人员

operation_detail手术明细

operation_diagnose手术诊断明细

operation(手术)

operation_document手麻文书

operation_document_detail手术文书数据明细

anesthesia_record麻醉记录

operation_vital_sign手术体征记录

operation_event手术事件

vital_sign体征记录

nurse(护理)nurse_record_sheet护理记录单

nurse_data_record护理数据记录

case_base病案首页

cases(病案)

case_diagnose病案诊断表

8

DBXX/TXXX—XXXX

case_operation病案手术表

case_baby病案婴儿表

inpat_medical_record住院病历

nurse_record

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论