版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
DBXX/TXXX—XXXX
江西省医疗大数据平台技术规范第四部分:数据存储规范
1范围
本规范规定了医疗大数据平台中数据存储的术语、定义进行约束,包含了医疗大数据主题层模型存
储规范、开放表存储、对象存储、过程数据存储、结构化数据存储等技术要求。
本规范适用于医疗大数据平台的设计、开发、选型和实施,可作为医疗大数据平台建设时的评测依
据。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T18391.1—2009信息技术元数据注册系统(MDR)第1部分:框架
GB/T34960.5—2018信息技术服务治理第5部分:数据治理规范
GB/T35294-2017信息技术科学数据引用
GB/T35295-2017信息技术大数据术语
WS445.1-2014电子病历基本数据集第1部分:病历概要
WS445.2-2014电子病历基本数据集第2部分:门(急)诊病历
WS445.3-2014电子病历基本数据集第3部分:门(急)诊处方
WS445.4-2014电子病历基本数据集第4部分:检查检验记录
WS445.5-2014电子病历基本数据集第5部分:一般治疗处置记录
WS445.6-2014电子病历基本数据集第6部分:助产记录
WS445.7-2014电子病历基本数据集第7部分:护理操作记录
WS445.8-2014电子病历基本数据集第8部分:护理评估与计划
WS445.9-2014电子病历基本数据集第9部分:知情告知信息
WS445.10-2014电子病历基本数据集第10部分:住院病案首页
WS445.11-2014电子病历基本数据集第11部分:中医住院病案首页
WS445.12-2014电子病历基本数据集第12部分:入院记录
WS445.13-2014电子病历基本数据集第13部分:住院病程记录
WS445.14-2014电子病历基本数据集第14部分:住院医嘱
WS445.15-2014电子病历基本数据集第15部分:出院小结
WS445.16-2014电子病历基本数据集第16部分:转诊(院)记录
WS445.17-2014电子病历基本数据集第17部分:医疗机构信息
WS446-2014居民健康档案医学检验项目常用代码
WS/T447-2014基于电子病历的医院信息平台技术规范
WS/T448-2014基于居民健康档案的区域卫生信息平台技术规范
WS/T303-2009卫生信息数据元标准化规则
WS/T304-2009卫生信息数据模式描述指南
1
DBXX/TXXX—XXXX
WS/T305-2009卫生信息数据集元数据规范
WS/T306-2009卫生信息数据集分类与编码规则
3术语和定义
GB/T18391.1—2009、GB/T34960.5—2018、GB/T35294-2017、GB/T35295-2017、WS445、WS446、
WS447、WS448界定的以及下列术语和定义适用于本文件。
3.1
主题层存储
为实现数据解耦而设计的数据存储方式,根据数据之间的依赖性和业务关联,进行数据主题域划分,
降低使用时数据跨表查询复杂度。
3.2
结构化数据存储
面向海量分析型数据的存储方式,支持标准SQL接口,采用基于分布式计算的数据仓库技术,可以
实现数据的分布式存储和处理,以及大数据挖掘分析。
3.3
实时数据存储
面向实时性、海量的流式数据的存储方式,采用分布式流式处理技术,可以实现实时流式数据存储
和处理。
3.4
对象数据存储
面向医疗影像数据、文本文件、json对象、XML文件等对象数据的存储方式,采用分布式的、面向
列的、多维的NoSQL数据库系统,可以实现对像数据的快速检索和存储。
4缩略语
下列缩略语适用于本文件:
——TTL:TimeToLive(生存时间价值);
——MPP:MassivelyParallelProcessing(大规模并行处理技术);
——SDK:SoftwareDevelopmentKit(软件开发工具包);
——API:ApplicationProgrammingInterface(应用程序接口);
——ETL:Extract-Transform-Load(抽取、转换、加载);
——HDFS:HadoopDistributedFileSystem(分布式文件系统);
——Redis:RemoteDictionaryServer(远程字典服务);
——SQL:StructuredQueryLanguage(结构化查询语言)。
5数据存储规范
2
DBXX/TXXX—XXXX
5.1数据存储架构
由于医疗大数据平台需要存储的数据量大、类别多且复杂,在存储时应采用分层分域的存储架构,
降低数据之间的耦合性,应建立包含主题层、汇总层、应用层的数据存储架构。
主题层是在接口层采集的原始数据基础上进行主题划分,形成关联性强的主题域表,应包括但不限
于:
——病人信息;
——就诊信息;
——医嘱信息;
——费用;
——诊断;
——过敏;
——检查;
——检验;
——手术;
——护理;
——病案;
——病历文书;
——肿瘤;
——报告卡;
——体检;
——其他。
汇总层是在主题层基础上,根据不同数据使用需求,对不同粒度的数据进行一定汇总处理,提高数
据使用效率,便于后续使用。其设计应满足如下原则:
——应保障汇总数据的共用性;
——应能够提高数据使用效率;
——应与原始事实表维度保持一致;
应用层是在汇总层基础上,通过构建指标集、标签集、应用宽表等数据存储形式,以满足各类数据
应。其在医疗机构主要支撑建立科研大数据应用平台、人工智能应用平台、运营管理系统等基于大数据
的智慧应用。
5.2医疗大数据主题层数据表存储目录
5.2.1数据标准化
5.2.1.1原则
医疗数据中心中的医疗数据应遵循统一的数据标准并优先采用国家、卫生行业已经制定的相关数据
标准作为基准,对非标准数据进行转换处理。若没有相应的国家或卫生行业数据标准可以引用,应按照
国家卫生信息标准制定的有关要求完成数据标准制定工作。
5.2.1.2通用电子病历数据标准
对于医疗机构的主要业务断面和相关数据,应符合WS445-2014(所有部分)《电子病历基本数据
集》里的有关规定。
5.2.1.3未标准数据的标准化
3
DBXX/TXXX—XXXX
对于国家或者卫生行业尚未制定标准的数据,医疗大数据平台数据集应按照WS/T303-2009、WS/T
304-2009、WS/T305-2009、WS/T306-2009的要求形成标准化数据元,并按照附录A要求构建数据集
及标准化存储。
5.3结构化数据存储技术要求
结构化数据存储计算面向的是从结构化数据库采集的海量数据,主要应用于海量结构化数据分析,
应用时需满足以下技术要求:
——结构化数据存储应基于MPP架构实现分布式列式数据仓库;
——应提供标准的SQL接口,减少传统数据应用迁移成本,降低开发运维人员使用门槛;
——应提供准实时的数据插入,以满足用户对实时数据的实时交互式分析;
——应提供压缩存储,以有效节约存储成本,并基于分布式文件系统的多副本机制实现数据安全
存储;
——应提供基于多种编程语言(如python、R、Java等)编写的Map/Reduce程序或自定义函数的
上传接口,支持定制化数据处理需求;
——应支持多租户管理,便于将大数据平台计算存储资源进行合理划分,提高资源使用效率;
——应支持多种计算引擎(如HiveSQL、Spark算子、SparkSQL、Map/Reduce等计算引擎)。
5.4实时数据存储技术要求
实时数据存储主要应用于接收医疗生命体征监测仪器、物联网可穿戴设备采集的海量实时数据,由
于需要的数据吞吐能力、处理能力更高,传统数据库及处理方式难以满足需求,实时数据存储应基于当
前流行的开源大数据处理技术,实现分布式流数据处理服务,使其具有高可靠、高可用、高性能和动态
扩展的特性,以满足医疗大数据的存储要求,应用时需满足以下技术要求:
——应集成通信网关实现数据采集,并通过数据采集网关对接多种医疗/可穿戴监测设备,实现设
备海量数据的自动存取;
——应提供实时数据和历史数据的存储服务,两者均应采用分布式架构,以满足海量数据的存储;
——应通过分布式消息队列和分布式流式计算框架,以确保数据得到快速处理。
5.5对象数据存储技术要求
对象数据存储技术底层是基于分布式的、面向列的、多维的NoSQL数据库系统,它具备高容错性和
高可扩展性。传统的关系型数据库,如Oracle和MySQL等,如果数据记录在亿级别,则查询和写入的性
能都会呈指数级下降,所以更大的数据量级并不适用于传统数据库,而对象数据存储技术对于存储百亿、
千亿甚至更多的数据都不存在任何问题。应用时需满足以下技术要求:
——对象数据存储应提供海量、安全和高可靠的云端对象存储服务,以解决海量图片文件的存储
与检索问题;
——应支持多租户模式,为每个租户提供独立的底层表存储,租户之间应相互隔离;
——应提供基本的分类管理功能,每个租户应可创建若干个不同的Bucket,不同的Bucket存储不
同类型或用途的对象文件;
——每个Bucket中存储的Object数据对象,应以Object和Bucket的名称作为单行记录主键,
并以此作为检索条件;
——每个Bucket中应支持存储百亿级的Object;
——存储Object在纵向维度上支持的数据量级应能弹性扩展;
——用户应可通过调用API,在任何应用、任何时间及任何地点上传和下载图片数据,也可通过
Web控制台管理界面对数据进行管理;
4
DBXX/TXXX—XXXX
——存储在对象存储中的图片文件,应可直接通过图片链接方式进行分享;
——用户应可直接将图片链接嵌入至HTML页面,并作为页面的组成部分进行发布。
5.6数据存储安全技术要求
为保障大数据平台数据存储安全,应按照数据分级分类原则制定不同等级的安全策略,实施时需满
足以下技术要求:
——数据存储应支持多副本备份,保障数据存储安全;
——涉及数据分级分类的,宜按照GB∕T39725-2020信息安全技术健康医疗数据安全指南执行;
——涉及网络和系统安全的,宜按照GB/T22081-2016、GB/T22239-2019执行;
——涉及基础安全和数据服务安全的,宜按照GB/T35274-2017执行;
——涉及云计算安全的,宜按照GB/T31168执行;
——应建立数据存储安全应急处置方案,以应对数据存储突发情况,快速恢复备份数据;
——数据存储应按照最小权限原则管理,对各数据使用用户进行权限管理,降低数据泄露风险。
5.7数据存储管理要求
5.7.1数据存储管理包括数据的分类和标准的命名方法,数据的存储、数据的保密规范和数据的备份
要求等。
5.7.2管理要求应包括以下内容:
——应指定专人负责数据的管理,明确职责;安排专人负责涉密数据资源的传输、存储、共享和
使用;
——应对存储数据的设备及基础设施重点做好安全防护,包括落实数据存储设备的操作终端安全
管控措施及接入鉴权机制;
——应设置访问控制策略,定期实施安全风险评估,配置安全基线、部署必要的安全存储技术手
段等;
——应对不同安全等级的数据采用差异化安全存储;
——应根据数据备份制度和策略,按照操作规程进行系统和数据日常备份,在出现异常时根据备
份策略进行恢复操作;
——应根据维护计划定期进行数据资源目录、数据库系统维护;
——应加强数据备份介质的管理,对各类介质进行控制和保护;
——应根据所承载的数据和软件的重要程度对介质实行分类和标识,并实行存储环境专人管理。
5
DBXX/TXXX—XXXX
A
A
附录A
(规范性)
医疗大数据主题层数据表存储目录
表A.1HDR(HospitalDataRepository)表集合
业务域表名描述
organization机构信息
company公司信息
standard_system标准系统信息
system系统信息
patient_id_type病人标识类型表
standard_class基准分类表
code_domain代码域
code_system代码系统表
code_set通用代码集合
code_map通用代码对照表
department科室信息
dept_category科室分类表
mdm(主数据)employee员工信息
medical_group医疗组信息
medical_group_empl医疗组人员
drug药品字典
item项目字典表
order_item_class开单项目分类表
order_item_relationship开单项目关系表
diagnose诊断字典表
operation手术字典表
bed床位字典表
lis_item检验项目信息
lis_item_map检验项目对照表
mdm_map主数据对照表
6
DBXX/TXXX—XXXX
unit_conversion单位转换表
mdm_drug_property森亿药品属性表
mdm_drug_map药品标准化对照表
patient_master_info病人主信息
patient_identifier病人标识信息
patient(病人信息)
patient_id_relationship病人标识关系表
patient_base_info病人基本信息
visit_record就诊总表
outpatient_record门诊就诊记录
visit(就诊信息)inpat_record住院就诊记录
inpat_baby_info住院婴儿信息
inpat_shift_dept住院转科记录
outpat_recipe门诊处方
outpat_recipe_detail门诊处方明细
orders(医嘱信息)
inpat_drug_order住院用药医嘱
inpat_undrug_order住院非药品医嘱
outpat_fee门诊费用汇总表
outpat_fee_detail门诊费用明细表
fee(费用)
inpat_balance住院结算表
inpat_fee_detail住院费用明细表
diag(诊断)patient_diagnose病人诊断记录
allergy(过敏)patient_allergy病人过敏记录
radiology_report放射学报告
radiology_report_item放射学报告检查项目
ecg_report心电报告
ecg_result_detail心电报告结果明细
checks(检查)
ecg_report_item心电报告检查项目
endoscopy_report内窥镜报告
endoscopy_report_item内窥镜报告检查项目
ultrasound_report超声报告
7
DBXX/TXXX—XXXX
ultrasound_report_item超声报告检查项目
ultrasound_result_detail超声报告检查结果报告
pathology_report病理报告
pathology_report_item病理报告检查项目
other_report其他检查报告
other_report_item其他检查报告检查项目
lab_report检验报告
lab_report_result检验报告结果
microbe_report微生物报告
bacteria_result细菌结果
lab(检验)
antibiotic_result药敏结果
lab_result_show检验结果展示表
lis_report_item检验报告项目
microbe_report_item微生物报告项目
preoperative_visit_record术前访视记录
operation_record手术记录
operation_employee手术人员
operation_detail手术明细
operation_diagnose手术诊断明细
operation(手术)
operation_document手麻文书
operation_document_detail手术文书数据明细
anesthesia_record麻醉记录
operation_vital_sign手术体征记录
operation_event手术事件
vital_sign体征记录
nurse(护理)nurse_record_sheet护理记录单
nurse_data_record护理数据记录
case_base病案首页
cases(病案)
case_diagnose病案诊断表
8
DBXX/TXXX—XXXX
case_operation病案手术表
case_baby病案婴儿表
inpat_medical_record住院病历
nurse_record
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 虚拟现实广告的跨媒体传播-洞察分析
- 纤维素生物质化学转化-洞察分析
- 初二期末综合评价总结(6篇)
- 天然气合成甲醇-洞察分析
- 元宇宙对时装设计影响分析-洞察分析
- 匠心筑梦技能报国三分钟演讲稿范文(10篇)
- 办公自动化技术的推广与应用研究报告
- 办公空间走向可持续的展馆模式
- 以科技为驱动的家庭财富增长路径探索
- 煤矿爆破员劳动合同三篇
- 《中国心力衰竭诊断和治疗指南(2024)》解读
- 中医烤灯的应用与护理
- 变频控制柜知识讲座
- 2024年3月河北定向选调生面试及参考答案全套
- 智能建造专业职业规划
- 2024届浦东新区初三英语期末练习卷及答案
- 地下室坡道施工方案样本
- 保安报价方案
- 四年级下册运算率计算题100道
- 《跨境电商应用英语1》课程标准
- 合规专员工作总结
评论
0/150
提交评论