版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医疗数据中台基础平台需求说明一、项目概况“医院中台基础平台项目”旨在构建一个全面而可持续的数据治理和基础平台,以满足医院在数字化转型和长远发展中的战略需求。目前,随着医院医疗数据的逐步积累,数据管理和治理面临着巨大挑战。当前平台的数据存储与计算能力、数据集成能力、数据标准化能力、数据资产能力、数据服务能力等方面存在瓶颈,亟需一个更为先进和综合的解决方案,以更好地应对数据资产管理和服务的复杂性,实现全院级数据资产管理问题的解决。为响应国家对医疗健康数据管理和利用的政策,医院拟开展医院数据中台基础平台建设项目,强化医院数据源头质控能力,为未来医院及医疗集团的数据标准提供依据,提供可利用的数据资产,以加强健康医疗大数据创新应用与行业治理,培育健康医疗数据要素市场,激发数据要素价值,推动健康医疗大数据在临床研究、疾病预防、健康管理、辅助决策、药物研发、医疗保险、精准医疗、营养健康等方面产业化、规模化应用。二、服务需求明细序号采购计划编号服务需求名称服务需求明细(建设系统)数量单位预算金额(元)1医院医疗数据中台基础平台采购项目湖仓一体化建设1套2数据采集1套3数据资产管理1套4数据服务管理1套5数据安全管理1套6平台管理1套7数据治理1套8医疗数据中台建设指南编写与发布1套9配套硬件4套三、技术要求序号子系统一级模块详细功能点1湖仓一体化建设构建数据湖1、通过搭建数据湖的CDC\ETL等服务,将平台内所有的结构化、半结构化、结构化数据全部整合到一起,实现在不影响业务系统正常运行的情况下快速完成数据的接入,并且保障数据的一致性,提高数据传输的安全。22、数据湖集中存储原始结构化数据(如关系型数据库中的表),半结构化数据(如CSV、日志、XML、JSON),非结构化数据如文档、PDF(影像、图片除外),成为所有数据加工生产的统一出口。33、数据湖提供数据版本控制的功能,允许跟踪和管理数据的不同版本,有助于数据追溯、回滚和合并。44、基于基础数据湖的建设以及通用字段模型的设计,通过大数据平台的基础数据制备工作,形成的不同主题数据库。55、数据湖具备以下特性:61)增量数据处理:支持增量数据处理,包括数据的插入、更新和删除操作。72)ACID事务:提供ACID(原子性、一致性、隔离性、持久性)事务支持。83)支持多数据引擎:不仅适用于ApacheSpark,还可以与其他分布式计算引擎集成,如ApacheFlink。94)支持多格式:可以处理多种数据格式,包括Parquet、Avro等,使得它更加灵活,适应各种数据存储和处理需求。105)时间旅行(TimeTravel):支持时间旅行查询,可以查询数据在不同时间点的状态。116)SchemaEvolution:允许用户在不中断数据流的情况下进行模式演变。127)索引和查询性能优化:支持索引,可以加速数据的查询操作,提高查询性能。138)易用性和可伸缩性:具备易于使用和可伸缩的框架,适用于处理大规模数据集。149)支持横向汇集完整的数据,对所有业务信息系统的数据进行汇集,包括病历、诊断、医嘱、处方、检验、影像报告、病理报告、电生理报告、手术操作记录等,支持构建全院级的数据湖来存储历史数据备份,并实现所有数据在线访问。15构建数据仓库1、数据仓库,提供所有类型数据支持的数据集合,为前端查询和分析作为基础。16数据仓库须具备以下功能:效率高。数据仓库的分析数据可分为日、周、月、季、年等,其中,以日为周期的数据要求在24小时甚至12小时内,使医院能看到昨天的数据分析。172、极速SQL查询:配备向量化执行引擎,实现亚秒级的查询延时,每秒需可处理≥100亿行数据。具有大规模并行处理执行框架,支持星型模型和雪花模型,提供Join性能。183、需具有灵活的资源分配策略,每秒可支持≥1万以上的并发查询,从而高效支持数千用户同时进行数据分析。194、提供列式存储引擎,支持大规模数据的实时写入,支持在秒级内完成对业务指标的实时聚合。20湖仓存储(分布式存储)1、系统需采用分布式数据存储架构,符合大批量数据管理的要求。211)实现虚拟机可用性和可扩展性:采用超融合分布式计算技术,保证基础设施在进行扩展时其性能仍然保持不变。支持在集群扩展时,存储控制器可有效的扩展。222)实现虚拟的性能稳定可靠:保证每个节点的SSD磁盘并非有每个节点单独使用,而是在整个集群范围内作为一个整体使用,保证不会由于单个节点本地的SSD耗尽而导致其性能急剧下降。233)整个数据的存储规模,要支持历史所有临床相关的数据以及未来≥3年数据的存储,并且支持多节点的备份。244)平台具备数据备份功能,数据备份采用无代理虚拟机备份,通过备份设置每天对平台进行一次定时备份。255)数据备份平台提供多种数据恢复方式,支持即时虚机恢复、即时文件恢复、数据库恢复。26湖仓计算1、提供一个数据整合、标准化、结构化的支撑计算平台。基于Hadoop框架,对医院TB级海量数据做高效的分布式存储和计算,实现高并发、高可用和灵活扩容以及容灾备份机制。272、支持多种数据源数据计算:1)结构化数据:来自传统医疗信息系统,以关系数据库为主;2)非结构化数据:比如病历中的长文本等;3)流式数据:比如ICU生命体征监测、患者的体征变化等。283、主流计算引擎选择:采用主流计算引擎,如Spark和Flink,构建高并发、高可用性、容错机制完备、支持自动故障切换的计算环境。294、数据计算断点功能:引擎具备数据计算断点功能,确保在任务执行中的任何阶段都能保持数据的可用性和任务的容错性。305、日志审计支持:引擎支持日志审计功能,通过详细的日志记录能够快速地定位具体任务的运行情况,确保数据处理的可追溯性和安全性。316、动态资源调整:引擎允许在有任务执行的情况下灵活地分配资源,可以设定任务资源的上限和下限,以满足不同计算任务的需求。327、任务流批一体计算:引擎支持任务流批一体计算,即批处理和流处理任务使用相同的逻辑,避免维护多套代码。33数据采集多源异构数据采集1、项目数据采集主要采用数据同步备份和CDC\OGG、ETL等方式进行无创数据采集,在不进行任何接口改造,不影响现有生产系统运行的情况下,随时整合接入医院生产系统:HIS系统、EMR系统、移动护理、LIS系统、PACS系统、超声系统、内镜系统、心电系统、病理系统、手麻系统、重症系统、输血系统、体检系统、药房管理、静配中心系统、急诊分诊系统、院感系统、传染病报卡、生物样本库等临床系统的历史数据的全量采集;且随时可以整合新的数据源进入。342、支持结构化、半结构化和非结构化数据的采集处理,支持接入不同医院、不同厂商、不同业务系的数据来源采集数据;支持的数据库包括MySQL、PostgreSQL、MongoDB、Oracle、SQLServer、Cache、Sybase、TiDb、达梦、goldenDB等。353、系统支持相关的临床信息和生物样本信息的集成;能够根据不同的临床信息和样本信息,组合查询条件,筛选出需要研究的病例;可以用来组合查询的信息包括但不限于:诊断、用药、检查检验指标、影像报告、手术和麻醉信息、ICU重症信息、电子病历和病案首页,生物样本类型,样本存放位置,样本采集时间,样本剩余储藏量。36历史全量数据采集1、采用基于Hadoop的组件,封装数据采集界面,并内置多种医疗行业特有的处理逻辑,方便实施人员通过图形化界面进行数据采集和转换。372、将医院各业务系统的历史数据进行抽取,按照统一的数据标准存储在hive仓库及hbase数据库中,支持半结构化和非结构化数据的采集处理。383、采用hadoop的大数据组件,实现多台服务器的分布并发执行。394、数据中心对原始业务数据进行原样备份合并,将历史数据库的数据按照原始结构进行数据合并,保留一份原始业务数据的全量备份,方便发现问题重复数据清洗,方便以后数据核对和校验,保证数据中心数据和原始数据的一致性。405、数据源管理,定义原始业务系统备份库的连接方式,支持任何一款符合JDBC规范的数据库,如Oracle、DB2、MySQL以及微软SQLServer等关系型数据库或Cache对象数据库。416、利用源表导入功能,进行数据导入,依赖于HBase的No-Schema特性,无需提前定义数据表结构,自动适应任何原始业务系统表。支持以下四种接口方式进行数据导入。表或视图方式、存储过程方式、直接读取对象、文本导出方式。42增量数据采集1、全量抽取之后,对上次抽取过的数据源表中新增的或被修改的数据进行增量数据采集。构建基于CDC(数据变更捕获)、ETL等技术的数据增量采集,既可以实现业务系统的读写分离,又可以实现数据实时备份。432、增量数据模型构建是基于医院的全量数据模型,创建增量的数据模型与全量的数据模型保持一致,方便新增数据快速采集到原有数据平台中。44实时数据采集1、支持数据的实时采集,采用CDC等技术,实时地捕获和传递数据源中的变更,保持数据的实时性和及时性。452、通过将CDC等技术捕获的数据变更应用到实时计算引擎或数据湖中,支持实时的数据分析和洞察。463、通过实时集成和分析,确保数据湖及时接收并处理实时生成的数据。在采集阶段进行数据处理,以确保数据湖中的数据质量和一致性。47采集全流程可视化1、任务目录灵活管理:用户可创建多级任务目录,在指定目录下创建任务,可调整所属目录;482、支持采集任务向导模式:通过可视化交互界面配置任务,用户可自行分类管理采集任务。用户可自行分类管理采集任务。任务分为父任务和子任务,一个父任务流程可配置采集多张源端表,向导模式(全量)和向导模式(增量)一个子任务对应采集一个源端表,高级向导模式(全量)一个子任务对应采集一个源端表或一个源端表的自动拆分子任务之一。对于已创建的任务,可以额外追加新的源端表。493、支持便捷地查找、浏览所需的源端表列表,包括分页展示、模糊搜索、多种条件排序等能力,且支持千、万数量级下源端表的流畅展示、浏览;504、对于医院HIS、LIS、RIS/PACS、手术麻醉、病理、心电、重症监护(ICU/CCU)等系统中所需要的各个数据表,使用适配和抽取工具获取其源端表结构,并在数据中台的ODS数据库中批量创建目标表。515、支持字段类型映射,将源端数据库的字段类型与目标端数据库字段类型进行对照,不同的数据库数据类型在采集时转换成相应的数据结构。支持字段类型映射的新建、编辑和删除。526、支持字段模板配置,定义数据采集字段。支持在统一界面维护字段的模板,可新增和修改,可维护字段模板的数据类型,选择字段的默认值,灵活配置实际采集任务。536、过滤条件及试运行:支持三种过滤场景下条件的综合配置:本表内筛选SQL、跨表间筛选SQL、指定条件的白名单等,白名单支持上传Excel文件导入多字段(如患者身份证号、就诊号等)、批量化的过滤条件。基于筛选SQL+白名单合并后的筛选条件,可试运行查看前十条数据、以及符合条件的数据总量。547、任务调度和资源分配:支持配置手动执行、定时执行等调度策略的多种场景。支持任务内存参数自动动态调整,自动合理分配内存硬件资源,提升批量任务、大小任务掺杂等情况下的整体执行效率。558、按需灵活追加表:支持全量、增量任务的追加表操作,基于现有的任务灵活追加新的源端表的采集子任务,减少一个数据源下对应很多零散无序的采集任务的问题。569、支持每天定时监测采集任务中源端表的结构变化,如新增、减少字段,字段类型变化等,在任务列表中进行提示。发现结构变化的话,则发送消息至消息中心。5710、大表任务自动拆分:源端数据库有强制性的连接时间限制(如Oracle),表内数据量较大时会导致采集时间超时而失败,支持将耗时很长的或大数据量的采集任务自动拆分为多个小任务分步执行,支持三种自动拆分策略:自定义日期范围、自定义ID范围(适用于有自增ID的数据表)、自定义拆分条件SQL。5811、采集任务SQL脚本、dataXjson内容格式化展示。5912、支持按不同版本发布采集任务,提高在后续创建新任务复用性,并支持直接配置定时任务实现手动执行、定时任务等调度策略的多任务场景。6013、支持多种数据源的灵活配置、支持数据库连通性测试,支持对采集目标模型灵活添加时间戳字段,与增量任务形成完整闭环。6114、支持对全量、增量(自增主键、时间戳、表达式等方式)任务的一站式配置,提高配置效率,降低配置出错率。62数据源配置1、具备多种数据源的配置(分为平台数据源、业务数据源)、支持数据库连通性测试,可以进行数据源的添加、编辑以及删除等操作。632、在数据源配置页面中,输入数据源信息,可以保存新增的数据源信息(数据源名称,数据源类型,数据层级,IP主机名,端口,用户名,密码,数据库名,jdbc链接参数,描述等信息),按照数据源配置执行测试连接操作。643、支持选择一个数据源,输入需修改的数据源信息,可以保存修改的数据源信息,按照数据源配置执行测试连接操作。654、支持选择一个或多个数据源,删除所选数据源。665、数据源配置的数据库密码可加密存储。676、数据抽取配置支持下载功能。687、支持选择待删除的数据抽取配置项,二次确认后所选数据抽取配置项被删除。698、通过灵活的数据源界面化配置,支持业务数据源发生变更时,切换数据源获取入口,不影响下游数据应用,实现独立服务的解耦。70数据资产管理数据建模(模型管理)1、各医院信息化系统来自不同厂商、不同版本,每个系统的架构、数据结构、数据标准可能不同,为方便医院大数据统一处理各业务系统的数据,需构建一套统一的数据模型与标准。712、支持灵活创建模型并在各生产节点上调用,支持对采集原始数据直接读取模型、自定义创建模型两种模型创建和管理方式,支持模型与数据标准的打通。723、系统支持在ODS层自动创建原始数据模型,无需人工操作即可获得原始数据表结构等信息。734、系统支持在DWD数据层自定义创建数据模型,在模型下自定义创建若干个表,支持定义表中包含的字段以及字段的英文名、中文名、数据类型、时间格式、数据长度、是否枚举、值域、主键、外键、外键关联的表名和字段名、空值约束、唯一性约束等属性。745、数据建模包括新建模型、新建模型版本、新建表、新建字段、模型发布功能。756、支持源表-目标表字段映射界面化配置,支持多人在线协同设计数据模型。767、支持数据模型引用数据标准和值域码表,支持指定数据模型一键发布为物理表。778、数据模型关联与配置:数据模型具有与数据标准的关联,支持转换、清洗配置等功能。789、可以查看已创建的数据模型列表,包含模型名称、数据层级、更新时间、发布状态、历史版本数量、更新记录等重要信息,可以修改和删除已有模型。7910、多种建模方式支持:支持基于物理表逆向创建数据模型,支持通过导入Excel、CSV等格式文件构创建数据模型,支持维表+事实表关联进行维度建模。8011、支持版本化管理,支持按需创建新版本,查看现有的版本列表,可导出现有的模型版本信息。8112、支持复制某个版本的内容,然后编辑修改形成新版本。8213、支持修改、删除某个版本的内容,并且可追溯查看更新记录。8314、支持将某个版本的模型发布到指定项目,则该项目下可以使用该模板进行建库建表、数据转模等工作,已发布的模型可以取消发布。8415、层级化管理与环境发布:在不同数据层级中,用户可以进行模型的新建、编辑、删除、版本管理等操作。8516、具有界面化的模型转换功能,实现对原始数据到标准化数据的映射关系配置。86数据标准管理1、实现基于医院平台各医疗系统、医院各系统术语的语义级别的统一,将医院内重要的术语等作为主数据进行维护管理;并提供开放式访问接口和更新通知接口,简化数据交互,降低系统之间的耦合度,建立平台级的术语(字典)标准,满足医院数据统一标准的需要。872、数据标准定义参照卫健委以及国际标准如ICD9/10、医院标准等,建立代码、数据元的分类标准,依据本项目的业务和数据规范要求,制定详细的代码标准和数据元分类标准,为数据的存储、访问、整合提供一致性保障。883、平台内预置业内标准,包括但不限于疾病诊断、手术操作、药品项目、检查项目、检验项目、卫生材料项目等各类行业标准字典、目录、值域码表等。894、平台能将病历中一些重要字段(比如诊断、症状、用药等)进行术语化、标准化映射,并给出其对应的医学术语详情,并可显示对应的术语库信息。905、数据元标准给数据质控提供邮箱、联系电话、身份证、护照等通用规则字典正则表达式的维护方式,建立统一标准规范,以供数据质控直接调用进行数据规范性校验。916、平台能将自由文本中的同义词或不标准表述进行准确识别,并进行标准化,术语化映射。927、支持数据标准的可视化映射配置、查询。938、提供对字典类型及字典项进行新增、修改、删除及查询等功能,并支持对字典类型进行分类管理。949、针对各类医学术语可查看标准化情况,支持下钻展示某个类型或科室下的所有原始词、标化词、涉及科室、原始词数量、原始词占比等信息。9510、支持查看没有进行标准化的原始词,包括原始词、涉及科室、原始词数量、原始词占比等信息。9611、数据元标准:建立平台级的术语(字典)标准,以满足系统数据集成需要。其中包括:1)术语/字典维护:用于术语/字典的维护功能。包括术语/字典查询、浏览、增加、编辑、删除、修改等功能。2)术语/字典审批、启用流程:用于某个术语/字典中的项目增加或者变更后,可以通过此功能审批后进行发布操作。3)术语/字典发布、订阅与数据同步:当系统发布更新术语/字典时,通知订阅了该字典的各业务系统,同时提供批量的数据更新同步功能,使得已订阅的业务系统能够更新其本地保存的术语内容。9712、支持数据元内容展示,包括内部标识符、数据元标识符、数据元名称、定义、数据元值类型、表示格式、数据元允许值、更新时间。9813、支持新建数据元,可单独输入数据元,也可使用excel导入数据元。支持新建、编辑、发布数据元和数据元版本管理。9914、数据元校验标准提供校验数据功能。提供校验标准新建、编辑、删除功能。10015、值域标准:值域映射是建立非规范值和值域之间的映射关系。主要功能有新建值域映射、编辑、删除功能。值域标准提供新建、编辑、发布、删除、版本管理的功能,支持单独输入值域或excel导入。10116、命名标准:命名标准可根据模型层级建立不同层级的命名规则。模型的类型维护也在命名标准中。数据平台中的所有数据都会被划分到某个数据层级中,便于数据在应用过程中合理调用和更高效的数据加工处理、更快速的异常数据问题排查;1)支持按不同的业务场景灵活的自定义数据模型层级,如ODS、DWD等;2)支持对不同的数据模型层级,灵活设定命名规则;如模型类型-业务域-厂商-自定义命名;3)输入命名标准名称、模型类型和库命名规则,完成命名标准的创建。命名标准构建发布后,供数据建模调用,形成完整的数据标准体系;10217、支持构建交叉映射配置值域标准,将医院不同业务系统数据映射成标准统一的值;值域映射修改会同步进行日志记录,确保数据加工流程的可以溯源。103元数据管理1、支持对从各信息系统采集的数据进行元数据自动提取,与之前提取的版本进行自动比对,可查看历次元数据变更历史;1042、支持自动提取各个数仓层下已加工治理的数据库表的元数据信息;1053、支持查看元数据的不同版本变更信息;1064、支持对元数据不同版本间的差异对比;1075、支持与用户权限的打通,确保元数据的数据安全。108数据血缘图谱1、支持数据来源追溯,平台提供了完整的表级和字段级数据血缘图谱,其内容覆盖完整的数据生命周期,记录多层数据间产生的链路关系。1092、支持表与表之间的关联,还原原本数据表之间的关系,如患者表与就诊表、就诊表与处方表、处方主表与处方明细表,表间应该通过患者号、就诊号、处方号等进行关联。1103、支持血缘关系中节点详情的层层递进查看、快速跳转查看。1114、表级数据血缘图谱:展示数仓中各个表之间的数据血缘关系。1121)支持查看最后一次生产任务指明的直接上游表和直接下游表的血缘关系,按照生产的上游到下游的顺序确定箭头的指向。1132)支持展开该表的更多一级的上游或下游。1143)支持查看完整的血缘图谱,展示完整的血缘关系,最上游为ODS层的模型建表或者某个临时表,最下游为某个数仓层的模型建表或者某个临时表。1154)数据血缘关系图谱实时生成、实时展示,保持与生产任务脚本的变化同步。1165)血缘关系图中包含模型建表、临时表(非模型创建的表)以及对应的已删除的表。1176)表血缘关系中包含模型建表和临时表的详细信息,包括数据库名称、数据库类型、数仓层级、类型、表英文名、表中文名、应用场景、业务域等。1187)支持左右、上下滑动查看图谱内容,方便快速定位感兴趣的表及其关联关系。1195、字段级数据血缘图谱:展示数仓中各个表中字段级的数据血缘关系。支持全链路字段数据血缘展示,支持从数据源、数据贴源层、标准数据层、数据加工处理到数据应用的全链路血缘关系采集和展示。1201)查看该字段的最后一次生产任务指明的直接上游表字段和直接下游表字段的血缘关系,按照生产的上游到下游的顺序确定箭头的指向。1212)如有更多的上游或下游,支持展开查看该表的更多一级的上游或下游。1223)支持查看完整的血缘图谱,展示完整的血缘关系,最上游为ODS层的模型建表或者某个临时表的字段,最下游为某个数仓层的模型建表或者某个临时表的字段。1234)字段数据血缘关系图谱实时生成、实时展示,保持与生产任务脚本的变化同步。1245)血缘关系图中包含模型建表、临时表(非模型创建的表)以及对应的已删除的表的字段。1256)模型建表的血缘卡片中包含表所在的数据库名称、数据库类型、数仓层级,以及表的类型、表英文名、表中文名、应用场景、业务域、是否已删除,临时表的血缘卡片中包含表所在的数据库名称、数据库类型、数仓层级,表的类型(表或视图)、表英文名、表中文名、是否已删除。1267)权限控制:根据权限可查看授权字段的血缘关系,默认仅查看该字段的最后一次生产任务所指明的直接上游表字段和直接下游表字段的血缘关系。1278)同一个物理表在血缘图谱中只出现一次,确保图谱的清晰度和易读性。1289)支持全链路血缘关系的展示:展示从数据源、数据贴源层、标准数据层、数据加工处理到数据应用的全链路血缘关系。129资产总览资产总览分为API资产、库表数据资产、数据模型资产三类资产信息。1、API资产:实时更新,包括数据API、租户总数、API申请总次数、API申请通过总次数、API请求量和API请求成功率等指标。1302、库表数据资产:(1)更新频率为T+1更新。131(2)展示数据库总数、物理表总数、数据总行数、数据容量等指标。132(3)库表数据资产概况,分为数据库、覆盖业务域、物理表、数据行数和数据容量五个指标。133(4)展示每个应用场景在每个数仓层级下每个库中物理表的分布情况。1343数据模型资产:包含各个数仓层级下模型数量,及其覆盖的业务域分类和标签总数、包含的逻辑表总数和字段总数。135数据资产概览1、包含ODS、DWD层库表数据资产的概览信息。1362、ODS层统计概览:(1)包括数据接入和采集情况。数据源数量和总数根据来源厂商、来源系统和数据源类型进行统计。数据库总数、物理表总数、数据总容量和昨日新增容量。容量达到一定量级时,以GB、TB为单位进行统计。137(2)包含指定数据库的统计信息:包括数据库每日新增数据行数和每日新增容量、数据采集的数据源类型分布情况、业务系统数据采集分布、厂商-业务系统数据采集分布、物理表应用场景分布TOP10、物理表业务域分布TOP10、表数据容量分布TOP10、数据调用监控TOP10。138(3)支持点击下钻带参跳转库表数据资产目录页面,以便用户查看更详细的信息。1393、DWD层统计概览:统计DWD层级下的库表数据资产信息.140(1)包括数据库总数、物理表总数、数据总行数、昨日新增行数、数据总容量和昨日新增容量。141(2)包括数据新增趋势、物理表应用场景分布TOP10、物理表业务域分布TOP10、表数据容量分布TOP10、表数据量分布TOP10、数据调用监控TOP10统计图表信息。142数据资产地图1、通过关键词模糊匹配搜索全部物理表和字段,搜索范围包括经模型所建的库表和表下的全部字段。1432、支持搜索物理表的英文名、中文名、表描述以及字段的英文名、中文名。1443、支持对结果进行筛选,包括数仓层级、数据库、表应用场景和表业务域。1454、支持查看资产的详情、血缘、质量等详细信息。1465、搜索结果包括物理表和字段的命中数量、英文名、中文名、最后更新时间、应用场景、业务域、表描述、所在数据库和数据库类型等信息,支持查看到应的物理表详情页。1476、支持用户自定义数据资产类别、管理员等信息。1487、支持可视化界面展示:提供全局数据资产的质量监控情况,支持提供界面化的质量探查结果页面。1498、提供我的收藏:用户可以收藏常用资产,方便快速查看收藏资产的内容。1509、全局资产检索:支持通过表名称、字段名称、备注信息、业务元数据、管理元数据等关键词进行数据资产检索。151数据资产目录1、支持数据资源的全生命周期可视化管理,形成面向院内、外统一的数据资产目录。支持全局资产质量、不同类别资产的数量统计、使用热度及标准覆盖等情况统计。1522、提供数据ODS层\DWD层完整资产的展示与管理功能,可展示系统采集数据总行数等详细信息。平台采用多层级展示,支持用户对资产中的数据库、数据表、数据字段下钻详细情况查看。1533、支持以下数据库表资产目录信息查看:1541)数据库信息包括数据库名称、类型、建库时间和数据最后更新时间,以及模型和版本。1552)物理表筛选条件包括每个应用场景及其物理表数量、可见每个分类下的每个业务域及其物理表数量。1563)库表统计概览信息包括覆盖的业务域分类数和标签总数、物理表总数、字段总数、数据量和数据容量。1574)物理表列表展示物理表英文名称、中文名称、应用场景、业务域类别和标签,展示关联数据模型的信息,可模糊搜索表名。1585)表结构信息包括序号、字段名、数据类型、描述、应用场景、业务域标签、数据安全等级等。1596)支持查看字段的数据血缘和数据预览信息;预览查看该表的前十条数据,展示序号、字段英文名、中文名、数据内容。根据用户权限进行数据预览,无权限的列展示(无权限)占位符。1607)支持查看每个表的数据增长趋势:每日新增数据量即行数。1618)支持跳转查看指定物理表的数据预览、表数据血缘、字段数据血缘等详情信息。1624、支持查看物理表基本信息:包括英文名、字段数量、数据量、数据更新时间、描述、存储格式、类型、所有者用户名、存储路径等。展示该物理表所属的数仓层级和数据库,以及引用的模型的名称、表英文名、表中文名、应用场景和业务域。163数据服务管理统一API管理平台支持对外统一的数据访问接口和模型,平台提供API接口对外开放,同时也提供二次开发界面,针对不同的使用需求也可以提供定制化的视图,以满足不同第三方系统对平台中数据的调阅使用。1641、以对外后台服务的方式被第三方应用程序调用,支持特定患者的病例检索和数据导出。1652、对外统一数据服务支持采用脚本或后台服务的方式,支持基于数据平台开放的统一查询语法进行数据查询,定义较为复杂的查询和病例筛选条件,并查看查询结果的字段。1663、API资源目录:支持查看已发布的API列表,可以查看APIID、名称、版本、类目、累计调用量、更新时间、创建人信息。可以通过API类目、标签筛选API,通过ID、名称搜索API。支持申请使用指定的API,提供租户名称、API调用时限、申请说明信息进行申请。支持下载接口文档,查看了解接口的使用信息。1674、API配置:支持查看已配置的API列表,包括APIID、名称、描述、版本、提交状态、发布状态、API类型、数据源类型、数据源名称、最近24h调用次数、创建时间信息,支持按最近24h调用次数、创建时间正序或倒序排序。支持新增生成API和注册API,前者是基于数据查询创建新的API,后者是将已有的API在平台内注册、管理,两者均可以在平台内提交、发布,授权给指定租户调用。1685、API生成:数据源配置,支持向导模式和自定义SQL模式创建,向导模式支持设置单表内字段为输入或输出参数,自定义SQL模式支持多表关联、复杂查询和聚合函数等复杂查询和计算。1691)向导模式:设置基本属性,输入租户名称、所属类目、API英文名称、API中文名称、描述、APIPath、API标签、生命周期、协议、请求方式、返回类型、超时时间、单用户每秒调用次数上限、安全组信息。支持GET、POST两种请求方式,安全组下可选预设的白名单或黑名单的租户信息。1702)设置参数:支持选择指定的数据源、数据表。可选择表内字段添加为输入参数,支持修改参数名称、操作符号、是否必填、说明信息,支持删除不需要的参数。支持设置是否返回结果分页、返回结果携带分页参数、返回结果中携带requestheader参数。1716、API注册:注册已有的API至数据服务,进行统一管理、发布和对接。1727、API测试:设置输入参数和分页参数的测试值,测试已发布的API,在服务管理页面进行测试,需要先发布API。1738、API发布:在数据服务中生成和注册的API,需要发布至API网关才能对外提供服务。数据服务与API网关产品相关连通,支持一键发布API至API网关。1749、API网关:API网关提供权限管理、流量控制、访问控制、计量等服务。数据服务与API网关相关连通,支持一键发布API至API网关。17510、API调用:使用API网关控制台提供的多语言调用示例来测试调用,可以自行编辑HTTP(S)请求来调用API。17611、API安全:展示设置的API安全组列表,包括安全组名称、类型、IP地址、关联API数量、最近修改人、最近修改时间信息,关联API数量即使用了该安全组的API数量。可以查看、编辑或者删除指定安全组。可以新建安全组,选择安全组类型、租户,输入安全组名称、IP地址信息,可以将指定的租户、IP地址设置为可访问API的白名单,或者不可访问API的黑名单。17712、API监控:展示已配置的API告警配置列表,包括告警名称、触发方式、告警方式、创建人、所属租户、状态信息,可以新建、、编辑、关闭删除指定配置。可查看触发生产的API告警记录,包括API名称、API中文名、API创建人、告警配置名称、告警创建时间、触发方式、告警方式、所属租户、告警接收人信息。17813、我的认证和申请:可以查看我的租户的名称、APPkey、APPsecret信息,供后续API申请使用。可以查看我发出的API申请列表,包括APIID、API名称、API描述、API版本、授权状态、最近24h调用次数、累计调用次数、订阅时间、审批人信息。可以停用指定API,下载接口文档。17914、API授权:对已发布API进行下线、授权和变更协议等。展示收到的API使用申请列表,包括申请人、APIID、API名称、状态、申请说明、申请时间、审批人信息,可以通过或者拒绝申请。已通过申请的可以取消授权、查看审批说明等详情。可以通过申请人、APIID、API名称、状态搜索或者筛选申请列表。18015、API统计:提供可视化图表及统计数据,统计展示近24小时内的累计调用次数、失败率、调用的API总数,以及调用次数、失败率时间分布,近24小时内的调用租户top10、API调用量top10。统计展示近24小时内的错误类型分布和API失败率TOP10。181通过统一API平台的API生成、配置、目录、注册、编排、授权、限流、隔离、监控告警、统计等一系列服务,实现平台内各系统之间数据的灵活安全交换。182数据自定义同步管理1、平台支持向导模式、脚本模式两种配置方式,满足不同用户的配置需求,进行高效便捷的数据同步任务配置。1832、任务管理:已完成配置的任务展示在数据同步任务列表内,用户可对所有已配置任务进行增删改查、上线、运行等操作。1843、任务执行情况:展示运行中的数据同步任务的执行情况,用户可通过搜索定位目标任务,并查看详情、日志、代码等相关信息。支持进行任务终止运行、重新运行等操作,以确保任务的有效执行和管理。1854、任务运行进度:已运行的任务可预览任务运行进度相关信息,包括同步成功条数、同步失败条数、目标表数据预览等。1865、支持对数据源端、目标端、同步范围、开发模式、冲突处理策略等进行配置,实现异构数据库之间的数据同步。187数据资产结构化查询1、平台提供交互性强的可视化数据探查界面。用户可通过选择要查询的目标字段及设置字段过滤条件,完成一个完整的数据探查条件的配置。系统将自动将此语句解析成为程序语言并完成后台查询,从而返回查询结果。1882、平台支持SQL查询方式:提供SQL查询编辑器,支持SQL语句的灵活编辑;在构建SQL语句的过程中,可以查看相应数据结构;查询任务提交后,可预览查询结果样例数据。1893、平台支持基于Doris的即席查询/数据资产结构化搜索、结果数据导出。1904、历史的查询将以查询日志的形态保存在,以便于用户进行后续调用。用户可对自身账户下的查询记录进行删除操作。191数据安全管理数据加密1、提供多种加密算法的管理,根据医疗机构要求,提供可逆、不可逆的加密算法,平台提供多种加密算法的管理,以满足医疗机构的不同需求,包括但不限于国密SM4算法、SHA-256算法等。1922、加密任务:通过界面化的操作配置流程,实现加密任务的创建和管理,做到字段级的加密。193加解密算法新增、编辑、删除1、可对算法进行关键词搜索,可对算法进行配置(加密、解密)。算法设置包含算法名称、加解密函数、配置方式、应用厂商、操作人、修改时间、启用状态等。1942、可对算法新增、编辑、删除。1953、在算法配置中,用户可以设置算法的各项参数,包括UDF加解密函数的定义、配置方式的选择等。1964、支持用户在系统中根据需要启用或禁用某个算法。197数据脱敏1、遵循《GB/T39725-2020信息安全技术健康医疗数据安全指南》,并借鉴HIPAA法案,对个人的隐私数据进行数据脱敏处理。1982、针对敏感数据,数据库的每一字段都有脱敏规则,脱敏规则的设置和更改,只有被授权的员工,才有权限进行操作。1993、平台支持对患者数据中的姓名、出生日期、地址、身份证、军官证、电话号码等患者隐私信息、可唯一识别出患者的信息做脱敏。2004、支持以下功能:1)脱敏规则:具备多种脱敏规则的制定,例如全覆盖、部分覆盖、字符替换、算法等。并可对脱敏规则名称进行模糊搜索。可新增、编辑、删除脱敏规则。2012)脱敏配置:可实现在界面中制定脱敏字段,实现不同的脱敏规则。可展示脱敏示例,样例数据与脱敏结果两行显示。2023)脱敏任务:通过界面化的操作和配置流程,实现脱敏任务的自动化调度。2035、实现敏感隐私数据的可靠保护,同时依然保持其它数据的格式和属性,保证其可识别性和可用性。204数据访问控制1、对数据的访问权限做了全面的控制,不同用户角色、不同业务系统运维人员或系统管理员的权限不同,登录平台看到的业务系统的数据亦不相同。2052、具备成体系的数据访问控制管理机制。例如:单独用户群组、角色及权限管理;权限细化至每个人每个字段。2063、用户无法自行注册,必须由医院管理员开通;平台必须先登录再使用;密码强度必须为大小写字母加数字的组合;要求在医院内网使用。207监控审计平台服务的所有服务器均部署在运维审计系统之后,用户的访问或操作,都必须先经过运维审计系统,运维审计系统对所有的行为进行实时全镜像记录和监控,在操作记录的镜像日志中部署实时监控和审计服务,任何可疑操作一旦发生,会立即产生告警消息,任何不当行为会被立即发现或后续审计取证。208安全任务管理1、可对所有安全任务进行列表信息的展示,可根据任务名称关键词搜索查询,可新建、编辑、上线、下线、运行、删除任务,可对大任务及子任务进行详情查看。2091)新建任务时,可选择全量任务,全量任务可配置“加密”、“解密”、“脱敏”。2102)增量任务,支持配置调度策略,增量类型分三种:时间戳、表达式,同之前版本,选择后进行调度配置,支持手动执行、定时执行和其他。2113)编辑任务:对于全量任务,用户可以编辑字段规则配置,以确保任务执行时按照预期进行数据操作。对于增量任务,用户不仅可以编辑字段规则配置,还可以进行调度配置,灵活定义任务的执行时间和频率。212平台管理用户权限1、支持新增和编辑、删除用户,新增用户支持输入登录账号、用户姓名、用户昵称、所属项目、用户邮箱、联系方式、所属角色、所属租户、用户有效期、用户编号。2131)用户管理平台提供医疗机构账户、用户账户、角色、以及数据资源访问权限的管理。支持数据使用在线审批流程,支持授权、驳回及权限回收操作。2142)用户管理包含新建用户、冻结用户、启动用户、编辑用户、删除用户、重置密码、查看用户详情操作。可以根据账号、用户姓名、用户昵称、账号状态、联系方式、用户邮箱来查询用户。2152、租户管理支持平台设置外部平台调用接口的有效性鉴权。2163、角色管理:管理员可以新建角色、编辑角色、删除角色、权限配置、查看角色详情操作。支持根据角色名称、角色别名来查询角色。2171)支持通过数据资产授权,为所选账号分配数据资产角色。2182)支持库表数据权限设置:选择库表数据,根据应用场景,表业务域,数仓层级等筛选目标库表,选择库表数据。2193、菜单管理:支持对平台的菜单树进行添加、删除、编辑操作,菜单层级可以支持多层嵌套;也可以对页面按钮进行添加、删除操作。22
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年大红描金粉蜡笺项目投资可行性研究分析报告
- 2024-2026年中国智慧金融市场供需现状及投资战略研究报告
- 一年级数学(上)计算题专项练习汇编
- 2025年中国数控火花割机行业发展监测及市场发展潜力预测报告
- 2023-2028年中国栀子花行业市场深度研究及投资战略咨询报告
- 2025年湿法革助剂项目可行性研究报告
- 2024-2030年中国血液透析粉液行业市场发展监测及投资方向研究报告
- 2021-2026年中国电暖气行业市场调研及行业投资策略研究报告
- 2024正餐服务市场前景及投资研究报告
- 2025年化纤毛纺纺纱项目可行性研究报告
- 人教版(2025新版)七年级下册英语:寒假课内预习重点知识默写练习
- 2024年食品行业员工劳动合同标准文本
- 全屋整装售后保修合同模板
- 高中生物学科学推理能力测试
- GB/T 44423-2024近红外脑功能康复评估设备通用要求
- 2024-2030年中国减肥行业市场发展分析及发展趋势与投资研究报告
- 2024年公安部直属事业单位招聘笔试参考题库附带答案详解
- 临沂正祥建材有限公司牛心官庄铁矿矿山地质环境保护与土地复垦方案
- 六年级上册数学应用题练习100题及答案
- 死亡报告年终分析报告
- 棋牌室禁止赌博警示语
评论
0/150
提交评论