专病数据模块及数据库建设需求_第1页
专病数据模块及数据库建设需求_第2页
专病数据模块及数据库建设需求_第3页
专病数据模块及数据库建设需求_第4页
专病数据模块及数据库建设需求_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专病数据模块及数据库建设需求1、项目背景及目标目前专病筛查手段复杂,评估手段和标准不统一,使用工具及标准不统一,医务人员主观判断比重较大,不同医疗机构水平不齐,疾病特征数据管理混乱,专病数据采集手段比较落后,导致不同地区以及不同机构对疾病的诊治很难实现资源共享、互联互通。因此,关注专病临床数据及标准建设,编制省级精神障碍、睡眠-觉醒障碍专科数据库建设规范(或技术方案、建设指南),制定统一标准化的数据集和数据结构标准,建立专病数据库建设模版,并在全省推广使用势在必行也迫在眉睫。系统需要能够整合医院内部临床信息系统,使用本体技术、自然语言处理,结合信息安全技术,整合专科内的数据到规范化的科研临床数据库中。专科专病的数据多种多样,急需建立专病数据模型,通过自然语言处理,数据仓库的建立,数据清洗,建立一套规范化、体系化的数据结构,为数据共享、互联互通奠定坚实的基础。在专病标准数据集、规范化数据库建设之上,能够做可视化描述性分析、队列分析以及高级分析,并可通过可视化的方式查看研究分析结果,极大提高专病科研效率,为专病科研管理服务。本项目4个建设目标如下:1.1建设2套专病数据集标准围绕精神障碍、睡眠-觉醒障碍2个专病制定专病数据集、数据结构标准。形成全省卫生健康行业专病专科数据集、数据结构标准,形成全省统一标准,能够在全省各地推广应用。1.2建设2套关键评估指标集标准基于专病数据集,结合2个专病的诊断与治疗相关诊疗指南以及专家共识系统性梳理,提取各类评估指标,并对评估指标进行分类(包括诊断定性类指标、共病类指标、严重程度类指标、病理生理学机制类指标、亚型分类指标、疗效指标等),形成专病关键指标集。1.3建设2个专病数据库围绕精神障碍、睡眠-觉醒障碍2个专病,实现专病数据动态采集、科研服务和安全可控,编制省级专病专科数据库建设规范和指南,为省内互联互通提供基础,为各地各单位建设2个专病数据库提供规范指引。1.4助力医院专病科研效率和质量提升高质量专病数据可以支撑面向专病统计分析、诊疗分析、治疗效果分析等的科研工作,可在平台建立特定患者队列,并支撑科研项目研究管理,极大提高科研效率和质量。2、系统功能需求系统本期建设模块如下:序号内容需求参数1基本要求系统设计安全可靠,使用B/S架构建设,具有多种安全权限控制,能保证业务的连续性和安全性,方便系统维护升级。系统支持主流操作系统,符合要求的信创技术路线。系统支持高可用架构,支持分布式数据库等方式。基础架构支持数据可扩展,随着数据增长架构应该要支持可扩展性,以及保证扩展后保证数据性能、数据时效响应等方面不会下降。应用软件至少满足50以上在线用户、20以上并发用户、单页面响应速度小于3秒的性能指标。2数据集标准围绕精神障碍、睡眠-觉醒障碍2个专病制定专病数据集、数据结构标准。形成全省卫生健康行业专病专科数据集、数据结构标准,形成全省统一标准,能够在全省各地推广应用。基于专病数据集,结合2个专病的诊断与治疗相关诊疗指南以及专家共识系统性梳理,提取各类评估指标,并对评估指标进行分类(包括诊断定性类指标、共病类指标、严重程度类指标、病理生理学机制类指标、亚型分类指标、疗效指标等),形成专病关键指标集。3专病数据治理(需处理最少近3年历史就诊数据,并作为科研平台技术基础支撑后续新增的其他病种)。3.1OMOP库本项目要求参考国家标准、OHDSI等国际标准进行数据模型建设。本项目需支持OHDSIOMOP国际通用数据模型进行数据治理和规范存储,以及未来多中心科研需求。专病数据模型需支持拓展,系统需支持用户自定义录入类型数据元,并支持设定其数据类型,允许值,来源业务域、来源字段、关键词等属性;同时用户也可从已有的数值类型数据元创建计算类型数据元,支持选择多个变量,基于四则运算开展计算公式编辑操作,支持从基础的大数据中心到OMOP库的数据映射。支持根据建设科室的实际临床科研课题需求、科室特殊数据采集对接需求,结合所提供的精神类疾病标准模型或数据集,完成具有医院自身诊疗特色的个性化专病科研数据模型的梳理与构建,支持OMOP(通用数据模型)数据库的构建,可以实际用于国际多中心研究的参与。支持OHDSI开源分析工具的使用。提供基于OMOP的临床科研培训。3.2数据采集平台支持与医院信息化系统进行集成,最少能够采集以下系统中的专病数据:医疗机构信息系统(HIS)实验室系统(LIS)放射信息系统心电信息系统电子病历系统(EMR)病案管理系统心理测评系统3.3数据清洗和质控针对入库数据进行数据清洗,包括支持病案首页及参数配置的数据清洗,支持标化字典管理、库表结构管理、数据库校验、数据清洗质控。利用自动化辅以人工质控等综合手段,支持数据的准确性、完整性、规范性、一致性、时效性、唯一性等维度的数据质控,保证数据质量,并提供数量质量报告。支持对数据进行一致性检查、无效值和缺失值的处理、残缺数据处理、错误数据处理、重复数据处理。支持对后结构化数据的质控,包括准确率、召回率、关联关系、准确性等维度。数据清洗规则至少包含基础清洗规则、正则清洗规则、自定义清洗规则,其中正则清洗规则支持表名查询和新增,包含库名、表名、表含义、字段名、字段含义、正则表达式、替换内容、匹配操作和操作等功能。支持查阅字段名称对应的数据类型、值域/说明、是否可为空、对应其他标准的编码和名称等。3.4自然语言处理NLP标注:可制定标注指南(定义待标注的标签和不同便签之间可能存在的关系),可在界面上进行人工标注和机器标注。模型训练:可使用一批或多批NLP标注结果,利用在算法管理页面中配置好的算法,一键训练机器学习模型。入库规则:可选取需要结构化的标签,系统会跟即标签之间可能存在的关系自动配置数据表结构和入库规则。结构化任务:可选定训练好的模型、入库规则,对大批量的文本数据进行一键结构化。结构化结果可以导出为excel文件。支持提取的文本类型:自然语言处理(NLP)通过人工标注训练模型后自动提取医疗文本中的关键信息,文本类型有主诉(症状、疾病)、现病史(症状、一般情况)、既往史(过敏史、既往疾病、既往用药、疫苗接种史、既往手术、输血史)、个人史(接触史、烟酒史)、家族史、婚育史(结婚年龄、生育指标、子女数量)、月经史(月经情况、绝经年龄)、体格检查、病理(免疫组化、镜下所见、肉眼所见、病理结论)、以及头胸腹盆部位的CT\MRI的检查结论和检查所见、PET-CT所见及结论、骨扫描ECT结论、胸部和腹部的X线\超声结论与所见、浅表淋巴结超声所见及结论以及乳腺的超声及钼靶结论和所见、心脏超声的结论和所见。3.5术语标准化术语查询:可通过关键词、编码查询医学概念,可展示查询结果的上下位概念和其属性。概念模型配置:可配置每一类概念的属性和值域。概念构建:可填写新概念的必要属性和分类,系统自动计算新概念与原有概念的关系,并将新概念加入到SNOMEDCT体系中。表达式库:在库中存储所有SNOMEDCT未覆盖,但真实世界存在的概念,可将高频出现的新概念加入到SNOMEDCT中。标化范围:标化范围:5大类结构化数据(诊断、手术、检查、检验和药品),以及NLP处理后的半结构化数据。术语体系:SNOMEDCT、ICD-10、ICD-9、LOINC、药品字典。具有国际先进医学术语标准(SNOMEDCT)的使用授权,确保知识产权合法使用。3.6医学术语归一数据归一处理:用户可自行实现专病数据元归一字典的维护,支持查看标准词库和原始词库信息,支持新增专病数据元值域信息及编辑值域所对应的归一术语体系。归一可视化:支持对数据归一处理后的结果进行实时同步并通过桑基图展示,展示的归一项目至少包含诊断名称、检验名称、检查名称、药品名称、手术名称五大归一体系在内。3.7知识图谱管理路径推理:支持确定头实体或确定尾实体的路径知识推理,支持设置知识推理深度,得出满足条件的多条知识途径。知识筛选:支持按照指定实体类型和实体名称对知识进行筛选知识可视化:支持单条或多条知识途径进行全局可视化展示。3.8患者主索引支持患者主索引处理。3.9数据脱敏与加密支持数据脱敏和加密,保证科研的客观性和病人隐私的保密性。4专病科研数据分析平台(需支持后续新增其他病种)。4.1专病统计首页支持查看专病库内整体患者概要信息,包括全库患者数量,数据的时间跨度,住院总人数,门诊总人数,性别分布,年龄分布,患者来源,就诊趋势。支持查看用药排名,手术排名,诊断排名,检查检验排名,合并症统计,治疗方式统计等。支持统计以多种形式展现,如:连续型指标采用条形图、柱状图、折线图等图表类型,分类型指标采用柱状图、饼图等图表类型。支持专病特有统计的定制化开发,如:ICSD-3分类、是否使用氯氮平等。支持用户根据自己喜好,自定义首页内容,各个数据项的位置。4.2科研驾驶舱支持查看专病库内整体患者概要信息,包括全库患者数量,数据的时间跨度,住院总人数,门诊总人数,性别分布,年龄分布,患者来源,就诊趋势。支持查看用药排名,ICD10、ICSD-3分类,原发性失眠和继发性失眠、慢性失眠障碍、短期失眠障碍和其他失眠障碍,疾病亚型、是否首发、是否难治、是否使用氯氮平等。支持统计以多种形式展现,如:连续型指标采用条形图、柱状图、折线图等图表类型,分类型指标采用柱状图、饼图等图表类型。支持专病特有统计的定制化开发。4.3高级搜索为具体指标设置搜索条件,精确搜索患者。支持按照人口学信息、就诊信息(门诊、急诊、住院)、诊断信息、病历文书(入院记录、病程记录、会诊记录、24小时出入院记录、门急诊记录、出院记录、死亡记录)、护理信息、手术信息、病理信息、检查信息(X射线、超声、CT、MR、内镜)、检验信息(常规检验、微生物检验)、医嘱信息进行医疗检索数据域的构建,且每个数据域下面都包含了各个检索子项,可用于高级条件树检索。支持纳入、排除搜索,且支持两种搜索同时作用。搜索历史自动留存,并且可复用。搜索条件收藏,并且可复用。多个搜索条件之间的“并且”、“或者”关系灵活切换。支持同患者、同就诊两种维度查询。支持为搜索条件添加组,并且每个组之间的“并且”、“或者”关系灵活切换。支持不同类型数据不同搜索规则,数值型指标采用“大于”、“小于”、“等于”等规则,文本型指标采用“等于”、“包含”、“不包含”等规则,同时也支持按归一值进行检索。支持在搜索条件上添加“首次”、“末次”的限定条件(例如:首次诊断名称包含“肝恶性肿瘤”)。计算全部条件节点综合搜索出的总患者数量。计算每个组搜索出的患者数量。计算每个条件节点上搜索出的患者数量。4.4事件搜索支持多条件组合,精确定义T0事件。支持基于T0事件,在其前后添加多个限定条件。灵活配置事件前后多个条件之间的关系(例如:满足任意条件,满足全部条件)。支持多条件搜索,添加新事件搜索时可选择空白搜索或复制上一个事件搜索。支持在添加其他事件时,有示意图展示与T0事件的关系。4.5快速搜索支持通过用药名称、检验名称、手术名称进行快速搜索找到目标患者。4.6搜索结果查看搜索结果数据概览,支持手术人次、住院人次、检验总人次、死亡人数、年龄/性别分布、就诊排名。支持按照二维表的形式平铺展示检索队列人群数据。支持查看患者360全景视图。支持搜索出来的患者加入队列。支持搜索出来的患者加入科研项目。4.7患者360全景视图支持在人体图中展示患者诊断、手术的部位。患者诊疗事件按照时间可视化展示。支持查看每个诊疗事件的详情。支持查看每个诊疗事件的溯源文本。4.8队列人群支持用韦恩图分析患者人群。支持队列中的患者加入到科研项目。符合筛选条件的患者自动更新到队列。支持在队列中进行二次筛选,可对筛选出的患者另存为队列。队列内患者的可视化管理,如疾病、检验、检查、手术、用药信息等。支持自定义数据导出。4.9数据导出导出格式支持SPSS、Excel、CSV。支持为待导出的指标限定时间阶段,导出特定一次的值(例如:首次诊断名称包含“单纯性疱疹”的当次就诊内“末次”C反应蛋白的值)。支持阶段内多种指标导出规则:首次、末次、最大值、最小值、平均值、求和、所有值等。支持在检验、用药的变量后面增加天数(例如:入院后持续服用“拜新同”多少天)。导出数据时支持使用概念集合进行设置,导出的数据中可查看相应概念集合的结果N/Y。保留所有用户的数据导出记录,便于管理。4.10项目管理-创建科研项目支持研究者根据课题需要创建回顾性科研项目和前瞻性科研项目,管理自己参与的科研项目,同时支持项目参与成员管理。4.11项目管理-研究对象支持数据检索出来的患者直接添加到项目中作为研究对象,支持已有队列的患者添加到项目中作为研究对象;研究对象支持剔除和增量加入。4.12项目管理-研究指标选取支持根据课题需要,提取不同观测指标,且可以设置观测指标的基线时间,支持首次末次(例如:首次TACE术结束时间之后30天内)。支持观测指标的数据预览。支持观测指标的数据质量检查,可选择全部指标进行检查。观测指标支持实时自动保存。支持对研究对象某些观测指标的缺失值进行均数/中位数/随机数/删除替换。4.13项目管理-研究指标清洗支持设置变量信息:对变量的名称、变量类型、目标变量进行设定,对进入分析的所有变量进行定性操作,支持对标识为无效变量的变量进行剔除。支持修改异常记录:对连续型变量中非数值型的记录进行修改、删除操作,使所有记录转换为适用于统计建模分析的格式。支持校正变量类型:对于数据的变量,系统会自动检测变量类型,若系统检测变量类型与用户之前设定的变量类型不一致,则需要对用户设定的变量类型进行修改或对具体的数据值进行批量修改,使系统检测变量类型与用户设定类型一致。支持处理极端分布变量和异常值:支持删除极端分布变量,支持实现对连续变量数据自动进行异常值检测,使用统计学方法自动检测该变量的符合统计学分布的正常范围,并将变量中超出该范围的数值视为异常值,用户可选择修改异常值检测上下界或使用系统检测的异常值检测范围,并对检测的异常值进行删除,亦可选择某个变量不进行异常值检测,保留异常值数据。支持填补缺失值:通过一定的统计学方法对缺失值进行自动填补,支持均值众数填补、KUN插补、多重插补等。支持添加分析衍生变量:本模块提供变量组合计算,衍生新变量的功能,如BMI变量的衍生。4.14项目管理-统计分析方法选取支持用户在创建项目,数据收集后,直接在平台上进行数据统计。支持相关分析、单因素分析、描述性分析、多因素分析、生存分析统计。统计分析结果可保存、方便管理科研成果。描述性统计。为科研项目中的变量进行基本统计量的计算,如构成比、均数、标准差、中心位、方差、极值、正态性检验等。单因素分析,支持单变量的单因素组间比较,目前支持t检验、卡方检验、秩和检验、单因素方差分析。相关性分析支持两变量间的相关性分析,目前支持线性相关、秩相关。支持多种回归分析算法:用户可选择一元线性回归、多元线性回归、COX回归、决策树回归、SVM回归、深度神经网络回归、随机森林回归、XGBoost回归、lgb回归,多因素分析支持逻辑回归和线性回归算法进行数据分析,并得到可视化的结果图表。支持多种建模流程:LR(逻辑回归)、SVM(支持向量机)、GNB(高斯贝叶斯)、RF(随机森林)、GBM(梯度提升树)、ANN(人工神经网络)、ADA(自适应提升树)等;用户可自行选择多种建模流程进行自动分析建模处理,生成的建模报告可进行下载导出。支持多种分类统计算法:用户可选择一元logistic回归、多元logistic回归、决策树分类、SVM分类、深度神经网络分类、随机森林分类、XGBoost分类和lgb分类进行数据分析,并得到可视化的结果图表。4.15项目管理-分析结果支持分析结果在线展示;支持分析结果采用三线表进行基线信息展示;支持倾向评分匹配。4.16CRF表单配置自定义建题,题型支持:单选题、填空题,多选题、日期题、附件题、多行文本题、矩阵选择题、矩阵填空题、评分题等。支持点选方式建题。支持CRF内多题目间显示与隐藏的逻辑关系以及自动计算量表等。如:当题目1选择A答案时,题目2才显示,否则题目2隐藏。支持题目自由排序。支持新增心理评估量表及心理干预措施内容,如:匹兹堡睡眠质量指数、社会支持评定量表等。4.17临床路径-医院数据临床路径基于专病数据进行临床路径分析,用户可以按照时间顺序了解这个疾病是如何进行用药、检查或者手术等操作,通过不同方式的操作分为不同的分支,可对比每一个节点对应的病人数量是多少,费用是多少,可通过路径长短、费用多少和患者人数多少评估最终的治疗效果。4.18临床路径-卫生部临床路径展示应印发的各个病种临床路径。4.19临床路径-自定义临床路径可在诊断、用药、手术、检验中查询想要分析的关键字,系统会根据医院数据自动生成路径。4.20临床路径-临床路径比较在医院数据临床路径和自定义临床路径中选择两个进行比较。4.21账户管理-用户管理支持专病库自行管理用户列表。4.22账户管理-创建用户支持根据用户名、科室、手机号等信息创建用户。4.23账户管理-修改用户支持修改用户的基本信息。4.24账户管理-角色管理支持高级用户、普通用户、录入员、监察员、核查员、数据管理员等不同角色不同权限控制、实现功能数据权限分离。4.25账户管理-权限管理支持管理员赋予用户角色,授予功能使用权限;不同用户开启不同数据授权;支持专病库拥有者自行为用户授权。4.26系统管理-我的收藏患者收藏。特定患者标签管理,将患者按照标签进行自动分组,可增加分组或编辑已有分组来管理收藏的患者,支持收藏的患者进行数据导出。搜索表达式收藏。常用的搜索表达式支持收藏,收藏的搜索表达式可快速加入搜索框进行搜索。4.27系统管理-专病流行病学概况维护支持专病日常维护专病特有的流行病学概况,并同步更新展示在专病首页中。4.28系统管理-专病入库条件&就诊时间维护支持专病日常维护专病特有的入库条件和患者就诊时间范围,并同步更新展示在专病首页中,以便专病使用者知晓。4.29系统管理-专病库数据权限维护支持对专病用户的数据权限进行配置,可根据实际用户职称角色划分不同数据权限。管理员可对所有及单个数据元是否可见、是否可申请下载、系统内是否脱敏和下载时是否脱敏进行设置,全面助力医院数据安全管理。没有可见数据权限的用户在检索结果页面所查看的队列数据信息需用上锁符合或图标进行标识;没有系统内脱敏数据查看权限的用户在检索结果页面所查看的队列数据信息需用脱敏*号进行隐藏或替换展示;用户可只查看自身权限范围内的队列数据信息。4.30系统管理-密码安全管理支持对用户密码格式要求设置,包含是否要有大写英文字母,是否要有小写英文字母,是否要有数字,是否要有特殊字符以及最短长度设置;支持对用于密码时效性设置,包含限制密码在设置时间范围内失效要求重置密码,以及限制新密码与旧密码是否可重复;支持设置用户输入密码时重试约束,包含限定时间范围内连续输错多少次则锁定多少分钟;支持设置新用户的初始密码。5专病随访与患者管理平台(需支持后续新增其他病种)。5.1随访概述随访功能含强大的随访表单自定义和拖拽设计;支持多种随访方式、频次设置;支持设定自动终止随访规则,自动终止随访;支持设定不良事件触发规则,自动提醒不良事件;根据随访规则自动生成随访任务,随访任务自动提醒;支持同时开启多个随访阶;支持随访发布后继续增加随访任务。5.2随访项目管理支持院内多个随访项目同时开展,有权限的用户可根据自己的需求在平台上创建并管理自己的项目。支持对随访队列节点下的连续型数据随访问卷题型的答案进行离群值探查。如存在离群值,则将会以红点的形式进行提醒,并支持以箱线图形式展示连续型变量类型数据,支持图表数据下钻查看患者个体随访详情。支持对随访任务中的患者随访数据进行可视化展示,包括随访节点完成情况、随访状态分布、患者性别比、随访人员年龄分布等。支持对随访队列中的单个随访问卷数据进行探查。用户可以查看不同队列下对同一随访问卷题目的填写统计情况。支持对随访过程中出现的随访异常数据进行列表展示,用户可对其进行即时消息推送,推送内容可选则文本、健康宣教知识及问卷内容在内。5.3随访方式可支持用医院自己的公众号、小程序进行患者随访,以及医生管理患者随访。5.4随访方案支持不同类型的随访方案配置,如:信息采集、居家自测、来院复查、科普宣教、随访表单。每个类型都可以设置不同的随访时间、随访频率、随访表单。随访频率可选择,均匀随访(每X天随访一次;定期随访(定义每一次随访的时间点);不限制频率。随访开始时间为单选,可选择:手动触发开始、入组后开始随访、出院后开始随访。随访偏差时间,支持设置在随访点前后X天进行随访,可独立设置每个随访点不同的偏差时间,也可以设置所有的随访点使用相同的偏差时间,也可以部分随访点独立设置,其余随访点采用相同的偏差时间。系统根据配置的方案,自动生成随访任务。5.5随访表单配置(CRF表单配置)支持点选方式建题。自定义建题,题型支持:单选题、填空题,多选题、日期题、附件题、多行文本题、矩阵选择题、矩阵填空题、评分题等。支持CRF内多题目间显示与隐藏的逻辑关系以及自动计算量表等。如:当题目1选择A答案时,题目2才显示,否则题目2隐藏。支持在问卷设置自动回填功能,支持将题目关联专病库的数据元,并设置回填数据元的取数条件和取数时间设置如基于问卷推送前的1年范围内的第一次或最后一次数据进行自动回填。支持题目自由排序。支持精神障碍及睡眠障碍疾病随访量表模板,如:匹兹堡睡眠质量指数(PSQI)、社会支持评定量表等、Hamilton抑郁量表(HAMD)、抑郁症筛查量表(PH1-9)、广泛性焦虑障碍量表(GAD-7)、Epworth嗜睡量表(ES

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论