版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1T/CMEASXXXX-XXXX儿童临床数据要素建设与评价规范本文件规定了儿童临床数据要素的数据标准、体系建设、质量评价与价值评估方面的相关标准、要求、指标和方法,并定义相关的评测指标。本文件适用于指导儿童临床数据要素控制者对儿童临床数据的收集治理、加工管理、质量评价、价值评估与应用转化的实施,也可供指导和组织儿童临床数据要素资产化的相关工作。本文件适用于健康医疗、数据安全、数据资产、数据交易等相关管理部门和机构开展儿童临床数据的合规流通监管时作参考。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T15424电子数据交换用支付方式代码GB/T22239—2019信息安全技术网络安全等级保护基本要求GB/T25069—2022信息安全技术术语GB/T25070—2019信息安全技术网络安全等级保护安全设计技术要求GB/T35273—2020信息安全技术个人信息安全规范GB/T37964—2019信息安全技术个人信息去标识化指南GB/T37988—2019信息安全技术数据交易服务安全要求GB/T39335—2020信息安全技术个人信息安全影响评估指南GB/T39477—2020信息安全技术政务信息共享数据安全技术要求GB/T39725—2020信息安全技术健康医疗数据安全指南GB/T41479—2022信息安全技术网络数据处理安全要求3术语和定义下列术语和定义适用于本文件。3.1数据data任何以电子或者其他方式对信息的记录。3.2源数据sourcedata源头的数据,原始未被加工,或未被处理的数据。2T/CMEASXXXX-XXXX3.3元数据metadata具体单个数据的数据条目、字段数、字段名、字段描述等信息。3.4数据集dataset除特殊说明外,本文件中按某种数据标准或规则形成的一条或多条数据的集合。3.5数据湖datalake一个多种数据或数据集的存储与集合,可存储任意规模的所有结构化和非结构化数据。3.6个人信息personalinformation以电子或者其他方式记录的与已识别或者可以识别自然人有关的各种信息。注1:个人信息包括姓名、出生日期、公民身份号码、个人生物识别信息、住址、通信通3.7医疗/健康数据healthcaredata存储于不同介质/系统的个人医疗健康数据以及由个人医疗健康数据加工处理之后得到的健康医疗相关电子数据。3.8临床数据clinicaldata在药品或医疗器械使用过程中产生的、或在医疗健康活动(包括健康体检、疾病防控、疾病筛查、疾病诊断、疾病治疗、疾病康复等)产生的安全性、临床性能和/或有效性信息。3.9数据标准datastandard由制度规范、管控流程和技术工具共同组成的体系,对临床数据进行定义、分类、格式、采集、计算、编码、建模等标准化管理。3.10数据要素dataelement根据特定需求汇聚、整理、加工而成的计算机数据及其衍生形态。注:投入于生产的原始数据集、标准化数据集、各类数据产品及以数据为基础产3.11数据资产dataasset合法拥有或控制的,能进行计量的,为组织带来经济和社会价值的数据资源。。3T/CMEASXXXX-XXXX3.12临床研究/试验clinicalstudy/clinicaltrial任何在人体(病人或健康志愿者)进行药物、医疗器械或治疗方式的系统性研究以证实或揭示试验药物、医疗器械或治疗方式的作用、不良反应及/或试验药物的吸收、分布、代谢和排泄,目的是确定试验药物、医疗器械或治疗方式的有效性与安全性。3.13随访followup对患者参加某项特定目的的临床试验后,关于患者的健康情况、药物/医疗器械的疗效和安全性的跟踪和记录活动。3.14保密性confidentiality使信息不泄露给未授权的个人、实体、进程,或不被其利用的特性。3.15合规性compliance对本文件中的数据要素所适用的法律法规的符合程度。3.16隐私计算privacy-preservingcomputation指在保证不泄露原始数据的前提下,对数据进行分析计算的一类信息技术,保障数据在产生、存储、计算、应用、销毁等信息流程全过程的各个环节中“可用不可见”。3.17自然语言处理naturallanguageprocessing一种研究如何让计算机能够理解、处理、生成和模拟人类语言的能力,从而实现与人类进行自然对话的技术。3.18机器学习machinelearning一种教计算机从经验中学习的AI方法。机器学习算法使用计算方法直接从数据中“学习”信息,而不是依赖于预先确定的方程作为模型。3.19匿名化anonymization用生成的新字符,取代原来的直接标识符,使得在不借助额外信息情况下无法识别出个人信息主体。3.20去标识化de-identifying对标识符进行处理,使其处理后的信息无法识别到特定个人信息主体的数据处理方式。3.214T/CMEASXXXX-XXXX数据脱敏datadesensitization通过一系列数据处理方法对原始数据进行处理以屏蔽敏感数据的一种数据保护方法。3.22数据清洗dataclearing发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值3.23数据安全datasecurity保护数据及跟数据相关的一切资产免遭未经授权的访问、披露、修改或盗窃的做法。3.24访问控制accesscontrol一种确保数据处理系统的资源只能由经授权实体以授权方式进行访问的手段。3.25数据质量dataquality指数据在指定条件下使用时,其特性能够满足明确的或者隐含的要求的程度。4缩略语GCP:goodclinicalpractice,即药物/医疗器械临床试验质量管理规范SOP:standardoperatingprocedure,即标准操作规程EDC:ElectronicDataCaptureSystem临床数据电子采集系统PI:primeInvestigator,即主要研究者ICF:Informedconsentform,即知情同意书EC:ethicscommittee,伦理委员会CRF:casereportform,即病例报告表SAE:seriousadverseevent,即严重不良事件IIT:investigatorinitiatetrial,即研究者发起的临床试验RWS:realworldstudy,即真实世界研究HEOR:healthcareeconomicsandoutcomeresearch,即卫生经济学与结局研究5角色分类针对儿童临床数据的特定场景,相关组织或个人可划分为以下四类角色。对任何特定组织或个人,围绕特定数据,在特定场景或特定的数据使用处理行为上,其只能归为其中一个角色。a)个人健康医疗数据主体:个人健康医疗数据所标识的自然人。b)数据要素控制者:能够决定健康医疗数据处理目的、方式及范围等的组织或个人。包括提供健康医疗服务的组织、医保机构、政府机构、健康医疗科学研究机构等,其以电子形式传输或处理健康医疗数据。判断组织或个人能否决定健康医疗数据的处理目的、方式及范围。5T/CMEASXXXX-XXXXc)健康医疗数据处理者:代表控制者采集、传输、存储、使用、处理或披露其掌握的健康医疗数据,或为控制者提供涉及健康医疗数据的使用、处理或者披露服务的相关组织或个人。常见的处理者有:健康医疗信息系统供应商、健康医疗数据分析公司、辅助诊疗解决方案供应商等。6数据标准本文件所指的数据标准是指数据要素控制者或处理者在疾病流行病调查、卫生经济学研究、上市前临床研究、上市后真实世界研究、专科专病数据库建设、临床综合评价、数据资产盘点、医保商保等应用场景下宜遵循和采用的标准规范。6.1数据范围6.1.1儿童年龄范围本文件定义的儿童临床数据来源于不同年龄段的儿童在医疗健康活动中产生的数据,儿童年龄范围应参考国际《儿童权利公约》和国家卫健委相关标准确定。详见附录A.1。6.1.2儿童疾病范围本文件定义的儿童临床数据是指来源于不同年龄段的儿童在呼吸、消化、循环、泌尿、神经、肌肉骨骼、免疫、皮肤、内分泌代谢、血液、耳鼻喉、眼科、口腔、泌尿生殖系统、遗传病、精神行为障碍、肿瘤等20个疾病大类,115个细分疾病的健康医疗活动中产生的数据。儿童疾病范围随着医疗健康活动开展,可能会扩充或缩小,本文件暂未考虑上述因素。详见附录A.2。6.2数据类型本文件中的儿童临床数据主要来自于儿童健康与疾病诊治业务系统中的数据,包括中医药、基层医疗、医疗服务、临床科研、医疗保障、计划生育、卫生监督、公共卫生等数据。具体的源数据、元数据、数据集、值域代码等相关标准可参考国家相应卫生信息标准。详见附录B.1。6.3数据来源本文件中的儿童临床数据主要来自于儿童健康与疾病诊治医疗业务系统中的数据,包括中医药、基层医疗、医疗服务、临床科研、医疗保障、计划生育、卫生监督、公共卫生等数据。具体如下:a)医药、医疗监管性数据和医疗保险数据;b)常规儿童人口统计和重大传染性、重大疾病监测数据;医学影像和健康体检等医疗业务系统产生和存储的数据;d)临床研究数据,包括临床试验、自然人群队列、专病队列数据和人群流行病学调查等数据;e)生物信息数据库,包括生物标志物和多组学信息;f)登记系统,包括但不限于疾病登记系统、死亡登记系统等数据库;g)手机、PAD、智能手表等移动设备产生的数据;h)患者自我报告的数据;i)其他特殊来源数据库。6.4数据形式6T/CMEASXXXX-XXXX6.4.1为更好完成儿童临床数据要素建设与评价,数据要素控制者宜了解和掌握存储于各种医疗业务系统或信息化工具的临床数据形式。6.4.2数值型数据,以数字的形式表达的数据,可依托各类医疗业务系统或信息化工具进行多种计算和分析统计。6.4.3文本型数据:以字符的形式表达的数据,包含字母、字符、数字、符号等。文本型数据用于记录和传输大量的文字信息,如医生个人填写或使用信息化工具编辑产生的患者医嘱、检查检验结果、门诊病历、住院病历等文本。6.4.4图像型数据:以图像的形式表达的数据,由像素点组成的二维矩阵。图像型数据可以呈现出丰富的视觉信息,如CT影像、检查检验结果照片等。6.4.5音频型数据:以声音的形式表达的数据,由声波振动产生的。音频型数据可呈现出患者在健康或医疗活动中的各种反馈信息,较常见于临床研究中的随访环节。6.5建设标准6.5.1健康档案基本架构与数据标准u健康档案基本架构与数据标准(卫办发〔2009〕46号)u健康档案公用数据元标准(卫办发〔2009〕46号)u个人信息基本数据集标准(卫办发〔2009〕46号)u出生医学证明基本数据集标准(卫办发〔2009〕46号)u新生儿疾病筛查基本数据集标准(卫办发〔2009〕46号)u儿童健康体检基本数据集标准(卫办发〔2009〕46号)u体弱儿童管理基本数据集标准(卫办发〔2009〕46号)uWS/T303-2009卫生信息数据元标准化规则uWS/T305-2009卫生信息数据集元数据规范uWS/T306-2009卫生信息数据集分类与编码规则u儿童风湿免疫病标准数据集北京协和医院(2023年12月)uT/ZJHIA10-2023儿童保健数据集u川崎病标准数据集(2022版)上海市儿童医院uICD-10国际疾病分类标准编码6.5.2临床研究标准uNMPAGMP附录《计算机化系统》(2015年第54号);uNMPA《药械临床试验的生物统计学指导原则》(2016第93号);uNMPA《临床试验数据管理工作技术指南》(2016第112号);uNMPA《药械临床试验数据管理与统计分析的计划和报告指导原则》(2016第113号);uNMPA《临床试验的电子数据采集技术指导原则》(2016第114号);uNMPA《医疗器械临床试验质量管理规范》(2016局令第25号)uNMPA《真实世界证据支持药械研发与审评的指导原则(试行)》(2020第1号);uNMPA《药械临床试验数据递交指导原则(试行)》(2020第16号);uNMPA《药物临床试验质量管理规范》(2020第57号);uNMPA《药品记录与数据管理要求(试行)》(2020第74号);uNMPA《真实世界数据用于医疗器械临床评价技术指导原则(试行)》(2020第77号);uNMPA《患者报告结局在药物临床研发中应用的指导原则(试行)》(2021年第62号);7T/CMEASXXXX-XXXXuCDE《真实世界研究支持儿童药械研发与审评的技术指导原则(试行)》(2020第22号);uCDE《用于产生真实世界证据的真实世界数据指导原则(试行)》(2021第27号);6.5.3国际标准规范);uISPEARisk-BasedApproachCompliantGXPComputerizedSystems(GAMP5)(2008);uFDAGeneralprinciplesofsoftwareValidation:FinalGuidanceforIndustryandFDAStaff(2002);uEUGMPguideannexes:Supplementaryrequirements:Annex11:Computerisedsystems;uClinicalDataAcquisitionStandardsHarmonization(CDASH):CDISC-数据集定义标准;uStudyDataTabulationModel(SDTM):CDISC-数据递交标准;uMedDRA:医学临床术语;uWHODrug:药械标准术语;uCommonTerminologyCriteriaforAdverseEvents(CTCAE)Version5.0:不良事件分级标准;6.6数据模型6.6.1数据要素控制者应根据数据要素建设需求和数据应用场景如疾病流行病调查、卫生经济学研究、上市前临床研究、上市后真实世界研究、临床综合评价、医保商保应用等制定特定目的的数据方案和数据标准,宜以此为基础确定数据分析、数据统计、疾病筛查、辅助诊断、临床辅助决策、预后评估等数据模型。6.6.2由于临床数据类型、疾病危险因素、未测量的危险因素、治疗措施以及治疗背景等随时间变化,数据模型应不断调整、不断验证、不断进化、动态更新。7体系建设7.1数据采集7.1.1综合我国临床研究行业现状和不同数据应用场景,数据要素控制者和处理者宜在遵守国内外相关法律法规和标准规范的前提下,保障临床数据及数据技术平台的安全性,保障临床数据与源数据的一致性。儿童临床数据库可参考《美国NCS儿童临床数据库范例》,详见附录E。7.1.2如采用传统的人工录入方式,研究参与人员应将患者数据录入纸质CRF表或电子化CRF(即EDC系统),保证已录入临床数据的及时性、完整性与准确性。7.1.3如采用拍照识别技术,应根据研究方案规定的数据类型和范围提前将待采集数据所在典型量表、文本等以照片的形式收集后应用机器学习进技术行模型训练,采用多种隐私计算方法,实现患者隐私信息如姓名、身份证号、编号等做数据脱敏化,形成可供拍照设备识别和获取的数据表,经反复验证后交付研究人员,由研究人员拍照完成数据自动采集。7.1.4如采用远程监查平台,远程监查平台宜部署在研究中心即医院内部,依托患者唯一ID作为唯一代码,将实现患者的原始数据经隐私数据脱敏后,传输至院内电子化CRF(即EDC系统)。7.1.5如采用接口对接方式,针对于医院业务系统已经提供对外数据输出的HTTPS/WebService接口,通过调用该HTTPSURL可获取符合条件的返回数据,数据一般是以JSON的形式返回给客户端,客户端在接收到数据之后需进行解析,将半结构化的数据进行解析成格式化的数据,然后再存储到院内电子化数据库。7.1.6数据采集时,宜遵循以下要求:a)数据采集之前要先确定元数据的格式和内容,并对元数据有必要的描述信息;8T/CMEASXXXX-XXXXb)应当在采集数据之前,明确数据采集目的、方式和范围,并在采集数据时告知儿童父母或监护人相关信息。c)采集儿童临床数据的目的应当明确、具体,并仅用于实现采集目的。d)应当仅采集与实现采集目的相关且必要的最小范围的个人数据。e)数据应当与实现采集目的相关且必要,并尽可能进行匿名化处理。f)数据采集时注意与数据唯一识别标识建立相关的信息收集。g)应当采取合理措施确保数据的安全和保密,防止其被泄露、滥用或非法使用。h)在采集儿童临床数据时,应当尽可能对数据进行匿名化处理,以保护儿童的隐私。i)对于敏感的儿童临床数据,例如遗传信息、精神疾病信息等,应当采取更为严格的保护措施。j)儿童父母或监护人有权查阅、更正、删除儿童医疗数据,并限制或反对对儿童临床数据的处理。k)应将所采集的数据内容、用途、共享计划或数据不共享说明提交给其他研究参与者。l)如涉及人员变更,应及时完成临床数据的收集进度和责任人更新说明7.2数据治理7.2.1数据治理主要是对医院多源异构数据资源进行清洗、整合、处理、存储,整合结构化临床数据和临床文本数据等非结构化数据,形成可结构化、归一化的可分析数据。7.2.2数据清洗宜以研究人员和专业计算机人员共同讨论确定的数据治理规则为前提。专业计算机人员宜根据数据治理规则,采用专门技术手段过滤不符合临床研究要求的数据,将过滤后的数据结果交由研究人员最终确认。7.2.3专业医学人员或计算机人员宜对临床研究项目所需的知识库进行定义和维护,服务于数据标准化、归一化和结构化处理。该知识库应包括疾病诊断类ICD-11、ICD-10,手术影像类ICD-9、LOINC、药品类NMPA等医学字典,应用知识库类CTCAE5.0、MedDRA医学编码以及同义词编码库。7.2.4专业技术人员应根据每个变量的合理取值范围和相互关系,检查数据是否合乎要求,发现超出正常范围、逻辑上不合理或者相互矛盾的数据,并进行修正或剔除,完成一致性检查。7.2.5数据结构化时,计算机人员宜针对医院业务系统提供的临床数据,通过自然语义处理技术,结合医疗专业术语的语义结构,将医疗语义信息从原始的自然语言表达,扩展分析为结构化模式,按照模型配置规则,自动写入基于对应的临床研究项目的电子化数据库EDC。7.2.6数据治理过程中,宜建立患者数据唯一识别标识,保证同一患者的多元信息可以被准确识别。7.3数据质疑7.3.1研究人员应对已录入的临床数据进行数据核查,以保证数据的有效性和正确性。7.3.2数据核查后产生的质疑宜以电子或纸质文档的形式发送给相应的研究人员或其他研究参与者。7.3.3研究人员对质疑做出回答后,宜由专业的数据管理员根据返回质疑答复对数据进行修改。如质疑未被解决则将以新的质疑再次发出,直至数据疑问被清理干净。7.4数据审阅7.4.1本文件定义的数据审阅是指由专业的、独立的、公正的临床研究参与人员或数据要素相关人员组成的专家组发起的对临床研究方案、已收集的临床数据及初步结果进行全面审阅。7.4.2专家组在数据审阅过程中,应侧重监察某项治疗干预的数据,保证临床研究的安全性、有效性和完整性,并减少研究结果的偏倚,并提出有关该项临床研究的专业意见。7.4.3数据审阅的内容一般包括审阅临床研究方案、知情同意书、统计分析计划等文件;对正在进行的临床研究累积数据进行安全性评估,以确保患者安全;对于使用已有数据进行的研究应当评估数据是否使用于适宜的研究设计;根据事先规定的统计原则对研究累积数据进行疗效评估;监察研究执行情况,包括总体及各中心的入组、方案违背和脱落情况、基线特征;监察临床数据的元数据、数据集的准确性、完整9T/CMEASXXXX-XXXX性和及时性;监察研究者和患者对临床研究方案的依从性;监察各中心对不良事件及严重不良件事件的评价的一致性。7.5数据编码7.5.1研究人员或专业的数据管理人员宜对临床研究中收集的患者病史、不良事件、伴随药物治疗等临床数据按照国内外被广泛采用的标准字典版本进行再编码。7.5.2研究人员或专业数据管理人员无法确认词目时,应通过数据质疑与研究者沟通以获得更详细的信息进行更确切的编码。7.5.3研究人员或专业数据管理人员应制定并遵循标准操作规程(SOP),更新标准字典版本并保证医学和药物编码在不同版本字典之间的一致性。7.6数据管理7.6.1研究人员或专业数据管理人员应考虑临床数据库未来应用需求,应制定详细且明确的数据管理计划,以确保数据管理过程可追溯,产生标准化的临床数据集。7.6.2数据库锁定是为防止对数据库文档进行无意或未授权的更改,取消数据库编辑权限。7.6.3数据库锁定过程和时间宜有明确的文档记录,对于盲法临床研究,数据库锁定后才可以揭盲。7.6.4如果对数据库锁定和开锁过程进行记录和控制,数据库开锁的流程应至少包括:通知研究项目团队;给出要进行的更改内容、更改原因以及更改日期;并由主要研究者、专业数据管理人员和专业统计分析人员共同签署确认。7.6.5专业数据管理人员在完成数据清理时,应考虑以下内容:第一次的数据录入以及每一次的更改、删除或增加,其稽查轨迹都应保留在电子化数据库中。稽查轨迹应包括更改的日期、时间、更改人、更改原因、更改前数据值、更改后数据值。此稽查轨迹应被电子化数据库系统保护,不允许任何人为的修改和编辑。稽查轨迹记录宜存档并可查询。建立数据权限管理机制,包括授权查看、授权使用、可查看的数据、可使用的数据。临床研究中所有观察结果和发现都应予以核实,以保证数据的可靠性,确保临床研究中各项结论来源于原始数据。确保数据管理相关文件的准确性、完整性和可追溯性。建立清晰的文件管理系统,方便数据管理过程的回顾和审查。定期进行数据备份,并建立合适的数据恢复计划,以防止数据丢失或损坏在数据管理的每一阶段宜采取质量控制,以保证所有数据的可靠性和数据管理操作的正确性。多中心临床研究时,临床数据应进行集中管理与分析,并满足数据安全各项条件。7.7数据建模7.7.1数据要素控制或处理者者宜利用自然语言技术、深度学习算法等AI技术和辅助工具,对大量的临床研究数据进行定制模型训练,以支持研究人员做出客观决策。7.7.2研究人员可利用多个与疾病相关联或类似的临床研究案例,形成可应用于此类型疾病研究的标准临床研究病例报告模型、数据管理模型和统计分析模型,缩短临床研究的设计时间,提高临床研究运行效7.7.3研究人员可利用临床数据库中脱敏后的患者基本信息、病史、治疗方案和出院信息等数据,借助AI技术自动发现与某种疾病相关的风险因素、预测疾病的发作和进展、比较不同治疗方法的效果、诊断复杂疾病等,为医生提供更精准的诊断和治疗方案,轻松预测不同的治疗效果和康复周期。7.7.4研究人员可根据已应用各种疾病研究的纳排标准和临床数据,采用机器学习算法开发AI模型,预测患者参加临床试验的资格,提高临床研究的入组预测和实际效率。T/CMEASXXXX-XXXX7.8数据应用7.8.1本文件定义的数据应用是指在公开或在特定访问条件下,数据要素控制者汇集、整理和加工个人临床信息数据,包括源数据、元数据、数据集和/或其他任何形式的衍生数据形成的数据湖,也包括数据要素控制者与其他研究参与方之间的数据传输或数据交换。7.8.2鉴于儿童临床数据为临床研究,以及疾病观察、监测、检验检测、预防、康复等过程或期间收集的每个儿童分别记录的个体数据;如临床研究中收集的数据包括标识符、部位标识符、出生日期、性别、种族、疗效结果、实验室测试结果等,数据应用过程中将发生个体参与者(患者或受试者)权利与数据应用的科学、研究、研发等社会公共利益之间的冲突。因此,数据隐私保护工作应遵循以下要求。7.8.3隐私保护要求可查找性(Findable)数据应该是唯一且持久可识别的,其他临床研究人员应该能够找到数据。可访问性(Accessible)对数据应用者和计算机来说,可以使用数据的条件应该是清楚的。互操作性(Interoperable)互操作性是指来自非应用协作资源的数据或工具以最小的努力集成或协同工作的能力。数据应该是机器可读的,并使用研究领域中常用的术语、词汇或本体。可重复使用(Reusable)数据应符合上述要求,并充分利用元数据和源数据进行描述,以便数据源能够与其他数据源链接或集成,并能够进行适当地引用和应用。保护个人信息的数据隐私是数据应用的必要先决条件。其中最基本的要求就是数据的去标识化或匿名化。所以数据应用过程中,包括信息化系统和网络平台采集和使用临床数据时,均须删除涉及个人健康隐私的一般和专业标识符,如姓名、住址、电话、住院号等。7.8.4知情同意要求知情同意中的“同意”应该建立在“告知”基础之上,知情同意中的“告知”内容一般包括了临床研究相关信息以及临床研究的风险受益等。具体如下:a)主要内容应包括研究或应用的目的、内容、方法、风险和收益,应明确患者或受试者的权利和义务,应包括患者或受试者的退出权。b)告知方式告知应以患者或受试者能够理解的方式进行,并应提供书面告知书。c)告知主体告知应由研究者或数据应用者负责进行。d)知情同意方式知情同意宜由患者或受试者签署书面知情同意书,或由患者或受试者口头表示同意。e)知情同意撤回患者或受试者有权在任何时间撤回其知情同意。广泛性知情同意(以下简称泛知情同意)是知情同意的特殊形式,已在国外需要利用临床数据和生物样本的医学研究中得到广泛应用,其特点表现为:以该类研究对受试者的低风险性为基础,使患者授权其个人健康数据在去标识化前提下,研究者尽可能对医疗数据和生物样本应用于将来研究履行“告知T/CMEASXXXX-XXXX责任”;提升医疗数据和生物样本应用于将来研究中的“效用”。这也为我国更大范围内的临床数据开发和应用提供了一定的借鉴。对于8岁以上儿童应提供儿童和监护人的共同知情同意,知情同意书需要用通俗语言清晰阐述数据收集的目的、方法以及对患者数据的隐私保护等相关内容;对儿童的知情同意应当使用易于儿童理解的语言进行。对于8岁以下儿童应当取得其监护人的知情同意;在有条件的情况下,对儿童本人也进行知情同意。7.8.5伦理审核要求医学临床研究和医疗健康活动(临床诊疗和护理)是临床数据的两大主要来源,数据要素控制者或处理者在数据应用时,应遵循医学伦理学基本原则,即保护患者的政策,即“尊重、有益无害、公平”。a)尊重原则应尊重患者的知情同意权,并确保患者在知情的情况下作出决定。应尊重患者的隐私权,并采取措施保护患者的隐私。应尊重患者的自主权,并尊重患者的自主选择。b)有益无害原则临床数据的应用应有利于患者的健康,且不会对患者造成伤害。临床数据应用宜符合患者的利益。c)公平原则数据应用宜公平对待所有患者,不得因患者的身份、性别、种族、宗教、经济条件等因素而歧视。儿童属于未成年群体,涉及儿童的临床研究的伦理保护应给予特别重视,涉及个人敏感信息数据的健康疾病信息和遗传疾病资源信息的个体参与者及其家庭应该被视为“弱势群体”,在数据应用过程中应该被提高保护级别,体现在包括知情同意的履行中应予以特别保护。另外,还需考虑和尊重基于传统文化、地域环境等多元原因产生的个体参与者包括儿童及儿童监护人的多元个性化选择。7.8.6协议约定要求数据要素控制者如医疗机构和项目发起者应通过合同/协议等形式约定数据使用范围,明确数据保密及隐私保护合同/协议双方的责任和义务。数据要素控制者应确认临床研究及其他临床数据要素处理者的安全能力满足安全要求,并签署数据处理协议后,才能让处理者为其进行数据处理,处理者应当按照控制者的要求处理数据,未经控制者许可,处理者不能引入第三方协助处理数据。数据要素控制者应确认数据应用的合法性、正当性和必要性,并确认本方或数据要素处理者具备相应数据安全能力,且使用者签订了数据使用协议并承诺保护受限制数据集中的个人健康医疗数据后,可将受限制数据集用于科学研究、医疗保健业务、公共卫生等目的;使用者只能在协议约定的范围内使用数据并承担数据安全责任,在使用数据完成后,应按照控制者要求归还、彻底销毁或者进行其他处理。未经控制者许可,使用者不能将数据披露给第三方。7.9数据销毁数据要素控制者应确保数据以不可逆的形式最终无法还原,尤其应关注残留数据的处置和消除。当前我国《数据安全法》和《个人信息保护法》尚未明确提高数据销毁和信息擦除的必要性。因此,数据销毁应在国家法律法规许可下,且数据销毁的书面许可的前提下,通过多样化物理手段和多层次技术方法实现数据不留痕迹、不可恢复,同时对数据销毁活动进行记录和留存。T/CMEASXXXX-XXXX7.10数据安全7.10.1数据隐私应建立健全的数据隐私和安全保护管理体系,并指定专人负责数据隐私和安全保护工作。应定期对数据隐私和安全保护工作进行评估,并采取措施改进。根据数据的可识别程度(即数据隐私性)对不同应用场景下的数据进行分级分类是解决数据隐私内容不断变化的可行依据。1可识别信息的数据的隐私分级标准的依据是信息一旦泄露将对个体和(或)其家庭潜在影响和危害的严重程度,具体包括对个体可识别信息的身份信息量、包含疾病信息的敏感程度、如是否包含对个体及其家庭带来生活(婚姻、保险、交往)和工作等带来歧视的信息。详见附录C.1.2去识别信息的数据的隐私分级则根据去识别数据重新识别的可能性高低进行初步分类,进而结合前述可识别信息的级别可进行综合分类。本文件初步提出依据重新识别的风险高低的分级标准。详见附录C.2。识别信息作为隐私分类的主要依据,提出临床数据的识别信息和去识别信息两类隐私数据分级,可作为拟定我国的健康医疗数据隐私保护的医学伦理标准参考和基础。7.10.2数据使用数据要素控制者在使用儿童临床数据时,宜遵循以下要求,并形成相应的文档记录,应当在收集目的范围内使用个人数据,不得将其用于与收集目的无关的其他用途;应当采取合理措施确保个人数据的安全和保密,防止其被泄露、滥用或非法使用;应当在使用个人数据之前,对数据进行脱敏或匿名化处理,以保护数据主体的隐私。数据访问控制1对儿童临床数据的访问应进行严格限制,只有经过授权的人员才能访问。2访问权限应根据用户的角色和职责进行分配。3宜设置限定时长的访问期限。4应定期对访问权限进行审核。数据使用记录1应记录儿童临床数据的使用情况,包括使用目的、使用时间、使用人员等。2使用记录应定期进行审核。7.10.3数据算法数据要素控制者在数据治理或数据建模过程中,应形成相应的文档记录。a)应支持多种数据分析与隐私计算方法,支持从数据库中提取隐含的事先未知、潜在的有用的信息和知识。b)应支持数据脱敏和加密算法,对患者个人信息中的敏感信息(如:患者姓名、身份证号、电话、地址等)通过脱敏或加密规则进行数据的变形,实现敏感隐私数据的可靠保护,同时依然保持其它数据的格式和属性,保证其可识别性和可用性。c)宜支持线性回归算法,支持利用Logistic回归建立模型,对采集的患者临床指标数据建立特定疾病恶化预警模型,对病人未来一定时间段内可能出现的疾病恶化风险进行预测,为患者疾病及时诊治和有效控制取得时间优势。d)宜支持分类算法,确定待查数据应划归入的类别,并用于疾病预测性研究。e)宜支持聚类分析算法,如K-means和TwoStep等。T/CMEASXXXX-XXXX7.10.4平台安全数据要素控制者在体系建设过程中,宜保证技术平台遵循以下要求,并形成相应的文档记录。a)技术平台应满足J2EE和数据库技术,应满足FDA21CFRPart11对电子签名和痕迹稽查的要求。b)应从用户登录安全机制、权限体系安全机制、数据监控安全机制、操作过程安全机制、系统备份安全机制等多个方面进行全面的安全控制,保障数据安全。7.10.5数据存储数据要素控制者在儿童临床数据要素建设与评价时,应保证数据存储遵循以下要求。应采取合理措施确保个人数据的存储安全,防止其被意外或非法破坏、丢失、更改或访问。应定期对个人数据进行备份,并制定数据恢复计划。应在不再需要个人数据时,及时将其删除或销毁。数据存储应满足合法性、合规性和安全性,其中数据存储基础设施宜确保满足以下要求:a)可用性应不小于99.9%;b)数据可靠性应不小于99.9%;c)在线率应不小于99.9%;d)宜支持国家信创基础软件及相关系统的安装。数据存储系统或介质所依托的硬件环境应按国家标准建设,满足中华人民共和国公安部等级保护三级认证标准的要求。应对网络环境进行安全域划分,部署防火墙,安全隔离网闸等安全系统,提供平台与外部网络的边界隔离、业务系统间隔离措施。部署入侵防御系统,提供异常流量分析,入侵防御等措施,部署VPN设备,保障数据的传输安全。应建立业务操作系统安全基线,配备漏洞扫描系统,为存储环境主机、业务系统提供漏洞扫描与检测,部署防病毒软件,并提供恶意软件检测功能。应部署WEB应用防火墙,网页防篡改系统,为数据业务系统提供应用层安全防护措施。应提供虚拟层安全防护措施以及开展虚拟主机加固工作。应定期进行数据备份,建立数据存取、验证等管理制度,并对备份数据进行每年不少于2次的定期恢复的有效性验证。7.10.6数据传输数据要素控制者在数据传输过程中,宜遵循以下要求,并形成相应的文档记录。a)数据的传输应遵循最小必要原则,仅限于实现数据传输目的的必要范围。b)数据传输目的应明确、具体,并与儿童健康相关。c)数据的传输应采取安全可靠的方式,防止数据泄露、丢失或滥用。d)宜使用加密传输、安全通道等技术措施确保数据安全。e)数据应传输给具有合法授权的接收方。f)在进行数据传输之前,应告知数据主体相关信息,并征得其同意。7.10.7数据审计数据要素控制者在数据审计时,宜遵循以下要求,并形成相应的文档记录。a)应建立针对数据全过程和数据技术平台的审计制度,对数据的采集、加工、应用、销毁等活动进行审计,并确定必要的审计控制范围和需要审计的数据。b)应建立数据过程日志的相关信息化系统,保证审计日志的完整性,记录数据过程中的访问者、程序、时间、地点和场景等信息,确保重点审计数据的访问和操作合规性,并记录安全事件。c)宜定期提供审计报告,向数据要素相关方的高级管理人员、数据管理员以及其他利益相关者报告数据安全状态。T/CMEASXXXX-XXXXd)应提供数据合规建议,提出改进数据合规的设计、操作和安全等方面的工作建议。7.11技术应用平台7.11.1技术框架本文件定义的技术平台宜采用人工智能和大数据技术对存储于医院业务系统的非结构化医疗数据在国家法律法规、医院数据安全及既定研究方案要求下,将患者隐私信息进行数据脱敏,完成标准化配置,将为半结构化及非结构化的临床数据提供分布式数据存储资源,并为NLP(自然语言处理)、模型算法提供分布式计算资源。技术架构详见附录D.1。经提取的标准化临床数据传输至电子化数据库,以智能化、移动端的形式满足医生应用端、患者应用端,应持续符合数据录入和项目管理的要求,实现以患者为中心的数据全流程质量控制,形成专病领域多项目、多中心的整体项目体系架构。7.11.2应用功能项目构建配置模块本功能宜满足数据要素控制者的数据库构建和核查规则配置要求,保证数据库满足临床所需的数据,并且可以对数据进行验证。a)宜支持完成平台层级的基础参数设置;b)宜支持将专病库/临床研究项目的纸质CRF转化成eCRF,通过可视化的表单构建功能;c)宜支持逻辑核查,对现有数据进行的系统自动核对,并提醒可能存在的错误;d)宜支持自动化配置,对系统的自动运算且无需研究者填写的内容进行自动化处理;e)宜支持随机化,对数据进入数据库的患者通过随机方案进行随机分组,降低研究数据的偏倚性;f)宜支持患者管理,根据疾病的不同程度预设对应的标准居家治疗方案;g)宜支持对需要使用系统平台的相关人员进行账号的添加和授权其在项目中的角色与权限。h)宜支持项目公共配置;i)宜支持项目字典库配置;j)宜支持系统测试环境与正式环境配置、发布。临床数据治理模块本功能宜满足对医院多源异构信息资源进行整合、处理与存储要求,整合结构化临床数据和临床文本数据等非结构化数据,形成可结构化、归一化的可分析数据。a)支持将原始数据导入/接口对接至系统;b)支持HIS、EMR、手麻、重症、放疗、输血、随访等医院业务系统对接至本系统;c)支持对疾病种类、疾病名称进行模糊搜索;d)支持对时间类型数据进行大于、等于、小于的搜索,时间精度可精确至年月日;e)支持自定义搜索选项接口,支持对返回的自定义数据进行自定义搜索;f)支持单条件、多条件的复合搜索,搜索条件间支持与、或、非的连接;g)支持对返回的数据进行自定义设置;h)支持对当前医院所有可查询的子系统进行选择;i)支持获取当前子系统下的可导出的数据属性列表,并对需要导出的数据属性进行选择;j)支持导出目标病例下的子系统数据;k)支持记录目标病例数据的导出状态,避免重复导出;l)支持发送患者编号数据,形成数据同步关系,启动院内系统的数据对接流程;T/CMEASXXXX-XXXXm)支持以病例编号为标识完成对数据的接收;n)支持返回数据同步状态;o)支持项目数据模型配置;p)支持项目知识库配置;q)支持数据规则配置;r)支持数据自动写入。临床数据管理模块本功能应满足数据库管理、数据录入、数据质量管理、数据应用等,尤其在数据录入的智能化、数据可视化、数据搜索、数据质量和进度保证方面提供支持。a)支持接口对接,按频率同步外部数据;b)支持Excel/Json格式数据手工上传导入外部数据;c)支持外部数据清洗、转化,导入临床研究数据库;d)支持数据录入人员待回复质疑、待提交提醒;e)支持DM待关闭质疑、待审核提醒;f)支持首页按受试者状态和项目进度汇总总览;g)支持访视内设置部分CRF表强制优先填写;h)支持表单内单选/多选变量控制后续变量编辑/只读;i)支持同一CRF表在访视上以不同别名显示;j)支持同一CRF表在不同访视上显示不同变量;k)支持自增型内嵌CRF表:可自由增加多条子表信息;l)支持固定型内嵌CRF表:初始显示固定模板信息;m)支持衍生变量按照公式自动计算;n)支持按单表/多表在访视内批量标注未采集/未发生;o)支持草稿/审核中状态的数据进行失效/激活;p)支持数据录入时保存后再提交;q)支持实验室正常值范围按录入信息自动填充到CRF表内;r)支持计划外访视按需选择CRF表;s)支持循环访视按需增加;t)支持设置默认显示的非公共访视,支持通过条件触发显示非公共访视;u)支持数据填写并保存后对不满足核查的数据点提示红色字体;支持数据提交后对不满足核查的数据点自动生成质疑;支持数据填写时必填项控制。v)支持发送人工质疑人员(DM)对同一数据点发送质疑;w)支持单条数据以变量/表类型发送质疑;x)支持数据修改后满足核查规则的系统质疑自动关闭;y)支持数据修改后不满足核查规则的系统质疑由DM主动关闭;z)支持DM对本角色质疑单条/批量关闭;aa)支持单受试者在摘要页显示不同CRF表的当前数据录入情况和质疑状态;ab)支持单受试者内按不同角色显示我的任务;ac)支持CRF表界面显示图片格式信息;ad)支持单受试者内切换上一个/下一个受试者;ae)支持DM数据清理后冻结操作;af)支持特殊角色受试者信息废弃操作;T/CMEASXXXX-XXXXag)支持数据点的稽查轨迹记录;ah)支持受试者批量提交,支持按受试者进行批量数据清理,支持按中心/受试者/访视/表单筛选后独立批量操作;ai)支持eCRF表数据提交时邮件提醒;aj)支持研究过程中受试者CRF版本升级;ak)支持各种PDF格式(空白病例报告表(全册/单一册)、注释病例报告表(全册/单一册)、受试者病例报告表)、Excel格式、SAS格式数据集、XPT格式数据集导出;al)支持导出质疑相关报告、数据库定义报告、稽查轨迹相关报告、账户信息相关报告;am)支持定制报告:已有报告基础上增加查询/分组条件后定制个性化报告;an)支持报告按单次/每天/每周/每月定时导出;ao)支持从系统直接导出本研究正常值范围的Excel格式的模板文件;ap)支持实验室正常值范围线下整理后一次性导入;aq)支持实验室正常值范围字典更新后系统自动红色提示,DM可手动进行已有CRF表数据的范围更新;ar)支持访视提醒日历在线查看、按Open时间邮件提醒;as)支持按单中心启动对应CRF表版本;at)支持与数据分析模块对接,支持患者360全景图查看,支持研究层次多维度报表查看。患者随访管理模块本功能宜满足患者随访服务体系要求,包括患者调查表收集、患者居家任务配置、随访提醒、用药提醒等。a)支持配置居家方案与医生应用端在访视内的数据表单进行绑定,实现数据互通;b)支持医生应用端对患者应用端绑定后的方案进行临时调整,c)支持患者应用端对相关原始数据照片的上传,并同步到已绑定的医生应用端表单;d)支持患者执行服药打卡、数据填写、评分表填写、化验单上传、不良事件上报、合并用药上报等多项任务;e)支持患者数据可视化查看,观察自己的数据变化趋势。如饼图、折线图;统计分析模块本功能宜满足多种临床统计方法的集成与智能化应用。a)支持多种统计方法集成应用,包括统计描述、假设检验、相关性分析、回归分析、生存分析、ROC曲线、协方差分析、TimeROC分析、决策曲线等;b)支持数据或数据集上传,c)支持研究者从疾病名称、产品名称、研究类型、设计方案、统计方法、语种及关键词等多个角度筛选目标分析模型;d)支持按照主要统计分析计划或者研究目的给平台项目配置智能分析模型,一键分析;e)支持统计分析结果导出word格式;f)支持三线表格式导出。7.11.3服务能力本文件定义的技术平台应满足以下服务能力要求:a)应支持适宜的响应时间:用户进行在线实时查询业务操作,支持查询时间低于5秒的秒级搜索。b)应支持适宜的系统容量:可存储的医疗健康数据(包括EMR数据、生物样本库数据、实验室数据等)满足实际工作需求。T/CMEASXXXX-XXXXc)应支持适宜的系统并发用户数:用户同时并发数量满足协同工作实际需要。d)应支持自适应的专病库包含字段数:用户可针对业务需求自主选择相应的专病库包含字段数。e)应支持适宜的专病数据库包含数据量:采用分布式多处理机结构,支持动态拓展医疗健康数据存储以满足实际业务需要。7.12数据确权7.12.1数据资源分为公共数据、企业数据、个人数据。对各级党政机关、企事业单位依法履职或提供公共服务过程中产生的数据属于公共数据。对各类市场主体在生产经营活动中采集加工的不涉及个人信息和公共利益的数据属于企业数据。载有可识别特定自然人信息的数据,不包括匿名化处理后的数据属于个人数据。7.12.2数据资源的权属厘定,需根据数据来源和数据生成特征,分别界定数据生产、流通、使用过程中各参与方享有的合法权利,建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制,推进非公共数据按市场化方式‘共同使用、共享收益’的新模式,为激活数据要素价值创造和价值实现提供基础性制度保障。7.12.3分析数据资源主体是否合法拥有或合法控制,以确定数据持有权;依据数据资源应用情况,分析数据资源的使用权以及数据产品经营权等数据产权。涉及公共数据,需通过公共数据运营授权,获得相关资产化权利。7.12.4在2022年12月19日中共中央国务院对外发布的《关于构建数据基础制度更好发挥数据要素作用的意见》里,公共数据是指各级党政机关、企事业单位依法履职或提供公共服务过程中产生的数据。在中国公立医院属于事业单位,是由国家机构举办或者由其他组织利用国有资产举办的,从事公益服务活动的组织。所以公立医院在对外提供公共服务过程中所采集产生的医疗健康数据属于公共数据。7.12.5按照《关于构建数据基础制度更好发挥数据要素作用的意见》的内容,鼓励公共数据在保护个人隐私和确保公共安全的前提下,按照“原始数据不出域、数据可用不可见”的要求,以模型、核验等产品和服务等形式向社会提供,对不承载个人信息和不影响公共安全的公共数据,推动按用途加大供给使用范围。推动用于公共治理、公益事业的公共数据有条件无偿使用,探索用于产业发展、行业发展的公共数据有条件有偿使用。这也说明了作为公共数据的医疗健康数据具有财产属性,医疗机构对医疗健康数据享有财产性权益。7.12.6医疗健康数据是源于患者个人,而由医疗机构在诊疗过程中采集、制作保管形成的有价值的资源,因而医疗健康数据上存在患者(个人)和医疗机构两个利益主体,涉及患者利益和医疗机构的私人利益。但基于多数患者不具备医学和IT知识和能力,无法管控并形成可以分析利用的医疗数据资源。从医疗数据有效利用的角度,在严格保障了患者隐私安全同时取得其授权同意,并承认患者对其医疗数据享有分享利益的权利下,承认医疗机构对于医疗数据享有财产性权益并赋予其开发利用的权利,利于数据价值最大化。7.12.7医疗数据从产生到应用全生命周期都离不开医疗机构的控制行为,因此,医疗机构基于医疗数据的财产属性以及对于医疗数据的控制行为,满足上文提到的数据持有权的数据产权制度,可对符合条件的医疗数据进行开发利用,形成数据资产并享有相关收益。8数据资产质量评价8.1工作流程T/CMEASXXXX-XXXX8.1.1在不同数据场景中,医疗机构的数据会持续动态产生,数据量不断增加,因此确保数据质量并对数据质量进行评价是一个持续过程,医疗机构应建立一套工作流程管理和评价数据质量。a)确定数据资产质量目标数据资产质量评价是以数据开发和应用需求为中心进行的,需通过明确具体业务针对临床数据的需求特征建立适用性的数据资产质量评价指标体系。b)确定评价对象及范围确定数据资产质量评价适用的数据集范围和边界,明确源数据、元数据、数据集在属性、数量、时间等维度的具体界限。c)确定数据资产质量评价指标临床数据在不同的数据类型和不同的数据过程阶段,确定可测、可用的数据质量监控指标和评价指标。d)确定数据资产质量评价方法数据质量评价在确定其具体指标和指标对象后,应该根据临床数据中每个评价对象的特点,确定其实现方法。对于不同的评价对象,需要不同的实现方法支持,所以应该根据质量对象的特点确定其评价方法。e)实施数据资产质量评价根据前面四步确定的质量对象、范围、指标及其实现方法实现质量评价过程。医疗机构的数据资产质量应当由多个质量指标评测反映,单个数据指标评价不能充分、客观评价由某一数据质量范围所限定的数据质量状况,也不能为数据集的所有可能的应用提供全面的参考,多个维度的质量评价指标组合可提供更加丰富的评价考量。f)撰写质量评价结果分析报告数据资产质量评价结果分析报告,除最后结论,还应当还包括对最后结论的分析和解读,并通过附有可视化图表予以附征。数据质量评价报告不是最终的目的,还应包括数据资产质量改善建议,对于下阶段临床数据的数据治理、数据资产质量管理、临床研究改善和临床数据要素活动等具有参考意义。8.2质量问题类型a)重复数据主要采用数据库技术和人工智能方法,主要包括关系数据库数据的重复记录检测和XML元素重复元素检测。对于关系数据库里的数据进行重复检测,主要用以下方法进行识别:排序&合并方法、建索引方法、机器学习方法、根据上下文信息识别、基于特定领域知识的方法、根据数据特征的方法。b)缺失数据缺失数据处理的研究主要分布在统计领域和数据库领域。主要分成单一填补法和多重填补法其中单一填补法是指对缺失值构造单一替代值来填补,常见的方法有取平均值或中间数填补法、回归填补法、最大期望填补法、hotdeck填补等方法。c)异常数据数据中异常一般是由两种原因造成的:一是数据固有变异性造成的,另外一种则是由于度量或执行错误导致的,在数据清洗时这两者都应予以关注。在数据清洗领域对异常数据的自动化发现主要采用数据审计的方法来解决d)逻辑错误具体的信息化系统都是面向某一个应用领域的,对于一个具体的应用如何采用自动化的方法来解决数据中不符合业务逻辑的错误,其思路是根据应用依赖的领域知识建立规则体系来自动处理。e)不一致数据多个数据源的数据集成清洗的时候,几个独立维护的数据源经常提供相互重叠的数据内容,会出现不一致的数据,从若千个不一致的数据结果中获得理想的数据答案是数据清洗经常面临的问题。目前常用的方法有排序、融合和根据规则的方式。T/CMEASXXXX-XXXX8.3质量监控指标8.3.1数据质量监控指标由数据项目和质量属性两个部分组成。8.3.2数据项目是指数据技术平台中需要进行数据质量监控和管理的数据项目,并非所有数据项目都涉及质量问题,需要选择。8.3.3质量属性是指每个数据项目的量描述,包括:数据的合法值域,表述数据的类型、长度和取值区间、正常值,以及遵从的标准等,数据的完整性,表述数据是否完整,有无缺失和漏项,数据的一致性,表述同一数据的同一属性在数据系统或数据集内是否一致:数据的关联性,表述数据系统或数据集内数据间是否存在逻辑、数值、应用等方面的关联;数据的有效性,表述数据是否满足应用系统定义的条件:数据的唯一性,表述数据在数据系统或数据集内是否存在重复记录。8.4质量评价指标8.4.1儿童临床数据的数据资产质量评价业务,需严格遵守中国资产评估协会《数据资产评估指导意见》中的数据质量评价指标,包含规范性、完整性、准确性、一致性、时效性、可访问性。数据资产质量评价机构及其数据质量评价专业人员通过质量评价指标初选、专家咨询、质量评价指标权重确定等流程来确定儿童临床数据质量评价指标体系,并从中选择适当的二级评价指标。质量评价指标初选是指需围绕儿童临床数据找寻出多个一级指标和二级指标。专家咨询是指需要对有权威的样本医院进行问卷调研来调整指标明细以及权重。8.4.2数据资产质量评价指标体系设计应遵循科学性、合理性、系统性、可操作性、可扩充性这五大原a)规范性:即数据符合数据标准、业务规则和元数据等要求的规范程度。下设值域合规率,元数据合规率,格式合规率,安全合规率四个二级评价指标。值域合规率:数据项值域符合标准规范的元素数量与元素总数量之比。值域也可以认为是数据值,数据值就是数据项的内容,即通过进行测量对目标实体的属性所赋予的数值或者类别。元数据合规率:数据集符合元数据规范的元素数量与元素总数量之比。元数据是指定义和描述其他数据的数据,主要用来指示数据类型、内容概要、存储路径、数据访问权、资源查找、信息记录等,其基本功能是描述数据的内容,便于更准确地识别、存取利用的数据。格式合规率:数据集格式符合标准规范的元素数量与元素总数量之比。安全合规率:数据集符合适用法律法规和行业安全规范的元素数量与元素总数量之比。b)完整性即构成数据资产的数据元素被赋予数值程度。下设数据元素填充率,记录填充率,数据项填充率三个二级指标。元素填充率:数据集赋值的元素数量与元素总数量之比。记录填充率:数据集赋值完整的记录条数与记录总条数之比。数据项填充率:数据集赋值完整的数据项数量与数据项总数量之比。c)准确性即数据资产准确表示其所描述事物和事件的真实程度。下设数据内容准确率、精度准确率,记录重复率,脏数据出现率四个二级指标。内容准确率:数据集内容表述正确的元素数量与元素总数量之比。数据集是指数据记录汇聚的数据形式。元素是组成数据源中记录或者数据项的最小单元。精度准确率:数据项精度符合标准规范的元素数量与元素总数量之比。数据项是指对应于数据源中一列信息的一组完整的内容。T/CMEASXXXX-XXXX记录重复率:数据集重复记录条数与记录总条数之比。数据记录是指对应于数据源中一行信息的一组完整的内容。脏数据出现率:数据集无效数据(非法字符和业务含义错误的数据)元素数量与元素总数量之比。d)唯一性即不同数据资产描述同一个事物和事件的无矛盾程度。下设元素赋值唯一率一个二级指标。元素赋值唯一率:数据集具有相同含义数据(同一时点、存储在不同位置)赋值唯一的元素数量与元素总数量之比。e)时效性即数据真实反映事物和事件的及时程度。下设周期及时性,实时及时性两个二级指标。周期及时性:数据集赋值满足业务周期频率要求的元素数量与元素总数量之比。实时及时性:数据集赋值延迟时间满足业务要求的元素数量与元素总数量之比。f)可访问性即数据能被正常访问的程度。下设可访问度一个二级指标。可访问度:数据集请求访问成功的元素数量与请求访问元素总数量之比。8.4.3每项二级指标,要明确精准统计满足二级指标的数据集中元素的个数。8.4.4数据资产质量评价采用的方法参考中评协印发的《数据资产评估指导意见》,包括但不限于:层次分析法、模糊综合评价法和德尔菲法等。执行数据资产质量评价业务,应当具备数据资产质量评价的专业知识和实践经验,能够胜任所执行的数据资产质量评价业务。缺乏特定的数据资产质量评价专业知识、技术手段和经验时,应当采取弥补措施,包括利用临床数据领域专家工作成果及相关专业报告等。8.5数据资产质量评价披露要求8.5.1出具数据资产质量评价报告,应当在质量评价报告中披露必要信息,使质量评价报告使用人能够正确理解评价结论。出具数据资产质量评价报告,应当说明下列内容:a)数据资产基本信息和权利信息;b)数据质量评价情况,评价情况应当包括但不限于评价目标、评价方法、评价结果及问题分析等内容;c)评价依据的信息来源;d)利用专家工作或者引用专业报告内容;e)评价方法的选择及其理由;f)各重要参数的来源、分析、比较与评价过程;g)对评价结果进行分析,形成评价结论的过程;h)评价结论成立的假设前提和限制条件。9数据资产价值评估9.1数据资产价值评估导论本指导意见所称数据资产价值评估,是指资产评估机构及其资产评估专业人员遵守法律、行政法规和资产评估准则,根据委托对医疗机构评估基准日特定目的下的数据资产价值进行评定和估算,并出具资产评估报告的专业服务行为。9.1.1执行临床数据资产价值评估业务,应当遵守财政部颁发的《资产评估基本准则》《企业数据资源相关会计处理暂行规定》、中评协印发的《数据资产评估指导意见》及其他相关资产评估准则,以及《健康医疗大数据应用发展指导意见》、《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》T/CMEASXXXX-XXXX等法律、行政法规,坚持独立、客观、公正的原则,诚实守信,勤勉尽责,谨慎从业,遵守职业道德规范,自觉维护职业形象,不得从事损害职业形象的活动。9.1.2执行临床数据资产价值评估业务,应当独立进行分析和估算并形成专业意见,拒绝委托人或者其他相关当事人的干预,不得直接以预先设定的价值作为评估结论。9.1.3执行临床数据资产价值评估业务,应当具备临床数据资产价值评估的专业知识和实践经验,能够胜任所执行的数据资产价值评估业务。缺乏特定的数据资产评估专业知识、技术手段和经验时,应当采取弥补措施,包括利用临床数据领域专家工作成果及相关专业报告等。9.1.4执行临床数据资产价值评估业务,应当关注医疗机构临床数据资产的安全性和合法性,并遵守保密原则。9.2数据资产属性9.2.1执行临床数据资产价值评估业务,通过委托人、相关当事人等提供或者自主收集等方式,了解和关注被评价医疗机构数据资产的属性信息。即中评协印发的《数据资产评估指导意见》的数据资产三大属性,分别为信息属性、法律属性、价值属性。9.2.2信息属性主要包括数据名称、数据结构、数据字典、数据规模、数据周期、产生频率及存储方式9.2.3法律属性主要包括授权主体信息、产权持有人信息,以及权利路径、权利类型、权利范围、权利期限、权利限制等权利信息。9.2.4价值属性主要包括数据覆盖地域、数据所属行业、数据成本信息、数据应用场景、数据质量、数据稀缺性及可替代性等。9.2.5执行临床数据资产价值评估业务,应当根据临床数据来源和数据生成特征,关注数据资源持有权、数据加工使用权、数据产品经营权等数据产权,并根据评估目的、权利证明材料等,确定评估对象的权利类型。9.2.6同一数据资产在不同的应用场景下,通常会发挥不同的价值。资产评估专业人员应当通过委托人、相关当事人等提供或者自主收集等方式,了解相应评估目的下评估对象的具体应用场景,选择和使用恰当的价值类型。9.3数据资产特征9.3.1执行数据资产价值评估业务,应当知晓数据资产具有非实体性、依托性、可共享性、可加工性、价值易变性、行业属性等特征,其中前五大特征出自中评协印发的《数据资产评估指导意见》中数据资产的五大特征,注重数据资产特征对评估对象的影响。9.3.2非实体性是指数据资产无实物形态,虽然需要依托实物载体,但决定数据资产价值的是数据本身。数据资产的非实体性也衍生出数据资产的无消耗性,即其不会因为使用而磨损、消耗。9.3.3依托性是指数据资产必须存储在一定的介质里,介质的种类包括磁盘、光盘等。同一数据资产可以同时存储于多种介质。9.3.4可共享性是指在权限可控的前提下,数据资产可以被复制,能够被多个主体共享和应用。9.3.5可加工性是指数据资产可以通过更新、分析、挖掘等处理方式,改变其状态及形态。9.3.6价值易变性是指数据资产的价值易发生变化,其价值随应用场景、用户数量、使用频率等的变化而变化。9.3.7行业属性是指行业本身具有的性质和特点。医疗健康行业具有其独特的技术性、专业性,以及严格的行业监管属性,与之相关的医疗健康行业数据资产在各个环节都受到国家相关法律法规的严格监管,确保医疗健康行业数据的安全、有效、质量可控。T/CMEASXXXX-XXXX9.4价值影响因素9.4.1执行临床数据资产评估业务,需要关注影响数据资产价值的成本因素、场景因素、市场因素、质量因素和行业因素,其中前四大因素出自中评协印发的《数据资产评估指导意见》中数据资产的四个因素。9.4.2成本因素包括形成临床数据资产所涉及的前期费用、直接成本、间接成本、机会成本和相关税费9.4.3场景因素包括临床数据资产相应的使用范围、应用场景、商业模式、市场前景、财务预测和应用风险等。9.4.4市场因素包括临床数据资产相关的主要交易市场、市场活跃程度、市场参与者和市场供求关系等。9.4.5质量因素包括临床数据的准确性、一致性、完整性、规范性、时效性和可访问性等。9.4.6行业因素包括临床数据相关的医疗卫生机构网络安全管理办法,国家健康医疗大数据标准、安全和服务管理办法等。9.5数据资产价值评估方法9.5.1确定数据资产价值的评估方法包括收益法、成本法和市场法三种基本方法及其衍生方法。9.5.2执行数据资产评估业务,资产评估专业人员应当根据评估目的、评估对象、价值类型、资料收集等情况,分析上述三种基本方法的适用性,选择评估方法。9.5.3采用收益法评估临床数据资产时应当:a)根据数据资产的历史应用情况及未来应用前景,结合应用或者拟应用数据资产的医疗机构经营状况,重点分析数据资产经济收益的可预测性,考虑收益法的适用性;b)保持预期收益口径与数据权利类型口径一致;c)在估算数据资产带来的预期收益时,根据适用性可以选择采用直接收益预测、分成收益预测、超额收益预测和增量收益预测等方式;d)区分数据资产和其他资产所获得的收益,分析与之有关的预期变动、收益期限,与收益有关的成本费用、配套资产、现金流量、风险因素;e)根据数据资产应用过程中的管理风险、流通风险、数据安全风险、监管风险等因素估算折现率;f)保持折现率口径与预期收益口径一致;g)综合考虑数据资产的法律有效期限、相关合同有效期限、数据资产的更新时间、数据资产的时效性、数据资产的权利状况以及相关产品生命周期等因素,合理确定经济寿命或者收益期限,并关注数据资产在收益期限内的贡献情况。9.5.4采用成本法评估临床数据资产时应当:a)根据形成数据资产所需的全部投入,分析数据资产价值与成本的相关程度,考虑成本法的适用性;b)确定数据资产的重置成本,包括前期费用、直接成本、间接成本、机会成本和相关税费等;c)确定数据资产价值调整系数,例如:对于需要进行质量因素调整的数据资产,可以结合相应质量因素综合确定调整系数;对于可以直接确定剩余经济寿命的数据资产,也可以结合剩余经济寿命确定调整系数。9.5.5采用市场法评估临床数据资产时应当:a)考虑该数据资产或者类似数据资产是否存在合法合规的、活跃的公开交易市场,是否存在适当数量的可比案例,考虑市场法的适用性;b)根据该数据资产的特点,选择合适的可比案例,例如:选择数据权利类型、数据交易市场及交易方式、T/CMEASXXXX-XXXX数据规模、应用领域、应用区域及剩余年限等相同或者近似的数据资产;c)根据数据资产价值的影响因素,比如数据有效性、稀缺性、场景经济性等因素,对比和分析调整可比数据资产的价值,并将调整后的结果汇总分析得出被评估数据资产的价值。通常情况下需要考虑质量差异调整、供求差异调整、期日差异调整、容量差异调整以及其他差异调整等。对同一数据资产采用多种评估方法时,应当对所获得的各种测算结果进行分析,说明两种以上评估方法结果的差异及其原因和最终确定评估结论的理由。9.5.6临床数据资产价值评估适用原则以及指标临床数据资产估值宜满足以下原则:a)安全合规原则,即在估值过程中需要关注数据资产的安全性和合法性,确保估值过程安全合规;b)目标导向原则,即能够实现为支持内部管理决策和促进外部数据要素流通提供量化参考的目标;c)合理假设原则,即数据资产作为医疗机构资产组成部分的价值可有别于作为单项资产的价值,宜采取适当方法区分数据资产和其他资产共同发挥作用时对组织的贡献,合理使用现状利用假设、公开市场假设、持续经营假设等估值假设;d)量化评估原则,即确保数据资产各方面信息的真实性、准确性,使用专业知识、技术手段和实践经验等,以数据应用特征匹配估值方法,构建数据资产管理估值指标体系,开展数据资产估值。估值指标体系和估值指标数据资产估值指标体系的内容主要包括成本价值、经济价值、市场价值和数据内在价值4大类指标:a)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 能源企业安全生产责任培训方案
- 运动会临时食材配送方案
- 高校食堂财务管理制度优化方案
- 学校实验楼维修施工方案
- 在线教育平台接口对接方案
- 娱乐场所经营合同协议书
- 数据中心设备减震施工方案
- 初中学校工会促进师生关系工作总结
- 工程承包合同协议书(2篇)
- 七年级新生班级建设方案
- 《应用统计学》(第4版)-自测试卷及答案B卷
- 《赋能年轻一代、共筑韧性未来》国际减灾日主题班会教案
- 10.1爱护身体(课件)-2024-2025学年统编版道德与法治七年级上册
- 2024口腔执业医师聘用合同
- 2024-2025学年人教版生物七年级上册期中备考重点知识
- 低空经济招商引资策略与措施
- 第10课《我们不乱扔》(课件)-部编版道德与法治二年级上册
- 阳光心理-健康人生小学生心理健康主题班会课件
- 2024年江苏苏州高新区(虎丘区)城乡发展局公益性岗位招聘3人历年高频考题难、易错点模拟试题(共500题)附带答案详解
- 人教版(2024)七年级地理上册2.2《地形图的判读》精美课件
- 黄河商品交易市场介绍稿
评论
0/150
提交评论