版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学信息学标准与数据第1页,共42页,2023年,2月20日,星期五背景--美国、英国、加拿大要建全民电子健康记录。--我国要建全民健康档案ElectronicHealthRecord,EHRHER要在全国通用,必须实现标准化。第2页,共42页,2023年,2月20日,星期五没有信息标准化,任何软件产品大范围的推广都有困难,不同部门之间的信息交换也存在困难。实现跨区域的电子医疗系统尤其困难。第3页,共42页,2023年,2月20日,星期五第一节信息标准化的定义与特点(一)信息标准化的定义:(1)狭义:信息表达上的标准化,在一定范围内能共同遵从和使用的对某类、某些、某个客体抽象的描述与表达。(2)广义:涉及信息元素的表达,信息处理,信息传输与通信,信息加工流程,信息处理技术与方法,信息处理设备等。第4页,共42页,2023年,2月20日,星期五信息表达:信息表达类标准化。如:ICD10:疾病分类编码系统CPT4:临床操作与服务的分类编码与术语体系SNOMED:人医和兽医系统命名法第5页,共42页,2023年,2月20日,星期五信息交换:目的是实现不同系统之间、不同部门、企业之间的信息共享。更注重信息的格式,与是什么内容无关,但要求接收方和发送方对内容有一致的理解。
第6页,共42页,2023年,2月20日,星期五三个标准:HL7:医疗卫生信息交换标准。规定当一个事件发生时,用何种方式将信息传递给需要信息的一方。XML:互联网信息交换标准。W3C1998年发布。DICOM:医学影像数据存贮和交换标准。第7页,共42页,2023年,2月20日,星期五信息的处理与流程:信息处理流程标准化和规范化。如:如我国财务电算化;美国病人分类系统。第8页,共42页,2023年,2月20日,星期五(二)信息标准化的特点明确的域:需要进行标准化的对象构成的域必须是明确的,能够很清晰地判断什么属于该域,什么不属于该域。域的定义与应用范围有关,因为用途和目的不同,同一客体的信息学属性便不同。举例:药物的属性(p13),根据药物的不同使用目的来定义不同的属性。第9页,共42页,2023年,2月20日,星期五唯一性:无论是一个客体还是一组客体,在标准化代码中都应该有而且仅有一个确定的代码与其对应。同一客体有多个编码会引起信息表达和信息交换中的混乱。完整性:编码应完整地表达客体信息。因为编码用途和分类不同,往往采用“收容组”来实现,即在编码中设置其他类别的编码,实现一码多用。面对比较复杂的客体,一码多用也不适用,这时还需要两个以上的编码,并且使用特殊标志进行说明,如卫氏并殖吸虫病(p13)。(二)信息标准化的特点第10页,共42页,2023年,2月20日,星期五(二)信息标准化的特点权威性:信息标准化最终要形成文本,在一定范围内得到认可和广泛应用,才能真正成为标准。要做到这一点,必须具有权威性。其制定和颁布要有主管部门负责完成,并在一定范围内强制执行。第11页,共42页,2023年,2月20日,星期五(三)、元数据(MetaData)与数据元(DataElement)元数据:关于数据的数据。是对信息资源的规范化描述,它是按照一定的标准,从信息资源中抽取相应的特征,组成的特征元素集合。第12页,共42页,2023年,2月20日,星期五元数据内容标准:包括描述一个具体对象时所需要的数据项集合、各数据项语义定义、著录规则、计算机应用时的语法规定等。元数据内容:一般包括标示信息、数据质量信息、内容信息、发行信息、元数据参考信息、联系信息等。第13页,共42页,2023年,2月20日,星期五制定元数据标准的意义:提高数据库建库质量,使数据加工达到规范化、标准化,促进科学数据的标准化,加强数据交流与共享。第14页,共42页,2023年,2月20日,星期五数据元:又称数据元素,是用一组属性描述定义、标识、表示以及允许值的数据单元。一般认为是不可再分的最小数据单元。用于构建一个无歧义的、具有特定概念语义的信息单元。第15页,共42页,2023年,2月20日,星期五组成数据元的三个部分:(1)对象类:思想、概念或真实世界中的事物集合,他们具有清晰的边界和含义,其特征和行为遵循同样的规则。是人们希望对其进行研究,并收集和存储他们相关的事物,如:汽车、人、订单。第16页,共42页,2023年,2月20日,星期五组成数据元的三个部分:(2)特性:见书第17页,共42页,2023年,2月20日,星期五(3)表示:表达数据的方式。表示与数据元的值域有密切的关系。数据元的值域是该数据元所有允许值的集合。P14。数据元概念:对象类+特性数据元:数据元概念+表示第18页,共42页,2023年,2月20日,星期五数据元的结构模型第19页,共42页,2023年,2月20日,星期五第二节数据分类与编码的基本原则与方法信息表达的标准化编码,可以按很多不同的轴向分类,不同层次和类别的标准用途不同。两种编码方法:命名法:以具体事物为对象,每一个事物对应一个唯一的、确切的代码与名称。分类法:仅仅把具体对象分类,然后给每一类事物以确切的编码。如ICD-10,一组病对应一个码。第20页,共42页,2023年,2月20日,星期五一、数据分类与编码的定义数据分类:根据数据的属性或特征,将分类对象按一定的原则和方法进行区分和分类,并建立起一定的分类体系和排列顺序的过程。数据分类的两个要素:分类对象和分类依据。分类对象由一系列被分类的数据组成。第21页,共42页,2023年,2月20日,星期五数据编码:将需要编码的对象赋予具有一定规律、易于计算机和人类识别、处理的符号,并形成对应的代码表的过程。数据编码的四个要素:编码对象、数据表达成代码的方法、数据的代码表示形式、代码表。p16第22页,共42页,2023年,2月20日,星期五二、数据分类的基本原则数据分类应遵循科学性、系统性、可扩展性、兼容性、综合实用性等基本原则。科学性:p16系统性:可扩展性和可维护性:实用性:第23页,共42页,2023年,2月20日,星期五三、数据分类的基本方法线分类法、面分类法、混合分类法(一)线分类法:将分类对象所选定若干属性(或特征)逐次地分成相应的若干个层级的类目,并排成一个有层次的、逐渐展开的分类体系。第24页,共42页,2023年,2月20日,星期五表2-1线分类法示例第25页,共42页,2023年,2月20日,星期五线分类法的优点:层次性好,能较好地反映类目之间的逻辑关系;实用方便,既符合手工习惯,又便于计算机处理。线分类法的缺点:结构弹性较差,分类结构一经确定,不易改动;效率较低,当分类层次较多时,代码位数较长。举例:WS/T8-1999,表2-1。p17第26页,共42页,2023年,2月20日,星期五(二)面分类法将所选的分类对象的若干属性或特征视为若干个“面”,每个“面”中又可分成若干个彼此独立的若干个类目。可以将这些“面”中的类目结合在一起,形成一个复合类目。第27页,共42页,2023年,2月20日,星期五面分类法的优点:具有较大的弹性,一个面内类目的改变,不会影响其它的面;适应性强,可根据需要组成任何类目,便于机器处理;易于添加和修改。面分类法的缺点:不能充分利用容量,可组配的类目很多,但有时实际应用的类目不多;手工处理困难。第28页,共42页,2023年,2月20日,星期五表2-2面分类法示例使用面分类法的4点要求:p18。第29页,共42页,2023年,2月20日,星期五(三)混合分类法面分类法和线分类法集合使用,以其中一种为主。举例:表2-3混合分类法示例第30页,共42页,2023年,2月20日,星期五四、代码类型的划分第31页,共42页,2023年,2月20日,星期五表2-4缩写码示例(1)有含义代码1、缩写码:按统一的方法缩写编码对象的名称,由取自编码对象名称中的一个或多个字符组成。优点:易记;压缩数据长度。缺点:以来表示方法,重码;稳定性差。第32页,共42页,2023年,2月20日,星期五2、层次码编码方法:以编码对象集合中的层级分类为基础,将编码对象编码成连续并且递增的组(类)。
适用于分类和统计。
优点和缺点:p20
举例:表2-5xxxxxx第一层大类第二层小类第三层更小类第33页,共42页,2023年,2月20日,星期五表2-5固定递增码示例(学科分类码)第34页,共42页,2023年,2月20日,星期五3、矩阵码:以复式记录表的实体为基础,赋予这个表中行和列相关坐标上编码对象一定的代码值。目的是为矩阵表中的标码对象赋予有意义的代码,这些编码对象在不同的组合中具有若干共同特性。特别适用于具有良好结构和稳定特性的编码对象。
优点和缺点:p20举例:区位码第35页,共42页,2023年,2月20日,星期五4、并置码:由一些代码段组成的复合代码,这些代码段描绘了编码对象的特性,这些特性是相互独立的,代码段的编码方式可以是任意类型。适用范围:p21优点和缺点:举例:轨道编码第36页,共42页,2023年,2月20日,星期五5、组合编码:若干代码段组成的复合代码,描绘编码对象的不同特性,这些特性相互依赖并且具有层次关联。
适用于标识目的。
优点和缺点:p21举例:身份证,表2-6第37页,共42页,2023年,2月20日,星期五表2-6组合码示例第38页,共42页,2023年,2月20日,星期五(二)无含义代码p22~231、顺序码:顺序码编码方法是从一个有序的字符集合中顺序地取出字符分配给各个编码对象。(1)递增顺序码(2)序列顺序码(3)约定顺序码第39页,共42页,2023年,2月20日,星期五表2-7递增顺序码示例(1)递增顺序码编码方法:编码对象被赋予的代码值,可由预定数字递增决定。
优点:能快速赋予代码值;简明;编码表达式容易确认。
缺点:编码对象的分类或分组不能由编码表达式来决定;不能充分利用最大容量。第40页,共42页,2023年,2月20日,星期五(2)系列顺序码编码方法:这种方法首先要确定编码对象的类别,按各个类别确定它们的代码取值范围,然后在各类别代码取值范围内对编码对象顺序地赋予代码值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030全球医用气泡探测器行业调研及趋势分析报告
- 山胡椒油行业行业发展趋势及投资战略研究分析报告
- 2024年职业教育培训行业发展前景预测及投资战略研究报告
- 2025年中国噻苯隆行业市场发展前景及发展趋势与投资战略研究报告
- 现代化棉花交易物流可行性研究报告申请备案立项
- 山东省某综合用房建设项目节能评估报告
- 2025年中国气动超音波仪器行业市场发展前景及发展趋势与投资战略研究报告
- 莱卡羊毛行业市场发展及发展趋势与投资战略研究报告
- 2025年新西兰红梨行业深度研究分析报告
- 2025年不锈钢匙扣项目投资可行性研究分析报告
- 2025年春季学期学校德育工作计划安排表(完整版)
- 2025年有机肥行业发展趋势分析报告
- 2023-2024年员工三级安全培训考试题及参考答案(综合题)
- 五年级口算题卡每天100题带答案
- 2024年全国初中数学联合竞赛试题参考答案及评分标准
- 人教版高中地理必修一全册测试题(16份含答案)
- 《民航服务沟通技巧》教案第11课孕妇旅客服务沟通
- 新东方四级词汇-正序版
- 面向机器人柔顺操作的力位精准控制方法研究共3篇
- 《地下工程测试技术》课程教学大纲
- 2023-2024学年天津市小学数学二年级上册期末高分试卷
评论
0/150
提交评论