信息资源组织与原理(第3版):第02章 信息的分类与编码_第1页
信息资源组织与原理(第3版):第02章 信息的分类与编码_第2页
信息资源组织与原理(第3版):第02章 信息的分类与编码_第3页
信息资源组织与原理(第3版):第02章 信息的分类与编码_第4页
信息资源组织与原理(第3版):第02章 信息的分类与编码_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息资源组织与管理信息资源组织与管理第第 2 2 章章 信息的分类与编码信息的分类与编码星期三星期三9时时52分分18秒秒 1/68星期三星期三9时时52分分18秒秒 内容提要(1/4)2.0 基本概念基本概念2.0.1 信息分类与编码的概念2.0.2 对信息进行分类与编码的重要意义2.1 信息元素的涵义信息元素的涵义 2.1.1 信息元素的概念2.1.2 信息元素的命名原则2.1.3 信息元素的标识2.1.4 信息元素的一致性2.1.5 信息元素与数据库之间的关系2/ 68星期三星期三9时时52分分18秒秒 内容提要(2/4)2.2 信息分类的方法信息分类的方法2.2.1 信息分类的概念2.

2、2.2 信息分类的基本原则2.2.3 信息分类的基本方法 线分类法线分类法 面分类法面分类法 混合分类法混合分类法2.2.4 信息分类的综合案例()分类范围、分类维度和分类方法分类范围、分类维度和分类方法分类实施过程分类实施过程3/ 68星期三星期三9时时52分分18秒秒 内容提要(3/4)2.3 信息编码方法信息编码方法2.3.1 信息编码与信息代码的概念2.3.2 信息编码的原则2.3.3 信息代码的功能2.3.4信息代码分类(或信息编码方法) 信息代码体系表信息代码体系表 符号代码法符号代

3、码法 符号含义代码法符号含义代码法4/ 68星期三星期三9时时52分分18秒秒 内容提要(4/4)2.3 信息编码方法信息编码方法2.3.5 信息代码的校验 信息编码错误归类及其解决方法信息编码错误归类及其解决方法 信息编码错误的校验常用方法信息编码错误的校验常用方法 信息编码错误的校验步骤信息编码错误的校验步骤 校验案例校验案例 2.3.6 信息编码的综合案例: 公民身份证编码示例公民身份证编码示例 公民身份证编码规则公民身份证编码规则 地址码(地址码(ABCDEF )2.3.6.

4、4出生日期码(出生日期码(YYYYMMDD) 顺序码(顺序码( XXX ) 校验码校验码2.4 作业作业 (.)5/ 68星期三星期三9时时52分分18秒秒 2.0.1 信息分类与编码的概念信息分类与编码的概念1.1.信息分类的概念信息分类的概念信息分类就是将具有某种共同特性或特征的信息归信息分类就是将具有某种共同特性或特征的信息归并在并在起,把不具有上述共性的信息区分开来的过起,把不具有上述共性的信息区分开来的过程。程。2.2.信息编码的概念信息编码的概念信息编码是将表示信息的某种符号体系信息编码是将表示信息的某种符号体系( (如文字、如文字、图像图像) )转换成

5、便于计算机识别和处理的另一种符号转换成便于计算机识别和处理的另一种符号体系的过程。体系的过程。 6/ 68星期三星期三9时时52分分18秒秒 2.0.2 对信息进行分类与编码的重要意义对信息进行分类与编码的重要意义随着社会经济、科学技术的发展随着社会经济、科学技术的发展 人们可利用的信息量急剧增人们可利用的信息量急剧增长长 提高这些信息资源的综合利用水平成为人们社会生活中提高这些信息资源的综合利用水平成为人们社会生活中亟待解决的问题?亟待解决的问题?上述问题中必须首先解决的关键问题就是:如何识别、组织这些信息资源?而对是解决这一问题的前提与关键:信息的效用在于交流信息的效用在于交流。进行信息交

6、流的各方只有对表示信息的符号体系。进行信息交流的各方只有对表示信息的符号体系有统一的理解,这种交流才有意义,信息才能得到有效的利用。有统一的理解,这种交流才有意义,信息才能得到有效的利用。信息信息按科学的原则进行按科学的原则进行分类与编码分类与编码,并依次作为一定范围内(如国际、,并依次作为一定范围内(如国际、国家、地区、行业、企业)共同遵守的准则和国家、地区、行业、企业)共同遵守的准则和进行信息交换的共同语言进行信息交换的共同语言(即标准)(即标准)。7/ 68星期三星期三9时时52分分18秒秒 2.1.1 信息元素的概念信息元素的概念信息元素(又称数据元素或数据项)是最小的不可再信息元素(

7、又称数据元素或数据项)是最小的不可再分的信息单位,是一类信息的总称。分的信息单位,是一类信息的总称。例如:例如:船舶资料中的船名“天河轮”、“冀海轮”等,可以抽象出“船舶名称”这个数据元素;每一条船都有一个编号,可以概括出“船舶编号”这个数据元素。通常职工档案中的“简历”、“受奖情况”等,不是信息元素。因为“简历”至少包括时间、地点等信息,是可以继续分解的信息;“受奖情况”也是可以继续分解的信息。8/ 68星期三星期三9时时52分分18秒秒 2.1.2 信息元素的命名原则(信息元素的命名原则(1/3)1 1、命名原则、命名原则信息元素命名的原则就是用一简明的来描述一个信息元素的意义和用途。 2

8、 2、词组的一般结构、词组的一般结构类别词和基本词都只有个,修饰词可以有一个或多个。修饰词一基本词一类别词修饰词一基本词一类别词9/ 68星期三星期三9时时52分分18秒秒 2.1.2 信息元素的命名原则(信息元素的命名原则(2/3)2 2、词组的一般结构(续)、词组的一般结构(续)类别词和基本词都只有个,修饰词可以有一个或多个()是信息元素命名中的是信息元素命名中的个最重要的名词,用来识别和描述个最重要的名词,用来识别和描述信息元素的一般信息元素的一般,一般不具有行业持征,条目较少。,一般不具有行业持征,条目较少。如数量(如数量(AMOUNTAMOUNT)、名称()、名称(NAMENAME)

9、、编号()、编号(NUMBERNUMBER)、代码)、代码(CODECODE)等。)等。 是类别词的最重要的修饰词,它对一大类信息对象进一步是类别词的最重要的修饰词,它对一大类信息对象进一步分类(反映一小类信息对象),一般具有分类(反映一小类信息对象),一般具有特征,条目较多。特征,条目较多。如会计(如会计(ACCOUNTINGACCOUNTING)、预算()、预算(BUDGETBUDGET)、顾客()、顾客(CUSTOMERCUSTOMER)等。等。10/ 68星期三星期三9时时52分分18秒秒 2.1.2 信息元素的命名原则(信息元素的命名原则(3/3)3 3、信息元素命名案例、信息元素命

10、名案例社会保险编码 (修饰词)、(修饰词)、(基本词)、(基本词)、(类别词)(类别词)学校学生学号、九龙学院学生学号学校贵重设备名称(修饰词)、(修饰词)、(修饰词)、(修饰词)、(基本词)、(基本词)、(类(类别词)别词)11/ 68星期三星期三9时时52分分18秒秒 2.1.3 信息元素的标识信息元素的标识是计算机和管理人员共同使用的标识。用,字母字符可按信息元素名称的汉语拼音抽取首音字字母,也可按。12/ 68星期三星期三9时时52分分18秒秒 2.1.4 信息元素的一致性信息元素的一致性和和要在组织(政府部门或要在组织(政府部门或企事业单位)中企事业单位)中。不允许有不允许有“”的信

11、息元素。的信息元素。也不允许有也不允许有“”的信息元素的信息元素。这里的”是指信息元素的标识;“”是指信息元素的命名或定义。13/ 68星期三星期三9时时52分分18秒秒 2.1.5 信息元素与数据库之间的关系信息元素与数据库之间的关系1. 结构化数据库系统涉及元数据、主数据等数结构化数据库系统涉及元数据、主数据等数据的管理。据的管理。又称数据的数据,它是用来描述数据及其环境的结构化信息,相当于数据库表单中的“”,它是典型的信息元素。学生管理系统中。信息元素(元数据)有信息元素(元数据)有姓名姓名、学号学号、性别性别等。等。14/ 68星期三星期三9时时52分分18秒秒 2.2.1 信息分类的

12、概念信息分类的概念1. 信息分类定义信息分类定义信息分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序。2.信息分类的两个要素信息分类的两个要素一是分类对象分类对象:由若干个被分类的实体组成;二是分类的依据:分类依据取决于分类对象的属性或特征。信息内容属性的相同或相异,形成了各种不同的类信息内容属性的相同或相异,形成了各种不同的类(或类目或类目)。选择信息的本质属性和特征作为分类的依据,使分类体系结构具有稳定选择信息的本质属性和特征作为分类的依据,使分类体系结构具有稳定性,以供人们方便地使用。性,以供人们方便地使用。 15/ 68星期三星期

13、三9时时52分分18秒秒 2.2.2 信息分类的基本原则(信息分类的基本原则(1/3)1 1、科学性、科学性使类别的划分符合信息的内涵、性质及使用与管理要求;选择信息的本质属性和特征作为分类的依据,使分类体系结构具有稳定性,以供人们方便地使用。 2 2、系统性、系统性分类结构中各类信息按照他们之间的相互联系排成一定的顺序,形成一个系统,既便于人们区分信息、识别信息,又便于人们从整体上去把握信息之间的关系。16/ 68星期三星期三9时时52分分18秒秒 2.2.2 信息分类的基本原则(信息分类的基本原则(2/3)3 3、可扩展性、可扩展性随着科学技术的进步和社会经济的发展,人们可利用的信息量急剧

14、增长,信息的类别和分类体系结构也应适应这种变化的需要,这就要求:分类体系结构在原有的基础上有扩展的余地,其中包括新的类别分类体系结构在原有的基础上有扩展的余地,其中包括新的类别的增补和在原有类别的基础上进行分解、细化。的增补和在原有类别的基础上进行分解、细化。 4 4、兼容性、兼容性信息的分类是一个庞大而复杂的系统,这个大系统中存在着若干层分系统与子系统,一些子系统之间存在着相互联系和信息共享问题:如生产类信息和人事类信息中都包含工人这一类信息。生产类信息在对如生产类信息和人事类信息中都包含工人这一类信息。生产类信息在对工人这一信息的定义和再分类时就要和人事类信息兼容。工人这一信息的定义和再分

15、类时就要和人事类信息兼容。 17/ 68星期三星期三9时时52分分18秒秒 2.2.2 信息分类的基本原则(信息分类的基本原则(3/3)5 5、实用性、实用性由于信息的属性与特征的多样性,在实际生活中选择何种属性与特征进行分类还要考虑到人们实际应用的需要。例如:某企业在开发新产品时,管理部门、设计部门与制造部门从各自的应用目的出发,对信息的分类会提出不同的要求。管理部门从企业的经营管理目标出发,希望信息的分类要便于生产的计管理部门从企业的经营管理目标出发,希望信息的分类要便于生产的计划与控制,并能反映成本和市场需求方面的情况;划与控制,并能反映成本和市场需求方面的情况;设计部门则从设计需要出发

16、,希望信息的分类体系体现新产品开发组合设计部门则从设计需要出发,希望信息的分类体系体现新产品开发组合化化( (模块化模块化) )、标准化、序列化的趋势;、标准化、序列化的趋势;制造工艺部门则从实现产品的小批量、多品种成组生产,以提高生产效制造工艺部门则从实现产品的小批量、多品种成组生产,以提高生产效率和质量的目的出发,希望信息的分类体系能反映产品的量、部件的几率和质量的目的出发,希望信息的分类体系能反映产品的量、部件的几何特征与工艺特性。何特征与工艺特性。因此,因此,。 18/ 68星期三星期三9时时52分分18秒秒 线分类法(线分类法(1/4)1 1、线分类法的基本思想、线分

17、类法的基本思想(又称或)是将初始的分类对象(即被划分的事物或概念)按所选定的若干个属性/特征作为分类的划分基础,逐次地分解成若干个层级类目,并编排成一个逐级展开、有层次的分类体系。同层级类目之间存在着并列关系,称为同位类。同层级类目之间存在着并列关系,称为同位类。一个层级类目经分解形成的下层类目,称为下位类;相应的被分一个层级类目经分解形成的下层类目,称为下位类;相应的被分解的类目称为上位类;上位类与下位类的关系是隶属关系。解的类目称为上位类;上位类与下位类的关系是隶属关系。19/ 68星期三星期三9时时52分分18秒秒 线分类法(线分类法(2/4)1 1、线分类法的基本思想(

18、续)、线分类法的基本思想(续)同层级类目互不重复,不同层级的类目互不交叉。每个下位层的同层级类目互不重复,不同层级的类目互不交叉。每个下位层的类目只对应于一个上位层,类目只对应于一个上位层,具体格式具体格式如下(类似如下(类似windows windows 系统的资源管理器系统的资源管理器)20/ 68星期三星期三9时时52分分18秒秒 线分类法(线分类法(3/4)2 2、线分类法的典型案例、线分类法的典型案例(以下为河北省部分案例以下为河北省部分案例)国民经济行业分类与代码国民经济行业分类与代码(GBT 47541994)和)和职业分类职业分类与代码与代码(GBT 65651

19、999) 21/ 68星期三星期三9时时52分分18秒秒 线分类法(线分类法(4/4)3 3、线分类法的优缺点、线分类法的优缺点优点:可容纳较多类目的信息。可容纳较多类目的信息。采用树形结构能较好反映类目之间的逻辑关系。采用树形结构能较好反映类目之间的逻辑关系。既符合手工处理信息的思维习惯,又便于计算机处理。既符合手工处理信息的思维习惯,又便于计算机处理。缺点:。分类结构一经确定,不易改动。分类结构一经确定,不易改动。当分类层次较多时,编码的位数较长,影响数据处理。当分类层次较多时,编码的位数较长,影响数据处理速度。速度。 22/ 68星期三星期三9时时52分分18秒秒 2.2

20、.3.2 面分类法(面分类法(1/3)1 1、面分类法的基本思想、面分类法的基本思想是按分类对象多个方面的属性与特征的异同来建立分类体系的。将给定的分类对象按选定的分成(简称属性面或面),包含了。从选定的面中每面作为描述的事物的属性值,以构成面分类法的分类体系中的一个。 将按顺序将各个“面”的代码进行组合,即为某对象代码。23/ 68星期三星期三9时时52分分18秒秒 面分类法(面分类法(2/3)2 2、面分类法的典型案例、面分类法的典型案例某高校教师分类编码24/ 68星期三星期三9时时52分分18秒秒 面分类法(面分类法(3/3)3 3、面分类法的优缺点、面

21、分类法的优缺点优点:一个面内的属性内容与数量的调整不会影响其一个面内的属性内容与数量的调整不会影响其他的面。他的面。可根据需要组成任何类目,也便于机器处理。可根据需要组成任何类目,也便于机器处理。 缺点:。在面分类法形成的分类体系中,可组成的类。在面分类法形成的分类体系中,可组成的类目很多,但有时实际应用的类别不多。目很多,但有时实际应用的类别不多。 25/ 68星期三星期三9时时52分分18秒秒 混合分类法混合分类法1 1、混合分类法的基本思想、混合分类法的基本思想用用形成的分类体系中有些部分需要采用面分类法;形成的分类体系中有些部分需要采用面分类法;用用形成的分类体系中也存

22、在部分用线分类法定义的类形成的分类体系中也存在部分用线分类法定义的类目。这种分类方法称为混合分类法。目。这种分类方法称为混合分类法。2 2、案例:、案例:上述教师的面分类体系上述教师的面分类体系中的从事专业,又可以分为学科门类中的从事专业,又可以分为学科门类( (如管理学、如管理学、工学等工学等) ),学科门类下设若干一级学科,每个一级学科一般设有若干二级,学科门类下设若干一级学科,每个一级学科一般设有若干二级学科。学科。这样,从事专业这一面可按线分类法分成学科门类、一级学科、二级学这样,从事专业这一面可按线分类法分成学科门类、一级学科、二级学科三个层次,如表科三个层次,如表2.32.3所示。

23、其中,一级学科用三位数字表示,二级学科所示。其中,一级学科用三位数字表示,二级学科用两位数字表示;一、二级学科之间用点隔开。用两位数字表示;一、二级学科之间用点隔开。 26/ 68星期三星期三9时时52分分18秒秒 分类范围、分类维度和分类方法分类范围、分类维度和分类方法(1/2)0.0.铁路大数据背景铁路大数据背景铁路大数据涵盖铁路勘测设计、建设和运营等各阶段,在铁路数据目录梳理、铁路数据交换共享、铁路数据建模分析、铁路数据安全保护等铁路大数据管理场景下均需对铁路大数据进行分类。1. 铁路大数据分类范围铁路大数据分类范围铁路大数据分类范围包括由铁路客运、物流、基础设施、移动设

24、备、工程建设、资产经营、企业管理等各铁路业务领域的结构化、非结构化数据所汇集而成的数据集合。27/ 68星期三星期三9时时52分分18秒秒 分类范围、分类维度和分类方法分类范围、分类维度和分类方法(2/2)2. 分类维度。分类维度。铁路大数据分类维度选择按数据格式分类、按产生来源分类、按产生频率分类、按业务归属分类。3. 分类方法分类方法铁路大数据分类方法采用以线分类法为主、面分类法为辅的混合分类法。28/ 68星期三星期三9时时52分分18秒秒 分类实施过程(分类实施过程(1/7)1.总体实施过程总体实施过程在进行铁路大数据分类实施时,考虑到铁路大数据的多源性

25、和异构性等特点,首先,首先,采用线分类法采用线分类法,选择按数据格式、按业务归属、按,选择按数据格式、按业务归属、按产生来源和按产生频率等维度对铁路大数据大类划分;产生来源和按产生频率等维度对铁路大数据大类划分;其次,针对具体的某一大类数据,采用其次,针对具体的某一大类数据,采用面分类法面分类法,选择按,选择按产生来源、数据格式等维度进行小类划分。产生来源、数据格式等维度进行小类划分。29/ 68星期三星期三9时时52分分18秒秒 分类实施过程(分类实施过程(2/7)2.线分类法实施过程及分类结果线分类法实施过程及分类结果第一级分类按数据格式分类,即根据数据存储形式的不同,将铁

26、路大按数据格式分类,即根据数据存储形式的不同,将铁路大数据分为结构化数据和非结构化数据两大类。数据分为结构化数据和非结构化数据两大类。第二级分类针对结构化数据,按业务归属分类,分为主数据、事务数针对结构化数据,按业务归属分类,分为主数据、事务数据和分析数据;据和分析数据;针对非结构化数据,按产生来源分类,分为文本文件和多针对非结构化数据,按产生来源分类,分为文本文件和多媒体文件。媒体文件。30/ 68星期三星期三9时时52分分18秒秒 分类实施过程(分类实施过程(3/7)2.线分类法实施过程及分类结果(续)线分类法实施过程及分类结果(续)第三级分类针对事务数据,按产生频率分类,

27、分为实时数据和非实时针对事务数据,按产生频率分类,分为实时数据和非实时数据;数据;针对文本文件,按业务归属分类,分为法律文件、制度文针对文本文件,按业务归属分类,分为法律文件、制度文件、办公文件、事务文件。件、办公文件、事务文件。第四级分类针对第三级分类结果和部分第二级分类结果,进一步按业针对第三级分类结果和部分第二级分类结果,进一步按业务归属分类,形成第四级分类。务归属分类,形成第四级分类。分类结果(如下页)31/ 68星期三星期三9时时52分分18秒秒 分类实施过程:分类实施过程:线分类法结果线分类法结果(4/7)32/ 68星期三星期三9时时52分分18秒秒 2.2.4.

28、2 分类实施过程(分类实施过程(5/7)3.面分类法实施过程及结果面分类法实施过程及结果经过上述四级线分类法后,铁路大数据已经划分到具体业务层面。而根据实际应用需求,还需采用面分类法将数据进行进一步进行细分。上述主数据中:数据按业务归属分类:车站主数据车站主数据专用线主数据。专用线主数据。以下以“专用线主数据”为例,说明面分类过程。33/ 68星期三星期三9时时52分分18秒秒 分类实施过程(分类实施过程(6/7)3.面分类法实施过程及结果(续)面分类法实施过程及结果(续)按产生来源分类根据数据所属铁路局对数据进行分类,分类实例如哈尔滨铁路局根据数据所属铁路局对数据进行分类,分

29、类实例如哈尔滨铁路局数据、沈阳铁路局数据、北京铁路局数据等。数据、沈阳铁路局数据、北京铁路局数据等。按数据格式分类根据数据使用标记对数据进行分类,分类实例如根据数据使用标记对数据进行分类,分类实例如A类数据、类数据、B类类数据、数据、C类数据等。类数据等。“专用线主数据”的面分类结果(如下页)34/ 68星期三星期三9时时52分分18秒秒 分类实施过程(分类实施过程(7/7)35/ 68星期三星期三9时时52分分18秒秒 2.3.1 信息编码与信息代码的概念(信息编码与信息代码的概念(1/2)1.1.信息编码、信息代码的基本概念信息编码、信息代码的基本概念是要将表示是要将表示信

30、息的符号体系信息的符号体系成便于成便于的过程。的过程。是将事物或概念(编码对象)赋予具有一定规律、易于计算机和人识别处理的符号,形成代码元素集合。代码元素集合中的代码元素就是赋予编码对象的符号,即编码对象的代码值,该代码值称为。2.2.信息编码的通俗理解信息编码的通俗理解是指对事物进行编码的过程;是指事物完成编码后的结果。信息代码可以是一个一个或一组有序的易于计算机和人识别与处理的符号。或一组有序的易于计算机和人识别与处理的符号。36/ 68星期三星期三9时时52分分18秒秒 2.3.1 信息编码与信息代码的概念(信息编码与信息代码的概念(2/2)3.3.信息编码的用途及案例信息编码的用途及案

31、例便于识别:所有类型的信息都能够进行编码,如关于产品、人、国家、货币、程序所有类型的信息都能够进行编码,如关于产品、人、国家、货币、程序、文件、部件等各种各样的信息。、文件、部件等各种各样的信息。便于共享交换:在利用信息的过程中,人与人之间、人与机器之间以及机器与机器之间在利用信息的过程中,人与人之间、人与机器之间以及机器与机器之间需要交换信息,共享信息资源,因此对具有相同内容的信息要有统一的需要交换信息,共享信息资源,因此对具有相同内容的信息要有统一的识别标准。识别标准。案例:学生学号(学生学号(编码部门编码部门:学校教务处学校教务处)公民代码或居民身份证(公民代码或居民身份证(编码部门编码

32、部门:公安部门公安部门)企业代码(企业代码(编码部门编码部门:工商局工商局)37/ 68星期三星期三9时时52分分18秒秒 2.3.2 信息编码的基本原则(信息编码的基本原则(1/2)1、唯一性。尽管编码对象可能有不同的名称、不同的描述,但对应于此对象的代码必须唯一,即代码与相应的编码对象一一对应。2、合理性代码的结构与形式要与编码对象的分类体系相适应,可以从代码上来识别一个编码对象在其分类体系中的位置。3、可扩展性代码的结构必须适应编码对象的发展与变化,为新的编码对象留有足够的备用代码。4、简洁性在满足应用要求和可扩展性的前提下,代码的结构应当简洁,代码位数尽可能短,以节省计算机的处理时间和

33、存储空间,降低差错率。38/ 68星期三星期三9时时52分分18秒秒 2.3.2 信息编码的基本原则(信息编码的基本原则(2/2)5、可识别性代码从结构上应尽可能多地反映编码对象的属性与特征,便于人们和计算机识别。有些代码的设计还要考虑到便于机器或人工检验可能出现的差错。6、规范性在一个信息分类编码标准中,代码的类型、结构以及编写格式应当统一。7、稳定性在应用环境与需求发生变化时,代码的结构应当保持相对稳定,具有适应变化和容纳变化的能力。在实际应用中,代码结构的变化要消耗人、财、物等资源,因此,凡已形成各级(国际、国家、地方、行业、企业)特征的代码结构需要调整时,必须由相应的标准化组织机构来进

34、行。39/ 68星期三星期三9时时52分分18秒秒 2.3.3 信息代码的功能(信息代码的功能(1/2)1. 识别功能信息编码是识别某个实体或属性的唯一标识。信息编码是识别某个实体或属性的唯一标识。2. 分类功能当按编码对象的某种属性分类并赋予不同的分类代码时,代码可当按编码对象的某种属性分类并赋予不同的分类代码时,代码可以作为不同类型对象的标识。以作为不同类型对象的标识。3. 共享功能编码统一,便于信息交换与利用,实现更大范围的资源共享。编码统一,便于信息交换与利用,实现更大范围的资源共享。4. 排序功能当按编码对象的某种当按编码对象的某种顺序关系顺序关系分类,并赋予不同的顺序代码时,分类,

35、并赋予不同的顺序代码时,代码可以作为不同类别对象的某种顺序标识。代码可以作为不同类别对象的某种顺序标识。 40/ 68星期三星期三9时时52分分18秒秒 2.3.3 信息代码的功能(信息代码的功能(2/2)5.统计功能利用代码对编码对象不同分类、不同属性的描述,可以根据代码利用代码对编码对象不同分类、不同属性的描述,可以根据代码方便地进行各种统计。方便地进行各种统计。6. 特定功能(如安全等)在设计代码时采用一些专用字符或对某些字符做出一些特殊规定,在设计代码时采用一些专用字符或对某些字符做出一些特殊规定,使其具有特定的含义。使其具有特定的含义。特定含义的代码有利于信息安全。(如:特定含义的代

36、码有利于信息安全。(如:)41/ 68星期三星期三9时时52分分18秒秒 信息编码(代码)方法体系表信息编码(代码)方法体系表 信息编码方法数 字 型 代 码字 母 型 代 码混 合 型 代 码顺 序 码无 序 码系 列 顺 序 码数 字 化 字 母 顺 序 码层 次 码特 征 组 合 码矩 阵 码符 号 编 码 法无 含 义 代 码复 合 码有 含 义 代 码符 号 含 义编 码 法42/ 68星期三星期三9时时52分分18秒秒 符号编码法(符号编码法(1/3)1 1、数字型代码、数字型代码或称或称是用一个或多个阿拉伯数字表示分类对象是用一个或多个阿拉伯数字表

37、示分类对象的代码。的代码。结构简单,使用方便,特别是排序很容易,易于向国内外结构简单,使用方便,特别是排序很容易,易于向国内外推广,推广,但对于分类对象属性与特征描述不直观。但对于分类对象属性与特征描述不直观。我国国家标准我国国家标准人的性别代码人的性别代码国民经济行业企业和代码国民经济行业企业和代码中华人民共和国行政区划代码中华人民共和国行政区划代码。 43/ 68星期三星期三9时时52分分18秒秒 符号编码法(符号编码法(2/3)2 2、字母型代码、字母型代码或称或称是是用一个或多个字母表示分类对象的代码。用一个或多个字母表示分类对象的代码。 字母型代码与数字型代码相比,同

38、样位数的代码比数字型的容量大得多。字母型代码与数字型代码相比,同样位数的代码比数字型的容量大得多。 用一位英文字母型代码最多可以表示用一位英文字母型代码最多可以表示26个个(A-Z)类目,而一位数字型代码最多类目,而一位数字型代码最多只能表示只能表示10个类目,个类目,2位字母型代码最多可表示位字母型代码最多可表示2626676个类目。个类目。(2)字母型代码由于其拼音字母的特点,还便于人们认识代码所表示的)字母型代码由于其拼音字母的特点,还便于人们认识代码所表示的类目的内容,方便人们的记忆。类目的内容,方便人们的记忆。 用用CN表示中国表示中国(China),BJ表示北京表示北京(Beiji

39、ng)等等 对象数量较多时,或增补、修改代码频繁时,用字母型代码容易出现重对象数量较多时,或增补、修改代码频繁时,用字母型代码容易出现重复与冲突现象复与冲突现象 44/ 68星期三星期三9时时52分分18秒秒 符号编码法(符号编码法(3/3)3 3、混合型代码、混合型代码或称或称是由数字、字母或数字、字母、专用字符是由数字、字母或数字、字母、专用字符组合表示分类对象的代码。组合表示分类对象的代码。 兼有上述数字型代码和字母型代码的优点,具有良好的直观性与兼有上述数字型代码和字母型代码的优点,具有良好的直观性与表达性。表达性。 火车时刻表上的火车时刻表上的T15表示北京至广州的某

40、一特别快车。表示北京至广州的某一特别快车。 http:/表示表示263网络集团在互联网上的域名编码。网络集团在互联网上的域名编码。 混合型代码组成复杂,造成计算机输入不方便,录入效率低、错混合型代码组成复杂,造成计算机输入不方便,录入效率低、错误率高误率高 45/ 68星期三星期三9时时52分分18秒秒 符号含义编码法(符号含义编码法(1/8)包括:包括:(2种)、(6种)1、无含义代码:无含义代码: (1)顺序码)顺序码是将具有顺序的数字或字母赋予编码对象。是将具有顺序的数字或字母赋予编码对象。 是一种最简单和常用的无含义代码。是一种最简单和常用的无含义代码。代码简短、使用方

41、便、易于增补代码简短、使用方便、易于增补 国家标准国家标准人的性别代码人的性别代码(GBT22611980)中,男性的代码中,男性的代码是是1,女性的代码是,女性的代码是2 ;代码本身不包含编码对象任何其他信息,不便于标识代码本身不包含编码对象任何其他信息,不便于标识 。46/ 68星期三星期三9时时52分分18秒秒 符号含义编码法(符号含义编码法(2/8)(2)无序码)无序码将无序的数字或字母赋予编码对象的代码。将无序的数字或字母赋予编码对象的代码。 代码无任何编写规律,通常靠机器产生的随机数赋予。代码无任何编写规律,通常靠机器产生的随机数赋予。此种代码仅表示编码对象是某约定

42、的分类体系中的一个类目。此种代码仅表示编码对象是某约定的分类体系中的一个类目。 47/ 68星期三星期三9时时52分分18秒秒 符号含义编码法(符号含义编码法(3/8)2 2、有含义代码:、有含义代码:(1)系列顺序码)系列顺序码这是一种特殊的顺序码。它是将顺序代码分成若干段(系列),并与编这是一种特殊的顺序码。它是将顺序代码分成若干段(系列),并与编码对象的分类一码对象的分类一 一对应,给每段的编码对象赋予一定的顺序。一对应,给每段的编码对象赋予一定的顺序。 是能表示一定的信息属性或特征,易于添加;是能表示一定的信息属性或特征,易于添加;是空码较多,不便于机器处理,不适应于复

43、杂的分类体系。是空码较多,不便于机器处理,不适应于复杂的分类体系。 国务院各部委局及其他机构名称代码国务院各部委局及其他机构名称代码(GBT 46571984)就采用就采用了这种代码,其中三位数字码的第一位数字表示类别标识,第二、三位数字了这种代码,其中三位数字码的第一位数字表示类别标识,第二、三位数字表示该机构在此类别中的数字代码。表示该机构在此类别中的数字代码。 300399为国务院各部为国务院各部;400499表示国务院各局办公机构表示国务院各局办公机构700799表示全国性人民团体。表示全国性人民团体。 48/ 68星期三星期三9时时52分分18秒秒 符号含义编码法(符

44、号含义编码法(4/8)(2)数字化字母顺序码)数字化字母顺序码是将编码对象按其名称的首字母顺序排列,然是将编码对象按其名称的首字母顺序排列,然后按此顺序赋以递增的数字代码后按此顺序赋以递增的数字代码 。容易归类,便于检索,适合于根据人名、机关名、事业、容易归类,便于检索,适合于根据人名、机关名、事业、企业单位名称以及地名来检索信息。企业单位名称以及地名来检索信息。新增代码调整困难,使用时间较短。新增代码调整困难,使用时间较短。 ()01 Apples(苹果苹果)02 Bananas(香蕉香蕉)03 Chenies(樱桃樱桃)04 Dates(枣枣) 49/ 68星期三星期三9时时52分分18秒

45、秒 符号含义编码法(符号含义编码法(5/8)(3)层次码)层次码定义:常用于常用于线分类法线分类法,它是按编码对象的从属层次关系为排列顺序的一,它是按编码对象的从属层次关系为排列顺序的一种代码。种代码。利用利用进行编码时,进行编码时,代码自左至右,表示的层级由高至低,每个层级代码自左至右,表示的层级由高至低,每个层级的代码可采用顺序码或系列顺序码的代码可采用顺序码或系列顺序码。 特点:能明确表明编码对象的类别,结构简单,容量大,便于计算机汇总。能明确表明编码对象的类别,结构简单,容量大,便于计算机汇总。当层次较多时,所用代码位数较多,弹性较差。当层次较多时,所用代码位数较多,弹

46、性较差。 案例: ()采用采用的层级码的层级码 X X X X第 一 层 代 码 ( 大 类 )第 一 层 代 码 ( 小 类 )第 二 层 代 码 ( 中 类 )50/ 68星期三星期三9时时52分分18秒秒 符号含义编码法(符号含义编码法(6/8)(4)特征组合码)特征组合码常用于面分类体系。它是将编码对象按其属性或特征分成若干个面。每常用于面分类体系。它是将编码对象按其属性或特征分成若干个面。每个面内的诸项属性或特征按其规律分别进行编码,面与面之间的代码没有层次关系个面内的诸项属性或特征按其规律分别进行编码,面与面之间的代码没有层次关系与从属关系。与从属关系。使用时,按预

47、先确定顺序,根据需要可将不同的面中代码组合起来以表示所代表的使用时,按预先确定顺序,根据需要可将不同的面中代码组合起来以表示所代表的类目。类目。 (雷同于雷同于面分类法面分类法)优点:优点:,一个面内的属性内容与数量的调整不会影响其他的面;,一个面内的属性内容与数量的调整不会影响其他的面;,可根据需要组成任何类目,也便于机器处理;,可根据需要组成任何类目,也便于机器处理;易于增、删、改易于增、删、改。 缺点:缺点:不能充分利用信息;用手工来组成信息类目比较困难。不能充分利用信息;用手工来组成信息类目比较困难。 机制螺钉分类机制螺钉分类 (注:(注:代码2342表示黄铜1.5方形镀铬螺钉)。 5

48、1/ 68星期三星期三9时时52分分18秒秒 符号含义编码法(符号含义编码法(7/8)(5) 矩阵码定义坐标的代码矩阵码定义坐标的代码定义:建立在二维空间建立在二维空间x、y坐标基础上的代码。通过赋予坐标基础上的代码。通过赋予x、y坐坐标的数值标的数值(序号序号)来确定代码的值。来确定代码的值。特点:可有效地用于标识那些具有良好结构和稳定特性的编码对可有效地用于标识那些具有良好结构和稳定特性的编码对象。象。 编制代码时较困难,需要考虑建立一定的逻辑关系。编制代码时较困难,需要考虑建立一定的逻辑关系。 案例: 信息交换用汉字编码字符集基本集其中其中区号区号为矩阵表中的行号,为矩阵

49、表中的行号,位号位号为矩阵表中的列号。为矩阵表中的列号。用区位码用区位码16-01编码表示,在这里,编码表示,在这里,16为区号,为区号,01为位号。为位号。52/ 68星期三星期三9时时52分分18秒秒 符号含义编码法(符号含义编码法(8/8)(6)复合码)复合码定义:是由两个或两个以上完整、独立的代码组合而成。是由两个或两个以上完整、独立的代码组合而成。 特点:使用灵活、应用面较广的代码类型,可以表示具有复杂分类和标使用灵活、应用面较广的代码类型,可以表示具有复杂分类和标识体系的事物。识体系的事物。代码总长度较长。代码总长度较长。 案例: 采用采用13位数字的复合码位数字的

50、复合码 XX XXXXXXX XX XX国 家 编 码 局 数 字 码物 品 识 别 代 码大 类 码小 类 码图 2.3 美 国 物 资 编 目 代 码 结 构 图53/ 68星期三星期三9时时52分分18秒秒 信息编码错误归类及其解决方法信息编码错误归类及其解决方法1、在录入代码时的可能错误:、在录入代码时的可能错误:识别错误:1/7,0/O,Z/2,D/O,S/5,易位错误:12345/13245,双易位错误:12345/13254,随机错误:上述两种或两种以上的错误出现2、避免代码录入出现错误的办法、避免代码录入出现错误的办法在设计好的代码后,在设计好的代码后,再增加一

51、位(最低位)再增加一位(最低位),作为代码的组成部分。增,作为代码的组成部分。增加的一位,即为校验位。使用中,没有特别意义。加的一位,即为校验位。使用中,没有特别意义。使用时,应录入包括校验位在内的完整代码,代码进入系统后,系统将使用时,应录入包括校验位在内的完整代码,代码进入系统后,系统将取该代码校验位前的各位,按照确定代码校验位的算法进行计算,并与取该代码校验位前的各位,按照确定代码校验位的算法进行计算,并与录入代码的最后一位(校验位)进行比较,如果相等,则录入代码正确,录入代码的最后一位(校验位)进行比较,如果相等,则录入代码正确,否则录入代码错误,进行重新录入。否则录入代码错误,进行重

52、新录入。54/ 68星期三星期三9时时52分分18秒秒 信息编码错误的校验方法(信息编码错误的校验方法(1/3)一般三种方法:一般三种方法:算术级数法、几何级数法、质数法算术级数法、几何级数法、质数法 ( (注:还有其他方法,如注:还有其他方法,如) ) 1 1、算术级数法、算术级数法55/ 68星期三星期三9时时52分分18秒秒 信息编码错误的校验方法(信息编码错误的校验方法(2/3)2 2、几何级数法、几何级数法56/ 68星期三星期三9时时52分分18秒秒 信息编码错误的校验方法(信息编码错误的校验方法(3/3)3 3、质数法、质数法 57

53、/ 68星期三星期三9时时52分分18秒秒 信息编码错误的校验步骤信息编码错误的校验步骤设有一组代码为:设有一组代码为: C1C2C3C4Ci第第1步步:为设计好的代码的每一位:为设计好的代码的每一位Ci确定一个权数确定一个权数Pi(权数可为(权数可为等差数等差数列列 、等比数列等比数列、)。第第2步步:求代码每一位:求代码每一位Ci与其对应的权数与其对应的权数Pi的的乘积乘积之之和和S S=C1*P1+C2*P2+Ci*Pi (i=1,2,n) n = Ci*Pi (i=1,2,n) i=1第第3步步:确定模:确定模M (一般为一般为11)第第4步步:取余:取余R = MOD(M)第第5步步:校验位:校验位Ci+1 = R最终代码为:最终代码为: C1C2C3C4CiCi+1使用时:使用时: C1C2C3C4CiCi+158/ 68星期三星期三9时时52分分18秒秒 校验案例校验案例 例题例题 原设计的一组代码为五位原设计的一组代码为五位32456,求其校验值。,求其校验值。第第1步:步:确定权数为确定权数为7,6,5,4,3(算数级数算数级数)第第2步:步:求代码每一位求代码每一位Ci与其对应的权数与其对应的权数Pi的乘积之和的乘积之和S S=C1*P1+C2*P2+Ci*Pi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论