版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
*1信息的分类与编码《信息资源组织与管理》之第2章*1信息的分类与编码《信息资源组织与管理》之第2章*2内容提要(1/2)2.1
信息元素的涵义(了解:信息分类与编码的最小单位)
2.1.1信息元素的概念2.1.2信息元素的命名原则2.1.3
信息元素的标识2.1.4
信息元素的一致性2.2
信息分类的方法
2.2.1信息分类的概念(了解)2.2.2
信息分类的基本原则(了解)2.2.3信息分类的基本方法(重点)
线分类法
面分类法
混合分类法*2内容提要(1/2)*3内容提要(2/2)2.3
信息编码方法
2.3.1
信息编码的概念
2.3.2信息编码的功能和信息编码的基本原则(了解)2.3.3
代码的分类(重点)
按符号形式分类
按符号的含义分类2.3.4编码的校验
错误种类(了解)
校验方法(重点)
信息编码错误的校验步骤(重点)
校验案例(重点)
2.4
作业(…….)*3内容提要(2/2)2.3信息编码方法*42.1.1信息元素的概念信息元素(又称数据元素或数据项)是最小的不可再分的信息单位,是一类信息的总称。例如:船舶资料中的船名“天河轮”、“冀海轮”等,可以抽象出“船舶名称”这个数据元素;每一条船都有一个编号,可以概括出“船舶编号”这个数据元素。通常职工档案中的“简历”、“受奖情况”等,不是信息元素。因为“简历”至少包括时间、地点等信息,是可以继续分解的信息;“受奖情况”也是可以继续分解的信息。(注意:“信息元素”可以视为数据库中的“字段”)*42.1.1信息元素的概念信息元素(又称数据元素或数据项*52.1.2信息元素的命名原则(1/2)1、命名原则信息元素命名的原则就是用一简明的词组来描述一个信息元素的意义和用途。
2、词组的一般结构类别词和基本词都只有—个,修饰词可以有一个或多个;类别词是信息元素命名中的—个最重要的名词,用来识别和描述信息元素的一般用途或功能,一般不具有行业持征,条目较少。如数量(AMOUNT)、名称(NAME)、编号(NUMBER)、代码(CODE)等。基本词是类别词的最重要的修饰词,它对一大类信息对象进一步分类(反映一小类信息对象),一般具有行业特征,条目较多。如会计(ACCOUNTING)、预算(BUDGET)、顾客(CUSTOMER)等。修饰词一基本词一类别词*52.1.2信息元素的命名原则(1/2)1、命名原则修饰*62.1.2信息元素的命名原则(2/2)3、信息元素命名案例社会保险编码
社会(修饰词)、保险(基本词)、编号(类别词)学校学生学号学校贵重设备名称学校(修饰词)、贵重(修饰词)、设备(基本词)、名称(类别词)*62.1.2信息元素的命名原则(2/2)3、信息元素命名*72.1.3信息元素的标识1、信息元素标识的含义又称信息元编码,是计算机和管理人员共同使用的标识。2、信息元素标识的方法用限定长度的大写字母字符串表达,字母字符可按信息元素名称的汉语拼音抽取首音字字母,也可按英文词首字母或缩写规则得出。3、案例:*72.1.3信息元素的标识1、信息元素标识的含义*82.1.4信息元素的一致性信息元素命名和信息元素标识要在组织(政府部门或企事业单位)中保持一致。不允许有“同名异义”的信息元素。也不允许有“同义异名”的信息元素。这里的”名”是指信息元素的标识;“义”是指信息元素的命名或定义。*82.1.4信息元素的一致性信息元素命名和信息元素标识要*92.2.1信息分类的概念(1/2)1、含义信息分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序。2、信息分类的两个要素分类对象,分类对象由若干个被分类的实体组成;分类依据,分类依据取决于分类对象的属性或特征。*92.2.1信息分类的概念(1/2)1、含义*102.2.2信息分类的基本原则(1/3)
1、科学性使类别的划分符合信息的内涵、性质及使用与管理要求;选择信息的本质属性和特征作为分类的依据,使分类体系结构具有稳定性,以供人们方便地使用。
2、系统性分类结构中各类信息按照他们之间的相互联系排成一定的顺序,形成一个系统,既便于人们区分信息、识别信息,又便于人们从整体上去把握信息之间的关系。
*102.2.2信息分类的基本原则(1/3)1、科学性*112.2.2信息分类的基本原则(2/3)3、可扩展性随着科学技术的进步和社会经济的发展,人们可利用的信息量急剧增长,信息的类别和分类体系结构也应适应这种变化的需要,这就要求:分类体系结构在原有的基础上有扩展的余地,其中包括新的类别的增补和在原有类别的基础上进行分解、细化。
4、兼容性信息的分类是一个庞大而复杂的系统,这个大系统中存在着若干层分系统与子系统,一些子系统之间存在着相互联系和信息共享问题:如生产类信息和人事类信息中都包含工人这一类信息。生产类信息在对工人这一信息的定义和再分类时就要和人事类信息兼容*112.2.2信息分类的基本原则(2/3)*122.2.2信息分类的基本原则(3/3)5、实用性由于信息的属性与特征的多样性,在实际生活中选择何种属性与特征进行分类还要考虑到人们实际应用的需要。例如:某企业在开发新产品时,管理部门、设计部门与制造部门从各自的应用目的出发,对信息的分类会提出不同的要求。管理部门从企业的经营管理目标出发,希望信息的分类要便于生产的计划与控制,并能反映成本和市场需求方面的情况;设计部门则从设计需要出发,希望信息的分类体系体现新产品开发组合化(模块化)、标准化、序列化的趋势;制造工艺部门则从实现产品的小批量、多品种成组生产,以提高生产效率和质量的目的出发,希望信息的分类体系能反映产品的量、部件的几何特征与工艺特性。因此,在制订企业信息分类体系时,要从企业的总体目标出发,充分考虑到各部门的合理要求,进行企业信息分类体系的整体优化。*122.2.2信息分类的基本原则(3/3)*13
线分类法(1/3)1、线分类法的基本思想线分类法(又称等级分类法或层级分类法)是将初始的分类对象(即被划分的事物或概念)按所选定的若干个属性/特征作为分类的划分基础,逐次地分解成若干个层级类目,并编排成一个逐级展开、有层次的分类体系。同层级类目之间存在着并列关系,称为同位类。一个层级类目经分解形成的下层类目,称为下位类;相应的被分解的类目称为上位类;上位类与下位类的关系是隶属关系。同层级类目互不重复,不同层级的类目互不交叉。每个下位层的类目只对应于一个上位层。*线分类法(1/3)1、线分类法的*14
线分类法(2/3)2、线分类法的典型案例国家标准有《中华人民共和国行政区划代码》(GB/T2260—1999)(以下为河北省部分案例)其他案例:《国民经济行业分类与代码》(GB/T4754—1994)和《职业分类与代码》(GB/T6565—1999)
*线分类法(2/3)2、线分类法的*15
线分类法(3/3)
3、线分类法的优缺点优点:容量大。可容纳较多类目的信息。结构清晰。采用树形结构能较好反映类目之间的逻辑关系。使用方便。既符合手工处理信息的思维习惯,又便于计算机处理。缺点:结构弹性较差。分类结构一经确定,不易改动。效率较低。当分类层次较多时,编码的位数较长,影响数据处理速度。*线分类法(3/3)3、线分类法的*16
面分类法(1/2)1、面分类法的基本思想面分类法是将所选定的分类对象的若干属性或特征视为若干个“面”,每个“面”中又可分成彼此独立的若干个类目。。使用时:可根据需要将这些“面”中的类目组合在一起,形成一个复合类目。
2、面分类法的典型案例某高校教师分类编码*面分类法(1/2)1、面分类法的基本*17
面分类法(2/2)3、面分类法的优缺点优点:具有较大的弹性。一个面内的属性内容与数量的调整不会影响其他的面。适应性强。可根据需要组成任何类目,也便于机器处理。易于增、删、改。
缺点:不能充分利用信息。在面分类法形成的分类体系中,可组成的类目很多,但有时实际应用的类别不多。用手工来组成信息类目比较困难。
*面分类法(2/2)3、面分类法的优*18
混合分类法1、混合分类法的基本思想混合分类法是将线分类法和面分类法组合使用,以其中一种分类法为主,另一种做补充的信息分类方法。
2、案例:上述教师的面分类体系中的从事专业,又可以分为学科门类(如管理学、工学等),学科门类下设若干一级学科,每个一级学科一般设有若干二级学科。从事专业这一面可按线分类法分成学科门类、一级学科、二级学科三个层次,如下表所示。其中,一级学科用三位数字表示,二级学科用两位数字表示;一、二级学科之间用点隔开。
*混合分类法1、混合分类法的基本思想*192.3.1信息编码的概念信息编码是将事物或概念(编码对象)赋予具有一定规律、易于计算机和人识别处理的符号,形成代码元素集合。代码元素集合中的代码元素就是赋予编码对象的符号,即编码对象的代码值。信息编码包含数据表达成代码的方法、数据的代码表示形式、代码元素集合的赋值。信息编码形式有多种,例如:国际莫尔斯电报码用小点与短横表示。国际通用的电阻元件参数值是用一组由不同颜色组成的圆环表示的,称为电阻色环码。一维条形码,二位条形码等等。
信息编码的概念*192.3.1信息编码的概念信息编码是将事物或概念(编码*202.3.2信息代码的功能和信息编码的基
本原则(1/2)代码的功能如下:①信息的标识唯一,便于分类鉴别,防止同名异义、异名同义现象发生。②信息的标识统一,便于信息交换与利用,实现更大范围的资源共享。③信息的标识有序,便于信息的加工、排序、查询、检索。④信息的标识明确,可以表达特定含义。⑤信息的标识简洁,可以提高信息处理的效率。⑥信息标识的形式与信息内容的对应关系可以人为设定,有利于信息的安全保密。
对信息进行编码,就是使信息的标识规范化的过程,代码就是信息规范化的标识符。*202.3.2信息代码的功能和信息编码的基
本原则(1/*212.3.2信息代码的功能和信息编码的基
本原则(2/2)信息编码的基本原则如下:
①唯一性。②合理性。③可扩展性。④简洁性。⑤可识别性。⑥规范性。⑦稳定性。注意:企业代码由技术监督局、工商管理局负责给定;人口代码(身份证)由公安局给定*212.3.2信息代码的功能和信息编码的基
本原则(2/*222.3.3代码的分类
*222.3.3代码的分类*23
按符号形式分类(1/3)1、数字型代码定义:数字型代码或称数字码是用一个或多个阿拉伯数字表示分类对象的代码。特点:优点:结构简单,使用方便,特别是排序很容易,易于向国内外推广,缺点:对于分类对象属性与特征描述不直观。案例:我国国家标准《人的性别代码》《国民经济行业企业和代码》《中华人民共和国行政区划代码》。
*按符号形式分类(1/3)1、数字型*24
按符号形式分类(2/3)2、字母型代码定义:字母型代码或称字母码是用一个或多个字母表示分类对象的代码。
优点及案例:(1)字母型代码与数字型代码相比,同样位数的代码比数字型的容量大得多。案例:用一位英文字母型代码最多可以表示26个(A-Z)类目,而一位数字型代码最多只能表示10个类目,2位字母型代码最多可表示26×26=676个类目。(2)字母型代码由于其拼音字母的特点,还便于人们认识代码所表示的类目的内容,方便人们的记忆。案例:用CN表示中国(China),BJ表示北京(Beijing)等.
缺点:对象数量较多时,或增补、修改代码频繁时,用字母型代码容易出现重复与冲突现象。*按符号形式分类(2/3)2、字母型*25
按符号形式分类(3/3)3、混合型代码定义:混合型代码或称混合码是由数字、字母或数字、字母、专用字符组合表示分类对象的代码。
优点及案例:兼有上述数字型代码和字母型代码的优点,具有良好的直观性与表达性。
案例:火车时刻表上的T15表示北京至广州的某一特别快车。
表示263网络集团在互联网上的域名编码。
缺点:混合型代码组成复杂,造成计算机输入不方便,录入效率低、错误率高。
*按符号形式分类(3/3)3、混合型*26
按符号的含义分类(1/8)1、无含义代码:指组成代码的字符本身无实际含义的代码,代码只作为编码对象的唯一标识符。(1)顺序码定义:顺序码是将具有顺序的数字或字母赋予编码对象。顺序码是一种最简单和常用的无含义代码。优点及案例:代码简短、使用方便、易于增补案例:国家标准《人的性别代码》(GB/T2261—1980)中,男性的代码是1,女性的代码是2;缺点:代码本身不包含编码对象任何其他信息,不便于标识。*2按符号的含义分类(1/8)*27
按符号的含义分类(2/8)(2)无序码定义:将无序的数字或字母赋予编码对象的代码。
特点:代码无任何编写规律,通常靠机器产生的随机数赋予。此种代码仅表示编码对象是某约定的分类体系中的一个类目。案例:手机网上“自助服务”的有关密码:一号通码、二次校验码。*2按符号的含义分类(2/8)(2)无序码*28
按符号的含义分类(3/8)2、有含义代码:是指代码不仅作为编码对象的唯一标识,代替编码对象,而且提供编码对象的分类、排序与逻辑意义等信息的代码。(1)系列顺序码定义:这是一种特殊的顺序码。它是将顺序代码分成若干段(系列),并与编码对象的分类一一对应,给每段的编码对象赋予一定的顺序。
特点:优点是能表示一定的信息属性或特征,易于添加;缺点是空码较多,不便于机器处理,不适应于复杂的分类体系。
*2按符号的含义分类(3/8)2、有*29
按符号的含义分类(4/8)(2)数字化字母顺序码定义:数字化字母顺序码是将编码对象按其名称的首字母顺序排列,然后按此顺序赋以递增的数字代码。特点:优点:容易归类,便于检索,适合于根据人名、机关名、事业、企业单位名称以及地名来检索信息。缺点:新增代码调整困难,使用时间较短。
案例(水果编码)01Apples(苹果)02Bananas(香蕉)03Chenies(樱桃)*2按符号的含义分类(4/8)(2)数字化*30
按符号的含义分类(5/8)(3)层次码定义:层次码常用于线分类法,它是按编码对象的从属层次关系为排列顺序的一种代码。编码时,将代码分成若干层级,并与分类对象的分类层级相对应。代码自左至右,表示的层级由高至低,每个层级的代码可采用顺序码或系列顺序码。
特点:优点:能明确表明编码对象的类别,有严格的隶属关系。代码结构简单,容量大,便于计算机汇总。缺点:当层次较多时,所用代码位数较多,弹性较差。
案例:(国家标准《国民经济行业分类和代码》(GB/T4754—1994)编码)采用三层四位数字的层级码
*30按符号的含义分类(5/8)(3)层次码*31
按符号的含义分类(6/8)(4)特征组合码定义:特征组合码常用于面分类体系。它是将编码对象按其属性或特征分成若干个面。每个面内的诸项属性或特征按其规律分别进行编码,面与面之间的代码没有层次关系与从属关系。使用时,按预先确定顺序,根据需要可将不同的面中代码组合起来以表示所代表的类目。特点(雷同于面分类法)优点:类目组合比较灵活,适于机器处理。
缺点:利用率低,不便于求和汇总。
案例:机制螺钉分类由上表可知:代码2342表示黄铜Φ1.5方形镀铬螺钉。
*3按符号的含义分类(6/8)(4)特征组*32
按符号的含义分类(7/8)(5)矩阵码定义坐标的代码定义:矩阵码是一种建立在多维空间坐标位置基础上的代码,代码的值是通过赋予多维空间坐标的代码组合而成,或是通过赋予多维空间位置的序号而构成。例如:两维矩阵吗,是通过赋予x、y坐标的数值(序号)确定代码的值。
特点:优点:逻辑关系明确,也容易解释其含义。缺点:编制代码时较困难,需要考虑建立一定的逻辑关系。
案例:国际标准ISO2711-73《顺序日期表示法》行:月份;列:日期矩阵的序号排列(逻辑关系):从下至上、从左到右依次赋予001(1月1日)至365(12月31日)(若为闰年则为366)*3按符号的含义分类(7/8)(5)矩阵*33
按符号的含义分类(8/8)(6)复合码定义:复合码是由两个或两个以上完整、独立的代码组合而成。
特点:优点:使用灵活、应用面较广的代码类型,可以表示具有复杂分类和标识体系的事物。缺点:代码总长度较长。
案例:
美国的物资编目代码结构图(采用13位数字的复合码)*3按符号的含义分类(8/8)(6)复合码*34
信息编码错误种类1、在录入代码时的可能错误:识别错误:1/7,0/O,Z/2,D/O,S/5,……易位错误:12345/13245,……双易位错误:12345/13254,……随机错误:上述两种或两种以上的错误出现
2、避免代码录入出现错误的办法增加校验位:在设计好的代码后,再增加一位(最低位),作为代码的组成部分。增加的一位,即为校验位。使用中,没有特别意义。使用方法:使用时,应录入包括校验位在内的完整代码,代码进入系统后,系统将取该代码校验位前的各位,按照确定代码校验位的算法进行计算,并与录入代码的最后一位(校验位)进行比较,如果相等,则录入代码正确,否则录入代码错误,进行重新录入。*3信息编码错误种类1、在录入代码时的*35
信息编码错误的校验方法
(1/2)三种方法:算术级数法、几何级数法、质数法
1、算术级数法*35信息编码错误的校验方法
(1/2)三*36
信息编码错误的校验方法
(2/2)2、几何级数法
3、质数法
*3信息编码错误的校验方法
(2/2)2*37
信息编码错误的校验步骤设有一组代码为:C1C2C3C4…Ci第一步:为设计好的代码的每一位Ci确定一个权数Pi(权数可为算术级数-等差数列、几何级数-等比数列、或质数)。第二步:求代码每一位Ci与其对应的权数Pi的乘积之和SS=C1*P1+C2*P2+……+Ci*Pi(i=1,2,……,n)n=∑Ci*Pi(i=1,2,……,n)i=1第三步:确定模M第四步:取余R=MOD(M)第五步:校验位Ci+1=R最终代码为:C1C2C3C4…CiCi+1*3信息编码错误的校验步骤设有一组代码为:*38
校验案例
原设计的一组代码为五位,如32456,确定权数为7,6,5,4,3(算数级数)求代码每一位Ci与其对应的权数Pi的成绩之和SS=C1*P1+C2*P2+……+Ci*Pi(i=1,2,……,n)=3*7+2*6+4*5+5*4+6*3=21+12+20+20+18=91确定模M,M=11取余R,R=SMOD(M)=91MOD(11)=3校验位Ci+1=R=3最终代码为:C1C2C3C4…CiCi+1,即324563使用时为:324563*3校验案例原设计的一组代码为五位,如339国家药品编码本位码编码规则药品编码本位码共14位,由药品国别码、药品类别码,药品本体码和校验码依次连接组成,不留空格。由药品监督管理部门授权的维护管理机构统一编制赋码。国别码为“86”类别码为“9”,代表药品企业标识遵循《企业法人营业执照》,《药品生产许可证》一照一证的原则,按照流水的方式编制;产品标识是该企业所有药品产品根据批准文号,依据名称、剂型、规格,遵循一物一码的原则,按照流水的方式编制。39国家药品编码本位码编码规则药品编码本位码共14位,由药品40国家药品编码本位码编码规则校验码是药品编码本位码中的最后一个字符,通过特定的数学公式来检验国家药品编码本位码中前13位数字的正确性,计算方法按照“GB18937”执行。从校验码开始是第1位数,依次类推到国别码是13、14位,偶位数相加的和乘以3,奇位数相加用10减去上两式的和的个位数就是校验码的数,如果个位数是“0”,则校验码为“0”例如:药品本位码86903119000056(8+9+3+1+0+0+5)*3+(6+0+1+9+0+0)=9410-4=640国家药品编码本位码编码规则校验码是药品编码本位码中的最后居民身份号码编码规则示例:GB11643—1999(居民身份号码),整个代码分成4个码段,前两个码段标识对象的空间和时间特性,第三个码段则限定于前面两个码段的范围,第四个码段则依赖于前三个码段赋值之后的校验计算结果。居民身份号码编码规则示例:GB11643—1999(居民身42信息编码校验示例:居民身份证校验码计算方法居民身份证前17位加权因子为C1,C2,……,C17模为:7,9,10,5,8,4,2,1,6,3,7,9,10,5,8,4,2,设某一17位数字是12345678901234567,计算其校验码步骤如下:第一步:计算17位数字各位数字与对应的加权因子的乘积的和SS=1×7+2×9+3×10+4×5+5×8+6×4+7×2+8×1+9×6+0×3+1×7+2×9+3×10+4×5+5×8+6×4+7×2=368;第二步:计算S÷11的余数T=SMOD11=368mod11=5;第三步:计算(12—T)÷11的余数R,如果R=10,校验码为字母“X”;如果R≠10,校验码为数字“R”R=(12—5)mod11=7。该17位数字的校验码是7,聚合在一起为123456789012345677的身份证编码。42信息编码校验示例:居民身份证校验码计算方法*432.4作业什么是信息元素?如何命名信息元素?查资料,了解我国卫生信息数据元标准的建设情况,予以简要说明。*432.4作业什么是信息元素?如何命名信息元素?第02章-信息的分类与编码课件*45信息的分类与编码《信息资源组织与管理》之第2章*1信息的分类与编码《信息资源组织与管理》之第2章*46内容提要(1/2)2.1
信息元素的涵义(了解:信息分类与编码的最小单位)
2.1.1信息元素的概念2.1.2信息元素的命名原则2.1.3
信息元素的标识2.1.4
信息元素的一致性2.2
信息分类的方法
2.2.1信息分类的概念(了解)2.2.2
信息分类的基本原则(了解)2.2.3信息分类的基本方法(重点)
线分类法
面分类法
混合分类法*2内容提要(1/2)*47内容提要(2/2)2.3
信息编码方法
2.3.1
信息编码的概念
2.3.2信息编码的功能和信息编码的基本原则(了解)2.3.3
代码的分类(重点)
按符号形式分类
按符号的含义分类2.3.4编码的校验
错误种类(了解)
校验方法(重点)
信息编码错误的校验步骤(重点)
校验案例(重点)
2.4
作业(…….)*3内容提要(2/2)2.3信息编码方法*482.1.1信息元素的概念信息元素(又称数据元素或数据项)是最小的不可再分的信息单位,是一类信息的总称。例如:船舶资料中的船名“天河轮”、“冀海轮”等,可以抽象出“船舶名称”这个数据元素;每一条船都有一个编号,可以概括出“船舶编号”这个数据元素。通常职工档案中的“简历”、“受奖情况”等,不是信息元素。因为“简历”至少包括时间、地点等信息,是可以继续分解的信息;“受奖情况”也是可以继续分解的信息。(注意:“信息元素”可以视为数据库中的“字段”)*42.1.1信息元素的概念信息元素(又称数据元素或数据项*492.1.2信息元素的命名原则(1/2)1、命名原则信息元素命名的原则就是用一简明的词组来描述一个信息元素的意义和用途。
2、词组的一般结构类别词和基本词都只有—个,修饰词可以有一个或多个;类别词是信息元素命名中的—个最重要的名词,用来识别和描述信息元素的一般用途或功能,一般不具有行业持征,条目较少。如数量(AMOUNT)、名称(NAME)、编号(NUMBER)、代码(CODE)等。基本词是类别词的最重要的修饰词,它对一大类信息对象进一步分类(反映一小类信息对象),一般具有行业特征,条目较多。如会计(ACCOUNTING)、预算(BUDGET)、顾客(CUSTOMER)等。修饰词一基本词一类别词*52.1.2信息元素的命名原则(1/2)1、命名原则修饰*502.1.2信息元素的命名原则(2/2)3、信息元素命名案例社会保险编码
社会(修饰词)、保险(基本词)、编号(类别词)学校学生学号学校贵重设备名称学校(修饰词)、贵重(修饰词)、设备(基本词)、名称(类别词)*62.1.2信息元素的命名原则(2/2)3、信息元素命名*512.1.3信息元素的标识1、信息元素标识的含义又称信息元编码,是计算机和管理人员共同使用的标识。2、信息元素标识的方法用限定长度的大写字母字符串表达,字母字符可按信息元素名称的汉语拼音抽取首音字字母,也可按英文词首字母或缩写规则得出。3、案例:*72.1.3信息元素的标识1、信息元素标识的含义*522.1.4信息元素的一致性信息元素命名和信息元素标识要在组织(政府部门或企事业单位)中保持一致。不允许有“同名异义”的信息元素。也不允许有“同义异名”的信息元素。这里的”名”是指信息元素的标识;“义”是指信息元素的命名或定义。*82.1.4信息元素的一致性信息元素命名和信息元素标识要*532.2.1信息分类的概念(1/2)1、含义信息分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序。2、信息分类的两个要素分类对象,分类对象由若干个被分类的实体组成;分类依据,分类依据取决于分类对象的属性或特征。*92.2.1信息分类的概念(1/2)1、含义*542.2.2信息分类的基本原则(1/3)
1、科学性使类别的划分符合信息的内涵、性质及使用与管理要求;选择信息的本质属性和特征作为分类的依据,使分类体系结构具有稳定性,以供人们方便地使用。
2、系统性分类结构中各类信息按照他们之间的相互联系排成一定的顺序,形成一个系统,既便于人们区分信息、识别信息,又便于人们从整体上去把握信息之间的关系。
*102.2.2信息分类的基本原则(1/3)1、科学性*552.2.2信息分类的基本原则(2/3)3、可扩展性随着科学技术的进步和社会经济的发展,人们可利用的信息量急剧增长,信息的类别和分类体系结构也应适应这种变化的需要,这就要求:分类体系结构在原有的基础上有扩展的余地,其中包括新的类别的增补和在原有类别的基础上进行分解、细化。
4、兼容性信息的分类是一个庞大而复杂的系统,这个大系统中存在着若干层分系统与子系统,一些子系统之间存在着相互联系和信息共享问题:如生产类信息和人事类信息中都包含工人这一类信息。生产类信息在对工人这一信息的定义和再分类时就要和人事类信息兼容*112.2.2信息分类的基本原则(2/3)*562.2.2信息分类的基本原则(3/3)5、实用性由于信息的属性与特征的多样性,在实际生活中选择何种属性与特征进行分类还要考虑到人们实际应用的需要。例如:某企业在开发新产品时,管理部门、设计部门与制造部门从各自的应用目的出发,对信息的分类会提出不同的要求。管理部门从企业的经营管理目标出发,希望信息的分类要便于生产的计划与控制,并能反映成本和市场需求方面的情况;设计部门则从设计需要出发,希望信息的分类体系体现新产品开发组合化(模块化)、标准化、序列化的趋势;制造工艺部门则从实现产品的小批量、多品种成组生产,以提高生产效率和质量的目的出发,希望信息的分类体系能反映产品的量、部件的几何特征与工艺特性。因此,在制订企业信息分类体系时,要从企业的总体目标出发,充分考虑到各部门的合理要求,进行企业信息分类体系的整体优化。*122.2.2信息分类的基本原则(3/3)*57
线分类法(1/3)1、线分类法的基本思想线分类法(又称等级分类法或层级分类法)是将初始的分类对象(即被划分的事物或概念)按所选定的若干个属性/特征作为分类的划分基础,逐次地分解成若干个层级类目,并编排成一个逐级展开、有层次的分类体系。同层级类目之间存在着并列关系,称为同位类。一个层级类目经分解形成的下层类目,称为下位类;相应的被分解的类目称为上位类;上位类与下位类的关系是隶属关系。同层级类目互不重复,不同层级的类目互不交叉。每个下位层的类目只对应于一个上位层。*线分类法(1/3)1、线分类法的*58
线分类法(2/3)2、线分类法的典型案例国家标准有《中华人民共和国行政区划代码》(GB/T2260—1999)(以下为河北省部分案例)其他案例:《国民经济行业分类与代码》(GB/T4754—1994)和《职业分类与代码》(GB/T6565—1999)
*线分类法(2/3)2、线分类法的*59
线分类法(3/3)
3、线分类法的优缺点优点:容量大。可容纳较多类目的信息。结构清晰。采用树形结构能较好反映类目之间的逻辑关系。使用方便。既符合手工处理信息的思维习惯,又便于计算机处理。缺点:结构弹性较差。分类结构一经确定,不易改动。效率较低。当分类层次较多时,编码的位数较长,影响数据处理速度。*线分类法(3/3)3、线分类法的*60
面分类法(1/2)1、面分类法的基本思想面分类法是将所选定的分类对象的若干属性或特征视为若干个“面”,每个“面”中又可分成彼此独立的若干个类目。。使用时:可根据需要将这些“面”中的类目组合在一起,形成一个复合类目。
2、面分类法的典型案例某高校教师分类编码*面分类法(1/2)1、面分类法的基本*61
面分类法(2/2)3、面分类法的优缺点优点:具有较大的弹性。一个面内的属性内容与数量的调整不会影响其他的面。适应性强。可根据需要组成任何类目,也便于机器处理。易于增、删、改。
缺点:不能充分利用信息。在面分类法形成的分类体系中,可组成的类目很多,但有时实际应用的类别不多。用手工来组成信息类目比较困难。
*面分类法(2/2)3、面分类法的优*62
混合分类法1、混合分类法的基本思想混合分类法是将线分类法和面分类法组合使用,以其中一种分类法为主,另一种做补充的信息分类方法。
2、案例:上述教师的面分类体系中的从事专业,又可以分为学科门类(如管理学、工学等),学科门类下设若干一级学科,每个一级学科一般设有若干二级学科。从事专业这一面可按线分类法分成学科门类、一级学科、二级学科三个层次,如下表所示。其中,一级学科用三位数字表示,二级学科用两位数字表示;一、二级学科之间用点隔开。
*混合分类法1、混合分类法的基本思想*632.3.1信息编码的概念信息编码是将事物或概念(编码对象)赋予具有一定规律、易于计算机和人识别处理的符号,形成代码元素集合。代码元素集合中的代码元素就是赋予编码对象的符号,即编码对象的代码值。信息编码包含数据表达成代码的方法、数据的代码表示形式、代码元素集合的赋值。信息编码形式有多种,例如:国际莫尔斯电报码用小点与短横表示。国际通用的电阻元件参数值是用一组由不同颜色组成的圆环表示的,称为电阻色环码。一维条形码,二位条形码等等。
信息编码的概念*192.3.1信息编码的概念信息编码是将事物或概念(编码*642.3.2信息代码的功能和信息编码的基
本原则(1/2)代码的功能如下:①信息的标识唯一,便于分类鉴别,防止同名异义、异名同义现象发生。②信息的标识统一,便于信息交换与利用,实现更大范围的资源共享。③信息的标识有序,便于信息的加工、排序、查询、检索。④信息的标识明确,可以表达特定含义。⑤信息的标识简洁,可以提高信息处理的效率。⑥信息标识的形式与信息内容的对应关系可以人为设定,有利于信息的安全保密。
对信息进行编码,就是使信息的标识规范化的过程,代码就是信息规范化的标识符。*202.3.2信息代码的功能和信息编码的基
本原则(1/*652.3.2信息代码的功能和信息编码的基
本原则(2/2)信息编码的基本原则如下:
①唯一性。②合理性。③可扩展性。④简洁性。⑤可识别性。⑥规范性。⑦稳定性。注意:企业代码由技术监督局、工商管理局负责给定;人口代码(身份证)由公安局给定*212.3.2信息代码的功能和信息编码的基
本原则(2/*662.3.3代码的分类
*222.3.3代码的分类*67
按符号形式分类(1/3)1、数字型代码定义:数字型代码或称数字码是用一个或多个阿拉伯数字表示分类对象的代码。特点:优点:结构简单,使用方便,特别是排序很容易,易于向国内外推广,缺点:对于分类对象属性与特征描述不直观。案例:我国国家标准《人的性别代码》《国民经济行业企业和代码》《中华人民共和国行政区划代码》。
*按符号形式分类(1/3)1、数字型*68
按符号形式分类(2/3)2、字母型代码定义:字母型代码或称字母码是用一个或多个字母表示分类对象的代码。
优点及案例:(1)字母型代码与数字型代码相比,同样位数的代码比数字型的容量大得多。案例:用一位英文字母型代码最多可以表示26个(A-Z)类目,而一位数字型代码最多只能表示10个类目,2位字母型代码最多可表示26×26=676个类目。(2)字母型代码由于其拼音字母的特点,还便于人们认识代码所表示的类目的内容,方便人们的记忆。案例:用CN表示中国(China),BJ表示北京(Beijing)等.
缺点:对象数量较多时,或增补、修改代码频繁时,用字母型代码容易出现重复与冲突现象。*按符号形式分类(2/3)2、字母型*69
按符号形式分类(3/3)3、混合型代码定义:混合型代码或称混合码是由数字、字母或数字、字母、专用字符组合表示分类对象的代码。
优点及案例:兼有上述数字型代码和字母型代码的优点,具有良好的直观性与表达性。
案例:火车时刻表上的T15表示北京至广州的某一特别快车。
表示263网络集团在互联网上的域名编码。
缺点:混合型代码组成复杂,造成计算机输入不方便,录入效率低、错误率高。
*按符号形式分类(3/3)3、混合型*70
按符号的含义分类(1/8)1、无含义代码:指组成代码的字符本身无实际含义的代码,代码只作为编码对象的唯一标识符。(1)顺序码定义:顺序码是将具有顺序的数字或字母赋予编码对象。顺序码是一种最简单和常用的无含义代码。优点及案例:代码简短、使用方便、易于增补案例:国家标准《人的性别代码》(GB/T2261—1980)中,男性的代码是1,女性的代码是2;缺点:代码本身不包含编码对象任何其他信息,不便于标识。*2按符号的含义分类(1/8)*71
按符号的含义分类(2/8)(2)无序码定义:将无序的数字或字母赋予编码对象的代码。
特点:代码无任何编写规律,通常靠机器产生的随机数赋予。此种代码仅表示编码对象是某约定的分类体系中的一个类目。案例:手机网上“自助服务”的有关密码:一号通码、二次校验码。*2按符号的含义分类(2/8)(2)无序码*72
按符号的含义分类(3/8)2、有含义代码:是指代码不仅作为编码对象的唯一标识,代替编码对象,而且提供编码对象的分类、排序与逻辑意义等信息的代码。(1)系列顺序码定义:这是一种特殊的顺序码。它是将顺序代码分成若干段(系列),并与编码对象的分类一一对应,给每段的编码对象赋予一定的顺序。
特点:优点是能表示一定的信息属性或特征,易于添加;缺点是空码较多,不便于机器处理,不适应于复杂的分类体系。
*2按符号的含义分类(3/8)2、有*73
按符号的含义分类(4/8)(2)数字化字母顺序码定义:数字化字母顺序码是将编码对象按其名称的首字母顺序排列,然后按此顺序赋以递增的数字代码。特点:优点:容易归类,便于检索,适合于根据人名、机关名、事业、企业单位名称以及地名来检索信息。缺点:新增代码调整困难,使用时间较短。
案例(水果编码)01Apples(苹果)02Bananas(香蕉)03Chenies(樱桃)*2按符号的含义分类(4/8)(2)数字化*74
按符号的含义分类(5/8)(3)层次码定义:层次码常用于线分类法,它是按编码对象的从属层次关系为排列顺序的一种代码。编码时,将代码分成若干层级,并与分类对象的分类层级相对应。代码自左至右,表示的层级由高至低,每个层级的代码可采用顺序码或系列顺序码。
特点:优点:能明确表明编码对象的类别,有严格的隶属关系。代码结构简单,容量大,便于计算机汇总。缺点:当层次较多时,所用代码位数较多,弹性较差。
案例:(国家标准《国民经济行业分类和代码》(GB/T4754—1994)编码)采用三层四位数字的层级码
*30按符号的含义分类(5/8)(3)层次码*75
按符号的含义分类(6/8)(4)特征组合码定义:特征组合码常用于面分类体系。它是将编码对象按其属性或特征分成若干个面。每个面内的诸项属性或特征按其规律分别进行编码,面与面之间的代码没有层次关系与从属关系。使用时,按预先确定顺序,根据需要可将不同的面中代码组合起来以表示所代表的类目。特点(雷同于面分类法)优点:类目组合比较灵活,适于机器处理。
缺点:利用率低,不便于求和汇总。
案例:机制螺钉分类由上表可知:代码2342表示黄铜Φ1.5方形镀铬螺钉。
*3按符号的含义分类(6/8)(4)特征组*76
按符号的含义分类(7/8)(5)矩阵码定义坐标的代码定义:矩阵码是一种建立在多维空间坐标位置基础上的代码,代码的值是通过赋予多维空间坐标的代码组合而成,或是通过赋予多维空间位置的序号而构成。例如:两维矩阵吗,是通过赋予x、y坐标的数值(序号)确定代码的值。
特点:优点:逻辑关系明确,也容易解释其含义。缺点:编制代码时较困难,需要考虑建立一定的逻辑关系。
案例:国际标准ISO2711-73《顺序日期表示法》行:月份;列:日期矩阵的序号排列(逻辑关系):从下至上、从左到右依次赋予001(1月1日)至365(12月31日)(若为闰年则为366)*3按符号的含义分类(7/8)(5)矩阵*77
按符号的含义分类(8/8)(6)复合码定义:复合码是由两个或两个以上完整、独立的代码组合而成。
特点:优点:使用灵活、应用面较广的代码类型,可以表示具有复杂分类和标识体系的事物。缺点:代码总长度较长。
案例:
美国的物资编目代码结构图(采用13位数字的复合码)*3按符号的含义分类(8/8)(6)复合码*78
信息编码错误种类1、在录入代码时的可能错误:识别错误:1/7,0/O,Z/2,D/O,S/5,……易位错误:12345/13245,……双易位错误:12345/13254,……随机错误:上述两种或两种以上的错误出现
2、避免代码录入出现错误的办法增加校验位:在设计好的代码后,再增加一位(最低位),作为代码的组成部分。增加的一位,即为校验位。使用中,没有特别意义。使用方法:使用时,应录入包括校验位在内的完整代码,代码进入系统后,系统将取该代码校验位前的各位,按照确定代码校验位的算法进行计算,并与录入代码的最后一位(校验位)进行比较,如果相等,则录入代码正确,否则录入代码错误,进行重新
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版团购工业地产协议书3篇
- 2024职业技能拓展训练合同
- 二零二五年度临时道路建设临建工程合同范本2篇
- 2025年度珠宝品牌授权与连锁经营合同范本2篇
- 二零二五版房地产项目市场调研与策划咨询服务合同范本3篇
- 二零二五年度农副产品电商平台数据分析与应用合同
- 2025年度智能穿戴设备代生产加工合同范本4篇
- 2024政府机关信息化系统运维服务询价采购合同3篇
- 个体餐饮店合伙人股权回购协议模板版B版
- 二零二五年度住宅楼屋顶绿化工程合同3篇
- 【地理】地图的选择和应用(分层练) 2024-2025学年七年级地理上册同步备课系列(人教版)
- (正式版)CB∕T 4552-2024 船舶行业企业安全生产文件编制和管理规定
- JBT 14588-2023 激光加工镜头 (正式版)
- 2024年四川省成都市树德实验中学物理八年级下册期末质量检测试题含解析
- 九型人格与领导力讲义
- 廉洁应征承诺书
- 2023年四川省成都市中考物理试卷真题(含答案)
- 泵车述职报告
- 2024年山西文旅集团招聘笔试参考题库含答案解析
- 恢复中华人民共和国国籍申请表
- 管理期货的趋势跟踪策略 寻找危机阿尔法
评论
0/150
提交评论