信息资源组织与管理第第章信息的分类与编_第1页
信息资源组织与管理第第章信息的分类与编_第2页
信息资源组织与管理第第章信息的分类与编_第3页
信息资源组织与管理第第章信息的分类与编_第4页
信息资源组织与管理第第章信息的分类与编_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息的分类与编码《信息资源组织与管理》之第2讲陈庄博士教授cz@1/24/20231内容提要(1/2)2.1信息元素的涵义(了解:信息分类与编码的最小单位)

2.1.1信息元素的概念2.1.2信息元素的命名原则2.1.3

信息元素的标识2.1.4

信息元素的一致性2.2信息分类的方法

2.2.1信息分类的概念(了解)2.2.2

信息分类的基本原则(了解)2.2.3信息分类的基本方法(重点)

线分类法

面分类法

混合分类法1/24/20232内容提要(2/2)2.3信息编码方法

2.3.1

信息编码的概念

2.3.2信息编码的功能和信息编码的基本原则(了解)2.3.3

代码的分类(重点)

按符号形式分类

按符号的含义分类2.3.4编码的校验

错误种类(了解)校验方法(重点)信息编码错误的校验步骤(重点)校验案例(重点)

2.4

作业(…….)1/24/202332.1.1信息元素的概念信息元素(又称数据元素或数据项)是最小的不可再分的信息单位,是一类信息的总称。例如:船舶资料中的船名“天河轮”、“冀海轮”等,可以抽象出“船舶名称”这个数据元素;每一条船都有一个编号,可以概括出“船舶编号”这个数据元素。通常职工档案中的“简历”、“受奖情况”等,不是信息元素。因为“简历”至少包括时间、地点等信息,是可以继续分解的信息;“受奖情况”也是可以继续分解的信息。(注意:“信息元素”可以视为数据库中的“字段”)1/24/202342.1.2信息元素的命名原则(1/2)1、命名原则信息元素命名的原则就是用一简明的词组来描述一个信息元素的意义和用途。

2、词组的一般结构类别词和基本词都只有—个,修饰词可以有一个或多个;类别词是信息元素命名中的—个最重要的名词,用来识别和描述信息元素的一般用途或功能,一般不具有行业持征,条目较少。如数量(AMOUNT)、名称(NAME)、编号(NUMBER)、代码(CODE)等。基本词是类别词的最重要的修饰词,它对一大类信息对象进一步分类(反映一小类信息对象),一般具有行业特征,条目较多。如会计(ACCOUNTING)、预算(BUDGET)、顾客(CUSTOMER)等。修饰词一基本词一类别词1/24/202352.1.2信息元素的命名原则(2/2)3、信息元素命名案例社会保险编码

社会(修饰词)、保险(基本词)、编号(类别词)学校学生学号学校贵重设备名称学校(修饰词)、贵重(修饰词)、设备(基本词)、名称(类别词)1/24/202362.1.3信息元素的标识1、信息元素标识的含义又称信息元编码是计算机和管理人员共同使用的标识。2、信息元素标识的方法用限定长度的大写字母字符串表达,字母字符可按信息元素名称的汉语拼音抽取首音字字母,也可按英文词首字母或缩写规则得出。3、案例:1/24/202372.1.4信息元素的一致性信息元素命名和信息元素标识要在组织(政府部门或企事业单位)中保持一致。不允许有“同名异义”的信息元素。也不允许有“同义异名”的信息元素。这里的”名”是指信息元素的标识;“义”是指信息元素的命名或定义。1/24/202382.2.1信息分类的概念(1/2)1、含义信息分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序。2、信息分类的两个要素分类对象,分类对象由若干个被分类的实体组成;分类依据,分类依据取决于分类对象的属性或特征。1/24/202392.2.2信息分类的基本原则(1/3)

1、科学性使类别的划分符合信息的内涵、性质及使用与管理要求;选择信息的本质属性和特征作为分类的依据,使分类体系结构具有稳定性,以供人们方便地使用。

2、系统性分类结构中各类信息按照他们之间的相互联系排成一定的顺序,形成一个系统,既便于人们区分信息、识别信息,又便于人们从整体上去把握信息之间的关系。

1/24/2023102.2.2信息息分类类的基基本原原则((2/3))3、可可扩展展性随着科科学技技术的的进步步和社社会经经济的的发展展,人人们可可利用用的信信息量量急剧剧增长长,信信息的的类别别和分分类体体系结结构也也应适适应这这种变变化的的需要要,这这就要要求::分类体体系结结构在在原有有的基基础上上有扩扩展的的余地地,其其中包包括新新的类类别的的增补补和在在原有有类别别的基基础上上进行行分解解、细细化。。4、兼兼容性性信息的的分类类是一一个庞庞大而而复杂杂的系系统,,这个个大系系统中中存在在着若若干层层分系系统与与子系系统,,一些些子系系统之之间存存在着着相互互联系系和信信息共共享问问题::如生产产类信信息和和人事事类信信息中中都包包含工工人这这一类类信息息。生生产类类信息息在对对工人人这一一信息息的定定义和和再分分类时时就要要和人人事类类信息息兼容容1/7/2023112.2.2信信息分类类的基本本原则((3/3)5、实用用性由于信息息的属性性与特征征的多样样性,在在实际生生活中选选择何种种属性与与特征进进行分类类还要考考虑到人人们实际际应用的的需要。。例如:某某企业在在开发新新产品时时,管理理部门、、设计部部门与制制造部门门从各自自的应用用目的出出发,对对信息的的分类会会提出不不同的要要求。管理部部门从从企业业的经经营管管理目目标出出发,,希望望信息息的分分类要要便于于生产产的计计划与与控制制,并并能反反映成成本和和市场场需求求方面面的情情况;;设计部部门则则从设设计需需要出出发,,希望望信息息的分分类体体系体体现新新产品品开发发组合合化(模块块化)、标标准化化、序序列化化的趋趋势;;制造工工艺部部门则则从实实现产产品的的小批批量、、多品品种成成组生生产,,以提提高生生产效效率和和质量量的目目的出出发,,希望望信息息的分分类体体系能能反映映产品品的量量、部部件的的几何何特征征与工工艺特特性。。因此,,在制制订企企业信信息分分类体体系时时,要要从企企业的的总体体目标标出发发,充充分考考虑到到各部部门的的合理理要求求,进进行企企业信信息分分类体体系的的整体体优化化。1/7/2023线分分类法((1/3)1、线分分类法的的基本思思想线分类法法(又称等级分类类法或层级分类类法)是将初初始的分分类对象象(即被被划分的的事物或或概念)按所选选定的若若干个属性/特特征作为分类类的划分分基础,,逐次地地分解成成若干个个层级类类目,并并编排成成一个逐逐级展开开、有层层次的分分类体系系。同层级类类目之间间存在着着并列关关系,称称为同位类。一个层级级类目经经分解形形成的下下层类目目,称为为下位类;相应的的被分解解的类目目称为上位类;上位类类与下位位类的关关系是隶属关系系。同层级类类目互不不重复,不同层级级的类目目互不交交叉。每个下下位层的的类目只只对应于于一个上上位层。。1/7/2023线分分类法((2/3)2、线分分类法的的典型案案例国家标准准有《中中华人民民共和国国行政区区划代码码》(GB/T2260——1999)(以下为河河北省部部分案例例)其他案例例:《国民经经济行业业分类与与代码》》(GB/T4754—1994)和《《职业分分类与代代码》((GB//T6565—1999))1/7/2023线分类类法(3/3)3、线分类法法的优缺点优点:容量大。可容纳较多类类目的信息。。结构清晰。采用树形结结构能较好反反映类目之间间的逻辑关系系。使用方便。既符合手工工处理信息的的思维习惯,,又便于计算算机处理。缺点:结构弹性较差差。分类结构一一经确定,不不易改动。效率较低。当分类层次次较多时,编编码的位数较较长,影响数数据处理速度度。1/7/2023面分类类法(1/2)1、面分类法法的基本思想想面分类类法是将所所选定定的分分类对对象的的若干干属性性或特特征视视为若若干个个“面面”,,每个个“面面”中中又可可分成成彼此此独立立的若若干个个类目目。。。使用时时:可根据据需要要将这这些““面””中的的类目目组合合在一一起,,形成成一个个复合合类目目。2、面面分类类法的的典型型案例例某高校校教师师分类类编码码1/7/2023面面分类类法((2/2))3、面面分类类法的的优缺缺点优点::具有较较大的的弹性性。一个面面内的的属性性内容容与数数量的的调整整不会会影响响其他他的面面。适应性性强。可根根据需需要组组成任任何类类目,,也便便于机机器处处理。。易于增增、删删、改改。缺点::不能充充分利利用信信息。在面面分类类法形形成的的分类类体系系中,,可组组成的的类目目很多多,但但有时时实际际应用用的类类别不不多。。用手工工来组组成信信息类类目比比较困困难。1/7/2023混混合分分类法法1、混混合分分类法法的基基本思思想混合分分类法法是将将线分分类法法和面面分类类法组组合使使用,,以其其中一一种分分类法法为主主,另另一种种做补补充的的信息息分类类方法法。2、案案例::上述教教师的的面分分类体体系中的从从事专专业,,又可可以分分为学学科门门类(如管管理学学、工工学等等),,学科科门类类下设设若干干一级级学科科,每每个一一级学学科一一般设设有若若干二二级学学科。。这样,,从事事专业业这一一面可可按线分分类法法分成成学科科门类类、一级级学科科、二二级学学科三三个层层次,,如下下表所所示。。其中中,一一级学学科用用三位位数字字表示示,二二级学学科用用两位位数字字表示示;一一、二二级学学科之之间用用点隔隔开。。1/7/2023182.3.1信信息息编编码码的的概概念念信息息编编码码是是将将事事物物或或概概念念(编编码码对对象象)赋赋予予具具有有一一定定规规律律、、易易于于计计算算机机和和人人识识别别处处理理的的符符号号,,形形成成代代码码元元素素集集合合。。代代码码元元素素集集合合中中的的代代码码元元素素就就是是赋赋予予编编码码对对象象的的符符号号,,即即编编码码对对象象的的代代码码值值。。信息息编编码码包包含含数据据表表达达成成代代码码的的方方法法、数据据的的代代码码表表示示形形式式、代码码元元素素集集合合的的赋赋值值。信息息编编码码形形式式有有多多种种,,例例如如::国际际莫莫尔尔斯斯电电报报码码用用小小点点与与短短横横表表示示。。国际际通通用用的的电电阻阻元元件件参参数数值值是是用用一一组组由由不不同同颜颜色色组组成成的的圆圆环环表表示示的的,,称称为为电电阻阻色色环环码码。。信息编编码的的概念念1/7/2023192.3.2信信息代代码的的功能能和信信息编编码的的基本本原原则((1/2))代码的的功能能如下下:①信信息息的的标标识识唯唯一一,,便便于于分分类类鉴鉴别别,,防防止止同同名名异异义义、、异异名名同同义义现现象象发发生生。。②信信息息的的标标识识统统一一,,便便于于信信息息交交换换与与利利用用,,实实现现更更大大范范围围的的资资源源共共享享。。③信信息息的的标标识识有有序序,,便便于于信信息息的的加加工工、、排排序序、、查查询询、、检检索索。。④信信息息的的标标识识明明确确,,可可以以表表达达特特定定含含义义。。⑤信信息息的的标标识识简简洁洁,,可可以以提提高高信信息息处处理理的的效效率率。。⑥信信息息标标识识的的形形式式与与信信息息内内容容的的对对应应关关系系可可以以人人为为设设定定,,有有利利于于信信息息的的安安全全保保密密。。对信息进行行编码,就就是使信息息的标识规规范化的过过程,代码就是信信息规范化化的标识符符。1/7/2023202.3.2信息代代码的功能能和信息编编码的基本本原则((2/2))信息编码的的基本原则则如下:①唯一性性。②合理性性。③可扩展展性。④简洁性性。⑤可识别别性。⑥规范性性。⑦稳定性性。注意:企业代码由由技术监督督局、工商商管理局负负责给定;;人口代码((身份证))由公安局局给定1/7/2023212.3.3代代码的的分类类1/7/2023按按符号号形式式分类类(1/3)1、数数字型型代码码定义::数字型型代码码或称数字码码是用一一个或或多个个阿拉拉伯数数字表表示分分类对对象的的代码码。特点::优点::结构简简单,,使用用方便便,特特别是是排序序很容容易,,易于于向国国内外外推广广,缺点::但对于于分类类对象象属性性与特特征描描述不不直观观。案例::我国国国家标标准《《人的的性别别代码码》《国民民经济济行业业企业业和代代码》》《中华华人民民共和和国行行政区区划代代码》》。1/7/2023按按符号号形式式分类类(2/3)2、、字字母母型型代代码码定义义::字母母型型代代码码或称称字母母码码是用用一一个个或或多多个个字字母母表表示示分分类类对对象象的的代代码码。。优点点及及案案例例::(1))字字母母型型代代码码与与数数字字型型代代码码相相比比,,同同样样位位数数的的代代码码比比数数字字型型的的容容量量大大得得多多。。案例例::用一一位位英英文文字字母母型型代代码码最最多多可可以以表表示示26个个(A-Z)类类目目,,而而一一位位数数字字型型代代码码最最多多只只能能表表示示10个个类类目目,,2位位字字母母型型代代码码最最多多可可表表示示26××26==676个个类类目目。。(2))字字母母型型代代码码由由于于其其拼拼音音字字母母的的特特点点,,还还便便于于人人们们认认识识代代码码所所表表示示的的类类目目的的内内容容,,方方便便人人们们的的记记忆忆。。案例例::用CN表表示示中中国国(China),,BJ表表示示北北京京(Beijing)等等.缺点点::对象象数数量量较较多多时时,,或或增增补补、、修修改改代代码码频频繁繁时时,,用用字字母母型型代代码码容容易易出出现现重重复复与与冲冲突突现现象象。。1/7/2023按按符符号号形形式式分分类类((3/3))1/7/2023按符符号的含含义分类类(1/8)1、无含义代代码:指组成代代码的字字符本身身无实际际含义的的代码,,代码只只作为编编码对象象的唯一一标识符符。(1)顺顺序码定义:顺序码是将具有有顺序的的数字或或字母赋赋予编码码对象。。顺序码是一种最最简单和和常用的的无含义义代码。。优点及案案例:代码简短短、使用用方便、、易于增增补案例:国家标准准《人的的性别代代码》(GB//T2261——1980)中中,男性性的代码码是1,,女性的的代码是是2;;学生学号号编码缺点:代码本身身不包含含编码对对象任何何其他信信息,不不便于标标识。1/7/20232按符符号的含含义分类类(2/8))(2)无无序码定义:将无序的的数字或或字母赋赋予编码码对象的的代码。特点:代码无任任何编写写规律,,通常靠靠机器产产生的随随机数赋赋予。此种代码码仅表示示编码对对象是某某约定的的分类体体系中的的一个类类目。案例:手机网上上“自助助服务””的有关关密码::一号通通吗、二二次校验验码。1/7/20232按按符号号的含含义分分类((3/8)2、有有含义义代码码:是是指代代码不不仅作作为编编码对对象的的唯一一标识识,代代替编编码对对象,,而且且提供供编码码对象象的分分类、、排序序与逻逻辑意意义等等信息息的代代码。。(1))系列列顺序序码定义::这是一一种特特殊的的顺序序码。。它是是将顺顺序代代码分分成若若干段段(系系列)),并并与编编码对对象的的分类类一一一对对应,,给每每段的的编码码对象象赋予予一定定的顺顺序。。特点::优点是能表表示一一定的的信息息属性性或特特征,,易于于添加加;缺点是空码码较多多,不不便于于机器器处理理,不不适应应于复复杂的的分类类体系系。1/7/20232按按符号号的含含义分分类((4/8)(2))数字字化字字母顺顺序码码定义::数字化化字母母顺序序码是是将编编码对对象按按其名名称的的首字字母顺顺序排排列,,然后后按此此顺序序赋以以递增增的数数字代代码。。特点::优点::容易易归类类,便便于检检索,,适合合于根根据人人名、、机关关名、、事业业、企企业单单位名名称以以及地地名来来检索索信息息。缺点::新增增代码码调整整困难难,使使用时时间较较短。。案例例(水果果编编码码)01Apples(苹苹果果)02Bananas(香香蕉蕉)03Chenies(樱樱桃桃)04Dates(枣枣)1/7/20232按按符符号号的的含含义义分分类类((5/8))(3))层层次次码码定义义::层次次码码常常用用于于线线分分类类法法,,它它是是按按编编码码对对象象的的从从属属层层次次关关系系为为排排列列顺顺序序的的一一种种代代码码。。编码码时时,,将将代代码码分分成成若若干干层层级级,,并并与与分分类类对对象象的的分分类类层层级级相相对对应应。。代代码码自自左左至至右右,,表表示示的的层层级级由由高高至至低低,,每每个个层层级级的的代代码码可可采采用用顺顺序序码码或或系系列列顺顺序序码码。。特点点::优点点::能明明确确表表明明编编码码对对象象的的类类别别,,有有严严格格的的隶隶属属关关系系。。代代码码结结构构简简单单,,容容量量大大,,便便于于计计算算机机汇汇总总。。缺点点::当层层次次较较多多时时,,所所用用代代码码位位数数较较多多,,弹弹性性较较差差。。案例例::(国家家标标准准《《国国民民经经济济行行业业分分类类和和代代码码》》(GB/T4754——1994)编编码码)采用用三三层层四四位位数数字字的的层层级级码码1/7/202330按按符符号号的的含含义义分分类类((6/8))(4))特特征征组组合合码码定义义::特征征组组合合码码常常用用于于面面分分类类体体系系。。它它是是将将编编码码对对象象按按其其属属性性或或特特征征分分成成若若干干个个面面。。每每个个面面内内的的诸诸项项属属性性或或特特征征按按其其规规律律分分别别进进行行编编码码,,面面与与面面之之间间的的代代码码没没有有层层次次关关系系与与从从属属关关系系。。使用用时时,,按按预预先先确确定定顺顺序序,,根根据据需需要要可可将将不不同同的的面面中中代代码码组组合合起起来来以以表表示示所所代代表表的的类类目目。。特点点(雷同同于于面分分类类法法)优点点::类目目组组合合比比较较灵灵活活,,适适于于机机器器处处理理。。缺点点::利用用率率低低,,不不便便于于求求和和汇汇总总。。案例例::机制制螺螺钉钉分分类类由上上表表可可知知::代代码码2342表表示示黄黄铜铜ΦΦ1.5方方形形镀镀铬铬螺螺钉钉。。1/7/20233按按符号号的含含义分分类((7/8)(5))矩矩阵码码定义义坐标标的代代码定义::矩阵码码是一一种建建立在在多维维空间间坐标标位置置基础础上的的代码码,代代码的的值是是通过过赋予予多维维空间间坐标标的代代码组组合而而成,,或是是通过过赋予予多维维空间间位置置的序序号而而构成成。例如::两维维矩阵阵吗,,是通通过赋赋予x、y坐标标的数数值(序号号)确确定代代码的的值。。特点::优点::逻辑关关系明明确,,也容容易解解释其其含义义。缺点::编制代代码时时较困困难,,需要要考虑虑建立立一定定的逻逻辑关关系。。案例::国际标标准ISO2711-73《顺序序日期期表示示法》》行:月份;;列:日期矩阵的的序号号排列列(逻逻辑关关系)):从下至至上、、从左左到右右依次赋赋予001(1月1日))至365(12月月31日))(若若为闰闰年则则为366)1/7/20233按按符号的含含义分类((8/8)(6)复合合码定义:复合码是由两个或或两个以上上完整、独独立的代码码组合而成成。特点:优点:使用灵活、、应用面较较广的代码码类型,可可以表示具具有复杂分分类和标识识体系的事事物。缺点:代码总长度度较长。案例:美国的物资资编目代码码结构图((采用13位位数字的复复合码)1/7/20233信信息编码错错误种类1、在录入入代码时的的可能错误误:识别错误:1/7,,0/O,Z/2,D/O,S/5,,……易位错误:12345/13245,,……双易位错误误:12345/13254,,……随机错误:上述两种种或两种以以上的错误误出现2、避免代代码录入出出现错误的的办法增加校验位位:在设计好的的代码后,,再增加一位位(最低位位),作为代码码的组成部部分。增加加的一位,,即为校验验位。使用用中,没有有特别意义义。使用方法:使用时,应应录入包括括校验位在在内的完整整代码,代代码进入系系统后,系系统将取该该代码校验验位前的各各位,按照照确定代码码校验位的的算法进行行计算,并并与录入代代码的最后后一位(校校验位)进进行比较,,如果相等等,则录入入代码正确确,否则录录入代码错错误,进行行重新录入入。1/7/20233信信息编码错错误的校验验方法((1/2))三种方法::算术级数法法、几何级级数法、质质数法1、算术级级数法1/7/20233信信息编编码错错误的的校验验方法法((2/2))2、几几何级级数法法3、质质数法法1/7/20233信信息编编码错错误的的校验验步骤骤设有一一组代代码为为:C1C2C3C4…Ci第一步步:为为设计计好的的代码码的每每一位位Ci确定一一个权权数Pi((权数数可为为算术级级数-等差差数列列、、几何级级数-等比比数列列、或或质数)。第二步步:求求代码码每一一位Ci与其对对应的的权数数Pi的成绩绩之和和SS=C1*P1+C2*P2+………+Ci*Pi(i=1,2,………,n)n=∑∑Ci*Pi(i=1,2,………,n)i=1第三步步:确确定模模M第四步步:取取余R=MOD(M)第五步步:校校验位位Ci+1=R最终代代码为为:C1C2C3C4…CiCi+1使用时时:C1C2C3C4…CiCi+11/7/20233校校验案案例原设计计的一一组代代码为为五位位,如如32456,,确定定权数数为7,6,5,4,3(算算数级级数))求代码码每一一位Ci与与其对对应的的权数数Pi的成成绩之之和SS=C1*P1+C2*P2+………+Ci*Pi(i=1,2,………,n)=3*7+2*6+4*5+5*4+6*3=21+12+20+20+18=91确定模模M,,M=11取余R,R=SMOD(M)=91MOD(11)=3校验位位Ci+1=R=3最终代代码为为:C1C2C3C4……CiCi+1,,即324563使用时时为::324563该组代代码中中的其其他代代码按按此算算法,,分别别求得得校验验位,,构成成新的的代码码。其它案案例::教材P461/7/2023382.4作业业P46:1,2,3,4,51/7/2023399、静夜四无邻邻,荒居旧业业贫。。1月-231月-23Saturday,January7,202310、雨中黄叶树树,灯下白头头人。。18:57:5618:57:5618:571/7/20236:57:56PM11、以我独独沈久,,愧君相相见频。。。1月-2318:57:5618:57Jan-2307-Jan-2312、故人人江海海别,,几度度隔山山川。。。18:57:5618:57:5618:57Saturday,January7,202313、乍乍见见翻翻疑疑梦梦,,相相悲悲各各问问年年。。。。1月月-231月月-2318:57:5618:57:56January7,202314、他乡乡生白白发,,旧国国见青青山

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论