信息资源组织与管理(第2版)第02章信息的分类与编ppt课件_第1页
信息资源组织与管理(第2版)第02章信息的分类与编ppt课件_第2页
信息资源组织与管理(第2版)第02章信息的分类与编ppt课件_第3页
信息资源组织与管理(第2版)第02章信息的分类与编ppt课件_第4页
信息资源组织与管理(第2版)第02章信息的分类与编ppt课件_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息的分类与编码之第2讲陈庄 博士 教授内容提要1/22.1 信息元素的涵义了解:信息分类与编码的最小单位 2.1.1 信息元素的概念2.1.2 信息元素的命名原那么2.1.3 信息元素的标识2.1.4 信息元素的一致性2.2 信息分类的方法 2.2.1 信息分类的概念了解2.2.2 信息分类的根本原那么了解2.2.3 信息分类的根本方法重点 线分类法 面分类法 混合分类法内容提要2/22.3 信息编码方法 2.3.1 信息编码的概念 2.3.2 信息编码的功能和信息编码的根本原那么了解 2.3.3 代码的分类重点

2、 按符号方式分类 按符号的含义分类2.3.4 编码的校验 错误种类了解 校验方法重点 信息编码错误的校验步骤重点 校验案例 重点 2.4 作业 .2.1.1 信息元素的概念信息元素又称数据元素或数据项是最小的不可再分的信息单位,是一类信息的总称。例如:船舶资料中的船名“天河轮、“冀海轮等,可以笼统出“船舶称号这个数据元素;每一条船都有一个编号,可以概括出“船舶编号这个数据元素。通常职工档案中的“简历、“受奖情况等,不是信息元素。由于“简历至少包括时间、地点等信息,是可以继续分解的信息;“受奖情况也是可以继续分解的信息

3、。留意:“信息元素可以视为数据库中的“字段2.1.2 信息元素的命名原那么1/21、命名原那么信息元素命名的原那么就是用一简明的词组来描画一个信息元素的意义和用途。 2、词组的普通构造类别词和根本词都只需个,修饰词可以有一个或多个;类别词是信息元素命名中的个最重要的名词,用来识别和描画信息元素的普通用途或功能,普通不具有行业持征,条目较少。如数量AMOUNT、称号NAME、编号NUMBER、代码CODE等。 根本词是类别词的最重要的修饰词,它对一大类信息对象进一步分类反映一小类信息对象,普通具有行业特征,条目较多。如会计ACCOUNTING、预算BUDGET、顾客CUSTOMER等。修饰词一根

4、本词一类别词2.1.2 信息元素的命名原那么2/23、信息元素命名案例社会保险编码 社会修饰词、保险根本词、编号类别词学校学生学号学校贵重设备称号学校修饰词、贵重修饰词、设备根本词、称号类别词2.1.3 信息元素的标识1、信息元素标识的含义又称信息元编码是计算机和管理人员共同运用的标识。2、信息元素标识的方法用限定长度的大写字母字符串表达,字母字符可按信息元素称号的汉语拼音抽取首音字字母,也可按英文词首字母或缩写规那么得出。3、案例:2.1.4 信息元素的一致性信息元素命名和信息元素标识要在组织政府部门或企事业单位中坚持一致。不允许有“同名异义的信息元素。也不允许有“同义异名的信息元素。这里的

5、名是指信息元素的标识;“义是指信息元素的命名或定义。2.2.1 信息分类的概念1/21、含义信息分类是根据信息内容的属性或特征,将信息按一定的原那么和方法进展区分和归类,并建立起一定的分类体系和陈列顺序。2、信息分类的两个要素分类对象,分类对象由假设干个被分类的实体组成;分类根据,分类根据取决于分类对象的属性或特征。2.2.2信息分类的根本原那么1/3 1、科学性使类别的划分符合信息的内涵、性质及运用与管理要求;选择信息的本质属性和特征作为分类的根据,使分类体系构造具有稳定性,以供人们方便地运用。 2、系统性分类构造中各类信息按照他们之间的相互联络排成一定的顺序,构成一个系统,既便于人们区分信

6、息、识别信息,又便于人们从整体上去把握信息之间的关系。 2.2.2信息分类的根本原那么2/3 3、可扩展性随着科学技术的提高和社会经济的开展,人们可利用的信息量急剧增长,信息的类别和分类体系构造也应顺应这种变化的需求,这就要求:分类体系构造在原有的根底上有扩展的余地,其中包括新的类别的增补和在原有类别的根底上进展分解、细化。 4、兼容性信息的分类是一个庞大而复杂的系统,这个大系统中存在着假设干层分系统与子系统,一些子系统之间存在着相互联络和信息共享问题:如消费类信息和人事类信息中都包含工人这一类信息。消费类信息在对工人这一信息的定义和再分类时就要和人事类信息兼容2.2.2 信息分类的根本原那么

7、3/3 5、适用性由于信息的属性与特征的多样性,在实践生活中选择何种属性与特征进展分类还要思索到人们实践运用的需求。例如:某企业在开发新产品时,管理部门、设计部门与制造部门从各自的运用目的出发,对信息的分类会提出不同的要求。管理部门从企业的运营管理目的出发,希望信息的分类要便于消费的方案与控制,并能反映本钱和市场需求方面的情况;设计部门那么从设计需求出发,希望信息的分类体系表达新产品开发组合化(模块化)、规范化、序列化的趋势;制造工艺部门那么从实现产品的小批量、多种类成组消费,以提高消费效率和质量的目的出发,希望信息的分类体系能反映产品的量、部件的几何特征与工艺特性。因此,在制定企业信息分类体

8、系时,要从企业的总体目的出发,充分思索到各部门的合理要求,进展企业信息分类体系的整体优化。 线分类法1/3 1、线分类法的根本思想线分类法又称等级分类法或层级分类法是将初始的分类对象(即被划分的事物或概念)按所选定的假设干个属性/特征作为分类的划分根底,逐次地分解成假设干个层级类目,并编排成一个逐级展开、有层次的分类体系。同层级类目之间存在着并列关系,称为同位类。一个层级类目经分解构成的下层类目,称为下位类;相应的被分解的类目称为上位类;上位类与下位类的关系是隶属关系。同层级类目互不反复,不同层级的类目互不交叉。每个下位层的类目只对应于一个上位层。 线分类法2/3

9、 2、线分类法的典型案例国家规范有(GBT 22601999)以下为河北省部分案例其他案例:GBT 47541994和GBT 65651999 线分类法3/3 3、线分类法的优缺陷优点:容量大。可包容较多类目的信息。构造明晰。采用树形构造能较好反映类目之间的逻辑关系。运用方便。既符合手工处置信息的思想习惯,又便于计算机处置。缺陷:构造弹性较差。分类构造一经确定,不易改动。效率较低。当分类层次较多时,编码的位数较长,影响数据处置速度。 面分类法1/2 1、面分类法的根本思想面分类法是将所选定的分类对象的假设干属性或特征视为假设干个“面,每个“面中又可分成彼此独立的

10、假设干个类目。 。运用时:可根据需求将这些“面中的类目组合在一同,构成一个复合类目。 2、面分类法的典型案例某高校教师分类编码 面分类法2/2 3、面分类法的优缺陷优点:具有较大的弹性。一个面内的属性内容与数量的调整不会影响其他的面。顺应性强。可根据需求组成任何类目,也便于机器处置。易于增、删、改。 缺陷:不能充分利用信息。在面分类法构成的分类体系中,可组成的类目很多,但有时实践运用的类别不多。用手工来组成信息类目比较困难。 混合分类法 1、混合分类法的根本思想混合分类法是将线分类法和面分类法组合运用,以其中一种分类法为主,另一种做补充的信息分类方法。 2、案例:

11、上述教师的面分类体系中的从事专业,又可以分为学科门类(如管理学、工学等),学科门类下设假设干一级学科,每个一级学科普通设有假设干二级学科。这样,从事专业这一面可按线分类法分成学科门类、一级学科、二级学科三个层次,如下表所示。其中,一级学科用三位数字表示,二级学科用两位数字表示;一、二级学科之间用点隔开。 2.3.1 信息编码的概念信息编码是将事物或概念(编码对象)赋予具有一定规律、易于计算机和人识别处置的符号,构成代码元素集合。代码元素集合中的代码元素就是赋予编码对象的符号,即编码对象的代码值。信息编码包含数据表达成代码的方法、数据的代码表示方式、代码元素集合的赋值。信息编码方式有多种,例如:

12、国际莫尔斯电报码用小点与短横表示。国际通用的电阻元件参数值是用一组由不同颜色组成的圆环表示的,称为电阻色环码。 信息编码的概念2.3.2 信息代码的功能和信息编码的基本原那么1/2代码的功能如下: 信息的标识独一,便于分类鉴别,防止同名异义、异名同义景象发生。 信息的标识一致,便于信息交换与利用,实现更大范围的资源共享。 信息的标识有序,便于信息的加工、排序、查询、检索。 信息的标识明确,可以表达特定含义。 信息的标识简约,可以提高信息处置的效率。 信息标识的方式与信息内容的对应关系可以人为设定,有利于信息的平安严密。 对信息进展编码,就是使信息的标识规范化的过程,代码就是信息规范化的标识符。

13、2.3.2 信息代码的功能和信息编码的基本原那么2/2信息编码的根本原那么如下: 独一性。 合理性。 可扩展性。 简约性。 可识别性。 规范性。 稳定性。 留意:企业代码由技术监视局、工商管理局担任给定;人口代码身份证由公安局给定2.3.3 代码的分类 按符号方式分类1/3 1、数字型代码定义:数字型代码或称数字码是用一个或多个阿拉伯数字表示分类对象的代码。特点:优点:构造简单,运用方便,特别是排序很容易,易于向国内外推行,缺陷:但对于分类对象属性与特征描画不直观。案例:我国国家规范。 按符号方式分类2/3 2、字母型代码定义:字母型代码或称字母码是用一个或多个

14、字母表示分类对象的代码。 优点及案例:1字母型代码与数字型代码相比,同样位数的代码比数字型的容量大得多。案例:用一位英文字母型代码最多可以表示26个(A-Z)类目,而一位数字型代码最多只能表示10个类目,2位字母型代码最多可表示2626676个类目。2字母型代码由于其拼音字母的特点,还便于人们认识代码所表示的类目的内容,方便人们的记忆。 案例:用CN表示中国(China),BJ表示北京()等. 缺陷:对象数量较多时,或增补、修正代码频繁时,用字母型代码容易出现反复与冲突景象。 按符号方式分类3/3 3、混合型代码定义:混合型代码或称混合码是由数字、字母或数字、字母、公用字符组合

15、表示分类对象的代码。 优点及案例:兼有上述数字型代码和字母型代码的优点,具有良好的直观性与表达性。 案例:火车时辰表上的T15表示北京至广州的某一特别快车。 表示263网络集团在互联网上的域名编码。 缺陷:混合型代码组成复杂,呵斥计算机输入不方便,录入效率低、错误率高。 按符号的含义分类1/8 1、无含义代码:指组成代码的字符本身无实践含义的代码,代码只作为编码对象的独一标识符。1顺序码定义:顺序码是将具有顺序的数字或字母赋予编码对象。 顺序码是一种最简单和常用的无含义代码。优点及案例:代码简短、运用方便、易于增补 案例:国家规范(GBT22611980)中,男性的代码是1,女

16、性的代码是2 ;学生学号编码缺陷:代码本身不包含编码对象任何其他信息,不便于标识 。 按符号的含义分类2/82无序码定义:将无序的数字或字母赋予编码对象的代码。 特点:代码无任何编写规律,通常靠机器产生的随机数赋予。此种代码仅表示编码对象是某商定的分类体系中的一个类目。 案例:手机网上“自助效力的有关密码:一号通吗、二次校验码。 按符号的含义分类3/8 2、有含义代码:是指代码不仅作为编码对象的独一标识,替代编码对象,而且提供编码对象的分类、排序与逻辑意义等信息的代码。1系列顺序码定义:这是一种特殊的顺序码。它是将顺序代码分成假设干段系列,并与编码对象的分类一 一对

17、应,给每段的编码对象赋予一定的顺序。 特点:优点是能表示一定的信息属性或特征,易于添加;缺陷是空码较多,不便于机器处置,不顺应于复杂的分类体系。 按符号的含义分类4/82数字化字母顺序码定义:数字化字母顺序码是将编码对象按其称号的首字母顺序陈列,然后按此顺序赋以递增的数字代码 。特点:优点:容易归类,便于检索,适宜于根据人名、机关名、事业、企业单位称号以及地名来检索信息。缺陷:新增代码调整困难,运用时间较短。 案例水果编码01 Apples(苹果)02 Bananas(香蕉)03 Chenies(樱桃)04 Dates(枣) 按符号的含义分类5/83层次码定义:

18、层次码常用于线分类法,它是按编码对象的从属层次关系为陈列顺序的一种代码。编码时,将代码分成假设干层级,并与分类对象的分类层级相对应。代码自左至右,表示的层级由高至低,每个层级的代码可采用顺序码或系列顺序码。 特点:优点:能明确阐明编码对象的类别,有严厉的隶属关系。代码构造简单,容量大,便于计算机汇总。缺陷:当层次较多时,所用代码位数较多,弹性较差。 案例: 国家规范(GB/T 47541994)编码采用三层四位数字的层级码 按符号的含义分类6/84特征组合码定义:特征组合码常用于面分类体系。它是将编码对象按其属性或特征分成假设干个面。每个面内的诸项属性或特征按其规律分别进展编码

19、,面与面之间的代码没有层次关系与从属关系。运用时,按预先确定顺序,根据需求可将不同的面中代码组合起来以表示所代表的类目。 特点雷同于面分类法优点:类目组合比较灵敏,适于机器处置。 缺陷:利用率低,不便于求和汇总。 案例:机制螺钉分类由上表可知:代码2342表示黄铜1.5方形镀铬螺钉。 按符号的含义分类7/85 矩阵码定义坐标的代码定义:矩阵码是一种建立在多维空间坐标位置根底上的代码,代码的值是经过赋予多维空间坐标的代码组合而成,或是经过赋予多维空间位置的序号而构成。例如:两维矩阵吗,是经过赋予x、y坐标的数值(序号)确定代码的值。 特点:优点:逻辑关系明确,也容易解释其含义。缺

20、陷:编制代码时较困难,需求思索建立一定的逻辑关系。 案例:国际规范ISO271173行:月份; 列:日期矩阵的序号陈列逻辑关系:从下至上、从左到右依次赋予0011月1日至36512月31日假设为闰年那么为36 按符号的含义分类8/86复合码定义:复合码是由两个或两个以上完好、独立的代码组合而成。 特点:优点:运用灵敏、运用面较广的代码类型,可以表示具有复杂分类和标识体系的事物。缺陷:代码总长度较长。 案例: 美国的物资编目代码构造图采用13位数字的复合码 信息编码错误种类 1、在录入代码时的能够错误:识别错误:1/7,0/O,Z/2,D/O,S/5,易位错误:12345/13245,双易位错误:12345/13254,随机错误:上述两种或两种以上的错误出现 2、防止代码录入出现错误的方法添加校验位:在设计好的代码后,再添加一位最低位,作为代码的组成部分。添加的一位,即为校验位。运用中,没有特别意义。运用方法:运用时,应录入包括校验位在内的完好代码,代码进入系统后,系统将取该代码校验位前的各位,按照确定代码校验位的算法进展计算,并

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论