信息组织与分类编目_第1页
信息组织与分类编目_第2页
信息组织与分类编目_第3页
信息组织与分类编目_第4页
信息组织与分类编目_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息组织与分类编目信息组织与分类编目南京农业大学信息管理系刘磊南京农业大学信息管理系刘磊llxx_H)SNS:人人网;QQ:2297370769提纲提纲1 1、互联网的发展趋势、互联网的发展趋势2 2、网络环境下的信息组织与分类编目、网络环境下的信息组织与分类编目3 3、信息组织与分类编目的关系、信息组织与分类编目的关系4 4、信息组织的基本任务、信息组织的基本任务1 1、互联网的发展趋势、互联网的发展趋势(1 1)发展速度(主机、用户、网站、带宽)发展速度(主机、用户、网站、带宽)1)上网计算机数比较)上网计算机数比较截至截至2007年底,我国上网计算机总数己达年

2、底,我国上网计算机总数己达7800万台,万台,与与1997年年10月相比,增长了月相比,增长了260倍;倍;2009年以后无总年以后无总数统计,呈现出上网设备多元化(台式机、笔记本、手数统计,呈现出上网设备多元化(台式机、笔记本、手机),按网民数推算上网电脑应超过机),按网民数推算上网电脑应超过1.5亿台。亿台。2)上网用户人数比较)上网用户人数比较截至截至2007年底,我国的互联网用户已经达到了年底,我国的互联网用户已经达到了2亿亿1千千万,居世界第二位(万,居世界第二位(2008年年6月居世界第一)。与月居世界第一)。与1997年年10月相比,增长了月相比,增长了300多倍,占中国人口总数

3、的多倍,占中国人口总数的16%。2010年普及率达年普及率达34.3%,四项指标增长比较分析3)WWW站点数比较站点数比较截至截至2007年底,我国年底,我国WWW站点数为站点数为1,500,000个,个,与与1997年年10月相比,月相比,WWW站点总数已是当初站点总数已是当初1400个的个的1000倍。倍。2010年达年达1270多倍。多倍。4)国际出口带宽总容量比较)国际出口带宽总容量比较截至截至2007年底,我国国际出口带宽的总容量为年底,我国国际出口带宽的总容量为368,927M,是,是1997年第一次调查结果年第一次调查结果 25.4M的的14757倍,倍,2010年达年达4395

4、6倍。上述指标中国际出倍。上述指标中国际出口带宽增速最快。口带宽增速最快。问题:为什么出口带宽增长速度高于其他指标?问题:为什么出口带宽增长速度高于其他指标?四项指标增长比较分析(续)1)社会原因)社会原因用户信息需求(市场导向)。用户信息需求(市场导向)。2)技术原因)技术原因IT四定律(摩尔定律、贝尔定律、吉尔四定律(摩尔定律、贝尔定律、吉尔德定律和麦特卡尔夫定律德定律和麦特卡尔夫定律)。3)经济原因)经济原因信息经济(电子商务、网络经济、数字信息经济(电子商务、网络经济、数字经济)在经济)在IT四定律推动下兴起四定律推动下兴起。(2 2)互联网迅猛发展的原因互联网迅猛发展的原因2003年

5、年6月月Google搜索的网页为搜索的网页为30亿个,而亿个,而2004年年11月,月,Google副总裁比尔副总裁比尔考兰宣布,考兰宣布,Google数据库数据库中网页已经超过中网页已经超过80 亿个;自亿个;自2003年开始:中国网页基年开始:中国网页基本保持翻番增长,本保持翻番增长, 2003年网页年网页3亿个、亿个、2008年年161亿亿个、个、2009年年336亿个,比亿个,比2008年增长了年增长了1倍多,比倍多,比2003年增长了年增长了100倍多。倍多。2010年年11月,新兴搜索引擎月,新兴搜索引擎Blekko CEO里奇里奇斯科伦塔表示,由于网页总量已经突斯科伦塔表示,由于

6、网页总量已经突破破1万亿,万亿,“垃圾信息也呈现加速增长态势垃圾信息也呈现加速增长态势”。他还表。他还表示:示:“我们将借助大规模的人工手段清理这类内容。我们将借助大规模的人工手段清理这类内容。”从而推广从而推广“受信赖受信赖”的内容。的内容。 (3 3)网络环境下信息资源发展状况)网络环境下信息资源发展状况 1 1)信息数量庞大且增长迅速)信息数量庞大且增长迅速2 2)信息内容丰富)信息内容丰富网络信息资源内容极为丰富,覆盖面广,涵盖了各网络信息资源内容极为丰富,覆盖面广,涵盖了各学科各领域,且种类繁多,几乎无所不包。学科各领域,且种类繁多,几乎无所不包。网络信息没有统一的管理机构和发布标准

7、,且变化、更迭、网络信息没有统一的管理机构和发布标准,且变化、更迭、新生、消亡等随时发生,质量良莠不齐,重复严重(我国新生、消亡等随时发生,质量良莠不齐,重复严重(我国重复网页比例达到重复网页比例达到25%左右),难以控制。左右),难以控制。3 3)信息质量差异增大)信息质量差异增大网络以超文本、超媒体、集成式地提供信息,除文本信网络以超文本、超媒体、集成式地提供信息,除文本信息外,还有图表、图形、图象、声音、动画、视频等。息外,还有图表、图形、图象、声音、动画、视频等。提供了丰富的学习、娱乐功能。提供了丰富的学习、娱乐功能。4 4)信息形式多样)信息形式多样5 5)信息交流方式多样)信息交流

8、方式多样现代社会信息高度的分散无序性与人们利用信息的高度现代社会信息高度的分散无序性与人们利用信息的高度选择性形成了尖锐矛盾,信息组织通过人工和机器干预,选择性形成了尖锐矛盾,信息组织通过人工和机器干预,使信息有序增值,形成信息资源,进而提供有效的利用使信息有序增值,形成信息资源,进而提供有效的利用(如搜索引擎谷歌和百度的发展、新兴搜索引擎(如搜索引擎谷歌和百度的发展、新兴搜索引擎Blekko对谷歌的挑战,又如雅虎用分类目录展开网络信息、图书对谷歌的挑战,又如雅虎用分类目录展开网络信息、图书馆为馆藏图书编制机读目录供用户查询、再如中国期刊网馆为馆藏图书编制机读目录供用户查询、再如中国期刊网中的

9、作者、关键词各种索引等)。中的作者、关键词各种索引等)。从这一角度看,信息组织可以说是信息管理的基本环节,从这一角度看,信息组织可以说是信息管理的基本环节,是信息资源开发利用的基础,同时也是信息管理学科研究是信息资源开发利用的基础,同时也是信息管理学科研究的核心内容。的核心内容。2 2、网络环境下的信息组织与分类编目、网络环境下的信息组织与分类编目(1 1)网络环境下信息组织的必要性)网络环境下信息组织的必要性随着互联网的普及和升级(随着互联网的普及和升级(Web1.0-Web2.0),数字),数字文本复制的便利和自由发表的可能性,使得信息数量急剧文本复制的便利和自由发表的可能性,使得信息数量

10、急剧增加。但社会信息量的增长并不意味着用户获取信息的增增加。但社会信息量的增长并不意味着用户获取信息的增长,恰恰相反,无序的信息不仅无助于信息的使用,反而长,恰恰相反,无序的信息不仅无助于信息的使用,反而会加剧信息增长与使用的矛盾。人们生动地称这种情况是会加剧信息增长与使用的矛盾。人们生动地称这种情况是“信息超载,知识缺乏信息超载,知识缺乏”。越来越多的人认识到,。越来越多的人认识到,“原始原始信息本身并不能产生价值信息本身并不能产生价值”,只有将其有效的组织,按特,只有将其有效的组织,按特定的需要集中和揭示,才能产生价值。要有效开发利用信定的需要集中和揭示,才能产生价值。要有效开发利用信息资

11、源,必须采用相应的方法加以控制和处理,信息组织息资源,必须采用相应的方法加以控制和处理,信息组织是关键措施之一。是关键措施之一。(1 1)网络环境下信息组织的必要性(续)网络环境下信息组织的必要性(续)(2 2)信息组织的概念与目的)信息组织的概念与目的n1)概念:信息组织亦称为信息资源组织,)概念:信息组织亦称为信息资源组织,它是根据信息检索的需要,以文本及各种类它是根据信息检索的需要,以文本及各种类型的信息源为对象,通过对其内容、特征等型的信息源为对象,通过对其内容、特征等的分析,选择,标引,处理(方法),使其的分析,选择,标引,处理(方法),使其成为有序化集合的活动。成为有序化集合的活动

12、。n2)目的:建立信息资源收藏系统和检索工)目的:建立信息资源收藏系统和检索工具,方便人们对信息资源的开发利用。具,方便人们对信息资源的开发利用。(3 3)信息载体(媒体)对信息组织的意义)信息载体(媒体)对信息组织的意义n信息交流的方式(媒体)有口头方式,印刷方式,数信息交流的方式(媒体)有口头方式,印刷方式,数字方式;以记录方式(硬载体依托,包括印刷型的纸字方式;以记录方式(硬载体依托,包括印刷型的纸张和数字型的硬盘、光盘)进行交流,有助于克服口张和数字型的硬盘、光盘)进行交流,有助于克服口语交流局限,便于进行信息的组织。语交流局限,便于进行信息的组织。 (4 4)信息源与文献的关系)信息

13、源与文献的关系n信息源或信息体通常信息源或信息体通常指一切记录形式存在指一切记录形式存在的信息载体,只是更的信息载体,只是更侧重于新型媒体形式侧重于新型媒体形式的强调。因此广义上,的强调。因此广义上,文献与信息源、信息文献与信息源、信息体是同义词或近义词。体是同义词或近义词。(5 5)信息组织的过程)信息组织的过程n信息组织过程包括标引和描述。控制语言及规则称为信息组织的信息组织过程包括标引和描述。控制语言及规则称为信息组织的规范。这些规范既包括对信息源外部描述的规范(如文献编目规规范。这些规范既包括对信息源外部描述的规范(如文献编目规则及各种元数据如则及各种元数据如MARC);也包括对内容描

14、述的检索语言(如);也包括对内容描述的检索语言(如各种文献分类表及其规则,各种规范的主题词表及其规则等)。各种文献分类表及其规则,各种规范的主题词表及其规则等)。 信息组织的各种形式信息组织的各种形式图书馆目录图书馆目录信息组织的各种形式信息组织的各种形式搜索引擎搜索引擎1)任务:)任务:对原始信息源的记录,如图书的记录、网页的快照进行对原始信息源的记录,如图书的记录、网页的快照进行排列。排列。直接组织原始信息本身,如对图书按一定方式排列,有题名直接组织原始信息本身,如对图书按一定方式排列,有题名排列法,分类排列法,固定排列法(如按时间顺序)等;排列法,分类排列法,固定排列法(如按时间顺序)等

15、;2)类型:)类型: 按检索工具的对象和特点划分类型按检索工具的对象和特点划分类型A文献目录;文献目录;B搜索引擎;搜索引擎; C索引数据库等。索引数据库等。 按检索工具的标识特征划分类型按检索工具的标识特征划分类型A外部特征的信息组织(如依据著者名,题名,机构名等);外部特征的信息组织(如依据著者名,题名,机构名等); B内部特征的信息组织(如依据分类号,主题词);内部特征的信息组织(如依据分类号,主题词);C引证关系的信息组织(依据引用关系,如引证关系的信息组织(依据引用关系,如SCI对期刊论文的相互引对期刊论文的相互引用关系进行信息组织)。用关系进行信息组织)。(6 6)信息组织的任务和

16、类型)信息组织的任务和类型对原始信息进行对原始信息进行描述:对外部特描述:对外部特征和内部特征的征和内部特征的记录;记录;提供检索点:如提供检索点:如外部特征的责任外部特征的责任者名,题名,机者名,题名,机构名等;如内部构名等;如内部特征的分类号,特征的分类号,主题词;主题词;对原始信息内容对原始信息内容的浓缩:包括编的浓缩:包括编写内容提要或文写内容提要或文摘。摘。(7 7)信息组织的处理方式)信息组织的处理方式(1)信息组织与分类编目之间是总体与部分,扩展)信息组织与分类编目之间是总体与部分,扩展与基础的关系;信息组织既包括以印刷文献为主与基础的关系;信息组织既包括以印刷文献为主体的文献编

17、目、分类标引和主题标引,也包括以体的文献编目、分类标引和主题标引,也包括以网络信息为主体的网站、搜索引擎、数据库和数网络信息为主体的网站、搜索引擎、数据库和数字图书馆等信息组织方法。字图书馆等信息组织方法。(2)网络环境下分类编目仍是信息组织的重要方法;)网络环境下分类编目仍是信息组织的重要方法;网络资源指南如雅虎就借鉴了文献分类法的原理,网络资源指南如雅虎就借鉴了文献分类法的原理,而国外图书馆联机公共检索目录而国外图书馆联机公共检索目录(OPAC=Online Public Access Catalog)已)已经用于网络信息资源的检索。传统的分类编目和经用于网络信息资源的检索。传统的分类编目

18、和网络信息组织正在相互渗透。网络信息组织正在相互渗透。3 3、信息组织与分类编目的关系、信息组织与分类编目的关系 所谓信息标引,亦称文献标引,是指主要分析信息的所谓信息标引,亦称文献标引,是指主要分析信息的内容属性,并用某种检索语言(如分类号内容属性,并用某种检索语言(如分类号G203代表代表信息资源及管理,信息资源及管理,G202代表信息处理技术;用规范代表信息处理技术;用规范的主题词,如激光器代替莱塞,用番茄代替西红柿)的主题词,如激光器代替莱塞,用番茄代替西红柿)表达分析出的属性或特征,从而赋予信息或文献检索表达分析出的属性或特征,从而赋予信息或文献检索标识的过程。这种方式的信息组织主要

19、采用两类基本标识的过程。这种方式的信息组织主要采用两类基本方法方法分类法和主题法。分类法和主题法。4 4、信息组织的基本任务、信息组织的基本任务(1 1)信息标引)信息标引标引过程一般包括两个环节:一是主题分析,在了解和确定信息标引过程一般包括两个环节:一是主题分析,在了解和确定信息的内容属性之后,将这些属性概括为主题并用自然语言表述,的内容属性之后,将这些属性概括为主题并用自然语言表述,同时分析主题概念之间或主题概念因素之间的结构关系;二是同时分析主题概念之间或主题概念因素之间的结构关系;二是转换标识,即用专门的检索语言中的标识或语词表达概括信息转换标识,即用专门的检索语言中的标识或语词表达

20、概括信息(文献)内容的主题概念或概念因素,构成一定形式的检索标(文献)内容的主题概念或概念因素,构成一定形式的检索标识。如对识。如对西红柿病虫害防治西红柿病虫害防治一书的主题标引为:一书的主题标引为: 番茄番茄病虫害病虫害防治方法防治方法首先进行主题分析,本书主要谈的是西红柿病虫害及其防治方法,首先进行主题分析,本书主要谈的是西红柿病虫害及其防治方法,如用如用汉语主题词表汉语主题词表进行主题标引,对内容分析后可直接从进行主题标引,对内容分析后可直接从西红柿第一字西红柿第一字“西西”的汉语拼音的汉语拼音xi去查西红柿,结果发现西红去查西红柿,结果发现西红柿不是正式主题词,因此只能用它的学名柿不是

21、正式主题词,因此只能用它的学名“番茄番茄”这个词去标这个词去标引,按其标引规则其标引结果如上。引,按其标引规则其标引结果如上。(2 2)信息标引过程)信息标引过程 如果用如果用中国图书馆分类法中国图书馆分类法来进行分类标引的话,来进行分类标引的话,则在主题分析之后,将其标引为则在主题分析之后,将其标引为S436.412(番茄(番茄病虫害及其防治)。分析过程如下:西红柿是一种病虫害及其防治)。分析过程如下:西红柿是一种农作物,因此在分类表中先找到农作物,因此在分类表中先找到S农业科学(一级类农业科学(一级类目),第二步考虑目),第二步考虑S农业科学下面有农业科学下面有S1农业基础科农业基础科学、

22、学、S2农业工程、农业工程、S3农学、农学、S4植物保护等二级类植物保护等二级类目,依其内容应归入目,依其内容应归入S4植物保护,然后在其下位类植物保护,然后在其下位类中发现中发现S436园艺作物病虫害及防治,进一步找到园艺作物病虫害及防治,进一步找到S436.412(番茄病虫害及其防治)。(番茄病虫害及其防治)。 (2 2)信息标引过程)信息标引过程 主题法则是通过主题名称来揭示信息或文献内容并加以组主题法则是通过主题名称来揭示信息或文献内容并加以组织的方法;分类法是通过学科知识的分类体系来揭示信息或文织的方法;分类法是通过学科知识的分类体系来揭示信息或文献内容并加以组织的方法。献内容并加以

23、组织的方法。 两者相同之处:两者都是为揭示信息(文献)内容,都需两者相同之处:两者都是为揭示信息(文献)内容,都需要对信息文献进行主题分析;一般都使用预先编制的专门语言要对信息文献进行主题分析;一般都使用预先编制的专门语言工具(主题词表或分类表);赋予的检索标识都是对信息文献工具(主题词表或分类表);赋予的检索标识都是对信息文献主题概念的表达。主题概念的表达。 两者之间的差异:两者之间的差异: 1)表达主题概念的标识形式及特点不同;表达主题概念的标识形式及特点不同; 2)标识揭示、组织信息,文献的角度不同;标识揭示、组织信息,文献的角度不同; 3)分类法和主题法的功能、作用是互相补充的。分类法

24、和主题法的功能、作用是互相补充的。(3 3)分类法和主题法的比较)分类法和主题法的比较 信息描述是对原始文献外部特征进行记录,从而提供信息描述是对原始文献外部特征进行记录,从而提供责任者、题名等检索途径。如下图:责任者、题名等检索途径。如下图:(4 4)信息描述)信息描述 信息描述以其记录的结果信息描述以其记录的结果元数据为中介,对原始信元数据为中介,对原始信息进行各种操作,信息描述(元数据)的作用是:息进行各种操作,信息描述(元数据)的作用是: 识别:确认并对要进行组织的信息进行个别描述,使识别:确认并对要进行组织的信息进行个别描述,使用户能识别被组织的信息对象;用户能识别被组织的信息对象;

25、 定位:提供信息资源位置的信息,以使用户访问并使定位:提供信息资源位置的信息,以使用户访问并使用;用; 检索:通过在描述数据中提供检索点,便于用户对资检索:通过在描述数据中提供检索点,便于用户对资源的检索和利用;源的检索和利用; 选择:通过记录信息资源的特征,供用户对信息资源选择:通过记录信息资源的特征,供用户对信息资源的使用价值进行判断,决定是否使用该资源。的使用价值进行判断,决定是否使用该资源。 (5 5)信息描述的作用)信息描述的作用 元数据是关于数据的数据,或关于数据的结构化数元数据是关于数据的数据,或关于数据的结构化数据。元数据的含义是逐步发展的,早期的元数据主据。元数据的含义是逐步发展的,早期的元数据主要指网络信息的描述数据,用于网络信息资源的组要指网络信息的描述数据,用于网络信息资源的组织(如用织(如用HTML描述网页的数据);其后,逐步扩大描述网页的数据);其后,逐步扩大到各种以电子形式存在的信息的描述数据(如到各种以电子形式存在的信息的描述数据(如MARC和和DC)。由于传统的书目数据与数字信息

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论