IT计算机 知识发现与信息检索_第1页
IT计算机 知识发现与信息检索_第2页
IT计算机 知识发现与信息检索_第3页
IT计算机 知识发现与信息检索_第4页
IT计算机 知识发现与信息检索_第5页
已阅读5页,还剩127页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

知识发现与信息检索

课程目标

面对日益增长的Internet的信

息和文献资源,如何通过一

种有效的方法,以最少的时

间与精力来获取自己所要的

信息,并综合成章。

这就是本课程所希望解决

的问题。

分三部分:

1.知识发现

2.信息检索基本概念

3.信息检索

第一部分:知识发现

4

工知识发现

知伊经济时代,知拥、知佣创新易知识

资源利用问题引起社叁的裔建英涯。

•知拥戚为筱济社会发展的首要资源,是

衡量国象能力的二要国素。知但作为一

种创造财富的战略资源,成者现代传息

技术和国家信息化迷程的迅速发展,。

及科技、文化的进步点住济农展竞争中

作用日景槽根,人们对获取知佣的犍力

却利用知山的水平得驯了空嗡的梃之。

5

工知识发现

伟大的科学家牛被就过:

“假心就我牝/1人看的

■假逐些,那是因,我

站点怪人的月哙上。”

6

■知识发现

塞修尔•的焦逊(SO^MCC说:和鹤

令凤麴类:

•一类是我们要掌握的学科知识;

•另一类是要知道在哪儿可以找到有关知

识的信息。

•Knowledgeisoftwokinds.We

knowasubjectourselves,orwe

knowwherewecanfind

informationuponit.

7

■知识发现

•知识资源利用创新必然成为知识资源的高度共享

乃至整个国家信息化发展战略的重要组成部分。

•美国和西方发达国家均视其知识为国家发展的重

要战略资源。

•我国将唉着国家知识与创新体系”、“强化信息资

源共享”作为基本国策,充分体现了这一战略资源

及其知识资源共享的重要战略意义。

•必须大力提高人们获取与利用知识的能力,在更

大程度上、更大规模上、更大范围内实现知识资

源的高度共享,充分满足人们在知识创新过程中

对知识的需求。

类型多样,但开发利用是有限的。

传统的文献资源共享主要是信息物

质载体的共享,即文献的共享。这

种共享由于受共享交易成本的限制,

只能是在一定时间、空间范围内有

限的共享。

9

■知识发现

现代神#机裁木、网络孩木的/

展,改变了人由获半、利用和或

漏和鹤的方式,打破了和泰信息

褚说的时变限制,使和鹤信息的

充濡、爽系形式美省金劭寺直观,

为和泰信息毓务梃偿了嘉新的信

叁林境,扑解了和鹤资源无限或

喜的新天池。

1知识发现

网珞信息技术加快了知积的传送,

都展了知徂颍域的广盛。网珞环境下

信息勿知积服务已系苒局限4一个囱

定建货实体形态,其服务边界系断犷

大界日景模糊化,知积梃供与传播彬

式呈现多向桃、共享桃、女至桃、实

时桃塔特点,社会知积需需的复盖根

日盍槽加,左询、利用知徂信息的多

段属于行算机化、网珞化。

11

■知识发现

知识的获得、组织与传播,通过

异地共享和返程传播越来越显示出无

比的优势。基于计算机网络的快速、

虚拟知识空间,可构建一个具有妨展

和辐射能力的开放化、立体化的知识

济源共享保障服务余统。在这种现代

技术网络环境之中,可最大限度地满

足人们对知识信息的无时空障碍的知

识需求,实现知识资源共享所应达到

的一种高级境界。______

1知识发现

为了使人们进入网络环境下

知短资源离度共享的境界,多年

来国内外专家、学者和企业在知

短春瀛共享方式的设计和服务技

求的实现上不断改革创新,陆续

推出了不少新的知袂产品和服务

技术与模式:

13

1知识发现

知识挖掘、个性化服务、知识可视化等。

“知识服务”理钿,成为当今知识咨

源共享模式设计的核心指导思想。在这

种共享模式之下,人们从知识济源中获

取的不仅仅是〜条条信息,而是一个个

针对特定问题的斛决方嗓,即知识。

这样的知识济源共享方式,已经成为现

代知识服务业所追求实现的高级境界。

14

1知识发现

基于〃知拥完”水平上的小次美寐的、

数据秸相标瘠化的、人与资源可实忖。,

媒体信息衮豆的知拥服务平台,无徐熬据

薜的物理假置何京,无俗熬据库专业桃质

和具体将构西何,都可使其森知但信息的

砌穿上跨越数据库界限而浑然我,一体。

人们点这个平台上可。用平台的各种小桃

化服务手段,从所1破据库中值意获取所

需要的知积信息,不可森人与人的袤流亘

劭述程中得到新的知拥。

I15

第二部分:信息检索基本概念

16

2信息检索基本概念

17

2信息检索基本概念

•2.1信息

•定义一一物质存在的一种方式,一般指

数据、消息中所包含的意义。可以使消

息中所描述的事件的不定性减少。

•(*注:中国《情报与文献工作词汇基本

术语》(GB48944-85)有关信息的定义。

2信息检索基本概念

・信息的概念十分广泛,围绕信息而

出现的信息资源、信息技术、信息

系统、信息产业、信息化社会和社

会信息化等相关术语不胜枚举。那

么,什么是信息,至今仍无确切、

统一的定义,站在不同的角度旧有

不同的理解或解释。

19

2信息检索基本概念

•信息既不是物质,也不是能

量,而是依附于自然界客观

事物而存在,只要有物质存

在,就有表征其属性的信息。

20

2信息检索基本概念

■信息的概念,实际上就是客观事

物运动状态、时空特征、能量大

小、质料系统特征、相互联系方

式等一切反映事物客观属性的总

称。从这种意义上看,信息比客

观事物的属性更具一般性与普遍

性。

21

2信息检索基本概念

信息概念的实质在于它以某种编码

形式储存或传输于某种介质之中,如储

存在书本、纸张上的文字信息,记录在

唱片、录音带上的声音信息,印制在画

报、照片、录象带上的图像(形)信息,

计算机系统种的信息系统各种数字、数

据信息等。

22

2信息检索基本概念

•例子:据说上古时期,诺亚的方舟在洪

水中飘荡许久,当放出的飞鸽衔回一束

橄榄,意味着带回了洪水已退的信息。

23

•从自然界角度看,表征物质的属性:地

球昼夜的变化是一种信息,它反映出地

球绕太阳自转的运动特性和状态;山的

高度是一种信息,它反映出山的空间特

性;树干的年轮是一种住处它反映了树

木成长的时间特性——树龄等等。

24

2信息检索基本概念

•1)按信息的加工程度划分

❿,零次信息资源—指尚未被记录下来,只是通过口头携

带和传播的信息资源。零次信息资源的出现和传递带有极

大的偶然性。其特点是鲜活、生命力旺盛。

❿•一次信息资源——指经加工或粗略加工的原始信息资源,

如正在研究或创造过程中产生的信息,包括会议记录、论

文报告、统计报表、专利等。其特点是比较零散,系统性

不强,半包括所有的主要内容。

❿•二次信息资源——指在一次信息资源基础上加工整理而

成的信息资源,如文摘、索引、目录等,它们是引导和使

用一次信息资源必不可少的工具。

❿,三次信息资源——通过二次信息资源提供的线索,对某

范围内的一次文献进行分析、研究加工而成的信息资源,

亦称三次文献,包括综述、述评、专题情报研究报告、百

科全书、年鉴、指南、手册、词典等。

2信息检索基本概念

•2)按信息表现形式划分

•文字信息

•图像信息

•数值数据信息

•语音信息

26

2信息检索基本概念

・信息交流渠道:

•正式渠道:信息是指由正式组织

发布并经由正式组织渠道向外传播,

如官方新闻发布会、正式报告、国

家统计部门发布统计信息等。

•非正式渠道:非正式渠道信息指

从正式渠道以外获取的信息。

27

2信息检索基本概念

•2・2知识

・是人类的主观世界对客观世界概括

和反映,是大量有组织的信息,是

关于事实和思想的有组织的陈述。

提供某种经过思考的判断和某种实

验的结果。

28

2信息检索基本概念

知识的来源:

・第一类是直接源于产生信息的客观事

物;

・第二类是通过信息载体或媒介(文献、

电视、广播、他人等)的传递、交流

而间接获得。

29

2信息检索基本概念

•据经合组织(OCED)出版的《以知识为基础的经济》报

告对知识的分类:

•1)“知事(Know-what)”,关于事实方面的知识,可理

解为Know-when>Know-where;即在什么样的时间

(Know-when)、什么样的地点或条件下(Know-where)

能解决什么样的问题;

•2)“知因(Know-why)”,自然原理和规律方面的科学理

论,知识生产是在专门研究机构如实验室和大学完成的;

•3)“知道怎样做的知识(Know-how)”,做某些事的技

艺和能力,称为技术情报和商业秘密,其典型是企业开发

和保存于其内部的技术诀窍或专有技术;

•4)“谁以及是怎样创造知识的(Know-who)”侧重创造

思想、方法、手段、过程以及特点等的了解。

30

2.3文献

•记录有知识的一切载体。

•权威的定义主要

•1)是《文献情报术语国际标准(草案)》(iso/

DIS5127):“为了把人类知识传播开来和继承下去,人

们用文字、图形、符号、声频、视频等手段将其记录下来,

或写在纸上,或晒在蓝图上,或摄制在感光片上,或录到

唱片上,或存贮在磁盘上。这种附着在各种载体上的记录

统称为文献。”

•2)国标:各种媒介和形式的信息集合,包括文字、声像

印刷品、电子信息、数据库等。

31

•i)按文献出版类型划分

•a图书

•b期刊

•c政府出版物

•d科技报告

•e专利文献

•f会议文献

•g学位论文

•h技术标准和规范

•i产品样本说明书

•j技术档案

32

2信息检索基本概念

•按文献的存储载体分:

・印刷型

•缩微型

­声像型

•电子型

33

2信息检索基本概念

文献的构成要素:

A、文献信息是文献的内容

B、符号系统是信息的携带者

C、载体是符号赖以依附的“寄主”

D、记录方式是将文献的符号进入载体的

方法和过程

।34

2信息检索基本概念

事信知

物产生人脑有序

息识

运化

文献

2信息检索基本概念

•知识是有组织的大量的信息,获得知识

有赖于获得信息;

■信息是知识得以形成和传播的中介,而

不是知识本身,知识是经过精心研究、

领会后的有用信息,是人类对信息加工

处理后的产物。

36

第三部分:信息检索

37

3信息检索

3.1概述

•3.1.1信息检索概念

•信息检索InformationRetrieval/

Access:是从任何信息集合中识别和获

取所需信息的过程及其所采取的一系列

方法和策略。从原理上看,它包括存储

与检索两方面。

•*

38

3信息检索

•文献检索原理是:将检索提问标识与存贮在检索工具中

的标引标识相比较,两者一致或信息标识包含着检索提

问标识,则含有该标识的信息就从检索工具中输出;

•对信息的著录是按一定规则对信息的外表特征和内容特

征加以简单明确的表述,信息的标引是对其内容按一定

的分类表或主题词表给出分类号或主题词;

・检索过程则是按同样的主题词表或分类表及组配原则分

析课题,形成检索提问标识,根据检索工具所提供的检

索途径,从信息集合中查找与检索提问标识相符的信息

特征标识的过程。(如下图)

39

信信息

息的选

源择与检索工具

收集标数据库检

识□结

信匹配

用息

户需检索

求是问式

What?

Where?

How?

41

3<M61

・检索是信息组织的反变换过程。信息组

织的目的是将零散的信息组成一个有序

的体系,检索的目的则是迅速从这个体

系中搜寻所需的信息。

42

3信息检索

•信息检索分类

•1).按存储和检索的内容划分为:

•文献信息检索

•数据信息检索

•事实数据检索Referencebook

Database:

NumericDatabase(数字)

PropertyDatabase(特性)

Textual-numericDatabase(文本数字)

Full-textDatabase(全文)

TerminologicalDatabase(专业)

GraphicDatabase(图形)...

**

43

3信息检索

•对应于信息检索方法的操作主体,检索

方法可分为:

・手工检索;

•机器检索。

44

3信息检索

•信息检索特征:

•1)有确定的目标;

•2)有一个可能的信息解的集合;

•3)有一定的线索(即启发信息);

•4)搜索过程是针对一定的目标、遵循一

定的线索,不断缩小搜索范围的求解过

程。

3信息检索

•从信息资源管理的角度讲,信息检索是

从已存储的信息资源中检索出与用户提

问相关的文献、知识、事实、数据的逻

辑运算和技术操作过程的总和,以文献检

索为本源。

46

•也就是说,这是一种从大量集合的文献中

查找出主题及其属性符合用户要求的情报

过程。查找的对象不一定就是文献,有时

也可能是正在研究中的项目,或正在进行

某项工作的人员与机构,或图书馆的藏书

目录等,但基本原理是一致的。

47

3信息检索

•信息检索能力(信息技能):

•——寻求有关新知识的能力

•具体表现为以下6种技能:

48

3信息检索

•1)明确任务(TaskDefinition):了解问

题的症结,确定所需信息和目的,分清

任务的轻重缓急;

•2)信息查询策略(InformationSeeking

Strategies):了解各种信息源,能够作

出评价并确定优先查找的次序;

3信息检索

•3)查找和检索(LocationandAccess):

确定信息藏址,从信息源中找出信息;

•4)信息利用(UseofInformation):能

够读懂(或听懂、理解)查出的信息,

了解信息在满足需求中的特定价值;

50

3信息检索

•5)信息综合(Synthesis):能够组织信

息,提供信息产品(论文、报告等);

•6)信息评价(Evaluation):评价查找结

果和解决问题的过程(效率)。

3信息检索

・检索者一方面要弄清文献的组织编排方式,

要具有“解构”能力;另一方面要善于分

析提问,善于将信息需求转化为可检索的

概念术语。这是一个双向分析和匹配的过

程,是一个以满足用户信息需求为目标,

以用户提问为线索,不断缩小检索范围并

查找用户所需信息的过程。

52

3信息检索

•信息检索方法:

•检索方法的运用离不开各种检索工具

(如目录、索引、文摘等),检索技术

的利用则离不开相关硬件和软件。它们

共同构成了联结信息资源体系和用户信

息需求的纽带与桥梁。

53

3信息检索

•对应于信息组织方法,信息检索方法可

分为:

•字顺(如题名、著者等)检索方法;

•类号检索方法;

•主题检索方法;

54

3信息检索

检索点:

主题subject

分类classification

著者author

名称title

号码code,coden

55

3信息检索

•主题途径:

•是根据文献所论述的主题,利用主题语

言编制的主题索引而进行的信息检索。

主题索引大多按字母排列方式,因此,

检索也要用相应的方式。

56

3信息检索

•分类途径(classification):

•是根据文献所论述的主题内容,利用分

类语言的学科专业体系进行的检索。大

多数检索工具都采用分类语言作为正文

编排体系的依据,分类目次通常不采用

字顺排列类目和检索类目,而是按照学

科专业角度的层层逻辑划分建立分类类

目体系。检索时要选择合适的分类类目。

3信息检索

­著者途径:

•作者(Author)/团体著者(CorporateAuthor/Authors9

Affiliation)

•检索中,著者是一个广义的概念,是对文献内容负有责任

的作者、编者、译者等,可以是个人、团体、机构、组织,

甚至还包括著者的单位。通过著者途径进行检索,主要可

利用著者索引。所有著者索引都采用字顺排列方式,如果

著者是个人,就以个人姓名字顺排列,如果著者是机构,

就以机构名称字顺排列。因此,检索也应该按相应的途径。

3信息检索

•题名途径(Title):

•检索中,文献题名是一个广泛的概念,

包括文献篇名、图书书名、期刊刊名。

常见的题名索引主要有篇名索引、书名

索引、刊名索引等。题名索引通常按字

顺排检方式,因此,检索也应该采取相

应的途径。

3信息检索

•序号途径:

•许多文献除普通外表特征外,还具有序号特征,

如,专利文献有专利号、标准文献有标准号、馆

臧文献有索书号。

•序号索引一般按照文献序号的大小顺序排列,如

文献序号纯粹由数字组成,就按数字大小生序排

歹U,如果序号包含数字和字母,就按数字大小和

字母顺序升序排列。如果前面是字母后面是数字

混合组成的序号,就先按字母顺序排列,字母相

同,再按后面的数字大小排列。因此,序号检索

也应按照同样方法。

3信息检索

•直检法:专业核心期刊跟踪

•常规法:顺查法,倒查法,抽查法

•追溯法:参考文献,引用目录

•综合法:分段法,循环法,交替法

61

3信息检索

♦常用法

-顺查法:

•从远及近查,用于了解某一事物发展的全过程,

-倒查法:

•由近及远查,重点为近期

-抽查法:

•查找某一段时间的文献

62

3信息检索

检索词/语言:SearchingLanguage&Thesaurus

描述检索系统中信息特征与表达用户信息提问的一种专门

语言,是为沟通文献信息用户和文献信息之间的语言,理

论上讲,是用于文献标引和检索提问的约定语言。

非规范词(非受控词自由词)uncontrolled,free-

term/自然语言naturalLanguage

行规范词(受控词)controlled/人工语言

ArtificialLanguage

主题词表

3信息检索

•按照表达文献主题概念的语词形式,有

分类语言和主题语言。

描述文献信息内容特征的语言:

标题词语言SubjectHeading

单兀词语BUniterm

叙词语言Descriptor

关键词语言Keyword

分类语言

64

3信息检索

•例如规定:aircraft表示“飞机”而不用

airplane;plane;aeroplane0

•作到文献存储和检索的一致性。这些规

范化词的集合构成了词表。

3信息检索

检索效果

铲查全率R(Recallratio)

夕R二检出的相关文献量/检索系统中相关文献总量

*100%

铲查准率P(Precisionratio)

bP二检出的相关文献量/检出的文献总量*100%

66

3信息检索

检索方式

(1)命令检索(commandsearch)

算符(operator)

检索式(statementformula)

(2)菜单检索(menusearch)

提示选项填空

67

3信息检索

检索技术

⑴常用算符

-逻辑算符

(booleanoperator)

68

3信息检索

•常用的布尔逻辑算符有三种:

•分别是逻辑或OR,+

•逻辑与AND,*,+

•逻辑非NOT,・。

69

3信息检索

•(1)逻辑或“OR”

■逻辑或(AORB)检索出凡含有检索词A

或者含有检索词B或者同时含有检索词A

和B的信息资源。

•逻辑或“OR”可以扩大信息的检索范围,

使用它相当于增加检索词主题的同义词

与近义词,能提高检索的查全率。

•*E概念大小、关系

3信息检索

•(2)逻辑与“AND”

•逻辑与(AANDB)检索出同时含有检索

词A和检索词B的信息。

・如果A和B无关,则没有命中文献,Q=0;

•如果A和B有一定相关性,则有M>Q〉O,

或N〉Q〉O;

•这表明,逻辑与“AND”可以缩小信息的

检索范围,提高检索的查准率。

**t

71

3信息检索

,(3)逻辑非“NOT”

■逻辑非(ANOTB)检索出含有检索词A而不含有检索

词B的信息资源。

■如果A与B无关,则Q二M;

■如果A与B有一定相关性,则QVM;

■如果A与B密切相关,则当M〉N时,Q=M-N,当M<N时,

Q—0;

•因此,逻辑非“NOT”可以用来排除不希望出现的检索

词,它与逻辑与“AND”的作用类似,能够缩小命中信

息的范围,提高检索的查准率。

•*W

72

3.信息检索

信息检索过程和检索策略

•无论是作为一种方法还是一种技术,信息检索

都表现为一种过程,该过程始于用户的信息提

问而终于检索结果的输出。

・检索策略是针对一定的检索目标,围绕信息检

索过程而制订的具体实施计划或实施方案,其

实质是对检索过程的科学规划,与检索方法和

检索技术相比较,检索策略更为具体,更为实

用,更富于可操作性。

73

i开西i

ji"问」

T弄清(明问题的实质而

■提问的•析综合处理「

用情报检索语言表达提问,编制提问检索式和检索提问式

I切题文献,信息的检索—J

I形成[索结果―I

I显示」索结果I

——结果与噎问的相关前

I<Si»

I1^

74

维药老鼠瓜抗风湿性关节炎有效部位的新

药研究

ThestudyconcerningwithCapparis

spinosaL.asanewmedicine

75

检索词

#1老鼠瓜或槌果藤或野西瓜

CapparisspinosaL.

#2类风湿性关节炎

RheumatoidarthritisorRA

检索式

#1*#2

76

聚合物光漂白及其在光

波导器件制备技术中的

研究

Studyonphotobleaching

applicationinfabricating

ofopticalwaveguides

77

检索策略:

检索词:

#1光漂白photobleaching;

#2聚合物polymer(PMMA/DRl、Poly-3BCMU和

polydiacetylene);

#3波导光栅waveguidegrating;

#4>非线性光学thethirdordernonlinearities;

#5单光束扫描法z-scan;

#6、双光束扫描法twobeamscantechnique

#7非线性定向耦合器nonlineardirectionalcoupler;

#8光栅耦合器chirpedgratingcoupler;

检索式:

#1*(#2+#3+#4+#5+#6+#7+#8)

78

精氨酸基因工程菌中试发酵工艺研究

检索词:

L精氨酸arginine

2.基因工程菌gene-engineeringstrain

3.黄色短杆菌brevibacteriumflavum

4.大肠杆菌escherichiacoli

5.合成componentorsynthesisorsynthetiae

6.发酵fermentation

检索式:1*(2+3+4+5+6)

79

3信息检索

计算机检索的特点

•信息量大

•信息及时

•检索功能强

•检索效率高

80

3信息检索

•数据库检索

V•网络资源检索

I82

3信息检索

3.2数据库检索

3.2.1数据库的基本概念

数据库的定义:

至少由一种文档组成,能满足特定目

的的或特定数据处理系统需要的数据

集合.

83

3信息检索

3.2.2.数据库的类型

(1)参考数据库

产书目数据(bibliographicdatabase)

・目录数据库(catalogdatabase)

I•文摘索引数据库(abstract/index

Idatabase)

卜指南数据库(directorydatabase)

3信息检索

(2)源数据库(sourcedatabase,databank)

•数值数据库(numericdatabase)

•文本■数值数据库(text-mimericdatabase)

•全文数据库(full-textdatabase)

85

3信息检索

•字段(field)

•记录(record)

•文档(file)

•数据库(database)

86

1.字段(数据项)

•是组成数据库的最小基本单位。

•它的作用是描述一个数据处理对象的某些

属性。

•如书目型的数据库,字段可为文献的篇名,

作者,作者单位,刊名等。

87

2.记录

•与某一数据处理对象有关的一切数据项构

成了该对象的一条记录。

•如书目型数据库,一条记录反映了一篇文

献的相关信息

例2书目型数据库中的记录

AutomaticdetectionoflungcancersinchestCTimages

bythevariableN-quoitfilterMiwa,7bmoko;Kako,Jun-IchT,

Yamamoto,Shinj/Matsumoto,Mitsuomi;Tateno,Yukio;Iinuma,

Takeshr,Matsumoto,7dwAuthorAffiliation:Knowledge-

BasedInfo.Eng.Dept.,ToyohashiUniversityofTechnology

Source:SystemsandComputersinJapanv33n1January

2002p53-63.InEnglish

Abstract

89

选库的4c原则:

内容Content

范围Coverage

时效Currency

费用Cost

90

中文数据库的类型

□1)按提供信息加工的层次分

口参考数据库

■包括书目数据库、指南数据库。

口源数据库

■包括全文数据库、数值数据库、多媒体数据库。

•2)按是否需要在线使用分:

口光盘数据库:单机使用光盘、光盘镜像。

口网络联机数据库

91

《万方数据资源系统》

•数据库介绍

92

工)概况

口是由中国科技信息研究所、万方数据集团公

司开发的网上数据库联机检索系统。

2)收录特色

□是一个以科技信息为主,集经济、金融、社

会、文化、教育、卫生等各行业信息于一体

的信息服务系统。它包括110余个数据库,

归属5个子系统,内容涉及自然科学和社会

科学各个专业领域,收录范围包括期刊、会

议、文献、题录、报告、论文、标准专利、

连续出版物、最新科技成果,称得上是一

个拥有海量信息的中文信息检索系统。

93

•3.3网络资源检索基础

94

因特网基础

95

■进入90年代后,随着网络技术的发展,尤其是互联网的迅

猛发展,使计算机检索进入一个崭新的时期。

■检索方法更简单,检索结果更全面;

■经过40多年的发展,从早期的书目信息到后来的全文本信

息,到今天的网络与多媒体信息,网络信息资源已成为现代

社会不可缺少的资源财富;

■其处理技术从简单的字段与关键词检索到全文检索,再到

今天成为网络主流的超文本与多媒体处理。处理技术的演

进与发展,一方面使网络信息资源的内容从单一的书目到图

文并茂的多媒体,更富有吸引力和使用价值;

■另一方面,超文本的广泛利用改变传统的信息组织的线性

方法,使电子资源的组织更接近于“自然”,大大方便了用

户的使用,使电资源的利用变得非常容易,用户不需要太多

的检索知识与技术。

96

按提供的内容网络信息资源可分为:

1.参考型数据库:指引用户到另一信息源以获得原文或其他

细节的一类数据库。包括各种书目数据库和引文数据库。

这种数据库具有参考和评价的功能,多用于查新、开题。

如:SCI、EI、维普的中文期刊数据库……

2,全文数据库:指存储文献全文或其中主要部分的数据库。

如新闻消息全文库、法律法规全文库、人大报刊资料库、

博硕论文全文库等。

3.事实型数据库:直接提供事实或数值的数据库。如:万方

的企业产品数据库、彼得森大学指南等。

4.电子图书:计算机利用计算机检索并下载阅读的图书。如:

韦生芝彖、超星数字图书馆、各种数字图书馆等。

・电子期刊:宜.接在网上就可以检索和阅读的期刊。如:万

方数字化期刊,中国期刊网全文数据库,science

online等

・电子报纸:如:人民日报的网络版。

,其它类型:如软件,新闻等

!97

网络信息资源的特点

•以网络为传播媒体

•以多媒体为内容特征

•以现代信息技术为记录手段

•数据结构县通用性、开放性和标准化

•高度的整合性,便于多产媒体一体化

•交互性能增强I—动态性—、缺—乏管理

结构复杂,分布广泛

98

常用网络类型代码:

com商业机构

mil军事部门

edu教育机构

net网管组织

gov政府部门

org非营利组织

int国际组织

99

WWW检索工具的含义及类型

■广义一种基于环球网(WWW)

的信息查询系统。应括信息存储、

信息管理和信息检索。

•狭义一种为搜索环球网(WWW)上

的网页而设计的座索软件。

100

按检索功能分:

•主题指南/目录(SubjectGuidesor

Directory)按某种分类规则建成树状等级

目录.

I字顺法、时序法、地序法。

由人工干预,保证了查准率,但查全率较低。

如Yahoo

•检索引擎(SearchEngines)

通过Robot、Spider等自动跟踪标引软件搜寻

网络资源。它不需要人工干涉,查全率较高,

但查卷率较低。

如AltaVista

按检索内容分:

•通用检索工具

是综合性的信息检索系统,它往往基于检索词去匹

配相关的内容。讨常也会因检出内容太泛而无法

一一过目O

如Yahoo、Go、AltaVista等。

I•专业检索工具

是专业信息机构根据专业需求,号Internet上资源

进行筛选整理、重新组织而形成专业信息检秦系

统,专业针对性较强。

如MedicalWorldSearch、MedicalMatrix等。

102

Web通用检索工具的使用

103

http://www.yahoo,com

・1994.4由美籍华人杨致远等创建。

•120万个网址;14个主题逐级细分。

•有150个编辑人员维护。

•鼓励用户利用联机表格递交自己的网址。

•目录一提供多项服务(购物、免费邮件、

拍卖、聊天和新闻等)的门户

104

简单检索

•分类目录点击检索

检出结果:网址

-例:查找数字化图书馆

105

^^Yahool-NetscapeHSE3

FileEditViewGoCommunicatorHelp

iA而&留'llN

Back立版小dReloadHomeSearchNetscapePrintSecurityStop

*"Bookmarkslocationhttp:///"71枚"WhafsRelated

Whmt'sNewCheckEmailPersonalizeHelp

Yahoo!MailKnowwhenfriendsareonline!Yahooligans!

freeemailforlifeClicktodownloadY\hoo!Messongerwebguideforkids

Searchadvancedsearch

Yahoo!Auctions-bidnow?BlairWitch,videoaames,Pokemon,U2,JenniferLopez.,.

ShopFing-Anctjons-YellowPages-PeopleSearch-Maps-Travel-Classifieds-Personals-Games-Chat

Email-Calendar-Messenger-MyYahoo!-TodaysNews-Sports-Weather-TV-StockQuotes-more…

Arts&HumanitiesNews&MediaIntheNews

Literature.Photography...FullCoverage.Newspapers.TV....Turkeyquaketollnears

3.900

Business&EconomyRecreation&Sports.Bushsayshewon'tanswei

Companies,Finance.Jobs...Sports.TraveLAutos.Outdoors...drugquestions

.GuiltypleainColumbine

Computers&InternetReferencegunsalecase

IntemekWWW.Software.Games...Libraries.DictionariesQuotations...more…

Marketplace

EducationRegional・T5Psellingvideos

CollegeandUniversity.K-12...Countiies,Regions、USStates..

-Yl[nsuranceCent"-auto,

EZCA八COC;—SA八life,homeowners,etc

Document::Done

:君开始|[^MicrosoftPowerPoin.

Word一通.16:48

I^^Yahoo!Reference:Libraries-NetscapeB0E3

FileEditViewGoCommunicatorKelp

PersonalizeHelp-CheckEmail

Home>Reference>

Libraries

enanE*TRADE-ount&

、6monlhsof、AHoO!0nlineREE!」

Search||allofYahool3J

•YellowPagesInsideYahoo!

YCalendar

•AcademicLihrarier(428)•MasonicLibraries@

•Archives@.•■lilitaryLibraries。!Y!PeopleSearch

•ArtsLibraries@•MusicLibraries@

•BusinessLibraries@•NationalLibraries(28)Y!YellowPages

•CommercialLibraryServices@•NativeAmericanLibraries@

•Conferences倒•Organizations(56)

•Countries(27)•PerformingArtsLibraries@

•DigitalLibraries(70)NEWI•PhilatelicLibraries@

•EducationLibraries@•PhysicsLibraries位:!■

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论