信息检索第一章绪论_第1页
信息检索第一章绪论_第2页
信息检索第一章绪论_第3页
信息检索第一章绪论_第4页
信息检索第一章绪论_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 信息检索信息检索吾尝终日而思矣,不如须臾之所学也;吾尝终日而思矣,不如须臾之所学也;吾尝跂而望矣,不如登高之博见也;吾尝跂而望矣,不如登高之博见也;登高而招,臂非加长也,而见者远;登高而招,臂非加长也,而见者远;顺风而呼,声非加疾也,而闻者彰;顺风而呼,声非加疾也,而闻者彰;假舆马者假舆马者, ,非利足也非利足也, ,而致千里;而致千里;假舟楫者假舟楫者, ,非能水也非能水也, ,而绝江河;而绝江河;君子生非异也君子生非异也, ,善假于物也。善假于物也。 -荀子荀子劝学篇劝学篇一、信息检索是一门什么样的课程?一、信息检索是一门什么样的课程?二、为什么要学习这门课程?二、为什么要学习这门课程?

2、三、学习什么内容?三、学习什么内容?四、学习这门课程有什么实际意义?四、学习这门课程有什么实际意义?五、课程学习要求?五、课程学习要求?六、怎样学习这门课程?六、怎样学习这门课程? 信息检索是一门关于信息资源的存储、整理和查找理论及方法的学信息检索是一门关于信息资源的存储、整理和查找理论及方法的学科,它包括信息资源、检索理论、检索语言、检索工具及使用方法等。它科,它包括信息资源、检索理论、检索语言、检索工具及使用方法等。它是一门工具性的学科。是一门工具性的学科。授人以鱼不如授人以渔 Give me a fish, Ill eat for a day; teach me to fish and

3、Ill eat for a life time. 一、信息检索是一门什么样的课程?一、信息检索是一门什么样的课程?二、为什么要学习信息检索?二、为什么要学习信息检索? 为了培养大学生的综合能力和综合素质而开设的。为了培养大学生的综合能力和综合素质而开设的。它以培养大学生的自学能力和独立研究能力主要目的,为它以培养大学生的自学能力和独立研究能力主要目的,为今后顺利地进行毕业设计或毕业论文写作打好基础,为毕今后顺利地进行毕业设计或毕业论文写作打好基础,为毕业后更新知识适应社会需求、从事科学研究以及技术开发业后更新知识适应社会需求、从事科学研究以及技术开发打好基础。打好基础。面对日益增长的信息资源,

4、如何通过一种有效的方法,面对日益增长的信息资源,如何通过一种有效的方法,以以最少的时间与精力来获取自己所要的信息最少的时间与精力来获取自己所要的信息这就是信息检索所要解决的问题。这就是信息检索所要解决的问题。信息检索需要解决的问题信息检索需要解决的问题三、学习什么内容?三、学习什么内容?-课程内容(课程内容(1 1) 第一章:绪论第一章:绪论 主要内容:本章主要对信息检索及其相关概念进行了简要介绍,目的是使读者对信息、信息主要内容:本章主要对信息检索及其相关概念进行了简要介绍,目的是使读者对信息、信息资源、信息需求、信息检索等内容有初步了解。资源、信息需求、信息检索等内容有初步了解。 第二章:

5、信息检索基础理论第二章:信息检索基础理论 主要内容:有了对信息检索的初步了解,本章详细讲述了信息检索的基础理论。主要内容:有了对信息检索的初步了解,本章详细讲述了信息检索的基础理论。 第三章:信息检索基本方法第三章:信息检索基本方法 主要内容:介绍信息检索语言的定义、类型及各类型检索语言的原理、特点;检索技术及主要内容:介绍信息检索语言的定义、类型及各类型检索语言的原理、特点;检索技术及其发展;检索策略等。其发展;检索策略等。 第四章:文献信息检索第四章:文献信息检索 主要内容:网络环境下各类文献及其检索工具的发展特点;主要内容:网络环境下各类文献及其检索工具的发展特点; 图书、期刊的检索途径

6、、检索图书、期刊的检索途径、检索方法及有关的国内外主要检索工具、检索系统;电子图书、电子期刊的查找、获取;世界著名文方法及有关的国内外主要检索工具、检索系统;电子图书、电子期刊的查找、获取;世界著名文献检索工具献检索工具EIEI、CACA、BABA、SASA、SCISCI的收录范围、编排体系结构和检索方法;网络环境下各类型特的收录范围、编排体系结构和检索方法;网络环境下各类型特种文献(政府出版物、科技报告、会议文献、学位论文、专利、标准)和重要学术信息的检索途种文献(政府出版物、科技报告、会议文献、学位论文、专利、标准)和重要学术信息的检索途径和方法;各种文献信息保障机构的服务。径和方法;各种

7、文献信息保障机构的服务。课程内容(课程内容(2 2) 第五章:数据与事实信息检索第五章:数据与事实信息检索 主要内容:数据与事实参考信息检索工具的功能、主要类型与评价标准;掌握百科全书、主要内容:数据与事实参考信息检索工具的功能、主要类型与评价标准;掌握百科全书、传记资料、地理资料、年鉴、机构名录、词典、统计资料等各类型参考工具中,有代表性的常传记资料、地理资料、年鉴、机构名录、词典、统计资料等各类型参考工具中,有代表性的常用工具的收录特点和查找、使用方法用工具的收录特点和查找、使用方法 。第六章:计算机信息检索第六章:计算机信息检索 主要内容:计算机检索系统的主要类型与选择方法,数据库的类型

8、与结构;联机检索系主要内容:计算机检索系统的主要类型与选择方法,数据库的类型与结构;联机检索系统与光盘检索系统服务与特点,主要联机检索系统和光盘数据库的查找、使用方法。统与光盘检索系统服务与特点,主要联机检索系统和光盘数据库的查找、使用方法。第七章:因特网信息检索第七章:因特网信息检索 主要内容:系统介绍了因特网信息资源和因特网信息检索的基础知识,以及网络信息检主要内容:系统介绍了因特网信息资源和因特网信息检索的基础知识,以及网络信息检索工具的利用方法。索工具的利用方法。 第八章:信息服务及其利用第八章:信息服务及其利用 主要内容:本章主要从信息提供与利用服务的角度介绍文献信息服务业以及信息素

9、质教主要内容:本章主要从信息提供与利用服务的角度介绍文献信息服务业以及信息素质教育的发展概况。育的发展概况。四、学习这门课程的现实意义?四、学习这门课程的现实意义?1.1.信息检索是信息检索是(自学能力、研究能力、思维能力等)的基本(自学能力、研究能力、思维能力等)的基本技能和方法之一。技能和方法之一。2.2.信息检索能使信息检索能使达到事半功倍的效果。达到事半功倍的效果。(1)提高信息查询的效率,缩短获取信息的时间)提高信息查询的效率,缩短获取信息的时间(2)避免重复研究,少走弯路)避免重复研究,少走弯路(3)及时把握科技发展的动态和趋势)及时把握科技发展的动态和趋势 大学生在校求学期间所获

10、得的不应该仅仅是大学生在校求学期间所获得的不应该仅仅是“黄金黄金”,更重,更重要的是应获得要的是应获得“点金术点金术”,其中之一就是信息检索的能力。通过,其中之一就是信息检索的能力。通过检索和利用各种信息,不仅可以深化所学的知识;而且可以开阔检索和利用各种信息,不仅可以深化所学的知识;而且可以开阔视野,拓宽知识面;也为自学前人的知识、不断更新知识以及从视野,拓宽知识面;也为自学前人的知识、不断更新知识以及从事科学研究和发明创造奠定基础。事科学研究和发明创造奠定基础。 据统计,据统计,“普通高等学校本科专业目录和专业介绍普通高等学校本科专业目录和专业介绍”目录中,目录中,共有专业设置共有专业设置

11、249种,其中有种,其中有218种专业培养要求明确规定种专业培养要求明确规定“掌握掌握资料查询、文献检索及运用现代信息技术获取相关信息的基本方资料查询、文献检索及运用现代信息技术获取相关信息的基本方法法”。 对对大学生大学生来说来说 实验研究30%查阅文献40%计划思考15%书写报告15% 对对科研工作者科研工作者来说来说 例例1 1:上海某研究所用了约十年时间研制成功:上海某研究所用了约十年时间研制成功“以镁代银以镁代银”新工艺,在进行技术鉴定时,查找科技情报资料,发现美国新工艺,在进行技术鉴定时,查找科技情报资料,发现美国早在早在1929年就已研究成功并申请了专利,而该专利的说明书年就已研

12、究成功并申请了专利,而该专利的说明书就收藏在当地的科技信息所。就收藏在当地的科技信息所。例例2 2:美国某轧钢厂一位化学家花了:美国某轧钢厂一位化学家花了1万美元完成了一系列实万美元完成了一系列实验,并解决了一个问题。当他不无得意地向一位图书馆员朋验,并解决了一个问题。当他不无得意地向一位图书馆员朋友谈起此事时,朋友告诉他,有一份德国人的报告,就是做友谈起此事时,朋友告诉他,有一份德国人的报告,就是做的这同样实验,结论也相同,全部资料只需要花费的这同样实验,结论也相同,全部资料只需要花费5美元。美元。 避免避免重复研究重复研究,少走弯路少走弯路 提高提高信息查询信息查询的效率的效率 全世界每年

13、出版的图书有全世界每年出版的图书有80万种以上,科技期万种以上,科技期刊刊8万种以上,发表期刊论文大于万种以上,发表期刊论文大于600万篇以上;公万篇以上;公开的专利说明书开的专利说明书100多万件;国际会议文献多万件;国际会议文献1万多件;万多件;美、英、德、日等国产生的科技报告达美、英、德、日等国产生的科技报告达20万件左右。万件左右。科技文献浩如烟海,具备一定的信息检索能力才能科技文献浩如烟海,具备一定的信息检索能力才能快速、有效地查找出有用的科技信息。快速、有效地查找出有用的科技信息。我们被信息的海洋包围着我们被信息的海洋包围着, , 但是确被知识饿死了但是确被知识饿死了! !如何从信

14、息的如何从信息的海洋中获取我海洋中获取我需要的知识需要的知识? ? 面对浩瀚的面对浩瀚的网络资源网络资源 五、课程学习要求五、课程学习要求通过本课程的学习,达到下面基本要求:通过本课程的学习,达到下面基本要求:1理解信息检索的基本概念2掌握信息检索基础理论和信息检索基本方法3掌握几种类型的检索:文献信息检索、数据与事实信息检索、计算机信息检索以及因特网信息检索。 六、怎样才能学好这门课?六、怎样才能学好这门课?认真阅读教材,掌握一定的信息理论知识勇于实践,亲自操作,积累检索技巧遵守相关信息法律法规,自觉做一个有素质、有道德的信息用户生活中多观察,多体验,提高自己的信息意识授课与考核方式授课与考

15、核方式学习方法:学习方法:11 多媒体教室授课多媒体教室授课22 网络自学和自测(上机)网络自学和自测(上机)成绩考核方式:成绩考核方式:考勤、作业、考试相结合。考勤、作业、考试相结合。所占比例:所占比例:待定待定四、我们怎样才能学好这门课?四、我们怎样才能学好这门课?只看到两匹马有毛病 只看到三匹马有点儿毛病只看到四匹马多少有点儿毛病 只看到五匹马也许有点儿毛病不合格只看到六匹马勉强凑合活着吧 - -只看到七匹马勉强凑合活着吧只看到八匹马基本上算正常 合格 只看到九匹马正常 只看到十匹马比较优秀 良好只看到十一匹马独俱慧眼 只看到十二匹马眼睛里不揉沙子 只看到十三匹马出类拔萃 优秀只看到十四

16、匹马可以去中情局当差 只看到十五匹马诸葛亮转世 看到十八匹马上帝来了 看到看到1515只:只:枣花马2匹;第二只上方有一人骑马;天上红云中隐藏一匹;帐篷画一匹;帐篷上方隐藏一匹;闪电是一匹;远方闪电是一个马头;树干下方有一只马头;中间树枝构成一个马头;上方细树枝构成一个马头;杂草中隐藏一个马头;月亮里面隐藏半只;大石头是一个马头;二匹马身画一只马头 。一、信息一、信息二、知识二、知识三、情报三、情报四、文献四、文献五、信息、知识、情报、文献之间的相互关系五、信息、知识、情报、文献之间的相互关系 补充知识一、信息一、信息1 1、信息的概念、信息的概念 信息是人们对外部世界的感知、认识过程之中的一

17、切信息是人们对外部世界的感知、认识过程之中的一切数据、事实和消息数据、事实和消息 。 自然界与人类社会存在的事实与变化及人类对它们自然界与人类社会存在的事实与变化及人类对它们形成的认识和创造是信息的内容组成;载体记录和媒体形成的认识和创造是信息的内容组成;载体记录和媒体传播是信息的存在形式。传播是信息的存在形式。一、信息一、信息2 2、信息的属性、信息的属性(1)识别性 信息是可以识别的,可通过感官或各种测试手段来识别。 (2)存储性 信息是可以通过各种方法存储的。 (3)扩充性 信息随着时间的变化,将不断扩充。(4)加工性 人们对信息进行加工、整理、概括、归纳就可使之精练。(5)传递性 信息

18、可以从一个地方传递到另外一个地方。信息的本质特征。 (6)转换性 信息是可以由一种形态转换成另一种形态。 (7)时效性 信息只在特定的范围内有效。这是信息区别于物质和能量的特性。(8)共享性 信息可在不同的人之间实现共享。 一、信息一、信息3 3、信息的分类、信息的分类自然信息自然信息:由自然界物质运动发出,通过声波、电磁波和物质的作用表现出来。社会信息社会信息:由人类社会活动发出,通过人的语言、文字、图像、符号、手势以及记录有上述内容的各种载体等形式表现出来。信息信息二、知识二、知识1 1、知识的概念、知识的概念 知识是人类社会实践经验和智慧的总结,是人的主观世界对于客观世界知识是人类社会实

19、践经验和智慧的总结,是人的主观世界对于客观世界的概括和如实反映。的概括和如实反映。知识与信息的关系:知识与信息的关系:信息知识一、知识一、知识2 2、知识的属性、知识的属性(1)实践性 知识产生于实践,又可反作用于实践活动。 (2)规律性 知识是对事物及其运动规律的总结。 (3)真理性 知识是人类社会实践经验和智慧的总结。(4)继承性 知识可继承,可深化。二、知识二、知识3 3、知识的分类、知识的分类OECDOECD分类分类世界经合组织世界经合组织(OECD)(OECD) 在1996年的年度报告以知识为基础的经济以知识为基础的经济中将知识分为四大类:(1)知道是什么的知识( Know-what

20、):主要是叙述事实方面的知识; (2)知道为什么的知识(Know-why):主要是自然原理和规律方面的知识; (3)知道怎么做的知识(Know-how):主要是指对某些事物的技能和能力; (4)知道是谁的知识(Know-who):涉及谁知道和谁知道如何做某些事的知识。 三、情报三、情报1 1、情报的概念、情报的概念 情报是指那些被人们用来解决特定问题所需要的、经过激活过程情报是指那些被人们用来解决特定问题所需要的、经过激活过程(加工、整理、传递)活化了的知识。(加工、整理、传递)活化了的知识。情报与信息、知识的关系:情报与信息、知识的关系:信息知识情报三、情报三、情报2 2、情报的属性、情报的

21、属性(1 1)知识性)知识性 情报的本质是知识,情报首先必须是知识。情报的本质是知识,情报首先必须是知识。(2 2)传递性)传递性 知识要变成情报,必须经过运动。知识要变成情报,必须经过运动。(3 3)效用性)效用性 运动着的知识也不都是情报,只有那些能满足特定要求的运动运动着的知识也不都是情报,只有那些能满足特定要求的运动的知识才可称为情报。的知识才可称为情报。四、文献四、文献 为了把人类知识传播开来和继承下去,人们用文字、图像、符号、声频、视频、代码等为了把人类知识传播开来和继承下去,人们用文字、图像、符号、声频、视频、代码等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或

22、录到唱片上,或存手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录到唱片上,或存储在磁盘上。这种附着在各种载体上的记录通称为文献。文献又分为科学技术文献和社会科储在磁盘上。这种附着在各种载体上的记录通称为文献。文献又分为科学技术文献和社会科学文献。学文献。 科学技术文献:人类在从事生产和科学研究活动中产生的文献:人类在从事生产和科学研究活动中产生的文献 社会科学文献:人类在从事社会文化活动中产生的文献。:人类在从事社会文化活动中产生的文献。四、信息、知识、情报、文献之间的关系四、信息、知识、情报、文献之间的关系 信息知识情报文献第第1 1章章 绪论绪论1.1 1.1 信息检索信

23、息检索1.2 1.2 信息资源信息资源1.3 1.3 信息检索需求信息检索需求教学目标:教学目标: 教学要求:教学要求: 本章作为导论,主要对信息检索及其相关概念进行本章作为导论,主要对信息检索及其相关概念进行了简要介绍,目的是使读者对信息、信息资源、信息需了简要介绍,目的是使读者对信息、信息资源、信息需求、信息检索等内容有初步了解。求、信息检索等内容有初步了解。 信息检索及相关概念;信息检索类型划分;信息资源信息检索及相关概念;信息检索类型划分;信息资源的载体形式、级次、类型划分以及各类型文献的特点和检的载体形式、级次、类型划分以及各类型文献的特点和检索利用价值;面向各类用户需要的信息检索需

24、求特点。索利用价值;面向各类用户需要的信息检索需求特点。 1.1 1.1 信息检索信息检索 本节主要介绍信息检索的定义及概念渊源,并根据不同的标准对信本节主要介绍信息检索的定义及概念渊源,并根据不同的标准对信息检索的类型进行划分。息检索的类型进行划分。1.1.11.1.1信息检索的概念信息检索的概念1.1.21.1.2信息检索的类型信息检索的类型1.1.1 1.1.1 信息检索的概念信息检索的概念 信息检索(Information Retrieval)就是信息用户为处理解决各种问题而查找、识别、获取相关的事实、数据、知识的活动及过程。 2020世纪中叶以前世纪中叶以前“文献检索文献检索” ”

25、; 2020世纪世纪5050年代以后年代以后“情报检索情报检索”; 近年来近年来“文献检索文献检索”和和“情报检索情报检索”统称为信息检索。统称为信息检索。 随着信息检索理论的不断发展,人们对信息检索的认识不断深入。随着信息检索理论的不断发展,人们对信息检索的认识不断深入。国内外有关专家从不同的角度解释信息检索,主要代表性观点有:国内外有关专家从不同的角度解释信息检索,主要代表性观点有:1.从通信的角度认识信息检索从通信的角度认识信息检索 莫尔斯认为莫尔斯认为“信息检索是一种时间性的通信形式信息检索是一种时间性的通信形式”,“此此种通信是时间性的,在时间上从一个时刻通往较晚的时刻,而种通信是时

26、间性的,在时间上从一个时刻通往较晚的时刻,而在空间上可能还在同一地点在空间上可能还在同一地点”。也就是说通过信息检索得到了。也就是说通过信息检索得到了一些文献,从而使得信息发布者与信息用户之间建立了一种通一些文献,从而使得信息发布者与信息用户之间建立了一种通信。这一观点旨在说明,信息传递是一种特殊的通信形式,正信。这一观点旨在说明,信息传递是一种特殊的通信形式,正是这种通信促使了人类思想、文化、科学上的交流。是这种通信促使了人类思想、文化、科学上的交流。 这种认识突出了用户需求的重要性,对于如何做好信息检这种认识突出了用户需求的重要性,对于如何做好信息检索服务具有很强的理论和实践意义。索服务具

27、有很强的理论和实践意义。2.从信息处理的角度认识信息检索从信息处理的角度认识信息检索 从信息处理的角度来看,信息检索的基本问题是如何处理从信息处理的角度来看,信息检索的基本问题是如何处理信息和信息的结构。这种认识偏重于信息管理领域,认为信息信息和信息的结构。这种认识偏重于信息管理领域,认为信息不仅限于传统不仅限于传统“文献文献”的范围,图像、声音、数据等也能反映的范围,图像、声音、数据等也能反映信息,并把信息检索视为计算机科学技术的一个分支。信息,并把信息检索视为计算机科学技术的一个分支。 这种认识强调如何构造以及利用什么形式来构造信息结构这种认识强调如何构造以及利用什么形式来构造信息结构的问

28、题。这种认识对于信息检索工具的设计和组建,具有指导的问题。这种认识对于信息检索工具的设计和组建,具有指导意义。意义。3.从信息检索过程的角度认识信息检索从信息检索过程的角度认识信息检索 这种观点认为,信息检索就是查找出含有用户所需信息的这种观点认为,信息检索就是查找出含有用户所需信息的文献的过程。美国兰卡斯特的经典表述是文献的过程。美国兰卡斯特的经典表述是“信息检索系统并不信息检索系统并不检索信息检索信息”,表明检索对象是文献。,表明检索对象是文献。4.全息检索全息检索 王永成教授认为,全息检索就是王永成教授认为,全息检索就是“可以从任意角度,从存储的多可以从任意角度,从存储的多种形式的信息中

29、高速准确地查找,并可以任意要求的形式和组织方式种形式的信息中高速准确地查找,并可以任意要求的形式和组织方式输出,也可以仅输出人们所需要的一切相关信息的电脑活动。输出,也可以仅输出人们所需要的一切相关信息的电脑活动。 任意角度:是指要求检索系统以用户可能的任何检索要求作为出任意角度:是指要求检索系统以用户可能的任何检索要求作为出发点,并把这些出发点都设计成发点,并把这些出发点都设计成“检索入口检索入口”; 多种形式的信息:是指在现代多媒体技术能够存储并输出文本、多种形式的信息:是指在现代多媒体技术能够存储并输出文本、图像和声音信息的条件下,继续发展直至能输出超音频与超视频信息;图像和声音信息的条

30、件下,继续发展直至能输出超音频与超视频信息; 任意要求的信息组织形式:是指按用户需求对已检索到的信息加任意要求的信息组织形式:是指按用户需求对已检索到的信息加以组织并输出,从而真正实现人机检索过程中以组织并输出,从而真正实现人机检索过程中“以人为本以人为本”的服务宗的服务宗旨。旨。 输出一切输出一切“相关信息相关信息”:从存储方面看,系统对存储的文本的外:从存储方面看,系统对存储的文本的外部特征,文本的内涵特征以及其他辅助性特征等的描述与信息本身存部特征,文本的内涵特征以及其他辅助性特征等的描述与信息本身存在不可避免的差异,应尽量缩小这种差异;从检索一方看,用户对信在不可避免的差异,应尽量缩小

31、这种差异;从检索一方看,用户对信息需求的认知能力、表述能力也同样影响到其能否检索出与真正的信息需求的认知能力、表述能力也同样影响到其能否检索出与真正的信息需求相关的结果。因此,息需求相关的结果。因此,“相关性相关性”不仅是传统文献检索,也是全不仅是传统文献检索,也是全息检索的基本特征和评价检索系统的重要参考指标。息检索的基本特征和评价检索系统的重要参考指标。5.5.概念信息检索概念信息检索 ChankChank等专家认为,概念信息检索是基于自然语言等专家认为,概念信息检索是基于自然语言处理中对知识在语义层次上的析取,并由此形成知识处理中对知识在语义层次上的析取,并由此形成知识库,再根据对用户提

32、问的理解来检索其中的相关信息。库,再根据对用户提问的理解来检索其中的相关信息。它与传统文献检索的区别在于,后者是基于关键词为它与传统文献检索的区别在于,后者是基于关键词为核心的标引与检索,而关键词在很多情况下并不能确核心的标引与检索,而关键词在很多情况下并不能确切表达文献信息的概念和内容,因此误检与漏检在所切表达文献信息的概念和内容,因此误检与漏检在所难免。难免。而概念信息检索要对输入的原文内容中的概念,而不而概念信息检索要对输入的原文内容中的概念,而不是关键字来进行组织和安排,在对其进行语义层次上是关键字来进行组织和安排,在对其进行语义层次上的自然语言处理基础上,来获取相关的概念和范畴知的自

33、然语言处理基础上,来获取相关的概念和范畴知识,然后通过记忆机制将它们存储到知识库中以备检识,然后通过记忆机制将它们存储到知识库中以备检索。概念信息检索系统一般由记忆机制、语义分析机索。概念信息检索系统一般由记忆机制、语义分析机制、知识库、人机接口等部分组成。制、知识库、人机接口等部分组成。广义信息检索广义信息检索 信息检索是指将信息按一定的方式组织和存贮信息检索是指将信息按一定的方式组织和存贮起来,并根据用户的需要找出相关信息的过程。其起来,并根据用户的需要找出相关信息的过程。其中包括信息存储与信息查找两部分。中包括信息存储与信息查找两部分。狭义信息检索狭义信息检索 即信息查找的过程即信息查找

34、的过程1 12 2 思考题:机器检索是否可以完全取代手工思考题:机器检索是否可以完全取代手工检索?为什么?检索?为什么?3 34 45 5 查找含有特定信息的文本文献的检索,其结果是以文本形式反映特定信查找含有特定信息的文本文献的检索,其结果是以文本形式反映特定信息的文献。息的文献。 多媒体信息检索是指根据用户的需求,对文字、声音、图像、图形等多多媒体信息检索是指根据用户的需求,对文字、声音、图像、图形等多种媒体信息进行组织、存储从而识别、查找并获取所需信息的过程。种媒体信息进行组织、存储从而识别、查找并获取所需信息的过程。6 6 全文检索是将存储于数据库中的整本书、整篇文章中的任意内容查找出

35、全文检索是将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索。来的检索。 超文本系统是将诸多文本信息通过超链接联系起来而形成的一种非线性超文本系统是将诸多文本信息通过超链接联系起来而形成的一种非线性的文本结构。的文本结构。 超媒体检索是对超文本检索的补充。其存储对象超出了文本范畴,融入超媒体检索是对超文本检索的补充。其存储对象超出了文本范畴,融入了静、动图像(形)以及声音等多种媒体信息。了静、动图像(形)以及声音等多种媒体信息。7 7 常用法也称工具法,是检索中最为常用的方法,指利用检索工具或系统常用法也称工具法,是检索中最为常用的方法,指利用检索工具或系统中常设的检索入口(如主题、

36、分类、著者、题名等)查找文献信息的方法。中常设的检索入口(如主题、分类、著者、题名等)查找文献信息的方法。其具体操作分为顺查、倒查、抽查其具体操作分为顺查、倒查、抽查3 3种。种。 回溯法也称引文法,是利用文献末尾所附的参考文献或引文为检索入口,回溯法也称引文法,是利用文献末尾所附的参考文献或引文为检索入口,由点到面地滚雪球般查找到更多的来源文献。由点到面地滚雪球般查找到更多的来源文献。 循环法也称分段法,是综合常用法和回溯法的检索方法,分阶段按周期循环法也称分段法,是综合常用法和回溯法的检索方法,分阶段按周期的交替使用两种方法。的交替使用两种方法。1.2 1.2 信息资源信息资源 信息及信息

37、资源是信息检索的主要对象,本节主要介绍信息资源的定信息及信息资源是信息检索的主要对象,本节主要介绍信息资源的定义及其类型,并对当前信息检索的主要检索对象义及其类型,并对当前信息检索的主要检索对象文献信息资源做了较文献信息资源做了较为详细的描述。为详细的描述。1.2.1 1.2.1 信息资源的概念信息资源的概念1.2.21.2.2信息资源的分类信息资源的分类1.2.31.2.3文献信息资源文献信息资源1.2.1 1.2.1 信息资源的概念信息资源的概念 信息资源同能量和物质一起被称做人类信息社会生产与生活必不可少信息资源同能量和物质一起被称做人类信息社会生产与生活必不可少的的3 3大资源。大资源

38、。 信息与信息资源的定义,目前仍是众说纷坛。尽管在认识上存在一定信息与信息资源的定义,目前仍是众说纷坛。尽管在认识上存在一定的分歧,但国内外多数专家都认为应该从狭义和广义两种角度来认识和理的分歧,但国内外多数专家都认为应该从狭义和广义两种角度来认识和理解信息资源的涵义解信息资源的涵义 。1.1.狭义信息资源狭义信息资源 狭义信息资源是指人类社会活动中经过加工处理的、有序化的并大量狭义信息资源是指人类社会活动中经过加工处理的、有序化的并大量累积后的有用信息的集合。在这个定义中需要注意以下累积后的有用信息的集合。在这个定义中需要注意以下3 3点。点。信息资源是信息的集合。信息资源是信息的集合。信息

39、资源是经过人类选择、获取的有用信息的集合。有用性是一切资源信息资源是经过人类选择、获取的有用信息的集合。有用性是一切资源的本质属性,信息资源也不列外。的本质属性,信息资源也不列外。信息资源是经过人类组织序化的信息的集合。与非信息资源相比,信息信息资源是经过人类组织序化的信息的集合。与非信息资源相比,信息资源的显著的特征就是有序性。组织、序化的信息才能成为信息资源,而资源的显著的特征就是有序性。组织、序化的信息才能成为信息资源,而没有控制的、未经组织的信息不能成为资源。没有控制的、未经组织的信息不能成为资源。2.2.广义信息资源广义信息资源 广义信息资源是信息和它的生产者以及信息技术的集合。也就

40、是广广义信息资源是信息和它的生产者以及信息技术的集合。也就是广义信息资源一般由义信息资源一般由3 3部分构成:一是人类社会活动中经过加工处理有序化部分构成:一是人类社会活动中经过加工处理有序化并大量累积后的有用信息的集合;二是为某种目的而生产有用信息的信息并大量累积后的有用信息的集合;二是为某种目的而生产有用信息的信息生产者的集合;三是加工、处理和传递有用信息的信息技术的集合。生产者的集合;三是加工、处理和传递有用信息的信息技术的集合。 本书的陈述是基于狭义信息资源概念基础上的。本书的陈述是基于狭义信息资源概念基础上的。1.2.2 1.2.2 信息资源的分类信息资源的分类 按照不同的标准可以将

41、信息资源划分为不同的种类,常见的划分标准按照不同的标准可以将信息资源划分为不同的种类,常见的划分标准及其类型有:及其类型有:1.1.按信息资源所依附的载体划分按信息资源所依附的载体划分 体裁信息资源、实物信息资源、文献信息资源和网络信息资源。体裁信息资源、实物信息资源、文献信息资源和网络信息资源。(1 1)体裁信息资源)体裁信息资源 体裁信息资源指以人体为载体并能为他人识别的信息资源。按其表体裁信息资源指以人体为载体并能为他人识别的信息资源。按其表达方式又可分为口语信息资源和体语信息资源。达方式又可分为口语信息资源和体语信息资源。(2 2)实物信息资源)实物信息资源 实物信息资源是指以实物为载

42、体的信息资源。产品、样品、模型等。实物信息资源是指以实物为载体的信息资源。产品、样品、模型等。(3 3)文献信息资源)文献信息资源 指以文字、图形、符号、声频、视频等方式记录在各种载体上的知指以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源,是人们目前利用最多的信息资源。识和信息资源,是人们目前利用最多的信息资源。(4 4)网络信息资源)网络信息资源 网络信息资源是指以网络为纽带链接起来的信息资源和以网络为主要网络信息资源是指以网络为纽带链接起来的信息资源和以网络为主要交流、传递、存储的手段与形式的信息资源。交流、传递、存储的手段与形式的信息资源。2.2.按信息资源传递的范

43、围划分按信息资源传递的范围划分 公开信息资源、半公开信息资源和非公开信息资源。公开信息资源、半公开信息资源和非公开信息资源。(1 1)公开信息资源)公开信息资源 又称共享信息资源或白色信息资源,指公开发行、流通和传递的信又称共享信息资源或白色信息资源,指公开发行、流通和传递的信息资源,其蕴涵的信息人人均可以使用。息资源,其蕴涵的信息人人均可以使用。(2 2)半公开信息资源)半公开信息资源 又称灰色信息资源,指非公开发行、流通和传递,从常规途径难以又称灰色信息资源,指非公开发行、流通和传递,从常规途径难以获取的信息(内部信息)。获取的信息(内部信息)。(3 3)非公开信息资源)非公开信息资源 又

44、称黑色信息资源,指人们未破译或未被辨识的,也指处于保密状又称黑色信息资源,指人们未破译或未被辨识的,也指处于保密状态的信息。态的信息。3.3.按信息资源的加工程度划分按信息资源的加工程度划分 一次信息资源、二次信息资源和三次信息资源。一次信息资源、二次信息资源和三次信息资源。(1 1)一次信息资源)一次信息资源 一次信息资源是指未经过加工或粗略加工的原始信息资源。如会议一次信息资源是指未经过加工或粗略加工的原始信息资源。如会议记录、统计报表、期刊文章、研究报告等。记录、统计报表、期刊文章、研究报告等。(2 2)二次信息资源)二次信息资源 是指对大量一次信息资源进行加工、整理、标引、著录、浓缩,

45、并是指对大量一次信息资源进行加工、整理、标引、著录、浓缩,并予以有序化编排而形成的结果,主要指各种目录、题录、索引、文摘等。予以有序化编排而形成的结果,主要指各种目录、题录、索引、文摘等。(3 3)三次信息资源)三次信息资源 是指通过二次信息资源提供的线索,对某范围内的一次信息资源进是指通过二次信息资源提供的线索,对某范围内的一次信息资源进行分析、研究、加工而成的信息资源。它包括综述、述评、百科全书、年行分析、研究、加工而成的信息资源。它包括综述、述评、百科全书、年鉴、指南、手册、词典等。鉴、指南、手册、词典等。1.2.3 1.2.3 文献信息资源文献信息资源 迄今为止,文献信息资源是信息检索

46、的主要对象之一和信息资源建设迄今为止,文献信息资源是信息检索的主要对象之一和信息资源建设和利用的主要类型。和利用的主要类型。1.1.文献的物质形态文献的物质形态 为了有效地记录、传递和积累信息,人们先后发明了各种各样的物质为了有效地记录、传递和积累信息,人们先后发明了各种各样的物质材料来记录信息。目前文献的物质形式有材料来记录信息。目前文献的物质形式有5 5大类型。大类型。(1 1)刻写型文献)刻写型文献(2 2)印刷型文献)印刷型文献(3 3)微缩型文献)微缩型文献(4 4)电子型文献)电子型文献(5 5)视听型文献)视听型文献 刻写型:刻写型:定义:定义: 通过手写的方式记录下来的文献。通

47、过手写的方式记录下来的文献。优点:优点: 便于阅读、传递,成本低,历史价值大。便于阅读、传递,成本低,历史价值大。缺点:缺点: 信息存储密度低、效率低、管理困难。信息存储密度低、效率低、管理困难。例如:古代的甲骨文、简牍,手稿、书信。例如:古代的甲骨文、简牍,手稿、书信。印刷型:印刷型:定义:定义: 通过铅印、油印和胶印、木版印等印刷方式,将知识固化在通过铅印、油印和胶印、木版印等印刷方式,将知识固化在纸张上的一类文献。纸张上的一类文献。优点:优点: 便于阅读、传递,便于大量印刷,成本低。便于阅读、传递,便于大量印刷,成本低。缺点:缺点: 信息存储密度低、分量重,体积大,收藏空间大,保存期短,

48、信息存储密度低、分量重,体积大,收藏空间大,保存期短,管理困难。管理困难。例如:图书、期刊、报纸以及各种印刷材料。例如:图书、期刊、报纸以及各种印刷材料。缩微型:缩微型:定义:定义: 以感光材料为载体,通过光学摄影方式将文献的影像固化以感光材料为载体,通过光学摄影方式将文献的影像固化在感光材料上形成的一种文献。在感光材料上形成的一种文献。优点:优点: 体积小,信息存储密度高,易传递、易保存。体积小,信息存储密度高,易传递、易保存。缺点:缺点: 文献加工困难,阅读不方便。文献加工困难,阅读不方便。例如:缩微平片、缩微胶片等。例如:缩微平片、缩微胶片等。视听型:视听型:定义:定义: 是指通过特定设

49、备,使用光、声、磁、电等技术将信息转换是指通过特定设备,使用光、声、磁、电等技术将信息转换为声音、图像、影视和动画等形式,给人以直观、形象感受的知识为声音、图像、影视和动画等形式,给人以直观、形象感受的知识载体。(一种非文字形式的文献)载体。(一种非文字形式的文献)优点:优点: 信息存储密度高,形象直观、生动、逼真。信息存储密度高,形象直观、生动、逼真。缺点:缺点: 成本高,不易检索和更新。成本高,不易检索和更新。例如:录音带、唱片等。例如:录音带、唱片等。电子型:电子型:定义:定义: 采用高技术手段,将信息存储在磁盘、光盘等一些媒体中,采用高技术手段,将信息存储在磁盘、光盘等一些媒体中,形成

50、的多种类型的电子出版物。是计算机对电子格式的信息进行的形成的多种类型的电子出版物。是计算机对电子格式的信息进行的存取和处理。存取和处理。优点:优点: 信息量大、存储速度快、查找方便、易于编制二次文献等。信息量大、存储速度快、查找方便、易于编制二次文献等。缺点:缺点: 设备昂贵、使用费用高。设备昂贵、使用费用高。例如;光盘、例如;光盘、U U盘、硬盘等。盘、硬盘等。2.2.印刷型文献印刷型文献 虽然传统印刷型文献面临着各种新型文献的冲击,但是目前而言,无虽然传统印刷型文献面临着各种新型文献的冲击,但是目前而言,无论是在文献出版或发表数量上,或是在用户利用比例上,其任然占据着论是在文献出版或发表数

51、量上,或是在用户利用比例上,其任然占据着主导地位。并且目前很多的电子型文献都是将印刷型文献内容电子化而主导地位。并且目前很多的电子型文献都是将印刷型文献内容电子化而形成。形成。印刷型文献的类型主要有以下印刷型文献的类型主要有以下1010类。类。(1 1)图书)图书(2 2)期刊)期刊(3 3)科技报告)科技报告(4 4)会议文献)会议文献(5 5)专利文献)专利文献(6 6)标准文献)标准文献(7 7)政府出版物)政府出版物(8 8)学位论文)学位论文(9 9)产品样本)产品样本(1010)技术档案)技术档案3.3.电子型文献电子型文献 目前,电子型文献是除了印刷型文献以外的利用最多的另一类文

52、献。目前,电子型文献是除了印刷型文献以外的利用最多的另一类文献。电子出版物内容丰富,类型众多,电子型文献种类划分标准也多样。电子出版物内容丰富,类型众多,电子型文献种类划分标准也多样。(阅读(阅读P15-P16P15-P16) 思考题:与印刷型文献相比,电子型文献有何特点?思考题:与印刷型文献相比,电子型文献有何特点?图书图书定义:定义: 图书是对已有的科研成果与知识的系统的全面的概图书是对已有的科研成果与知识的系统的全面的概括和论述并经过作者认真的核对、鉴别、筛选、提炼和融括和论述并经过作者认真的核对、鉴别、筛选、提炼和融会贯通编写而成的文献。会贯通编写而成的文献。 教科书、科普读物等(阅读

53、性图书)教科书、科普读物等(阅读性图书)例如:例如: 辞典、手册和百科全书等(工具性图书)辞典、手册和百科全书等(工具性图书) 专著(原始文献)专著(原始文献)期刊期刊定义:定义: 期刊一般是指名称固定、开本一致的定期或不定期出期刊一般是指名称固定、开本一致的定期或不定期出版的汇集许多个著者论文的连续出版物。(期刊上刊登的版的汇集许多个著者论文的连续出版物。(期刊上刊登的论文大多数是原始文献)论文大多数是原始文献) 按内容分:学术性期刊、通讯性期刊、述评性期刊等。按内容分:学术性期刊、通讯性期刊、述评性期刊等。例如:例如: 按时间长短分:周刊、月刊、双月刊、季刊、年刊等。按时间长短分:周刊、月

54、刊、双月刊、季刊、年刊等。 报纸报纸定义:定义: 报纸是以刊载新闻和时事评论为主的定期向公众发报纸是以刊载新闻和时事评论为主的定期向公众发行的印刷出版物。是大众传播的重要载体,具有反映和引行的印刷出版物。是大众传播的重要载体,具有反映和引导社会舆论的功能。导社会舆论的功能。例如:人民日报、体育周报等例如:人民日报、体育周报等 会议文献会议文献定义:定义: 指在国际或国内重要的学术或专业性会议上宣读表的指在国际或国内重要的学术或专业性会议上宣读表的论文。论文。 会前文献:会议议程表、会议议程、会议论文预印本等会前文献:会议议程表、会议议程、会议论文预印本等例如:例如: 会后文献:各种会议录、论文

55、集等会后文献:各种会议录、论文集等学位论文学位论文定义:定义: 学位论文是指科研单位、高等院校的本科毕业生、硕学位论文是指科研单位、高等院校的本科毕业生、硕士研究生和博士研究生为申请学士、硕士、博士学位提交士研究生和博士研究生为申请学士、硕士、博士学位提交的学术论文。的学术论文。例如:本科毕业生毕业论文等。例如:本科毕业生毕业论文等。科技报告科技报告定义:定义: 科技报告是指国家政府部门或科研生产单位关于某项科技报告是指国家政府部门或科研生产单位关于某项研究成果的总结报告,或是研究过程中的阶段进展报告。研究成果的总结报告,或是研究过程中的阶段进展报告。例如:技术报告、技术备忘录、札记、通报等。

56、(目前国际上较著名的科例如:技术报告、技术备忘录、札记、通报等。(目前国际上较著名的科技报告是美国政府的四大报告:技报告是美国政府的四大报告:ADAD报告、报告、 PBPB报告、报告、NASANASA报告和报告和DOEDOE报报告)告)专利文献专利文献定义:定义: 指在专利形成过程中产生的一系列官方文件和有关出指在专利形成过程中产生的一系列官方文件和有关出版物的总称。版物的总称。例如:专利说明书等例如:专利说明书等标准文献标准文献定义:定义: 所谓标准,主要是对工农业产品和工程建设的质量、规所谓标准,主要是对工农业产品和工程建设的质量、规格、参数及其检验方法等方面所作的技术规定,是从事生产格、

57、参数及其检验方法等方面所作的技术规定,是从事生产和建设应当共同遵守的一种技术依据和规范。每一件技术标和建设应当共同遵守的一种技术依据和规范。每一件技术标准都是独立、完整的技术资料。准都是独立、完整的技术资料。(国际上最重要的两个标准化组织:(国际上最重要的两个标准化组织:ISOISO、IECIEC)例如:例如:机械制造标准机械制造标准产品样本产品样本定义:定义: 产品样本包括各种产品目录、产品说明书和产品资料产品样本包括各种产品目录、产品说明书和产品资料等,是对产品的性能、结构、原理、用途、使用方法、技等,是对产品的性能、结构、原理、用途、使用方法、技术规范及产品规格等进行描述或说明的文献。术

58、规范及产品规格等进行描述或说明的文献。例如:数控机床使用说明书等。例如:数控机床使用说明书等。技术档案技术档案定义:定义: 是指在生产建设中和科技部门的技术活动中形成的,是指在生产建设中和科技部门的技术活动中形成的,涉及一定的工程对象的技术文件的总称。其内容包括任务涉及一定的工程对象的技术文件的总称。其内容包括任务书、协议书、技术经济指标和审批文件,研究计划、方案、书、协议书、技术经济指标和审批文件,研究计划、方案、大纲和技术措施等。大纲和技术措施等。例如:技术指标、研究计划、工艺记录等。例如:技术指标、研究计划、工艺记录等。政府出版物政府出版物定义:定义: 指各国政府部门及其设立的专门机构出

59、版的文献。指各国政府部门及其设立的专门机构出版的文献。例如:政府法令、方针政策、规章制度、调查统计资料、科学技术文献等。例如:政府法令、方针政策、规章制度、调查统计资料、科学技术文献等。1.3 1.3 信息检索需求信息检索需求 本节主要介绍现阶段各部门、行业、人群对信息检索的现实需求及这本节主要介绍现阶段各部门、行业、人群对信息检索的现实需求及这些信息需求的类型,知识点包括:些信息需求的类型,知识点包括:1.3.1 1.3.1 信息检索的现实需求信息检索的现实需求1.3.2 1.3.2 信息检索需求的类型信息检索需求的类型1.3.1 1.3.1 信息检索的现实需求信息检索的现实需求 所谓信息需

60、要,就是指人们在从事各项实践活动的过程中,为解决所所谓信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题产生的对信息的需求。各部门、行业、各人对信息检索的遇到的各种问题产生的对信息的需求。各部门、行业、各人对信息检索的需求是不一样的,本单元主要从以下几个方面来探讨信息检索的现实需求:需求是不一样的,本单元主要从以下几个方面来探讨信息检索的现实需求:1.1.决策部门的信息检索需求决策部门的信息检索需求 管理决策是一个动态过程,其程序一般包括发现问题,确定目标,制管理决策是一个动态过程,其程序一般包括发现问题,确定目标,制定方案,评估优选,实施决策,追踪反馈等环节。管理决策所需

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论