版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、浅析信息检索的途径及策略刘剑电子科技大学 管理学院 成都 610054E-mail: jenghisliu摘要:信息时代要求我们必须不断提高自身的“信息素质”,而“信息素质”集中表现为在纷繁复杂的信息面前如何获取有价值信息的能力。本文对常见的两中信息获取途径进行了对比并在此基础上提出了一套可行的、有效的检索策略。关键字:网络信息 信息检索 检索策略1 引言“谁掌握了知识和信息, 谁就掌握了支配他人的权力”权力的转移(阿尔温·托夫勒)信息时代的到来,使信息的生产、传播和更迭越来越快。信息的生命周期越来越短,集中的表现在知识的更新率大大加快,仅仅依靠在校园中汲取的课堂知识已经不能适应社会
2、的变化。而如何不断主动获取新的知识成为我们面临的一个挑战。对此有学者提出了“信息素质”概念,简言之,“信息素质”就是一个人在浩瀚无边、纷繁复杂的信息面前如何检索有价值信息的一种能力。而在笔者看来,如何根据我们具体检索的目标来选择最优的检索途径,以及如何实施有效的检索策略来避免“大海捞针”式的无效劳动是最值得探讨的两个问题,解决了这两个问题,我们就不会在纷乱的信息面前迷失方向,我们的“信息素质”自然就得到了提高。 2 信息检索的途径2.1 两种检索的途径信息和知识检索的途径包括传统的途径和现代的途径。传统的途径主要是依靠传统图书馆,通过馆藏目录(卡片式或书目式)进行手工检索;现代的途径包括数字图
3、书馆和互联网络,通过数据库进行自动检索。下表是二种方式的一个简单对比: - 1 - 检索工具 卡片书目 专业检索软件 搜索引擎搜索引擎 目录分类检索 查全 较全 全内容干扰大 查准 高 高低 检索 效率 耗时 长 短 冗长 2.2 检索途径的优劣分析 任何一家传统图书馆的藏书都是有限的,加上藏书必要的订购、入库等过程,传统图书馆内的图书资料往往都不是最新的,另外你还必须亲自到图书馆去才能使用卡片等检索工具,这使检索的效率很低。但图书馆蕴涵丰富全面的历史资料,例如大学图书馆中的本校论文集一般都可以追述到很早的时间,这些资料你通过其他途径是很难得到的。 数字图书馆通过自身收藏和网络共享(如与其他图
4、书馆、专业资料库相互授权开放)使其藏书和资料大大增加,加上自动的检索工具的使用,使得检索变得快速而又简单。特别需要说明的是现在很多传统图书馆都在原有的基础上同时建立了自己的数字图书馆,并且将内部图书管理数据通过网络共享(授权共享),使得你在家就能查阅到图书馆书目和书籍的借阅状态,这一结合凝聚了传统图书馆和数字图书馆两者的优势,不仅检索更快,而且检索内容更全面。 互联网特性之一就是全球的互通互联,其在信息方面的表现就是资源分散、无序和更迭无法预测。这使得任何用户都无法判断网上有多少信息与自己的需求相关,因此定位与检索主题相关的信息非常困难,也无从评判找到资料是否全面准确;同时,虽然互联网网络检索
5、信息只需要几十秒甚至更短的时间,但剔除无效的、干扰的信息消耗了大量的时间和精力,使检索变得冗长而疲惫。然而互联网作为全球信息开放式的集合体,其蕴涵的知识和信息浩瀚无边,并且这些信息还时时刻刻都在被及时更新,这些特点使得我们对互联网充满了渴望,因此必须要建立有效的检索策略来消除互联网的检索障碍,使互联网真正成为有价信息交流的平台。 3 检索策略初探 在分析了两种信息检索的途径后,我们需要集中探讨的是:在面对特定检索目标的情况下,如何通过制定有效的检索策略,使我们能尽量快速、准确、全面的检索到目标信息。 我们认为一个典型的信息检索策略的过程如图1所示:需要首先确定检索目的,然后对目的进行分析并确定
6、检索途径,最后确定具体的检索方法并检索结果。 - 2 - 图1 典型的信息检索策略的过程3.1 确定检索目的在进行信息检索前必须首先要明确你检索的目的(注:本文不考虑那种没有明确目的下的广泛的信息浏览),确定检索目的至少有以下几点好处:使检索有方向;明确了检索的目的也就指明了检索的方向。例如是到管理资料库中搜寻还是到技术资料库中搜寻?是书籍还仅是一篇论文?这完全取决于你检索的目的的是什么。使检索有终点;检索不能无休止的持续下去,必须要有一个终点,而终点的确定必须要有预先的目标为前提。使检索结果有评判指标;检索到目标信息没有?检索到足够的信息没有?检索的信息是否满足要求?是否在预期的时间内检索到
7、信息?这些都需要检索目的来评判。3.2 分析并确定检索途径确定了检索目的之后就应先分析,什么样的检索途径是找到目标信息最方便、最快捷的方式。从上一节我们知道每种检索途径都有自身的优劣,因此没有一种方式能解决完我们全部的需求。然而什么是最佳途径呢?很显然这一问题是没有标准答案的,仁者见仁,智者见智。不过虽然没有标准答案,但选择最佳检索途径还是有章可循的,在笔者看来,如何确定什么才是达到我们预期检索目的的最佳途径,主要应考虑以下两个原则:目标集最小原则:我们选取的目标集合应该(相对)最小;分类优先检索原则:如果检索目标存在分类资料库的应首先在分类资料库中检索;如果不知道分类资料库存在而必须使用In
8、ternet 搜索的,在检索结果中也应首选出专业网站进行二次检索;3.3 确定检索方法并检索结果 传统图书馆的检索方法比较成熟和固定,我们不再累述。以下我们主要讨论互联网络中的检索方法和技巧(其基本方法和理念同样适用于数字图书馆)。 检索方法主要包括目录分类检索和搜索引擎两种方式: 目录分类检索: 对网络查询无经验或者无法明确地用词语清晰表达自己信息需求的,可以选择这一方法进行查询,根据指南列出的类目一层层查下去,即可得到较为满意的结果。例如要查询有关考研方面的资料,先进入门户网站(例:yahoo ),然后通过目录指南中“教育考试研究- 3 -生考试”一层层展开就可找到一些相关的信息。目录分类
9、检索方式的最大好处就是通过逐步缩小目标集范围而使自身的检索目标变得清晰可寻。然而这一特点同时也成为了其最大的问题:多层分类导致检索时间过长;检索目标没有明确分类或在多个分类中交叉时会使检索变得茫然。搜索引擎:搜索引擎是一种利用网络自动搜索技术对互联网各种资源进行标引,并为检索者提供检索的工具1。搜索引擎自动在互联网搜寻包含用户提交的关键字或关键字组合的网页或网站链接,其优点就是使用简单、检索速度快、检索范围广,因此搜索引擎现在已经成为了互联网最有效和最常用的检索工具。目前我国互联网用户常用的搜索引擎包括Google( 、百度( 、雅虎 ( 、Altavista( 等,各种搜索引擎都有各自的特点
10、,我们不能说到底哪个搜索引擎好些,而应该通过对各种搜索引擎的组合使用来使我们的检索更准确、快速。虽然通过搜索引擎能简单、快速的获得大量信息,但由于互联网本身的开放性,搜索结果中可能包含大量干扰的信息,使检索的效果大打折扣,因此必须要选择合适的搜索引擎和熟练掌握各种搜索引擎的使用技巧。一般搜索引擎的使用技巧包括:合理选择关键字:在分析搜索目的基础上,应尽量去分析“什么样的关键字最容易区分出目标”、“简化点好还是完整点好”等问题;用好逻辑组合命令:现在的搜索引擎一般都支持逻辑运算符号进行关键字组合查询。常用的逻辑符号包括“+”、“-”、“And ”、“Or ”和“Not ”。熟练掌握各种搜索引擎的
11、特殊命令:特殊的搜索命令可以帮助我们提高搜索的准确度,各种不同的搜索引擎都有自己的特殊命令,一般这些命令在搜索引擎的帮助文件中都有详细的说明。例如在百度中使用“关键词+filetype:类型”可以限制检索结果为某种类型的文件。4 一个信息检索策略应用的案例以下是一次真实的关于信息检索的案例讨论课,笔者有幸参与其中并成功的应用了上述方法和策略。4.1 检索目的案例要求以小组为单位查找包含E-Business 或者Electronic-Business 的最早的一篇论文,然后完成报告。报告重点是要求阐述本小组检索的思路和过程。4.2 检索方法分析及分工我们组首先想到了上文提到的三种检索渠道,为了切
12、实感受各种不同检索方法的检索效- 4 -率,我们组分为3个小组,在三个方向对同一题目进行检索:第一小组到图书馆和管理学院的资料库检索,第二小组通过互联网检索,第三小组通过图书馆的电子版以及图书馆链接的对本校开放的专业资料库检索。随后我们组集中对目标任务进行了分析。我们认为该题目的关键点有两个:一是“论文”,二是“最早”。因此如何把检索范围缩小到论文集中、以及如何判断检索到的论文是“最早”就成为了检索成败的关键。我们认为,第一:既然是“最早”的关于电子商务的论文,考虑到电子商务进入中国才10多年的时间,因此一定是国外的论文,我们三个小组都应该把目标放在外文资料的检索上;第二:检索的结果是“论文”
13、,那么我们数字图书馆检索小组重点应该利用图书馆链接出去的英文数据库,而我们互联网检索小组应该尽量通过第一轮的条件检索找到国外期刊、论文的专业网然后进行二次站内检索。4.3 检索过程、策略及结果第一小组第一小组到图书馆各个流通部以及外文期刊室检索目标,但感觉比较难以开展工作:图书馆和资料库中相关目录的书籍中都很难去判别某篇文章是否包含上述关键词的存在。最后在翻阅了大量电子类、管理类的相关书籍后,第一小组宣告失败;第二小组第二小组首先确定了“Electronic-business ”、“E-business ”、”paper”、”magazine”等关键字及其组合,同时考虑“最早”和“论文”这两个
14、因素,我们加上年代和技巧进行组合检索(例如年代1950s, 1960s;技巧filetype:PDF/CAJ等),结果互联网检索到数万条满足条件的记录,初略浏览了上百个链接中的文章后感觉无法直接定位目标,然后我们选定了其中几个可能与目标相关的专业网站进行了二次检索(例CIO :),但遗憾的是一般这类专业杂志中都没有很早的历史文件,最后第二小组也不得不宣告失败。第三小组第三小组在对比了数字图书馆的各种英文数据库后选择了ABI 和EBSCO/BSP两个库进行检索,选择关键词为“Electronic business”,然后不断变换检索数据的时间范围进行检索(先是“1905-1951”,没有搜索到,
15、然后在重新设定范围“1915-1961”,依次下去,最后落在为“1945-1971”),成功的搜索到了一篇1953年由哈佛学生撰写关于电子商务设备(Electronic business machines)的文章,我们认为这可能是最早的一篇包含“Electronic business”的文章,第二小组宣告成功。4.4 我们的结论选择检索方式得当、检索策略应用巧妙是成功检索非常关键的因素。5 结束语 - 5 - 总的来说,信息和知识的载体及检索形式还在不断的变化当中,本文所持有的观点仅是 一家之言,我们应该有选择的学习、运用,并且应该不断去创新和发展。 参 考 文 献 1陈晋浅论网络信息检索J科
16、技情报开发与经济,2005,15(9:244-245 2陈永平网络信息资源检索的障碍J大连民族学院学报,2002,4(9:93-95 3王怀诗,李平稳信息素质及其提高途径J图书与情报,2004, (1) :12-15 4李淑慧现代信息检索方法的探讨J兰台世界,2005,(7:46-47 The approach and strategy of the Information Retrieval Liu Jian (UESTC of China Chengdu 610054 Abstract: This paper analyzes the approaches of the information retrieval,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024苗木种植与水资源利用合作合同规范3篇
- 2024版计算机软件许可与实施协议版B版
- 2024年路演活动专用展示厅房屋租赁转租合同3篇
- 2024年项目合作合同:文化旅游景区开发与合作
- 2024年食品冷链物流与配送服务合同
- 2024年鲜活水产品运输合同3篇
- 2024年高效委托薪资发放合作合同版B版
- 2024年采购合同范本:供应商与采购方的货物质量、交付时间等关键条款
- 2022年抚顺职业技术学院公共课《马克思主义基本原理概论》期末试卷A(有答案)
- Unit+5+I+think+that+mooncakes+are+delicious同步练-+2024-2025学年鲁教版(五四学制)八年级英语下册+
- 鲁滨逊漂流记阅读任务单
- 12J5-1 平屋面建筑标准设计图
- 个人授权委托书(申报个人所得税)
- 《HSK标准教程1》第1课课件-
- 热熔标线 施工方案
- 过一个有意义的寒假课件
- 电力业扩工程竣工验收单
- 三年级上册口算题(1000道打印版)
- 安全保护区巡查管理规定
- 2021年12月医院临床药师培训理论考核试题(心血管专业)
- 科目一考试成绩表
评论
0/150
提交评论