版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、网络信息检索方法与应用摘要随着Internet在全世界范围内迅猛发展,使人们获得有用信息越来越困 难,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此, 对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又 实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术 及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的 发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途 径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地 利用。关键词检索方法工具重要性翻译summary With the rapid development o
2、f Internet in the world, to make people more and more difficult to obtain useful information, online information and huge numbers of people to obtain information contradiction between the increasingly prominent. Therefore, the retrieval of information technology and its development trends of the net
3、work to explore and research, is both urgent and practical issues.In this paper, the basic principle of network information retrieval techniques and tools of network information retrieval, information retrieval network status and other aspects of analysis, and the development trend of network inform
4、ation retrieval predicted, the network aims to find ways to improve information retrieval by means of and effective way to approach, and ultimately improve the effect of network information retrieval, making the network information resources can be fully effective use.Keyword Retrieval means Importa
5、nce一信息检索技术信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有 关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需 要的信息的过程,也就是我们常说的信息查寻(Information Search或Information Seek)。1信息检索的广义含义 对于专门从事信息检索及其系统的研究、开发和设计的少数人来说,“信息检索”可以 用英文Information Retrieval来表达,其完整的含义是信息存储与检索”,即 Information Storage and Retrieval。也就
6、是说,所谓信息检索,是指将有用信息按 照一定的方式组织存放起来,当用户需要这些信息时,再把它们从存放的地方查找和提 取出来。因此,广义的信息检索是包含存储和检索这样两个阶段和过程,缺一不可。2信息检索的狭义含义对于数量庞大的广大信息用户来说,在大多数情况下,“信息检索”可以用英文 Information Searching来表达,其准确含义是信息查找”或信息搜索”。也就是说, 所谓信息检索,是指按照一定的方式从现有的信息集合或数据库中,找出并提取所需要 的信息。可见,狭义的信息检索仅指检索这一个阶段或过程。人们获取信息源的方式主要有:遵循传统的检索方法在浩如 烟海的图书馆资料中, 通过人工查找
7、索引找到对应的文献索引号再获取文献原文;联机信息检索。这其中也 存在一个发展过程,由检索结果来看,从提供 目录、文摘等相关的二次信息检索到可 以直接获得电子版的全文;由检索方法来看,从对特定关键词或者如作者、机构等辅助 信息作为检索入口的常规检索 到以原始文献中任意词检索的全文检索等等。其中,全 文检索由于其包含信息的原始性、信息检索的彻底性、所用检索语言的自然性等特点 在近年来发展比较迅速,成为深受人们关注的一种非常有效的信息检索技术,它是从 大容量文档库中精确定位所需信息的最有效手段。网络信息检索的基本技术主要包括 以下几种技术:.信息推送技术“推”模式网络信息服务,是基于网络环境下的一种
8、新的服务形式, 即信 息服务者在网上利用“Push”技术为特定用户开展信息服务的方式。所谓Push技 术,又称“推送”技术、Web广播(Webeasting)技术,实质上是一种软件,这种软件可 以根据用户定义的准则,自动搜集用户最可能发生兴趣的信息,然后在适当的时候, 将其传递至用户指定的“地点”。因而从技 术上看,“推”模式网络信息服务就是具 有一定智能性的、可以自动提供信息服务的一组计算机软件,该软件不仅能够了解、 发现用户的兴趣(可能关心的某些主题的信息),还能够主动从网上搜寻信息,并经过 筛选、分类、排序,然后按照每个用户的特定要求,主动推送给用户。.信息拉取技术常用的、典型的信息拉取
9、技术,如数据库查询,是由用户主动查询 数据库,从数据库中拉取所需信息。其主要优点是:针对性好,用户可针对自己的需求 有目的地去查询、搜索所需的信息。.Web挖掘技术Web挖掘是数据挖掘在Web上的应用,它利用数据挖掘技术从与WWW 相关的资源和行为中抽取感兴趣的、有用的模式和隐含信息,涉及Web技术、数据挖掘、 计算机语言学、信息学等多个领域,是一项综合技术。Web内容挖掘。Web内容挖掘是 指对Web页面内容及后台交易数据库进行挖掘,从Web文档内容及其描述中的内容信息 中获取有用知识的过程。.信息过滤技术hitemet开放式的环境,为人们检索和利用信息提供了极大的方便, 但同时,网络环境也
10、为人们及时准确地检索到所需信息带来了麻烦。这是因为,第一, 网络环境中信息的来源复杂多样,随意性大,任何人、任何单位不管其背景和动机如 何都可以在网络上发布信息,信息的产生和传播没有经过筛选和审 定,因此信息的可 靠性、质量和价值成为用户普遍担心的一大问题;第二,目前大多数据搜索工具的检索 范围是综合性的,它们的Robots尽可能地把各种网页抓回来,经过简单加工后存放在 数据库中备检;第三,搜索引擎直接提供 给用户的检索途径大都是基于关键词的布尔逻 辑匹配,返回给用户的就是所有包括关键词的文献,这样的检索结果在数量上远远超 出了用户的吸收和使用能力,让人感到束手无策。这就是人们经常谈论的“信息
11、过载”、 “信息超载”现 象。信息过滤技术就是在这样的背景下开始受到人们的重视,它的目 的就是让 搜索引擎具有更多的“智力”,让搜索引擎能够更加深入、更加细致地参与 到用户的整个检索过程中,从关键词的选择、检索范围的确定到检索结果的精炼,帮 助用户在浩如烟海的信息中找到和需求真正相关的资料。3、信息检索的工具.web信息检索其检索方式有:浏览器方式和搜索引擎方式。浏览器方式(Br,singsystelns)。只要能够进入hitemct就能够通过浏 览器,利 用HTTP协议提供的WV乃万服务,浏览认触b页面和通过Web页面提 供的检索方式访 问数据库。搜索引擎方式(SearehEngines)。
12、搜索引擎是intemet提供公共信息检 索服务的Web 站点,它是以一定的技术和策略在intemet中搜集和发现网络信 息,并对网络信息进 行理解、提取和处理,建立数据库,同时以认倪b形式提 供一个检索界面,供用户输 入检索关键词、词组或短语等检索项,代替用户在 数据库中查找出与提问相匹配的记 录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所 处理的信息资源主要包括万维网服务 器上的信息,另外还包括电子邮件和新闻组信息。 搜索引擎服务的宗旨是为满 足用户的信息需要,所以它是面向用户的,采用的方式是 交互式的。网络信息检索工具采用主动提交或自动搜索两种方法搜索数据。按著
13、录信息特征分按著录信息的特征分,检索工具可以分为目录、索引、文摘、参考工 县书、搜索引擎、数据库。目录型检索工具一切可供检索使用的目录均可称为目录型检索工具。它主要报道信息的外表特征,著录 具体出版事宜及其收藏信息。常见的目录按其收录范围可以分为国家目录、联首目录、 馆藏目录;按报道的范围分为综合性目录和专题性目录。(2)索引型检索工具将信息的外部特征或内部特征(例如题名、著者、主题、分类等用各种检索语言进行描 述,并将它们按照一定的方法组织起来,用户根据查处的线索可以进一步查找原始信息 内容的工具。索引与目录的区别在于它不仅能揭示信息的外部特征,还能揭示信息的内 部特征。常见的索引有主题索引
14、、分类索引和关键词索引。文摘型检索工具文摘一般由题录和曜摘要两部分组成,它在描述信息外部特征的基础上,还增加有揭 示内容特征的摘要部分,是系统地报道、积累和检索信息的主要检索工具,也是传统检 索工具的核心。 按文摘的目的和用途划分,它可以分为报道性文摘、指示性文摘、报 道一指示性文摘、评论性文摘和转用文摘。参考工具书这是分析和著录大量具体而常用的科学数据库与事实以备查用的各种常用工具书的总 称。其中包括字典、词典、年鉴、百科全书、指南、手册、名录等。搜索引擎将网络信息分门别类地组织起来,通过搜索网址的方式来实现信息检索的工具就是搜 索引擎。它是一种网络检索工具,检索到的既可以是一般的信息线索,
15、也可以是原始信 息全文,既可以是一般的文本信息,也可以是多媒体信息。(6)数据库严格来讲,数据库包括了目录、索引、文摘、搜索引擎等工具的内容,但是由于其组织 的特殊性,也可以认为是一种检索工具3.按收录范围分按收录范围分,检索工具可以分为综合性检索工具、专业性检索工具和单一性检索工 具。综合性检索工具收录的学科范围较广,涉及的信息种类和语种也比较多。例如,美国的工程索引。专业性检索工具收录的学科范围比较窄,仅限于报道某学科或专业的信息,但收录该学科信息的类型 比较全。例如,美国的化学文摘。单一性检索工具指收录的文献类型比较单一,文献的著录格式也标准、规范。例如中国专利公报 就是典型的单一性检索
16、工具,它仅仅收录单一的文献类型一一专利文献,著录格式简单 规范,易于查找。二信息检索的重要信息检索的现状和发展趋势基于网页的网络信息检索工具的现状和发展趋势现状。网页是因特网的最主要的组 成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找 寻自己需要的信息,这类检索工具发展的最快。一般认为,基于网页的信息检索工具主 要有网页搜索引擎和网络分类目录两种。网页搜索引擎是通过“网络蜘蛛”等网页自动 搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格 式文件以及网络可访问的数据库,供人们检索网络信息的检索工具。网络目录则是和搜 索引擎完全不同,它不会
17、将整个网络中每个网站的所有页面都放进去,而是由专业人员 谨慎地选择网站的首页,将其放入相应的类目中。网络目录的信息量要比搜索引擎少得 多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因此虽然它标引质量比 较高,利用它的人还是要比利用搜索引擎的人少的多。信息检索的重要意义(1) .信息检索可以避免研究人员重复研究或走弯路引证:科学技术的发展具有连续性和继承性,闭门造车只会重复别人的劳动或走弯 路。事例:我国某研究所用了约十年时间研制成功“以镁代银”新工艺,满怀信心地去 申请专利,可是美国某公司早在二十世纪二十年代末就已经获得了这项工艺的专利,而 该专利的说明书就收藏在当地的科技信息所。科
18、学研究最忌重复,因为这是不必要的浪费。在研究工作中,任何一个课题从选题、 试验直到出成果,每一个环节都离不开信息。研究人员在选题开始后就必须进行信息检 索,了解别人在该项目上已经做了哪些工作,哪些工作目前正在做,谁在做,进展情况 如何等。这样,研究人员就可以在他人研究的基础上进行再创造,从而避免重复研究, 少走或不走弯路。.信息检索可以节省研究人员的时间和精力引证:科学技术的迅猛发展使得信息大量增长,加重了信息需求者搜索信息的负担。事例:许多研究人员在承接某个课题之后,也意识到应该查找资料,但是他们以为整天泡 在图书馆“普查”一次信息就是信息检索,结果浪费了许多时间,而有价值的信息没有 查到几
19、篇,查全率非常低。信息检索是研究工作的基础和必要环节,成功的信息检索无 疑会节省研究人员的大量时间,使其能用更多时间和精力进行科学研究。.信息检索是获取新知识的捷径引证:在改革开放的今天,传统教育培养的知识型人才已满足不了改革环境下市场 经济的需求,新形势要求培养的是能力型和创造型人才,具备这些能力的人才首先需要 具备自学能力和独立的研究能力。事例:大学生在校期间,已经掌握了一定的基础知识和专业知识。但是“授之以鱼”只 能让其享用一时。如果掌握了信息检索的方法便可无师自通,找到一条吸收和利用大量 新知识的捷径,把大家引领到更广阔的知识领域中去。高职院校开设信息检索课程是经济、信息高速发展的必然选择,目的是培养学 生的信息技术应用能力,信息获取、组织、加工和分析能力,从而培养学生的自学能力 和创新能力,为将来的学习、工作打下良好的基础。信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有 关的信息过程,所以它的全称又叫信息的存储与检索(Information Storage a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024版分期付款买卖合同样式
- 2025年度行政合同纠纷处理与概念探讨3篇
- 2025年度二零二五餐饮业员工加班工资与休息日工资合同2篇
- 二零二五年时尚产业广告合作合同1200字模板3篇
- 二零二五年度股东借款及公司债务重组及股权激励合同范本一3篇
- 2024股东向公司借款的合同范本
- 2025年度情侣分手风险控制协议书下载3篇
- 2025年度定居签证申请代理服务合同范本2篇
- 2025年度食品行业环保节能技术改造合同3篇
- 2024餐厅承包经营协议书
- 外配处方章管理制度
- 2025年四川长宁县城投公司招聘笔试参考题库含答案解析
- 《工程勘察设计收费标准》(2002年修订本)
- 【MOOC】PLC技术及应用(三菱FX系列)-职教MOOC建设委员会 中国大学慕课MOOC答案
- 2023七年级英语下册 Unit 3 How do you get to school Section A 第1课时(1a-2e)教案 (新版)人教新目标版
- 泌尿科主任述职报告
- 新零售门店运营管理流程手册
- 心理学专业知识考试参考题库500题(含答案)(一)
- 2024年浙江高考技术试题(含答案)
- 资管行业投研一体化建设
- 物业费收取协议书模板
评论
0/150
提交评论