人工智能论文_第1页
人工智能论文_第2页
人工智能论文_第3页
人工智能论文_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能技术在搜索引擎中的应用[关键词]搜索引擎人工智能智能代理自然语言查询人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。一种是希望找到人类智力的数学解释,只要找到了数学解释,那么人工智能就可以得到实现了;另一种是用一种软件或硬件的结构来模拟人脑的结构,通过类似仿生学的方法来模拟人类思维。人工智能模拟人类的思维过程,对工业设计产品或更多的艺术设计进行思维的创新和创造,目前已经取得了一些进展。使人工智能走进了一个崭新的领域,而智能化的概念设计软件正在开发与完善中。在数字化时代,我们设计师的眼光也要适时地放远拉长,让各种形式的设计都参与进来,做到工业设计真正与科技和智能相结合。搜索引擎(searchengines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。搜索引擎的工作原理是:由一个Robot尽可能多地收集WWW上的网页,按照每个网页的文本内容建立单词到网页的反向索引,用户在查询感兴趣的主题时,输入该主题的关键字作为查询条件,搜索引擎利用事先建立好的网页库和单词索引,检索出符合条件的网页返回给用户。搜索引擎的工作原理是:由一个Robot尽可能多地收集WWW上的网页,按照每个网页的文本内容建立单词到网页的反向索引,用户在查询感兴趣的主题时,输入该主题的关键字作为查询条件,搜索引擎利用事先建立好的网页库和单词索引,检索出符合条件的网页返回给用户。搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。搜索引擎的分类分为:目录式搜索引擎,基于Robot的搜索引擎和Meta搜索引擎三种。在目前所存在的搜索引擎中,没有一个搜索引擎能够覆盖所有的WWW资源,大部分的搜索引擎都只能涉及到整个资源的一小部分,并且各类搜索引擎的信息来源差异较大,因此集成多个搜索引擎而产生的Meta搜索引擎具有比传统引擎覆盖面大,搜索效果更好且具有可扩展性等优点。它的缺点是有一定的局限性,不能够充分使用所使用搜索引擎的功能。人工智能技术及其在搜索引擎中的应用研究Internet迅速的发展,使得网上的信息呈现指数级增长,Internet的问题已经从“提供信息”转到“如何从浩如烟海的信息中提取对自己有用的信息资源”。现有的搜索引擎存在着返回的无用信息太多、搜索效率低下、信息组织混乱等缺陷。起源于20世纪50年代的人工智能(AI)技术,可以在Internet中导引用户,不仅在用户进行搜索、浏览时给予直接的支持,而且能够提供具有独立搜索功能的智能体的幕后支持。因此人工智能已经在Internet中扮演越来越重要的角色。先看一下传统搜索技术又有诸多局限。首先信息丢失,一般来说,目录式的搜索引擎由于目录只在对站点的描述中进行搜索,因此站点本身的动态变化不会反映到搜索结果中来,对网站的描述也十分简略,其描述能力不能深入网站的内部细节,因此用户不能查询网站内部的重要信息,造成了信息丢失。其次,返回信息太多。基于机器人的搜索引擎由于应用了全文检索技术,能够解决对网页细节的检索问题。从理论上说,只要网页上出现了某个关键词,就能够使用全文检索用关键词匹配把该网页查出来,但是这又导致了它的缺陷——返回的信息太多。再次,信息无关。返回信息过多只是全文检索给人直观感觉到的问题。除此之外,它还有两个不很直观的深层次问题也给信息检索带来了不少困难。因此,很多情况下,用户很难简单地用关键词或关键词串来忠实地表达他所真正需要检索的内容,表达困难导致检索困难。造成上述信息检索困难的原因的实质在于传统的搜索引擎对要检索的信息仅仅采用机械的关键词匹配来实现,缺乏知识处理能力和理解能力,也就是说搜索引擎无法处理在用户看来是非常普通的常识性知识,更不能处理随用户不同而变化的个性化知识、随地域不同而变化的区域性知识以及随领域不同而变化的专业性知识等等。因此,结合人工智能技术的智能搜索引擎把信息检索从目前基于关键词层面提高到基于知识(或概念)层面,是解决问题的根本和关键。智能代理技术智能代理又称智能体,是人工智能研究的新成果,近几年的发展非常迅速。它使用自动获得的领域模型、用户知识进行信息搜集、索引、过滤,并自动地将用户感兴趣的、对用户有用的信息提交给用户智能代理的特点是具有不断学习、适应信息和适应用户兴趣动态变化的能力,从而能够提供个性化的服务。智能代理的优势智能性:具有丰富的知识和一定的推理能力,能分析用户的需求和揣测用户的意图,以便能完成较复杂的任务,而且它可以从经验中不断学习,以提高自己处理问题的能力。代理性:顾名思义智能代理是用户的某种代理,它可以代替用户完成一些任务,并主动将结果反馈给用户。主动性:它能根据用户的需求和环境的变化,主动向用户报告并提供服务协作性:它能通过各种通信协议和其他智能代理进行信息交流,并可以相互协调共同完成复杂的任务。搜索引擎中的客户端智能代理和服务器端智能代理客户端智能代理技术以智能搜索代理技术为主,结合搜索引擎“面向主题”的检索模式,在密切关注个体需求、提高信息与用户需求相关系统,彼此间可以通过统一的传输协议进行沟通,交换信息,从而使更多的信息得以挖掘,以弥补智能代理信息搜索范围有限的缺陷。服务器端智能代理引入用户反馈机制来完善检索机制,提高检索命中率,同时也可以提供面向个人的特殊检索服务。这种方式是记录该用户的查询踪迹,从而在用户再次登录时结合以往的用户检索记录来配合提供相关的检索服务。并且可以通过对用户的反馈意见进行跟踪,获取用户对结果的评价,以便提高检索质量。搜索引擎中查询接口的智能化1.基于关键词匹配搜索技术当用户提出查询请求时,用户最关心的是搜索结果是否能够满足自己的需要。目前采取的一种常见的策略是将用户的查询请求分解成若干关键词,根据这些关键词计算Web文档跟用户请求的匹配程度,从而挑出若干匹配的文档。匹配程度的衡量准则很多:一种是根据关键词在文档中出现的频率确定它对用户请求的匹配程度;另一种是计算关键词出现次数和页面总词数之比。但是基于关键词匹配的搜索技术有较大的局限性。它不能区分同形异义,也不能联想到关键词的同义词。2・自然语言查询为了提高搜索引擎对用户查询请求的理解,就必须有一个好的检索提问语言,为了克服关键词检索和目录查询的缺点,应用自然语言理解技术进行自然语言智能答询。它将信息检索从目前基于关键词层面提高到基于知识(或概念)层面,对知识有一定的理解与处理能力,能够实现分词技术、同义词技术、概念搜索、短语识别以及机器翻译技术等。因而具有信息服务的智能化、人性化特征。它允许用户采用自然语言进行信息的检索,为用户提供更方便、更确切的搜索服务。与传统的目录查询、关键词查询模式相比,自然语言查询的优势体现在由于自然语言查询具有智能分词功能,因此使得查询变得更为简单、易于操作。采用知识(概念)检索技术,明确和缩小了搜索范围,减少了对无用信息的搜索。由于有综合知识库为背景,使得信息检索

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论