【大数据时代人工智能在网络信息检索中的应用探究(论文)6000字】_第1页
【大数据时代人工智能在网络信息检索中的应用探究(论文)6000字】_第2页
【大数据时代人工智能在网络信息检索中的应用探究(论文)6000字】_第3页
【大数据时代人工智能在网络信息检索中的应用探究(论文)6000字】_第4页
【大数据时代人工智能在网络信息检索中的应用探究(论文)6000字】_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据时代人工智能在网络信息检索中的应用研究目录TOC\o"1-2"\h\u16270正文摘要 111279引言 26928一、网络信息检索概述 26454(一)网络信息检索的定义 217209(二)网络信息检索系统的发展 21534二、人工智能概述 412468三、网络信息检索的工具 430517(一)FTP类 412470(二)基于关键词的分类 531315(三)基于菜单式的分类 59103四、大数据时代人工智能在网络信息检索中的应用 572531.网络智能知识服务系统 51322.智能代理技术 693803.人工智能搜索代理技术 720911五、结语 77163参考文献 7正文摘要自从上世纪以来伴随着当前经济全球化、科学技术以及社会信息化的的迅猛发展,在各个领域内部网络的普及与应用是人们有目共睹的,网络的出现与发展为人们提供了很大的便利很大程度上改善了人们的生活以及思维方式。但是正是由于网络的迅猛发展,信息量就变得十分庞大,人们在检索信息的时候会遇到很大的阻力与困难。在网络飞速发展的当下、大数据时代背景下人工智能的应用,就使得网络信息检索更加的方便快捷缓解了人们网络信息检索遇到的问题。由此本文阐述什么是网络信息检索,并探讨网络检索工具的类型加以分析使用人工智能在网络信息检索中的用途及效率。关键词:大数据;网络信息检索;人工智能引言当下我们已经步入了信息化时代,任何人都可以使用网络轻易的搜索到自己需要的信息,使得人们获取信息的代价大大降低。相比于纸质版的传统检索方式,网络信息检索有很大的优势,但它也有着或多或少的缺陷与不足,例如搜索引擎的不完善会导致在检索信息时出现信息无效的情况,并且会因为数据的急剧膨胀导致检索效率下降,难以准确辨别数据。而人工智能就能有效的应对这样的情况,能够快速自动的将数据分类从而提高在海量数据中检索的效率,并且数据的准确性也可以得到极大的保证,从而促进网络信息检索的快速发展。一、网络信息检索概述(一)网络信息检索的定义网络信息检索即是利用互联网中的各种搜索引擎对信息的查找,用户可以借助移动客户端或者终端通过关键字来获取自身所需的数据信息。这是因为在互联网服务其中储存着大量的信息内容,用户通过终端设备和网络接口软件来对分散的信息进行查询和应用。而信息检索的原理则是对已有的信息根据一定的方式管理组织起来,在寻找信息的过程中,用户借助检索工具从信息集合中将有效信息进行提取,从而获取所需信息内容。实际上信息检索也是一种信息过滤技术,在信息集合中按照用户输入的数据进行过滤和查询,最终通过筛选提供给用户。(二)网络信息检索系统的发展二十世纪九十年代以来,随着互联网的快速普及使得网上的信息资源在不断的急剧增加,为了应对此情况,人们就开发了各种类型的数据库用来存储这些数据。应为数据的不断膨胀,也间接促进了信息检索的技术的不断发展,同时使得信息检索系统在各方面也不断的完善技术上也有了很大的改进和发展。在信息检索系统的发展历史上可以被划分为三个较大的阶段。1.布尔逻辑检索和分类检索为主的信息检索系统布尔逻辑检索和分类检索是出现的最早的功能完善的一代的信息检索系统。它主要根据mu数据文献的类型及作者、摘要等信息作为信息搜索的判断条件,并且每个相关的检索条件之间是有布尔的逻辑运算来对数据进行匹配从而得出想要的结果。在信息检索的时候会对数据库的数据进行一次引用标记的阶段,主要是标记一些关键词匹配的信息,再通过一些指定的方法来构建一个有序的二次文献的数据库,这部分数据将会保存在内存中,并运用一些相关的算法将检索出来的数据组成一个信息检索系统。用户再输入相关的检索词进行检索信息时,信息检索系统就会通过用户提供的关键词来对数据进行过滤,并与数据库中文献记录的标记标识来进行匹配,最后筛选出数据库中与用户输入检索词匹配的的数据集。除此之外数据库还可以按不同的行业、时间等方面进行分类,并将分类的条目作为信息检索是的索引从而提高检索效率2.使用加权检索和追踪检索技术改进的信息检索系统这个套检索系统是融合了布尔逻辑检索及分类检索两套检索系统的优点,[3]同时在它们的基础之上有增加了一套加权检索技术和追溯法追踪检索技术的信息检索系统。在检索是不同类型的数据可能代表的含义是不一样的,但是有可能包含过滤条件,所以检索的时候就被查询出来。为了体现对不同类型的数据的权重,通常在查询数据的时候加上一个权值,判断完数据是否存在后,通过添加的权值计算出数据的权重。再根据得到的这个这个权重使用排序算法将数据进行一次从小到大的排序,使得权重高的优先显示,从而提高检索的准确性。信息检索系统在对文献数据进行存储时通常会对其作者、机构和相关的引用建立一定的连接,以此来起到一个追溯的效果,这样也可以使得各信息资源之间相互关联,起到一个融合的作用。相比第一阶段的信息检素系统,第二阶段的信息检索系统通过加权和追溯的优化在信息的整合能力上变的更强,查询数据时的淮率也得到了不错的提高,在检索方式上也具有多样化。3.开展知识服务的信息检索系统。开展知识服务的信息检索系统是第三阶段的信息检索系统,它比前两个阶段的的检索系统在网络信息检索的表现上更加出色。它通过对以前两个阶段系统的一个改进优化,实现了对相关的符合条件的检索信息进行高度整合,不但提供了对检索出来的数据进行了统计分析,还增加了与结果数据集知识服务相关的信息检索系统。在用户对指定的数据进行检索信息时,检索系统在检索出结果的同时,还增加了按照信息的不同维度进行统计,例如主题、年份、作者等维度上的统计,采用图的形式对数据进行整理,以更直观的视角效果将检索的结果展示给用户。相比于前两个阶段,第三阶段开始融合知识服务的思想,在对数据的统计整理上已有了一个基本的概念,也从一种被动服务的状态转化为主动服务的方式。二、人工智能概述其实,人工智能就是利用机器来模拟和感知人们做事时所感受到的现实,在此基础上,我们可以做出更有效的判断和决策,使机器能够处理复杂的问题,只有人类专家才能做到。因此,人工智能的本质还在于大脑模拟。人工智能的最大特点是基于可靠的知识来解决问题,它需要一个相对完整的以推理为核心的系统来实现知识的重组和利用,可以分为逻辑学派和知识工程学派。虽然各个学派的研究方向不同,但研究方向与人工智能的结构和功能是一致的,也就是说,KI应该由中间数据库、解释器、知识获取、用户界面、知识存储和推理机六部分组成。首先,以人工智能系统中长期存储的知识库为例,它存储的是专业知识、确认的事实和信息,也有常识和规则。一些特殊系统包含数据库。其次,参数是搜索任务的组成部分,包括主控件和各种任务程序。作为一个特殊的数据库,它提供搜索支持,用户界面主要包括系统和用户对相关信息的输入和传输。作为外部信息与内部化之间的桥梁,它可以向最终用户展示处理的结果,并将用户的意思传达给计算机,非自然语言的使用可以减轻用户在使用过程中的负担和压力。中间数据库又称表,主要用于存储任务执行和论证过程中的中间结果和数据,系统首先在表上显示问题,然后指示问题的初始状态。专家系统根据知识库中知识调用的一致性工作,不断生成和归纳表的内容。必要时,他们会在知识库中向顾客传授知识,因此,董事会在某种程度上可以看作是一个动态的知识库,在控制过程中起着关键的作用。最后,该设备也被称为学习者,其主要任务是系统的操作,是保证系统顺利运行的有效补充,在零体验后进一步修复知识库。翻译人员主要负责解决用户的问题,并负责向用户解释系统锁的处理过程,葡萄酒一般由人工智能机器控制,通过技术和仿真,可以帮助人们解决紧迫的问题。三、网络信息检索的工具(一)FTP类FTP是一个文件传输协议,需要在用户登录到指定的客户机后才能对相关的文件进行检索,类似于一个检索的门户系统。FTP支持传输的数据类型非常丰富,如一些文本文件、二进制文件及图像文件等。在FTP类型的检索工具中最为常见的莫过于Archie,它的性能也是非常优越。Archie是基于FTP的一类自动标题检索工具。用户在使用时可以直接输入需要检索的文件名,然后Archie就可以自动的获取到相关文件的主机名和文件路径等信息。有了这些相关的信息后,用户就可以准确的获取到想要的资源文件。(二)基于关键词的分类用户在使用WAIS是无需关系检索的信息在网络中的哪些计算机上,更不用关心系统是通过何种方法来获取这些文件的。[5]WAIS检索的大致流程为:第一步WAIS会通过用户的选择获取到数据源的信,在接着在选定好的数据源中对指定的关键词进行检索,这一过程系统会自动进行远程检索,无需用户关系具体的检索步骤;查询完成数据后后,WAIS会通过结果的权重对结果进行一个排序,然后将排好序的数据通过可视化的方式展示给用户查看。(三)基于菜单式的分类它是一类分布式的信息检索工具,这类信息检索工具可以将用户发出的检索请求转换成与之对应的FTP或Telnet命令。能够对用户的实际需求的分析选择与之匹配的信息结果,它再以菜单的形式逐级的引导用户,可以让用户通过自定的选择方式来选取出自己感兴趣的信息资源,通过该方案解决了用户对操作系统不熟悉及对想要检索信息不熟悉难以检索的问题,用户可以很轻松在一级一级的菜单选项中轻松的查询到想要的信息,用户可以轻松自如的驾驭这套系统。四、大数据时代人工智能在网络信息检索中的应用1.网络智能知识服务系统(1)在计算机网络信息检索中应用人工智能主要是在网络智能信息服务系统中,其可以分为四个部分,其一是智能信息处理系统,其主要的功能和作用是将网络下载的信息进行合理的分类,然后根据关键词进行相似度匹配,最后将通过筛选和审核的信息数据传入到信息数据库中。主要的流程是根据检索信息的类型和内容按照特定的规则和方法进行合理分类,完成后进入到智能匹配环节;其次是将信息数据库内的分类规则与分类信息进行比较筛选,可以有效防止出现信息重复、占用计算机内存等现象,然后智能匹配和筛选结构会进入到智能更新流程中;通过匹配的结果可以决定信息储存到数据库或者是对原有的信息进行替换,或者也可能出现新载信息与原有信息的合并,构成一个相对完整的数据内容;最后智能数据库会定期对信息进行清理和更新,避免出现信息重复,及时释放内存,保障计算机系统的良好运行。(2)是信息采集系统,网络信息检索需要丰富的信息数据库支持,所以智能信息采集系统即是对信息库内的数据进行收集、整理、更新替换、补充等。通常情况下信息采集系统包括了印本信息采集以及数字数据采集。印本信息采集就是对传统的纸张书本知识进行扫描和录入,并实现数据转换,这一过程必须要借助人工智能的作用将文本转换为数字形式。而数字数据信息采集就是针对网络的数字资源进行采集,其是由站点镜像、智能信息监控、智能资源发现和智能信息资源转化四个部分组成,站点镜像即是对网站中的信息内容进行完全复制,将其下载到系统后台可以提高采集的速度。智能信息监控是对网络检索目标信息进行自动坚实,如发生变动和更新,则计算机本地系统内储存的信息也会随着更新。智能资源发现是针对目标门户网站,一旦出现符合网络信息检索的内容则会进行自动采集。智能信息资源转化是对数字资源进行采集和分类,从而整合为一个新的信息知识概念。(3)智能信息储存系统,其是网络信息知识库中的一个重要组成部分,能够有效的保障网络信息检索的效果和质量。一般智能信息储存系统分为软件、硬件和检索系统三个构成部分,软件就是网络信息存取管理系统,可以保障计算机系统能够相对高效的读取或者存档。硬件则是储存大量信息内容的设备设施,检索系统是软件和硬件的结合应用,在人工智能的作用下能够提高网络信息检索的效率,同时人工智能也能够对信息储存系统进行开发和改善,以提高网络信息检索服务性能[5]。2.智能代理技术智能代理技术是麻省理工学院从上世纪80年代开始的。它是人工智能研究的重点领域。在大数据时代的人工智能领域,基于互联网普及和发展的智能代理技术被广泛应用于互联网信息检索中,通过一系列的软件程序,经过用户授权,创建了软件代理通信协议,促进软件和用户之间的信息交互。同时,软件程序对用户的交互比较准确,它可以为网络信息系统提供,例如,用户想查找信息,但不能确定位置关键字,智能代理提供模糊关键字,智能代理技术为用户提供了网络搜索的轨迹、偏好、搜索结果等信息,在习惯之后我们可以对模糊关键词进行分析、查询和跟踪信息,去除无效和无用的数据,接收必要的信息,这在搜狗等常见的搜索引擎中随处可见。然而,智能代理技术对信息的分类并不准确,而且用户搜索主题的内容很多,因此需要人工搜索。由于模糊信息的方便性和准确性,使得网络中的信息更加准确,这是信息获取的常用技术之一。在使用智能活性物质时,其主要功能也是利用人工智能,比如网络管理可以让用户在短时间内找到合适的网站或平台下载信息数据,并且可以计算和监控资源丢失等网络资源点的信息,而智能网络管理可以对资源相对宽泛、服务器松散的网站进行优先排序,减少网络过载的影响,提高资源需求和下载效率,实现智能信息管理,用户可以充分了解网络信息资源的分布情况,帮助用户自定义搜索词,通过人工智能对目标信息进行过滤,并根据所按用户的喜好改变相应的信息内容。3.人工智能搜索代理技术在网络信息检索应用智能代理技术的过程中,衍生出了智能搜索代理服务,可以针对不同的用户指定具有针对性的搜索服务方案,依据用户平时的搜索偏好以及网络习惯等进行检索和分类,比如用户在检索某一类网络信息时,人工智能搜索代理技术可以对以往检索信息记录,分析用户对信息的关注程度和类型,结合同一类用户检索的信息关键词制定一个相对比较合理的搜寻方案,用户在输入相关信息时则可以提供潜在的网络信息需求方案。五、结语在大数据时代背景下人们对网络信息检索的需求愈来愈大,这也使得网络中的数据也来越多,并且人们对网络信息检索

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论