【信息检索方法研究4500字(论文)】_第1页
【信息检索方法研究4500字(论文)】_第2页
【信息检索方法研究4500字(论文)】_第3页
【信息检索方法研究4500字(论文)】_第4页
【信息检索方法研究4500字(论文)】_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索方法研究目录TOC\o"1-2"\h\u29794信息检索方法研究 120663一、信息检索技术概述 117578(一)信息检索在国内的背景 112973(二)信息检索在国内的现状 27425(三)信息检索的发展 219231(四)信息检索对于大学生的作用 26888二、常见的检索技术 230931(一)常见信息检索的操作技术的原理 29263(二)信息检索的操作技术 33060(三)信息检索的基本操作平台 411143三、大学生信息检索应用实践 619162(一)对于信息检索的理解和在生活中的应用 610921(二)信息检索对于自身的应用 627157link:用来查找链接到某一个网站的所有网页 151722(三)检索的具体实践 1530937四、总结 18[摘要]在知识经济和信息全球化的时代背景下,人们每天都被海量的信息所包围。为了更好地迎接信息时代的挑战,大学生必须从自身做起,增强自己的信息素养。信息检索能力作为大学生信息素养的重要组成部分,在学习和科研中发挥着非常重要的作用,是大学生在“信息爆炸”的时代所必备的一项基本技能,是大学生实现终身学习理念的必要条件。文章在对相关大学生信息检索、文献资料搜集及整理基础上进行梳理及归纳[关键词]大学生;信息检索研究;信息检索实践;一、信息检索技术概述(一)信息检索在国内的背景信息大量涌入的时代已经到来,现代意义上的信息检索出现在二十世纪五十年代。随着计算机的大量使用和互联网的发展,信息检索已经实现了网络数字化和交互化,大大提高了人们的工作、学习和研究的效率。21世纪是知识经济和信息全球化的时代,计算机技术和网络技术迅猛发展,各种信息充斥着大众的生活,人们每天都被海量的信息所包围。为了更好地迎接信息时代所带来的挑战,大学生必须从自身做起,增强自己的信息素养。对高等教育来说,大学生信息检索能力是适应现代社会发展的必要技能,是信息素养的重要组成部分,对学习和科研有重要意义,是实现终身学习的重要保证。(二)信息检索在国内的现状在我国信息检索随处可见,人们走在街上利用手机对想要的事物进行检索等,在现在信息数量急剧增长的背景下人们对信息检索的要求也随之提高,信息检索面向的对象也随之扩大。无论是在工作还是学习或者是在日常生活中,我们对于信息的渴求也在日益的增长。(三)信息检索的发展信息检索技术从最初的手工进行检索,到后来的计算机检索阶段,到如今网络检索的时代,信息检索在我国得到了飞速的发展。信息检索的飞速发展也正好满足了现在处于信息大爆炸时代的人们对于信息探索的渴望。除了传统的利用Web进行信息检索外,在企业和大型系统中还可以利用sql代码进行高效的查询。对于不同的人群,提供了专门的查询网站。例如:想要查询某一论文可以在知网上进行专门的检索,想要搜索计算机科学的相关资源可以上CiteSeer进行检索。在信息大爆炸的时代,信息检索对大学生的要求也越来越高。(四)信息检索对于大学生的作用在我国,利用网络信息化来带动教育现代化,使得大学生对于某些知识点有了更加广泛的认知,拓宽了知识的宽度,信息技术在大学生的学习发展中的作用主要有:它可以产生新的学习方式,让学习者使用各种移动终端在任何地点进行学习活动,使学习变得更加便捷、更具个性化和生活化;可以为教育提供强大的资源也能将一些前所未有的教学方式搬上课堂,让学习的方式更加具有多元化。提高大学生的科研能力利用信息检索技能,通过检索互联网学术平台和相关专业数据库,可以了解到学科领域的研究动态和发展前沿,再结合自己的专业特长,结合生活实际,检索阅读大量相关文献,找寻交叉研究空白领域,找寻到自己的科研兴趣开展研究。二、常见的检索技术(一)常见信息检索的操作技术的原理(1)信息标引和存储过程。标引是用检索语言和分类号、主题词等标识符号来表示信息,通过对大量无序的信息资源进行标引处理,使之有序化,并按科学的方法存储起来,并组成检索工具或检索文档--组织检索系统的过程。(2)信息的需求分析和检索过程。分析用户的信息需求,利用组织好的检索系统,按照系统提供的检索方法和途径检索有关信息检索系统的应用过程。因此,信息检索的实质是将描述用户所需信息的提问特征与信息存储的检索标识进行比较,从中找出与提问特征一致或基本一致的信息。(二)信息检索的操作技术1.布尔逻辑检索利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。2.截词检索截词检索是计算机检索系统中应用非常普遍的一种技术。由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。这是就要用到截词检索3.邻近检索位置检索也叫全文检索、邻近检索。所谓全文检索,就是利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。4.短语检索将一个短语或词组作为一个独立运算单元进行匹配,以提高检索精确度的方法和技术。在实践中,为了使系统能将一个词组或短语视作一个独立运算,常常采用双引号将其括起来的方法。5.字段大小检索字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在检索系统中,数据库设置的可供检索的字段通常有两种:表达文献主题内容特征的基本字段和表达文献外部特征的辅助字段。6.区分大小写检索区分大小写检索是指在对于要进行检索的英文单词在大小写不同的情况下对应含义也不同。(三)信息检索的基本操作平台1.百度百度拥有全球海量的中文网页库,截至2010年收录中文网页已超过200亿,这些网页的数量每天正以千万级的速度在增长;同时,百度在中国各地分布的服务器,能直接从最近的服务器上,把所搜索信息返回给当地用户,使用户享受极快的搜索传输速度。2.知网知网的背后是一个巨大的国家工程拥有海量的中文文献,包括剑桥大学、牛津大学这样顶级大学的数据库,以及美国、韩国、法国等国科学技术数据库,成为了一个具有国际性的知识资源平台。3.谷歌GOOGLE搜索引擎是由两名斯坦福大学的理学博士生拉里·佩奇和谢尔盖·布林在1996年早期建立的,他们开发了一个对网站之间的关系做精确分析的搜寻引擎,此搜索引擎的精确度胜于当时使用的基本搜索技术。当时项目被称作BackRub,因为系统会检查backlinks(反向链接),以评估站点的重要性。4.CiteSeerXCiteSeerX是免费论文搜索网,是CiteSeer的换代产品,而CiteSeer引文搜索引擎是利用自动引文标引系统(ACI)建立的第一个学术论文数字图书馆。CiteSeerX的检索界面简洁清晰,默认为文献(Documents)检索,还支持Authours、tables检索。若选择“IncludeCitations”进行搜索,期刊文献等检索范围会扩大,不仅包括学术文献全文的数据库,还会列出数据库中每篇论文的参考文献。点击“AdvancedSearch”,还可以进入高级检索界面。5.FindaRticlesInformationFindArticles作为文献论文搜索引擎,提供了多种顶极刊物的上千万篇论文,涵盖多方面的内容,包括艺术、商业、计算机与技术等。该网站大部分为免费全文资料,检索操作简单,查找十分方便。FindaRticles资料来源较为广泛,主要是来自于杂志、定期刊物和报纸等。三、大学生信息检索应用实践(一)对于信息检索的理解和在生活中的应用在生活中,我们离不开对于信息的渴求,特别是在当今信息大爆炸的时代,信息检索显得尤为的重要,在学习上,我们可以利用信息检索对知识的查阅和对文献的收集,在更多的时候对于课堂上的一个知识点没能弄明白时,利用信息检索寻找另一种学习的方式,例如:寻找相关的慕课,参加一些线上培训等。在日常生活中我们可以在购票软件上利用信息检索及时的查询到当日班次想要乘坐的交通工具,并且可以以较优惠的价格进行购买。(二)信息检索对于自身的应用1.利用布尔逻辑检索进行检索布尔逻辑检索的规则:与:and,*,&例如:搜索宜宾40周年则可以利用and逻辑关键词或:or,+,|例如:想要查找宜宾学院和四川轻化工大学则可以搜索“宜宾学院”|“四川轻化工大学”在谷歌浏览器上搜索非:not,andnot,-,!例如:想要在网上检索手机这个关键词但是不想要苹果手机则可以进行如下操作:在百度直接搜索得到的结果并不是我们想要的如图:如果想要在百度上得到搜索结果除了苹果之外的手机的话则需要利用高级搜索方式,具体关键操作如下:也可以在谷歌浏览器上搜索2.截词检索截词检索符:*,?前截词:*中截词:?后截词:*例如:想要知道有那些单词以*ology开头的的时候则可以在onelook上支持这种运算在有道词典和金山词典上并不支持查询不到想要的结果同样也查询不到想要的结果搜索开头为te结尾为ch的单词同样有道在线词典和金山在线词典不支持这种运算例如:想要查找tech开头的单词有道在线词典不支持这种运算金山在线词典不支持这种运算3.邻近检索PRE/0,P/0:顺序不能颠倒,中间不能插入其他词但是可以有空格逗号之内的符号例如:在浏览器中搜索"Wuhan"P/0"University"得到一下结果:PRE/#,P/#:顺序不能颠倒,中间最多能插入#(数字)这么多的单词例如:在浏览器中搜索"Wuhan"P/5"University"得到一下结果:NEAR/0,N/0:顺序可以颠倒,中间不能插入其他词但是可以有空格逗号之内的符号NEAR/#,N/#:顺序可以颠倒,中间最多能插入#(数字)这么多的单词例如搜索"Wuhan"N/3"University"4.字段检索title(ti)在不同的数据库中还可能使用/ti,ti=等都是用来限制后面的检索词必须出现在题名字段中py>=2020表示2020年以来出版的著作或者发表的论文la=Englishlink:用来查找链接到某一个网站的所有网页admissionANDsite:表示我检索的资料限制在这个网站中检索au=xxxAND(xx=xxxx):限制作者和其著作名(三)检索的具体实践在对于我的一次实践过程中我想利用信息检索收集一些有关Python机器学习方面的相关论文的时候,在利用信息检索的时候我利用多种检索方式对自己想要的结果进行检索,具体检索步骤如下:进入知网然后再搜索栏里面查找想要搜索的相关论文名但是这里需要注意的是:在搜索栏的左边有一个选项它的作用就是让读者选择检索的方式例如:主题、篇关摘、关键词、篇名、全文、作者、第一作者、通讯作者、作者单位、基金、摘要、小标题、参考文献、分类号、文献来源、DOI。我在选择检索方式的时候我选择篇名能够让含有Python和机器学习的标题的文章检索出来后来又在CiteSeerX收集和查看更多的有关机器学习的相关论文资料这样我们通过几个论文检索网站共同检索出的结果可以有更多的参考。例如在我们日常的生活中直接在百度的搜索栏里面搜索一些想要的东西的时候得到的结果往往并不能得到我们的满意其中可能参杂着很多的广告例如直接在搜索栏里面输入:手机则得到的结果如下:其中包含着京东等一些电商的广告,但是我们并不需要这些东西所以想要在百度上获得更加精确的搜索则可以在百度的检索界面的设置里面选择高级搜索然后得到如下界面:然后再里面输入自己想要查找的关键词和不希望出现的关键词得到的搜索结果里面就没有含有手机的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论