




已阅读5页,还剩78页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,2020/6/5,文献检索与论文导写zjupzq,网络信息资源检索的概念和发展历程网络信息资源检索的基本技术网络信息资源检索的发展趋势常用网络搜索引擎的原理和使用技巧,2,2020/6/5,文献检索与论文导写zjupzq,网络信息资源检索的概念和发展历程网络信息资源检索:是利用计算机通过网络来查找、利用各种信息资源。包括图书馆的公共书目(-PublicAccessCatalogue)、各种联机数据库、Internet上的信息资源等。,3,2020/6/5,文献检索与论文导写zjupzq,网络信息资源检索的发展历程脱机检索联机检索国际联机检索单机光盘检索光盘网络检索Web信息资源检索,4,2020/6/5,文献检索与论文导写zjupzq,1.脱机检索(50年代末60年代中期)这时是计算机检索的原始时期。只能进行简单的检索。为满足专业检索人员定期批量处理用户的情报要求。用户不能立刻获得检索结果。,5,2020/6/5,文献检索与论文导写zjupzq,2.联机检索(60年代末70年代初)1963年-1964年间,美国洛克希德导弹与宇航公司的情报实验室建立了”人机“对话的联机情报检索系统(DIALOG的前身),此后在60年代末到70年代初联机检索系统得以快速发展。国际著名的DIALOG系统、ORBIT系统、MEDLINE系统都是从这个时期发展起来的。用户可随时浏览检索结果由于这个阶段的计算机网络主要是通过电话线联接,因而联机检索受到地区的限制,6,2020/6/5,文献检索与论文导写zjupzq,3.国际联机检索(70年代中期)卫星通讯技术的出现,使得联机检索系统打破了地域限制。而数据库生产的迅速发展及微机大量的涌现,更使得国际联机检索蓬勃发展。联机检索系统进入发展的黄金时期。实现了人类情报资源的共享。,7,2020/6/5,文献检索与论文导写zjupzq,4.单机光盘检索(80年代-)CD-ROM技术促使计算机检索成本迅速下降(一张光盘可存贮600MB兆字节机读数据、成本价格便宜,而一张DVD光盘的容量最少可达4.7G)5.光盘网络检索(90年代)光盘网络是一种计算机网络,如图书馆局域网实现多用户光盘资源共享,8,2020/6/5,文献检索与论文导写zjupzq,6.Web信息资源检索(90年代末)进入90年代后,随着网络技术的发展,尤其是互联网的迅猛发展,使计算机检索进入一个崭新的时期。检索方法更简单,检索结果更全面,9,2020/6/5,文献检索与论文导写zjupzq,联机数据库检索,Onlineretrieval用户通过计算机终端设备,通过通讯线路或网络,在联机检索中心的数据库中进行检索并获得信息的过程最大的缺点是检索费用高现在用户量少,10,2020/6/5,文献检索与论文导写zjupzq,光盘数据库检索,CD-ROM数据库最初是单机检索,后来逐渐发展出了联机光盘检索联机光盘检索指把单用户系统发展成多用户的局域网系统,通过网络(如校园网)连接多个用户终端,用服务器管理多组光盘数据库及其检索系统,11,2020/6/5,文献检索与论文导写zjupzq,网络数据库检索,Web-database用户在自己的客户端上,通过互联网和浏览器界面对数据库进行检索,12,2020/6/5,文献检索与论文导写zjupzq,网络信息资源检索的特点,检索速度快检索途径多更新快资源共享检索更方便灵活检索结果可以直接输出,13,2020/6/5,文献检索与论文导写zjupzq,网络信息检索系统的构成,从物理构成来说,包括计算机硬件、软件和数据库、通讯线路和检索终端五部分,14,2020/6/5,文献检索与论文导写zjupzq,数据库的结构,文档记录字段文档(file):数据库中一部分记录的有序集合记录(record):数据库的信息单元,每条记录描述了一个原始信息的外部特征和内部特征。字段(field):比记录更小的单位,是组成记录的数据项目,15,2020/6/5,文献检索与论文导写zjupzq,网络信息资源的类型,1.参考数据库(Referencedatabase):指包含各种数据、信息或知识的原始来源和属性的数据库,主要包括书目数据库、文摘数据库、索引数据库,2.全文数据库(Fulltextdatabase)收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息为主,16,2020/6/5,文献检索与论文导写zjupzq,3.事实数据库(Factualdatabase):指包含大量数据、事实,直接提供原始资料的数据库。又分为数值数据库(Numericdatabase)、指南数据库(directorydatabase)、术语数据库(terminologicaldatabase)等,4.电子图书(electronicbooks)指供在电脑上阅读的一种新型的数字化书籍,是多媒体技术和超文本技术发展的产物。一般有专用电子图书阅读器。如:超星数字图书馆,中国数字图书馆有限公司的网上图书馆,书生之家“中华图书网”,方正Apabi电子图书,17,2020/6/5,文献检索与论文导写zjupzq,电子报纸(electronicnewspaper),将电子技术应用到涉及报刊出版、发行、利用的全过程纽约时报(Http:/)华盛顿邮报(泰晤士报(Http:/www.thetimes.co.uk)人民日报(Http:/)光明日报(Http:/)中国日报(Http:/),18,2020/6/5,文献检索与论文导写zjupzq,网络信息资源检索的基本技术,布尔逻辑检索(booleanlogic)是当今检索理论中最成熟的理论之一,也是构造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过布尔逻辑算符来实现的,这些运算符能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索要求,19,2020/6/5,文献检索与论文导写zjupzq,计算机检索式(逻辑表达式):检索词+有关算符1、布尔逻辑算符2、截词算符3、位置算符4、字段限定符,20,2020/6/5,文献检索与论文导写zjupzq,逻辑运算符(布尔逻辑检索:即运用布尔逻辑算符对检索词进行逻辑组配,表达两个概念之间的逻辑关系。)有三种:逻辑与(AND)逻辑或(OR)逻辑非(NOT),21,2020/6/5,文献检索与论文导写zjupzq,逻辑与:AND例如:dyslexiaandchild,常用“*”、“&”表示,检索时,命中信息同时含有两个概念,专指性强。可以缩小检索范围,提高查准率,22,2020/6/5,文献检索与论文导写zjupzq,逻辑或:OR例如:colororcolour,常用“+”、“/”表示,检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,可以扩大检索范围,提高查全率。,23,2020/6/5,文献检索与论文导写zjupzq,逻辑非:NOT例如:humannotanimal,常用“”表示,命中信息包含逻辑A、不包含逻辑B或同时有A和B的,排除了不需要的检索词,可以排除不必要的信息,提高查准率。,24,2020/6/5,文献检索与论文导写zjupzq,优先级运算()NOTANDOR,25,2020/6/5,文献检索与论文导写zjupzq,截词检索(truncation)截词符截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这个截词所有字符(串)的记录,系统都为命中。截词检索在西文数据库中广泛使用。是在词干后可能变化的位置加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既可减少检索词的输入量,又可扩大查找范围,提高查全率。,26,2020/6/5,文献检索与论文导写zjupzq,按截词的位置划分,前截断:又称左截断,截词符在词的左边,例如:*magnetic中截断:截词符在词的中间,例如:organi?ation,可以检索organisationorganization后截断:是前方一致检索,又称右截断,截词符放在被截词的右边,是最常用的检索技术,例如:librar*,27,2020/6/5,文献检索与论文导写zjupzq,根据截断的数量不同,无限截断:不限制被截断的字符数量有限截断:限制被截断的字符数量,例如educat*,可以检索educator、educated,28,2020/6/5,文献检索与论文导写zjupzq,按截词位置分:有前截断、后截断、中截断;按截词的字符数量分:有非限制截断、限制截断。*、?、&均可以表示截词的截断符号,各检索系统有不同的规定,没有统一标准。,29,2020/6/5,文献检索与论文导写zjupzq,1.后截断(前截断相同)后截断是在检索词词干后面加截词符,表示不限制或限制词尾可变化的字符数,即查找词干相同的所有词。从检索性质上讲,后截断是前方一致检索。非限制截断:是在检索词词干后面加一个截词符,表示不限制词尾可变化的字符位数,即查找词干相同的所有词。例:comput?表示允许其后可带有任何字符且数量不限,相当于查找compute、computed、computes、computing、computer、computers、computerize、computerized、computation、computations、computational、computationally等词。*不宜将词截得过短,否则容易造成误检。,30,2020/6/5,文献检索与论文导写zjupzq,限制截断:是在检索词词干后面加若干个截词符,表示限制可变化的字符数。例:fib?相当于查找fiber或fibre(EiCompendexPlus)librar?相当于Libraries,librarian,libraryeducat?相当于Educator,educated,31,2020/6/5,文献检索与论文导写zjupzq,2.中截断(通配符或屏蔽)是把截断符号置于一个检索词的中间,对词中间出现变化的字符数加以限定。一般中截断仅允许有限截断。例:organi#ation,可检索到包含organization和organisation的记录。一个?代表零个或任意个字符。例:colo?r,可检索到包含color、colour、colonizer、colorimeter的记录。一个?和数字,其中的数字代表可替换的字符数。例:colo?1r,只能检索到包含colour的记录。,32,2020/6/5,文献检索与论文导写zjupzq,词位置检索(positionaloperator)位置运算符利用布尔逻辑算符对检索词进行逻辑组配时,未限定检索词之间的位置关系,会影响某些课题的查准率并容易造成误检。为了弥补其不足,一般检索系统都提供文中自由词检索功能,也称全文检索功能(Fulltextsearching)。所谓全文检索是利用文献记录中任何有实义的关键词、词组或字符串作为检索词,词与词之间的位置关系可以用位置运算符来表达。位置运算符的使用,进一步强化了对概念的限制,比布尔逻辑运算符更能表达复杂的概念,并避免AND逻辑组配产生的词义含糊或误检。,33,2020/6/5,文献检索与论文导写zjupzq,为了提高检索的广度和准确度,常常需要对检索词之间的位置关系加以限定。*全文检索的运算方式,不同的检索系统有不同的规定,主要差别有两点:规定的位置算符不同;位置算符的职能和使用范围不同。下面介绍几种数据库经常使用的位置运算符:,34,2020/6/5,文献检索与论文导写zjupzq,1.W-WithW算符是With的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。所连接的词之间除可以有一个空格、标点或连接号外不得夹有任何其他单词或字母。例:intelligent(W)robot?(EiCompendexPlus)Wn(或nW)表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。但允许在连接的两个词之间最多插入n个单元词。例:intelligentw1robot*(OCLCFirstSearch),35,2020/6/5,文献检索与论文导写zjupzq,2.NNearN算符是Near的缩写,表示此算符两侧的检索词必须紧密相连,所连接的词之间不允许插入任何其他单词或字母。但词序可以颠倒。例:intelligentNEARrobot*(EiCPXWeb)Nn(或nN)表示在两个检索词之间最多可插入n个单词,且两词的词序任意。例:intelligentN1robot*(OCLCFirstSearch),36,2020/6/5,文献检索与论文导写zjupzq,3.Adj-adjacency邻接算符,表示在此算符两侧的检索词必须按所列词序排列,不能颠倒,两词之间不允许有其他的词或字母。相当于短语检索。例:intelligentadjrobot*(ElsevierScienceSDOS),4.F-Field同字段邻接例:environment(F)protection,5.P-Paragraph同自然段邻接例:environment(P)protection,6.S-Sentence同句邻接词序可以颠倒,两词必须出现在同一句子(子字段)中例:environment(S)protection,37,2020/6/5,文献检索与论文导写zjupzq,38,2020/6/5,文献检索与论文导写zjupzq,字段检索(rangesearching)字段检索即指定检索词出现的字段,被指定的字段也称检索入口,检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。西文数据库,字段检索常用代码来表示,如下表所示。,39,2020/6/5,文献检索与论文导写zjupzq,40,2020/6/5,文献检索与论文导写zjupzq,常有的字段:篇(题)名字段TI=Title文摘字段AB=Abstract叙词字段DE=Descriptor自由词字段ID=Identified著者字段AU=Author著者机构字段CS=CorporateSource刊名字段JN=Journal出版年字段PY=publicationYear文献类型字段DT=DocumentType语种字段LA=Language分类号字段CC=Classification,41,2020/6/5,文献检索与论文导写zjupzq,注意:目前各个检索系统所设立的字段是各不相同的,即同一字段,也可能采用不同的字段代码表示。如题名字段:EiCPXWeb中,用highwaytransport*withinTI来表示;OCLCFirstsearch中,用TI:highwaytransport*来表示。在进行字段检索时,为了避免出现检索误差,应先看一下该数据库的使用指南或说明。,42,2020/6/5,文献检索与论文导写zjupzq,例:EiCPXWeb网络版数据库主要字段的字段代码如下:CVEi叙词表受控语言TI题名AB文摘AU著者姓名AF著者机构名称ST连续出版物名称PN出版时间,43,2020/6/5,文献检索与论文导写zjupzq,构造检索提问式示例:课题:数字化图书馆的文献检索服务检索概念分析:documentretrieval并列概念documentdeliverydocumentdeliverysystemdigitallibrary同义词virtuallibraryelectroniclibrary,44,2020/6/5,文献检索与论文导写zjupzq,检索提问式:(documentWretrievalordocumentWdeliveryordocumentWdeliveryWsystem*)and(digitalWlibrar*orelectronicWlibrar*orvirtualWlibrar*)recordfound:11(OCLCFirstsearch),45,2020/6/5,文献检索与论文导写zjupzq,禁用词表,在西文数据库中,系统对信息进行标引时,不能做标引词或检索词的语词包括介词、冠词、代词、连接词、某些形容词或副词等如a、and、for、in、she、should、the、well、only,46,2020/6/5,文献检索与论文导写zjupzq,搜索引擎,搜索引擎(searchengine),1995年开始搜索引擎以一定的策略从网络收集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。搜索引擎站“网络门户”,47,2020/6/5,文献检索与论文导写zjupzq,搜索引擎的工作原理,信息的收集处理信息的检索输出,48,2020/6/5,文献检索与论文导写zjupzq,搜索引擎的分类,目录式搜索引擎:以人工或半自动方式收集信息,按某种分类法进行加工整理Yahoo!、Galaxy、OpenDirectoryShou(搜狐)、Sina(新浪).机器人搜索引擎:由一个称为Spider的机器人程序以某种策略来.Google、AltaVista百度、天网.,49,2020/6/5,文献检索与论文导写zjupzq,搜索引擎的分类,元搜索引擎将用户的查询请求同时向多个搜索引擎递交,将返回的信息进行重复排除、重新排序等处理后,作为自己的结果返回用户。WebCrawler、InfoMaker,50,2020/6/5,文献检索与论文导写zjupzq,常用的一些搜索引擎网址(一),雅虎是中国最著名的目录索引,是搜索引擎开山鼻祖之一。它收录了全球资讯网上数以万计的中文网站,不论你要找的网站是用国标码简体字、大五码繁体字还是图形中文,都可以在这里找到。1999年9月,51,2020/6/5,文献检索与论文导写zjupzq,52,2020/6/5,文献检索与论文导写zjupzq,检索途径通过分类目录、关键词检索检索方法与技巧支持布尔逻辑检索(不支持“OR”)、可以使用引号,强调“+”、“-”、指定关键字出现的段落(加t:、加u:),53,2020/6/5,文献检索与论文导写zjupzq,检索结果根据关联程度排序同时列出“相关。”其它与Google合作,54,2020/6/5,文献检索与论文导写zjupzq,常用的一些搜索引擎网址(二),1998年创立,搜狐“分类与搜索”已收录网站四十多万,已形成庞大的中文网站数据库。搜狐的目录导航式搜索引擎完全是由人工加工而成,相比机器人加工的搜索引擎来讲具有很高的精确性、系统性和科学性。,55,2020/6/5,文献检索与论文导写zjupzq,56,2020/6/5,文献检索与论文导写zjupzq,检索途径通过分类目录、关键词检索检索方法与技巧支持布尔逻辑检索、“”、“&”、“/”、“()”、空格,57,2020/6/5,文献检索与论文导写zjupzq,检索结果根据关联程度排序返回五种分类结果其它直通车搜狐黄页,58,2020/6/5,文献检索与论文导写zjupzq,常用的一些搜索引擎网址(三),1997年,(简体中文)提供有类目检索和网站检索两种方式。支持和“-”等条件查询。以搜索精度高、速度快成为最受欢迎的搜索引索,是目前搜索的领军人物。,59,2020/6/5,文献检索与论文导写zjupzq,60,2020/6/5,文献检索与论文导写zjupzq,检索方法与技巧模块分类、关键词检索支持布尔逻辑检索(自动添加AND),不支持“OR”,“-”前面加空格忽略常见词,61,2020/6/5,文献检索与论文导写zjupzq,检索特色网页快照、手气不错相似网页、查询电话号码、查找PDF文件、股票报价、查找字典释意、用Google查找地图、工具条服务、网页翻译、单词纠错、繁简转换使用偏好,62,2020/6/5,文献检索与论文导写zjupzq,常用的一些搜索引擎网址(四),中国提供搜索引擎的主要网站中,超过80%由百度提供。1999年底,百度成立于美国硅谷,2000年百度回中国发展。是国内唯一商业化的全文搜索引擎,提供搜狐、新浪、263、TOM等站点的搜索服务。,63,2020/6/5,文献检索与论文导写zjupzq,64,2020/6/5,文献检索与论文导写zjupzq,检索方法与技巧模块分类、关键词检索要求“一字不差”,支持布尔逻辑检索(可以用空格代替AND/+)可以使用检索语法,65,2020/6/5,文献检索与论文导写zjupzq,检索特色百度快照、自动纠错、百度搜霸使用偏好,66,2020/6/5,文献检索与论文导写zjupzq,百度与google比较,搜索英文不必说用google,搜索中文呢?很多人并不了解它们更新的情况,google发展早,因而它贮存了大量旧的信息,百度发展迟,信息较新。更新速度:对中文google一般半月至一月一更新,而且仅搜索到三级链接,三级以下便不在搜索,那么我如何看到最新的google搜索的结果呢?这个站点:,67,2020/6/5,文献检索与论文导写zjupzq,百度和google语法的应用,找特定文件名的文件,尤其是PDF、ZIP、swf、DOC、TXT、RAR、EXE、RM、Mp3,MOV,PPT这些文件名都是网友想找的重点,至于各是什么类型文件,请上网查一下便知道了,这里不多说了。尤其老板让你做个powerpoint,找不到图怎么办?用google去搜索。,68,2020/6/5,文献检索与论文导写zjupzq,方法是利用语法filetype:后缀名。如找PDF文件,在正常关键词后面加filetype:PDF即可,搜索结果全是PDF文件。找特定题目的网页语法intitle:网站查找友情链接:link:(英文单字link后加冒号)用于搜索链接到某个URL地址的网页。可以了解有哪些网页把链接指向您的网页。,基本搜索语法查找文件,69,2020/6/5,文献检索与论文导写zjupzq,查找特定站点:site:www.*.com如金庸古龙site:但不可加入http:/或/这类,否则是错的。查找美国教育网上的宇宙大爆炸jpg图片搜索:“BIGBANGfiletype:jpgsite:edu”结果:搜索有关BIGBANGfiletype:jpgsite:edu的图片,基本搜索语法查找站点,70,2020/6/5,文献检索与论文导写zjupzq,Site可将搜索定位于某一个域名上,有利于缩小搜索范围,提高搜索效率。如keywordssite:edu,效果很好!可以方便地搜索到各大学内有用的资源。site:tw,site:edu.tw,site:.这是定位于国家或地区,将搜索局限于某些国家或地区,或加上edu,则是这些国家或地区的大学,效果自然更好。如果site:则搜索国内医科大学内的资源(会漏综合性大学的资源的,要慎用)。,71,2020/6/5,文献检索与论文导写zjupzq,特殊语法:inurl,“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。,72,2020/6/5,文献检索与论文导写zjupzq,INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。示例:查找MIDI曲“沧海一声笑”。搜索:“inurl:midi沧海一声笑”结果:已搜索有关inurl:midi沧海一声笑的中文(简体)网页。,73,2020/6/5,文献检索与论文导写zjupzq,注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。例如,GOOGLE会把“cgi-bin/phf”中的“/”当成空格处理。,74,2020/6/5,文献检索与论文导写zjupzq,google其它功能查缩略词的全称,利用google查缩略词的全称,如果写作时突然忘了某个缩略词的全称,当时手头若有金山词霸等软件则是易事,若无可考虑使用google,将其中文名与其缩略名作为关键词搜索,效果很好,如:不知道血管活性肠肽(VIP)的全称,可在google中输入血管活性肠肽V
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国山茶花行业投资前景及策略咨询报告
- 2025年中国种鸭行业市场发展监测及投资战略咨询报告
- 2025至2030年中国对甲砜基苯甲酸行业投资前景及策略咨询报告
- 中国儿童棉毛套装行业市场发展前景及发展趋势与投资战略研究报告(2024-2030)
- 2025至2030年中国启闭机自动控制仪市场调查研究报告
- 2025至2030年中国双炉膛无烟锅炉行业投资前景及策略咨询研究报告
- 2022-2027年中国水利行业信息化行业发展监测及发展战略规划报告
- 2025年中国自动化立体仓库市场竞争格局及投资战略规划报告
- 2024-2030年中国视频监视器行业发展潜力预测及投资战略研究报告
- 2025年中国电推剪行业市场发展监测及投资战略咨询报告
- 《人工智能技术基础》课件-第六章 知识图谱
- 2025年山东省济南市市中区中考物理一模试卷(无答案)
- 商业秘密保护:内外勾结型侵犯行为的司法认定分析
- 2025年全国中小学生安全教育日专题
- 2025年电子设备装接工岗位职业技能资格证考试题(附答案)
- 2025年河南航空港发展投资集团有限公司社会招聘45人笔试参考题库附带答案详解
- 2025太阳能光热发电站熔融盐储热系统技术
- 2025年安阳职业技术学院单招职业技能测试题库及答案一套
- 2024年全国高考新课标Ⅱ卷数学试题含答案解析
- 2025延长石油(集团)限责任公司社会招聘高频重点提升(共500题)附带答案详解
- 2025年山东国际信托股份限公司社会招聘高频重点提升(共500题)附带答案详解
评论
0/150
提交评论