版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
网络资源与信息检索MarineCollege,ShandongUniversity,Weihai,2021信息类别电子信息联机信息资源、光盘资源、Internet资源数据库文献数据库〔书目、期刊、专利数据库〕事实数据库〔物理化学性质、光谱、结构解析〕在线数据库…文献检索在科研中所占比例进入一个新课题的过程读书,打好根底找综述性文章〔中文综述一般水平都还挺高〕,了解研究状态如果能找到博士论文就太舒服了看会议文章,最新成果尽在于此研读重要的期刊文章〔除中文一级刊物外,一定是英文的〕要学会通过参考文献顺藤摸瓜什么样的文章有价值被引用次数高的在等级高的期刊或会议发表的作者牛的国际联机检索系统DIALOG系统ORBIT系统STN系统BDS系统检索流程到SCI、Ei、CA、Reaxys等检索有的有全文链接,但不怎么好用到ElsevierScience找全文运气实在不好,就再来这里://找作者要可惜没有一个终极搜索引擎图书馆购置、拥有使用权的电子资源〔网络资源〕
由IP地址限制,专线访问,免费使用并发用户〔??人〕注意:严禁过量下载即在一定时间内集中、批量下载全文数量超过50篇以上
电子资源知识产权文献检索概论导致文献量急剧增加,重复量大;文献分布异常分散,查找利用困难;文献寿命越来越短吸收信息的能力不高对信息进行有序化处理,可提高检索和利用的效率。信息爆炸电子期刊数量增长趋势图第一节文献的根底知识一、文献的概念二、文献的类型
三、文献的级次一、文献的概念及要素概念:记录有知识的一切载体要素:知识内容物质载体:古——今记录符号记录手段作用:记录、贮存和传递知识二、文献的类型1、按物质载体和记录形式分2、按出版形式和内容划分1.按物质载体和记录形式分手写型—甲骨文印刷型—纸载体缩微型—感光材料载体,缩微胶卷声像型—磁性、感光材料载体,录音带机读型—磁性材料载体,磁盘2.按出版形式和内容划分共11种图书:是对某专门知识或某学科进行系统的论述或概括,ISBN期刊:又称连续性出版物,有同样的名称,按一定时间编定卷号,每一卷又分假设干期,ISSN报纸:科技报告:报道研究和开发调查工作的成果或进展情况会议文献:学术会议文献〔conference,proceeding)2.按出版形式和内容划分专利文献标准文献学位论文政府出版物产品样本资料:一般是指产品样本,即产品说明书技术档案三、文献的级次1.一次文献2.二次文献3.三次文献1.一次文献也叫原始文献。是著者在科研、生产实践中所获得的第一手资料撰写成的文献大局部期刊上发表的文章和在科技会议上发表的论文均属一次文献。是文献检索的对象,具有原始性、创造性、分散性的特点。2.二次文献加工、整理、组织一次文献—————————>二次文献(目录、题录、文摘)外部特征:题名〔书名、篇名、刊名等〕、著者、出版社、出版时间等内容特征:分类号、主题词、文摘检索工具书和网上检索引擎是典型的二次文献是检索的手段与工具,具有检索功能3.三次文献二次文献检索一次文献—>内容重新组织加工——>三次文献如大百科全书、辞典等
既是检索对象,又可提供一定的检索手段文献分级关系示意图第二节文献检索的根底知识一、文献检索的含义二、文献检索的类型三、文献检索原理四、检索语言五、检索工具类型六、文献检索方法七、文献检索途径八、文献检索效果的分析一、文献检索的含义1.广义:文献信息的存储与检索2.狭义:仅指文献信息的检索二、文献检索的类型1.相关性检索2.确定性检索1.相关性检索以图书、期刊、资料、数据库中的篇章或全文为检索对象的一种检索检索结果为文献线索〔包括题名、著者、出处〕或全文以二次文献〔检索刊物或数据库〕或全文数据库为检索工具2.确定性检索根据检索对象不同又可分为---事实检索---数据检索检索结果为某一个具体的答案以三次文献〔参考工具书〕为检索工具三、文献检索原理1.文献替代2.文献整序3.文献特征标识与检索提问标识的匹配1.文献替代一次文献的文献特征标识〔外部特征和内容特征〕按一定的标准格式著录成它的替代文献〔二次文献〕的过程。著录工程与格式:中图分类号题名/著者〔著者所在单位邮政编码〕//刊名/主办单位.—出版年,卷〔期〕.—所在页码文摘……。图x表x参x〔文摘员〕将杂乱无章的替代文献〔二次文献〕按一定的顺序〔通常按学科类目〕排列,并编制各种索引的过程。经过文献替代和文献整序后,完成了文献存储的过程。2.文献整序文献检索的过程就是文献特征标识与检索提问标识两者匹配的过程为了实现这种匹配,标引人员和检索人员必须采用一种共同的语言,即检索语言。3.文献特征标识与检索提问标识的匹配四、检索语言1.
分类检索语言2.
主题检索语言1.
分类检索语言用分类号表达各种概念,将各种概念按学科性质进行分类和系统排列?中图法?: 以拉丁字母与阿拉伯数字相结合的混合制号码作为类目的分类号,将人类的文献分为五个根本部类,22个根本大类。国际十进制分类法
〔UniversalDecimallassification,UDC〕
000:总论、科学与知识
100:哲学、心理学
200:宗教、神学
300:社会科学
400:空缺
500:数学和自然科学
600:应用科学、医学、工业、农业
700:艺术、文娱、体育
800:语言、语言学、文学
900:地理、传记、历史2.
主题检索语言标题词:经标准化处理的词或词组,先组式语言,see,seealso
叙词:经标准化处理的词或词组,后组式语言,可自由灵活组配
关键词:未经标准化处理,直接从文献题名、原文或文摘中选取的能反映原文主题内容的自由词汇五、检索工具类型〔一〕按存储内容划分〔二〕按存储载体划分〔一〕按存储内容划分1.目录型
2.题录型3.文摘型4.全文型
1.目录型目录型检索工具是以整本图书或期刊的外部特征为报道对象。报道内容:图书:书名/著者//出版地:出版者,出版时间期刊:
刊名/编著出版地:出版者,创刊年2.题录型题录型检索工具是以书刊中的某篇文献〔或章节〕的外部特征为报道对象报道内容:文献篇名/著者//刊名出版年、月〔卷、期〕、页码3.文摘型报道对象与题录相同,但对文献内容揭示的程度较题录更深入更具体,增加了文献的摘要文摘按其内容特征可分:指示性文摘、报道性文摘、指示—报道性文摘
例:文摘型【题名】中国淡水蛏的形态学研究【作者】饶小珍陈寅山
【机构】福建师范大学生物工程学院
【刊名】福建师范大学学报.1998,14(4).-71-75,102
【ISSN号】1000-5277
【CN号】CN35-1074
【馆藏号】94783X
【关键词】中国淡水蛏形态学淡水蛏蛏科缢蛏
【分类号】Q959.194
【文摘】报道了以解剖法对中国淡水蛏外部形态和内部结构研究的结果。并与蛏科的缢蛏和刀蛏科的尖刀蛏的形态进行了比较。
4.全文型报道对象与题录相同,但增加了文献的全文按载体不同:全文数据库〔中文、外文〕期刊等印刷型〔二〕按存储载体划分印刷型缩微型电子型:联机型〔磁性载体、计算机及通信网络〕光盘型〔光盘、计算机及光驱〕网络型〔Internet、网络数据库〕六、文献检索方法1.检索工具法2.追溯法3.分段法4.浏览法1.检索工具法〔1〕顺查法:以课题研究的起始年代为起点,由远而近按时间顺序逐年查找的方法〔2〕倒查法:由近而远按时间顺序逐年查找的方法〔3〕抽查法:针对学科开展的顶峰期,选取一定时间段进行查找的方法2.追溯法是指利用文献后所附的参考文献入手,逐一追查原文,再从此原文后所附的参考文献逐一查找下去,直到获得满意的结果。3.分段法又称循环法、交替法、综合法。即利用检索工具法和追溯法交替使用的一种方法。4.浏览法指直接在一次文献中查找所需的文献,也称直接检索法。该方法带有盲目性,一般只作为对上述各种检索方法的补充,主要用于查找新近发表的文献。七、文献检索途径1.分类途径2.主题途径3.著者途径4.其它途径1.分类途径是从学科分类角度来查找文献的一种途径。利用目次表或目录来查找。检索文献的关键:分析课题,确定课题所属的类目与检索工具目次表中的类目相匹配,才能查准。特点:族性检索〔适合从学科体系出发泛指性比较强的课题的检索,但不适合专指度高的课题以及新兴学科、交叉学科、边缘学科的课题的检索〕从文献主题内容角度来检索文献的一种途径。利用检索工具后所附的主题索引,以主题词作为检索入口。检索文献的关键:分析课题,选准主题词,并了解主题索引的结构和编排。特点:特性检索〔适合比较具体专深的课题以及新兴学科、交叉学科、边缘学科的课题的检索〕2.主题途径3.著者途径在著者姓名的情况下,利用著者索引作为工具检索文献的途径。一般著者索引〔个人或团体〕均按著者姓的字母顺序编排,姓在前,名在后,姓用全称,名用缩写。分子式途径序号途径文献题名途径4.其它途径查全率〔R〕=检出相关文献量文献库中相关文献总量查准率〔P〕=检出相关文献量检出文献总量八、文献检索效果的分析*100%*100%第三节机检根底知识计算机检索式〔逻辑表达式〕:检索词+有关算符1、布尔逻辑算符2、截词算符3、字段限定符4、位置算符一、布尔逻辑检索在计算机文献检索中,用户的检索需求是通过检索提问式表达的,逻辑算符在检索提问式中起着逻辑组配作用,它们能把一些具有简单概念的检索词〔或检索项〕组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。布尔逻辑〔组配〕算符:系统中采用的逻辑组配算符是布尔代数中的逻辑运算符AND/*〔与〕、OR/+〔或〕、NOT/—〔非〕。布尔逻辑检索:即运用布尔逻辑算符对检索词进行逻辑组配,表达两个概念之间的逻辑关系。1.AND或*算符实现逻辑“与〞组配检索时,命中信息同时含有两个概念,专指性强。如:logisticsANDe-commerce2.OR或+算符实现逻辑“或〞组配3.NOT或–算符实现逻辑“非〞组配检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围比AND扩大。如:rapidtransitORlightrailORsubwaysrailwayORrailroad命中信息包含逻辑A、不包含逻辑B或同时有A和B的,排除了不需要的检索词。如:fruitNOTapple〔TEST〕二、截词检索(truncation)—截词符截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,但凡满足这个截词所有字符(串)的记录,系统都为命中。截词检索在西文数据库中广泛使用。是在词干后可能变化的位置加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既可减少检索词的输入量,又可扩大查找范围,提高查全率。
按截词位置分:有前截断、后截断、中截断;按截词的字符数量分:有非限制截断、限制截断。
**表示截词的截断符号,各检索系统有不同的规定,没有统一标准。1.后截断后截断是在检索词词干后面加截词符,表示不限制或限制词尾可变化的字符数,即查找词干相同的所有词。从检索性质上讲,后截断是前方一致检索。非限制截断:是在检索词词干后面加一个截词符,表示不限制词尾可变化的字符位数,即查找词干相同的所有词。例:comput?表示允许其后可带有任何字符且数量不限,相当于查找compute、computed、computes、computing、computer、computers、computerize、computerized、computation、computations、computational、computationally等词。***不宜将词截得过短,否那么容易造成误检。限制截断:是在检索词词干后面加假设干个截词符,表示限制可变化的字符数。例:fib??相当于查找fiber或fibre……(EiCompendexPlus)librar?相当于Libraries,librarian,library……educat??相当于Educator,educated……
2.中截断
(通配符或屏蔽)
是把截断符号置于一个检索词的中间,对词中间出现变化的字符数加以限定。一般中截断仅允许有限截断。例:organi#ation,可检索到包含organization和organisation的记录。
一个?代表零个或任意个字符。例:colo?r
,可检索到包含color、colour、colonizer、colorimeter的记录。
一个?和数字,其中的数字代表可替换的字符数。例:colo?1r,只能检索到包含colour的记录。三、词位置检索(positionaloperator)—位置运算符利用布尔逻辑算符对检索词进行逻辑组配时,未限定检索词之间的位置关系,会影响某些课题的查准率并容易造成误检。为了弥补其缺乏,一般检索系统都提供文中自由词检索功能,也称全文检索功能(Fulltextsearching)。所谓全文检索是利用文献记录中任何有实义的关键词、词组或字符串作为检索词,词与词之间的位置关系可以用位置运算符来表达。位置运算符的使用,进一步强化了对概念的限制,比布尔逻辑运算符更能表达复杂的概念,并防止AND逻辑组配产生的词义模糊或误检。为了提高检索的广度和准确度,常常需要对检索词之间的位置关系加以限定。**全文检索的运算方式,不同的检索系统有不同的规定,主要差异有两点:规定的位置算符不同;位置算符的职能和使用范围不同。下面介绍几种数据库经常使用的位置运算符:
1.W-With
W算符是With的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。所连接的词之间除可以有一个空格、标点或连接号外不得夹有任何其他单词或字母。
例:intelligent(W)robot?(EiCompendexPlus)
Wn(或nW)表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。但允许在连接的两个词之间最多插入n个单元词。
例:intelligentw1robot*(OCLCFirstSearch)
2.N-Near
N算符是Near的缩写,表示此算符两侧的检索词必须紧密相连,所连接的词之间不允许插入任何其他单词或字母。但词序可以颠倒。
例:intelligentNEARrobot*(EiCPXWeb)
Nn(或nN)表示在两个检索词之间最多可插入n个单词,且两词的词序任意。
例:intelligentN1robot*(OCLCFirstSearch)
3.Adj-adjacency
邻接算符,表示在此算符两侧的检索词必须按所列词序排列,不能颠倒,两词之间不允许有其他的词或字母。相当于短语检索。
例:
intelligentadjrobot*(ElsevierScienceSDOS)四、字段检索
(rangesearching)
字段检索即指定检索词出现的字段,被指定的字段也称检索入口,检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。西文数据库,字段检索常用代码来表示,如下表所示。
注意:目前各个检索系统所设立的字段是各不相同的,即同一字段,也可能采用不同的字段代码表示。如题名字段:EiCPXWeb中,用highwaytransport*withinTI来表示;OCLCFirstsearch中,用TI:highwaytransport*来表示。在进行字段检索时,为了防止出现检索误差,应先看一下该数据库的使用指南或说明。例:EiCPXWeb网络版数据库主要字段的字段代码如下:CVEi叙词表受控语言TI题名AB文摘AU著者姓名AF著者机构名称ST连续出版物名称PN出版时间构造检索提问式例如:课题:数字化图书馆的文献检索效劳检索概念分析:documentretrieval并列概念documentdeliverydocumentdeliverysystemdigitallibrary同义词virtuallibraryelectroniclibrary检索提问式:(documentWretrievalordocumentWdeliveryordocumentWdeliveryWsystem*)and(digitalWlibrar*orelectronicWlibrar*orvirtualWlibrar*)recordfound:11(OCLCFirstsearch)造成误检或漏检的原因1〕课题分析不透;“学科归属〞不清。2〕“语言〞不通。3〕主题概念不是大了,就是小了。4〕“同义词库〞不全5〕核心词太多6〕选择的检索工具专业性不够。E-journalorsearchengine?1〕课题分析不透;“学科归属〞不清。对课题的真正含义和学科归属不清楚,会造成最大的失误。如查找有关“玻璃钢〞制造工艺方面的资料,如果从字面含义着手,以为它属玻璃工业或金属材料的范畴,而事实上,玻璃钢既不属硅酸盐工业里的玻璃类,也不属金属材料里的钢铁制品,而是合成树脂与塑料工业里的增强、填充塑料制品。如果没有认真分析课题的真正含义和学科归属,就匆匆着手检索,往往会欲速不达,或多走弯路,甚至导致失败。2〕“语言〞不通。基于计算机的文献检索的特点与其说是人机对话,不如说是标引人员与检索人员的对话,只有标引人员与检索人员所表达的“语言〞一致,才能顺利实现文献检索。往往检索工具使用的是标引语言,而检索者使用的多数是自由词,未经标准化,这样在表达方式上有差异,造成了检索障碍。如:自由词:维生素C(vitaminC);标引词:抗坏血酸(ACID,ASCORBIC)自由词:艾滋病(AIDS);标引词:ACQUIREDIMMUNODEFICIENCYSYNDROME〔后天免疫缺陷综合症〕;又如“沙示〞〔SARs),禽流感〔Birdflu)…….3〕主题概念不是大了,就是小了。检索者不知道如何正确定位课题的主题概念,往往会不是大了,就是小了,初学者更容易把概念偏大。主题概念的范畴太大造成大量没用的文献被误检,太小造成重要的的文献被漏检。如“石油工业的废水处理〞,假设用“废水处理〞作为主题概念,就会太大,在?中国期刊网?中有1400多篇,如果我们知道石油工业主要排放的是毒性较大的含酚废水,那么主题概念定位在“含酚废水处理〞就比较恰当了,此时查出的文献大概有20~30篇。4〕“同义词库〞不全往往同一件事情或事物,不同作者喜欢用不同的词来表达,这就造成了庞大的同义词库,如果偏偏你头脑中的“同义词库〞不是那么全,造成漏见就缺乏为怪了。例:艾滋病——艾滋病、爱滋病碳纤维——碳纤维、炭纤维聚四氟乙烯——PTFE,polytetrafluoroethylene,Teflon设备——apparatus,equipment,device……汽车——car,automobile,vehicle……5〕核心词太多对于由A、B、C、D、E多个主题组合的多主题概念课题,如果将所有主题混在一起同时组配,会造成“零结果〞现象。因为,只要A、B、C、D、E其中之一的检索结果为零,那么经过布尔逻辑“和〞的运算,检索结果=A*B*C*D*E=0。6)选择的检索工具专业性不够E-journals:
中文:中国期刊网、万方数据库系统、维普。。。。。。英文:Elsevier……Searchengine:百度,Google,Yahoo!Openfind,…….
网络资源学会利用搜索引擎老鸟和菜鸟的区别,往往只是在于会不会利用资源,搜索引擎是很重要的手段。别看很多老鸟好似从来不提问题,而且还能答复新人的问题,好似他们什么都懂似的,其实他们并没那么厉害,只不过完全可以通过自己的搜索找到答案,所以不需要提问……如果大家有兴趣,可以到下面的链接看看各种搜索引擎的利用技巧:著名搜索引擎Google:,百度:://配合使用,根本上能解决问题。百度与google比较搜索英文不必说用google,搜索中文呢?很多人并不了解它们更新的情况,google开展早,因而它贮存了大量旧的信息,百度开展迟,信息较新。更新速度:对中文google一般半月至一月一更新,而且仅搜索到三级链接,三级以下便不在搜索,那么我如何看到最新的google搜索的结果呢?这个站点:,可见google采用不同效劳器逐步更新的。百度的更新较快,半月一次,最快一周。关键词的选择技巧我们了解常规搜索方式,但每个人都会搜索出不同结果,为什么?核心问题在于关键词选择不同。在当今互联网上,你永远不会愁你找不到东西,而是东西太多,你无法找到你需要的东西,因此搜索效率便成为最重要的一环,搜索效率直接关系到搜索的关键词的选择。关键的分析必须保证两点:一是专业性,即这个词是很精的,可能简化你的搜索结果,因而词甚至可以怪一点,尽量防止群众化的词,如net,site等。即使需要群众化词,如password,username,但假设参加一两个特征词,那么结果将大大简化。二是具有代表性,也即这个词具有代表意义,也即它在包含你所需网页内,它在出现的可能,以免一些有用信息被遗漏。百度和google语法的应用找特定文件名的文件,尤其是PDF、ZIP、swf、DOC、TXT、RAR、EXE、RM、Mp3,MOV,PPT这些文件名都是网友想找的重点,至于各是什么类型文件,请上网查一下便知道了,这里不多说了。尤其老板让你做个powerpoint,找不到图怎么办?用google去搜索。方法是利用语法filetype:后缀名。如找PDF文件,在正常关键词后面加filetype:PDF即可,搜索结果全是PDF文件。找特定题目的网页语法intitle:网站查找友情链接:"link:"〔英文单字link后加冒号〕用于搜索链接到某个URL地址的网页。可以了解有哪些网页把链接指向您的网页。根本搜索语法——查找文件查找特定站点:site:*如金庸古龙site:sina但不可参加://或/这类,否那么是错的。查找美国教育网上的宇宙大爆炸jpg图片搜索:“BIGBANGfiletype:jpgsite:edu〞结果:搜索有关BIGBANGfiletype:jpgsite:edu的图片根本搜索语法——查找站点Site可将搜索定位于某一个域名上,有利于缩小搜索范围,提高搜索效率。如keywordssite:edu,效果很好!可以方便地搜索到各大学内有用的资源。site:tw,site:edu.tw,site:edu.......这是定位于国家或地区,将搜索局限于某些国家或地区,或加上edu,那么是这些国家或地区的大学,效果自然更好。如果那么搜索国内医科大学内的资源〔会漏综合性大学的资源的,要慎用〕。特殊语法:inurl“inurl〞语法返回的网页链接中包含第一个关键字,后面的关键字那么出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比方“MP3〞、“GALLARY〞等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和根本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。例如:查找MIDI曲“沧海一声笑〞。搜索:“inurl:midi沧海一声笑〞结果:已搜索有关inurl:midi沧海一声笑的中文(简体)网页。注意:“inurl:〞后面不能有空格,GOOGLE也不对URL符号如“/〞进行搜索。例如,GOOGLE会把“cgi-bin/phf〞中的“/〞当成空格处理。google其它功能——查缩略词的全称利用google查缩略词的全称,如果写作时突然忘了某个缩略词的全称,当时手头假设有金山词霸等软件那么是易事,假
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论