文献检索课程第一讲第一节_第1页
文献检索课程第一讲第一节_第2页
文献检索课程第一讲第一节_第3页
文献检索课程第一讲第一节_第4页
文献检索课程第一讲第一节_第5页
已阅读5页,还剩154页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息资源检索与利用赵秀丽图书馆2011.9.71赵秀丽山西警专图书馆情报资料室电话-2课程考核?3平时成绩40%+期末60%40%平时成绩:包含三次作业和出勤情况的综合考核

60%期末测试开卷:检索报告根据自己的论文选题,结合课程的学习内容,提交一份检索报告4一、信息及其相关概念

-南唐李中《暮春怀故人》梦断美人沉信息5信息的定义信息是一个既古老又年轻的名词,这是汉语中“信息”一词最早的文字记载,古人所说的信息是指“音讯、消息”。《应用汉语词典》解释,信息是“音信、消息”.《新编简明哲学词典》讲,信息字面上的意义是“消息、材料、知识”。《辞源》解释,信息就是“消息”,《汉语大词典》解释为“音信、消息”,指事物所发出的消息、指令、符号所包含的内容,也引用了宋代一个词人的梅花词:欲传春信息,不怕雪埋藏。6信息(information)哲学家们从产生信息的客体来定义信息,认为事物的本质、特征、运动规律通过一定的媒介或传递形式(声音、文字、图象等)使其它事物感知。这些能被其它事物感知的、表征该事物特征的信号内容即为该事物向其它事物传递的信息。所以,信息是事物本质、特征、运动规律的反映。不同的事物有不同的本质、特征、运动规律,人们就是通过事物发出的信息来认识该事物,或区别于其它事物。简言之,信息是事物的运动状态和方式(申农)信息是认识过程中不确定性的消除或减少,不是已知消息的重复,而是未知的内容,是新的、适用的、及时的消息7信息资源(informationresources)是经过人类筛选、组织、加工,并可以存取和能够满足人类需求的各种信息的集合广义的信息资源是指信息活动中各种要素的总称,既包括信息本身,也包含与信息相关的人员、设备、技术和资金等因素8知识(knowledge)是关于事实和思想的有组织有系统的陈述是人类通过信息对自然界、人类社会及思维方式与运动规律的认识与概括,是人的大脑通过思维重新组合的系统化了的信息,是信息中最有价值的部分9情报(information/intelligence)是作为交流对象的有用知识,是在特定时间、特定状态下对特定的人提供的有用知识,是激活了、活化了的知识,其基本属性是知识性、传递性和效用性10文献(literature/document)我国《文献著录总则》(GB3792.1-83):文献是指“记录有知识的一切载体”,它是存储在一定物质载体上的关于知识信息的记录文献组成四个要素:第一,要有一定的知识内容第二,要有用以保存和传递知识的信息符号,如语言、文字、图像、符号、电子信号、视频、声频等第三,记录方式,如印刷、复印、篆刻、翻拍、录制等第四,要有记录知识的物质载体,如纸张、感光材料、磁性材料等11信息知识情报文献信息、知识、情报和文献之间的关系12文献信息的类型根据不同的划分标准,可分为许多类型(一)按载体的物理形态和加工方式区分:手写型、印刷型、缩微型、声像型、数字型(二)按加工深度不同区分:零次、一次、二次、三次文献(三)按内容特点和出版方式区分:图书、期刊、报纸、特种文献13(一)按载体的物理形态和加工方式区分的文献信息类型1、手写型(script),各种非印刷型文献如甲骨、简策、帛书等以及现代还没有正式付印的手稿、笔记、书信等——第一手材料,价值高,查阅不便用竹笔写在自制土纸上的东巴象形文字经文142、印刷型(Printedform),主要指以纸张为载体,通过印刷手段把负载知识的文字固化在纸上。如纸质图书、期刊等——便于直接阅读,但存储密度低,检索不便遼代雕版印刷珍品《熾盛光九曜圖》153、缩微型(Microform/Microfilm/microfiche),以感光材料为载体,以光学缩微技术为记录手段。如缩微胶片、缩微平片等——密度大、体积小,但需阅读设备美国斯坦福大学胡佛研究中心珍藏的蒋介石日记的缩微胶卷样品

164、声像型/视听型(Audio-Visualform/Compactaudio/videoform),以磁性、感光材料为载体,直接记录声音、图像的一种文献。如唱片、录音带、录像带、幻灯片、电影等——直观、真切,但制作成本高,阅读不便175、机读型/电子型/数字型(MachineReadableform/ElectronicPublication/Electronicform),利用计算机进行存储和阅读的一种文献形式。如文献的各种电子版本(Magnetictape/CD-ROM/online/network),多媒体(multi-media)等。包括磁带、磁盘、光盘等——存储密度高、存取速度快、识别和提取易于实现自动化,但必须借助计算机等才能阅读视频光盘18(二)按照加工深度不同区分的文献信息类型零次文献(non-printedsources)(灰色文献):是指非正式出版物或非正式渠道交流的文献,未公开于社会,只为个人或某一团体使用,如文章草稿、私人笔记、会议记录、未经发表的名人手迹,甚至包括口头言论和现代的电子邮件、电子布告牌文章、讨论组文章等。内容新颖,但不成熟,获取比较困难一次文献(primarysources):凡是以著者本人的经验、研究或研制成果为依据而撰写的原始文献,经公开发表或交流后,称为一次文献。其特点是论述比较具体、详细和系统化,有观点、有事实、有结论。一般包括期刊论文、专著、报纸、学位论文、会议论文、科技报告、政府出版物、专利说明书、技术标准、技术档案、产品说明等。是人们检索的最终目的和利用的主要对象,但数量庞大、分散,利用不方便19按照加工深度不同区分的文献信息类型二次文献(secondarysources):二次文献是信息部门将那些分散的、无组织的一次文献,用一定的方法经过加工整理、归纳、简化,把文献的外表特征和内容特征著录下来,使之成为有组织、有系统的检索工具,如书目、题录、文摘、索引等。主要作用是存储和报道一次文献线索、提供查找的途径20印刷型二次文献——检索工具书21数字型二次文献全国报刊索引数据库图书馆ILAS书目检索系统22三次文献(tertiarysources):它是在二次文献的基础上选用一次文献、零次文献的内容进行分折、概括、综合研究和评价而编写出来的文献一般附有大量的参考文献可分为 综述研究类:如动态综述、学科总结、专题述评、进展报告等参考工具类:如年鉴、手册、大全、词典、百科全书等三次文献主要是信息研究的产物和成果,其特点是一次文献的浓缩,源于一次文献又高于一次文献,属于一种再创性文献一般可以反映出该学科的概貌,是我们研究以往文献内容的重要信息源23印刷型三次文献-参考工具书24数字型三次文献CNKI中国年鉴网络出版总库25四级文献的关系零次文献是一次文献的素材,一次文献是二次、三次文献的来源和基础,二次、三次文献是对一次文献进行组织、加工、综合后形成的,它们编写目的明确,专指性强从一次文献到二次文献,再到三次文献,是一个由繁到简、由分散到集中、由无组织到系统化的过程,文献内容有很大的变化。二次文献和三次文献的产生并没有增加知识总量,但对于一次文献的形成和再生产有着很大的推动作用26图书期刊报纸特种文献专利学位论文科技报告档案产品资料会议论文政府出版物连续出版物(三)按内容特点和出版方式区分的文献信息类型标准271、图书(Book,Monography)按照联合国教科文组织的定义,图书是指50页以上的以印刷方式单本刊行的出版物(50页以下的称为小册子)大多是对已发表的科研成果、生产技术知识和经验通过选择、比较、核对、组织而成的包括专著(含有首次发表的新成果、新思想的图书)、丛书、教科书、词典、手册、百科全书等特点:内容成熟、定型,论述系统全面、可靠;但出版周期较长,知识的新颖性不够,时间性较差,传递信息的速度较慢适用范围:对陌生问题进行一般了解;对大范围问题获得一般性知识;对熟悉问题进行历史性的全面系统的回顾对于社会科学的检索课题而言,通常是最重要的信息源28图书的著录特征书名信息检索导论责任者叶继元主编出版项

北京:电子工业出版社,2002载体项412页:20cm价格RMB33.00ISBN7-5053-8694-8索书号G252.7/Y621主题词情报检索-高等学校-教材[12]卡洛琳.麦茜特.自然之死〔M〕.长春:吉林人民出版社,1999.327.Ma,Rong.EthnicrelationsinChina/RongMa.[monograph].Beijing:China

TibetologyPublishingHouse,2008.10,519p.:ill.;23cm.29国际标准书号(ISBN)(InternationalStandardBookNumber)每一种正式出版的图书的唯一标识代码例如:信息检索原理与方法教程》,赵岩碧主编,化学工业出版社,2005年3月出版。其ISBN号为:

ISBN7-5025-6431-4(旧号)ISBN978-7-5025-6431-5(2007年后出版图书采用的新号)第一段:978是由国际物品编码(EAN·UCC)系统专门提供给国际ISBN管理系统的产品标识编码。第二段:7语区号,代表国家、地区、语种如1-英,2-法,3-德,4-日,7-中第三段:5025出版商代号,由国家或地区ISBN中心分配;第四段:6431出版图书号,由出版商按出版顺序所给第五段:校验位302、期刊

(Journal,magazine,serial,periodical)期刊又称杂志。一般指有相对固定的名称和版式、有连续出版的时间顺序标识即出版年、月、卷、期号的连续出版物期刊上刊登的论文大多数是原始文献特点:出版周期短,报道文献速度快,内容新颖;信息量大,流通面广,易于获取期刊是获取知识信息的一个重要来源:据估计,人文社科研究中期刊信息约占整个信息源的30%-40%;自然科学研究中从期刊上得到的科技情报约占情报来源的65%以上△31ISSN号正式出版的期刊有ISSN代码,即国际标准连续性出版物编号

如,ISSN1001--8867为《中国图书馆学报》的国际标准编号32期刊的著录格式刊名:

语言教学与研究

LanguageTeachingandLinguisticStudies主办:

北京语言大学周期:

双月出版地:北京市语种:

中文开本:

16开ISSN0257-9448CN11-1472/H邮发代号2-458创刊年:1979中国期刊网来源刊2004版核心期刊33〔6〕参见:纪秀明.近三十年中国生态文学研究综述(1979-2008)——兼论生态文学与批评在中国的演进〔J〕.辽宁大学学报(哲学社会科学版),2009,(1).NewwritingfromZambia.[periodical]Lusaka:NewWritersGroup,1964-AProposedVisualEducationforAllAustralianStudents.By:Lee,Alan.ArtsEducationPolicyReview,2010,Vol.111Issue1,p25-32,8p;DOI:10.1080/10632910903228173;(AN44867924)

34核心期刊核心文献:与本学科发展水平、发展动向密切相关的文献相关文献边缘文献有人认为,任何学科的文献,在本专业书刊资料上只可见到三分之一,其余三分之二分散在相关或边缘书刊文献之中某学科(或某领域)的核心期刊,是指那些发表该学科(或该领域)论文较多、使用率(含被引率、摘转率和流通率)较高、学术影响较大的期刊351.脱机检索(50年代末~60年代中期

)这时是计算机检索的原始时期,计算机由电子管组成,主要存储介质是磁带、磁鼓,只能进行简单的检索。(第一台计算机诞生于1946年,美国的宾夕法尼亚州)专业检索人员定期批量处理用户的情报要求用户不能立刻获得检索结果检索结果为题名,作者,文摘等。在脱机检索阶段,计算机主要进行文献目录、索引、文摘等前处理工作。362.联机检索(60年代末~70年代初)1963年-1964年间,美国洛克希德导弹与宇航公司的情报实验室建立了”人-机“对话的联机情报检索系统(DIALOG的前身),此后在60年代末到70年代初联机检索系统得以快速发展。国际著名的DIALOG系统、ORBIT系统、MEDLINE系统都是从这个时期发展起来的。多个检索终端,通过通讯线路与联机检索系统中央计算机(主机)联接利用分时技术,使多个用户可同时与主机以“对话”方式进行检索用户可随时浏览检索结果由于这个阶段的计算机网络主要是通过电话线联接,因而联机检索受到地区的限制373.国际联机检索(70年代中期-)卫星通讯技术的出现,使得联机检索系统打破了地域限制。而数据库生产的迅速发展及微机大量的涌现,更使得国际联机检索蓬勃发展。用户利用终端设备,通过国际卫星通讯网与世界各地的大型计算机情报检索系统中央计算机直接进行“人-机对话”,查找世界各国的情报文献资料。联机检索系统进入发展的黄金时期。38国际联机检索方便和加速了世界情报资源的交流与利用过去千里迢迢不能找到看到的情报资料,现在利用国际联机情报检索终端,只用几分钟就可以从几年到几十年几万种期刊中查到实现了人类情报资源的共享。优点:信息量大、快速、方便数据库内容更新快394.单机光盘检索(80年代--)CD-ROM技术促使计算机检索成本迅速下降(一张光盘可存贮600〔MB〕兆字节机读数据、成本价格便宜,而一张DVD光盘的容量最少可达4.7G)光盘检索系统--普通的微机上配备光盘驱动器及光盘数据库及检索软件405.光盘网络检索(90年代-)必要性美国“化学文摘”(CA)从1987-1991年的五年累积索引(含文摘)光盘数据库共6张,价值40.5万元。光盘网络是一种计算机网络,如图书馆局域网实现多用户光盘资源共享416.Web信息资源检索(90年代末-)进入90年代后,随着网络技术的发展,尤其是互联网的迅猛发展,使计算机检索进入一个崭新的时期。检索方法更简单,检索结果更全面经过40多年的发展,从早期的书目信息到后来的全文本信息,到今天的网络与多媒体信息,网络信息资源已成为现代社会不可缺少的资源财富。其处理技术从简单的字段与关键词检索到全文检索,再到今天成为网络主流的超文本与多媒体处理。处理技术的演进与发展,一方面使网络信息资源的内容从单一的书目到图文并茂的多媒体,更富有吸引力和使用价值;另一方面,超文本的广泛利用改变传统的信息组织的线性方法,使电子资源的组织更接近于“自然”,大大方便了用户的使用,使电资源的利用变得非常容易,用户不需要太多的检索知识与技术。421.3机检与手检的异同手检途径-分类、主题号码、作者名机检的对象是机读信息,机读信息以数据库(database)的形式存贮43机检与手检的异同存入的信息同样需要进行标引标引是将信息中具有检索特征的词语或标志(索引点)抽出制成索引的过程手检工具采用手工标引而机检系统自动标引词表-控制标引,正控式和反控式正控式如各种分类法、主题表等-手工标引;反控式则以禁用词表为代表-自动标引;禁用词表,例如,用一个由a(an),the,of,for,from,by,to,with,and九个虚词构成的禁用词表作为控制词表让计算机自动抽词标引,除这些虚词外的所有词汇均可抽出作为索引点,这样从多个词汇可以查到同一信息。44机检与手检比较451.4按访问方式网络数据库可分为:光盘局域网数据库。传统的联机数据库。拨号,专线,费用昂贵。异军突起的Internet网络数据库。内容最丰富,包括图书馆的馆藏目录、数字图书馆、专业数据库、电子图书、电子期刊,搜索引擎……461.5按是否收费网络数据库可分为:商业数据库:内容系统、丰富、全面。图书馆通过购买获得的都是商业数据库。免费数据库:逊于商业数据库。一般是由政府部门开发,提供相关信息;或是暂未成熟收费的商业数据库。如:美国能源部的官方网站,

提供免费的DOE报告全文检索和下载;再如:国家知识产权局的官方网站,http:///可免费检索专利(带专利全文),并提供知识产权方面的信息。471.6按提供的内容网络信息资源可分为:参考型数据库。指引用户到另一信息源以获得原文或其他细节的一类数据库。包括各种书目数据库和引文数据库。这种数据库具有参考和评价的功能,多用于查新、开题。如:SCI、EI、维普的中文期刊数据库……全文数据库。指存储文献全文或其中主要部分的数据库。如新闻消息全文库、法律法规全文库、人大报刊资料库、博硕论文全文库等。事实型数据库。直接提供事实或数值的数据库。如:万方的企业产品数据库、彼得森大学指南等。电子图书。计算机利用计算机检索并下载阅读的图书。如:书生之家、超星数字图书馆、各种数字图书馆等。电子期刊。直接在网上就可以检索和阅读的期刊。如:万方数字化期刊,中国期刊网全文数据库,scienceonline等电子报纸。如:人民日报的网络版。其它类型。如软件,新闻等48第二节数据库的基本知识

492.1数据库的基本概念为了能对数据进行有效的处理,需要将数据有序地组织起来。数据的组织一般有四个必要的层次:字段(field)记录(record)文档(file)数据库(database)501.字段(数据项)是组成数据库的最小基本单位。它的作用是描述一个数据处理对象的某些属性。如书目型的数据库,字段可为文献的篇名,作者,作者单位,刊名等。512.记录与某一数据处理对象有关的一切数据项构成了该对象的一条记录。如书目型数据库,一条记录反映了一篇文献的相关信息52例1关系型数据库――工资表53例2书目型数据库中的记录

AutomaticdetectionoflungcancersinchestCTimagesbythevariableN-quoitfilter

Miwa,Tomoko;Kako,Jun-Ichi;Yamamoto,Shinji;Matsumoto,Mitsuomi;Tateno,Yukio;Iinuma,Takeshi;Matsumoto,Toru

AuthorAffiliation:Knowledge-BasedInfo.Eng.Dept.,ToyohashiUniversityofTechnologySource:SystemsandComputersinJapanv33n1January2002p53-630882-1666InEnglish

Abstract

542.2数据库的组织--记录格式对于书目型的数据库,每一条记录总由三种类型的字段组成:检索系统的存取号(AccessionNumber,AN)基本索引字段(BasicIndexFields)辅助索引字段(AdditionalIndexFields)551.存取号(AccessionNumber,AN)由系统所给每一条记录一个能被计算机识别的特定号码在同一个数据库中,每篇文献记录只有一个存取号在DIALOG系统中,称这种号码为DIALOG存取号562.基本索引字段(BasicIndexFields)表达文献内容特征,主要有:篇名字段(TitleField,/TI)文摘字段(AbstractField,/AB)叙词字段(DescriptorField,/DE)自由标引词字段(IdentifierField,/ID)57(1)叙词字段—规范词字段用来描述记录内容的主题词这些词经过规范化处理,保证了词和概念一一对应由标引员给出收集在相应的规范词表中如INSPEC数据库有INSPEC叙词表;COMPENDEX有SHE标题词表等。58例-主题标引如苏联小说“钢铁是怎样炼成的”(中译本)题名:钢铁是怎样炼成的分类号:I512.45A762A2

主题词:长篇小说-苏联-现代59(2)自由标引词字段-非规范词字段用来描述记录内容的词语非规范词,不在词表中由标引员给出这类词相当于一般所说的关键词60(3)基本索引字段比较基本索引字段表达了记录的主题内容标引词来源不同叙词和自由词字段是在主题分析后,按照一定的情报语言规则标引的有明确的概念含义,能表达确切的主题内容题名、文摘、或正文等字段来源于自然语言在整体上或许可以表达原始文献的主题,而其中的某一个词则不一定。61例子

《钢铁是怎样炼成的》一书,加工成书目型数据库中的一条记录时,叙词字段:“苏联小说”等,题名字段:“钢铁是怎样炼成的”,其中题名中的“钢铁”一词,其字面意思与本书内容风马牛不相及。62基本索引字段比较--结论 通过主题查找文献时,从叙词或自由标引词字段中查找较为准确;而从题名、文摘或正文字段中查找则容易误检。633.辅助索引字段(AdditionalIndexFields)表达文献外表特征 例:作者字段(AU=)、期刊名称字段(JN=)、出版年份字段(PY=)、语种字段(LA=)等。在检索中,辅助索引一般不单独使用,而常与基本索引配合使用,起限定检索范围的作用。64

第三节检索的技术

可以参照Dialog在线训练网站:

/sem_info/ontap_pw.html

以Ei为例,检索前先输入“b208”打开Ei数据库,然后再输入检索指令

浙江大学图书馆关于Dialog检索的课件:

/aduser/service/lesson/Teach/SearchYan/Ch5/CH5.htm

653.1常用的检索方式命令检索(commandsearch)使用特定的操作命令来实施检索灵活快捷速地进行检索?SCS=(general(w)electric(f)Portland)菜单检索(menusearch)方便,易掌握,称“easy-to-use”检索多用于光盘检索和web检索663.2布尔逻辑检索是当今检索理论中最成熟的理论之一,也是构造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过布尔逻辑算符来实现的,这些运算符能把一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索要求。逻辑运算符有三种:与、或、非671.逻辑与:一般用and或*表示是一种用于交叉概念和限定关系的组配它可以缩小减缩范围,有利于提高查准率凡是用AND的检索式,AND两侧的检索词必须同时出现在同一条记录中,该记录才算命中如:?SAU=CHENG,GENGDONGANDPY=1997:1998?sSolar*Energy682.逻辑或:一般用or或+表示,少数数据库用|表示

是一种用于并列关系的组配它可以扩大检索范围,防止漏检,有利于提高查全率凡是用OR的检索式,OR两侧的检索词只要有一个在一条记录中出现,该记录就算命中如:?S(AU=QIU,DAHONGORAU=QIU,D.H.ORAU=QIU,DHORORAU=QIU,DA-HONGORAU=DAHONG,QIU)ANDCS=DALIAN?swww+internet+network693.逻辑非:一般用not或-表示,少数数据库用#或/表示

是一种排斥关系的组配用来从原来的检索范围中排除不需要的概念或影响检索结果的概念,有利于提高查准率凡是用NOT的检索式,NOT前面的检索词必须在记录中出现而后面的检索词一定不能出现,该记录才算命中如:?SOPTICALNOTFIBER?sEnergy-Nuclear70NOTWebofScience中的逻辑运算举例71输入检索式选择文献类型Semiconductornanometernanoparticle

nanofilm

CompositecompositesPreparepreparationsynthesizesynthesisSemiconduct*andnano*andcomposite*and(prepar*orsynthes*)72优先顺序逻辑运算符的优先顺序为NOT、AND、OR如果要改变运算顺序需要用“()”如:AAND(BORC)73逻辑“与”的缺点逻辑“与”只要求两个检索词必须同时出现在同一篇文献中,而没有限定算符两侧检索词之间的位置关系,有时难免造成误检。例如:查找“细菌对染料破坏”方面的文献检索词:细菌、破坏、染料采用逻辑“与”组配:细菌and

破坏and

染料检索结果:命中同时用这三个词标引的文献有“细菌对染料的破坏”方面的文献也会有“染料对细菌的破坏”方面的文献要排除后一部分的文献,就需用位置算符限定词与词之间的位置关系。743.3位置运算符又称邻接算符(adjacentoperators),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。跟AND运算符类似,但比AND运算符功能更具体。比如:通过“communicationANDsatellite”进行检索时,命中的文献可能既含有“communicationsatellite”,又含有“satellitecommunication”;也可能含有“communicationdevicesforsatellite”“communicationlinkswithoutsatellite”等等。显然其中有些记录与课题要求毫无关系。位置运算符可以用于改进AND运算符的这种不足之处,因此,它们可以看成是特殊功能的AND运算符。按照两个检索词出现的顺序和距离,可以有多种位置运算符,而且对于同一功能的运算符,不同的检索系统可能有不同的表达方式,也有的检索系统不支持位置运算符,检索之前应该先看看数据库的帮助信息。常用位置运算符有(w)、(n)、(s)、(f)751.(W)(W)算符中的W含义为“With”。词序不许颠倒两词之间不许插词,只允许出现空格或连字符号(W)算符还可以使用其简略形式--()例如:?SCD(W)ROM将命中CDROM或CD-ROM?Ssolar()energy检出solarenergy?SCD(W)ROM/de,id7677782.(nW)(nW)算符中的W含义为“Word”它允许两词中间可以插入0-n个其他词,包括系统禁用词词序不变例如:?communication(2W)satellite将检索出含有communicationsatellite、communicationviasatellite、communicationonthesatellite的记录。7980813.(N)(N)算符中的N含义为“Near”词序可以颠倒两词之间不许插词,只允许出现空格或连字符号例:?Scross(N)section可检出

crosssection和sectioncross824.(nN)(nN)是(N)算符的变形检索词之间允许插入0-n个词,包括系统禁用词词序可以颠倒例如:?cotton(2N)processing可检出cottonprocessing、processingofcotton、processingofEgyptiancotton8384855.(S)(S)算符中的S含义为“Sentence”词序可以颠倒两词必须出现在同一句子(子字段)中(在EI的AB字段中为在两个句号之间同时出现,在DE字段中为在两个分号之间同时出现)86tio2samenano*samecomposite*same(prepar*orsynthes*)87886.(F)(F)算符中的F含义为“Field”两词必须出现在同一字段中词序不限例如:?

pollution(F)control可检出controlandmanagementofindustrialpollution89(F)与and的区别(F)邻近算符指定两个检索词在同一个字段中出现,而AND布尔逻辑组配中的两个检索词会出现在不同的字段中此外同位置运算符相比,AND可以连接两个以上的检索词,还可以两个以上的检索集合进行组配。例如:au=cheng,gengdongANDcs=dalianANDpy=1998或s1ands2ands3903.4截词算符截词算符就是使计算机保留检索词中的相同词干部分,允许检索词可有一定范围的变化,这种功能可减少输入步骤,简化检索程序,扩大检索范围,从而节省机时,降低费用,提高查全率。不同的数据库有不同的截词符,DIALOG系统用“?”,ORBIT系统用“+”,此外还有的系统用“$”或“*”截词有前方一致、后方一致、中间一致和中间屏蔽四种形式。截词是计算机检索中常用的方法,尤其是英语的单词词尾变化较多,为避免漏检经常要使用前方一致的截词检索。911.前方一致也叫后截断,将截词符置于一个字符串的后面,以表示其后的有限或无限个字符的检索。无限截词如:?Physic?可检出physic、physical、physican、physicalism截断两个字符如:?physic??

可检出physic、physical、physican截断一个字符如:?textile??

可检出textitle、textitles中间有一个空格922.后方一致(支持的检索系统较少,EI光盘不支持)也叫前截断,将截断符置于一个字符串的前面,以表示其前的无限个字符的检索。均为无限截词。如:??polymer可检出polymer、copolymer、homopolymer933.中间截断也叫中间屏蔽如:?defen?e

可检出defence、defense?fib??s可检出fibers和fibres

94WebOfScience平台:

Lap*roscop*

可检索到Laparoscopic,Laproscopic,Laparoscopy

CSA平台:

*截断任意个字符

patent*

可检索到patent,patents,patentable;h*ophilia

可检索到haemophilia,hemophilia;

?

截断一个字符,在单词中最多可使用三个?,

wom?n

可检到woman,women;fib??

可检到fiber,fibre;人大复印报刊资料全文书库:

!:两词(字)之间允许隔零个至多个字,最多允许出九个“?”例:旅游!!企业可检索到“旅游企业”、“旅游服务企业”、“旅游重点企业”等

?:两词(字)之间允许隔几个字,相隔字的个数等于出现?的个数,最多允许出九个“?”例:旅游??企业可检索到“旅游服务企业”、“旅游重点企业”等954.中间一致(支持的检索系统较少,EI光盘不支持)词头词尾都可变化如:?

?wave?

可检出wave、waves、microwave963.5检索限定字段限定时间范围限定分类限定语种限定等971.字段限定字段限定也是调整检索策略的一种重要手段。多数检索系统对不指定字段的检索词通常在所有字段(allfield)或所有基本字段中进行检索。如果想指定在文献的题目等特定字段中检索,就需要使用字段限制。字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索的查准率。例如:?OPTICALNOTFIBER在EI98光盘中有14799条记录。字段限制的优先级要比逻辑运算符的优先级高要把OPTICALNOTFIBER限制在题名字段就要输入:?(OPTICALNOTFIBER)/TI98992.Ei光盘中常用的基本索引字段/TITitle篇名/ABAbstract文摘/DEDescriptor规范词/IDIdentifiers自由词100基本索引字段检索在Ei光盘中基本索引字段用后缀方式表示如:?Polymer/ti,ab?Information(w)society/ti?nondestructive(w)(testingorexamination)/ti,ab,de,id1013.Ei光盘中常见的辅助索引字段代码 解释AU= Author(著者) CS= CorporateSource(机构)CT= ConferenceTitle(会名) JN= JournalName(刊名) DT= DocumentType(文献类型) LA= Language(语种) PY= PublicationYear(出版年)102在Ei光盘中辅助索引字段用前缀方式表示如:?LA=English

查找原文为英文的文献。?

PY=1993:1994

查找1993年至1994年间发表的文献。辅助索引字段检索103复杂检索式的构造:((ctorcomput?(1w)tomography)and(solid(s)rocket?orpropellant?)and(nondestruct?orndtorndeorndi))/de,id,ti,ab,1990-2000检索1990年至2000年以来CT用于固体火箭无损检测方面的文献,在规范词、自由词、篇名及文摘字段中检索。104第四节检索的方法1054.1直接法(常用法)直接法是指直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。它又分为顺查法、倒查法和抽查法。顺查法

顺查法是指按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。倒查法

倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。此法的重点是放在近期文献上。使用这种方法可以最快地获得最新资料。抽查法

抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。

1064.2追溯法(引文法)追溯法是指利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大信息来源的方法。它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。缺点:查全率、查准率较低,易误检漏检

107追溯法—原始文献108追溯法—原始文献所附的参考文献1094.3综合法综合法又称为循环法,它是把上述两种方法加以综合运用的方法。综合法既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段地交替使用这两种方法。即先利用检索工具(系统)检到一批文献,再以这些文献末尾的参考目录为线索进行查找,如此循环进行,直到满足要求时为止。综合法兼有常用法和追溯法的优点,可以查得较为全面而准确的文献,是实际中采用较多的方法。1104.4检索步骤确定检索目标选择数据库编制检索提问式上机检索整理检索结果并对检索效率进行评价1111.确定检索目标

要进行信息检索,首先必须确定信息检索的目标,即对信息用户的需求进行具体的分析,这种分析应主要包括以下内容:明确检索的目的明确用户是要查新、查参考资料还是查询论文被收录或引用情况等,以便对检索的查准、查全和时间范围的指标要求有一个大致的了解,从而制定出符合情况的检索策略。课题分析对课题内容进行分析,找出核心概念和隐含概念,排除无关的概念,明确概念之间相互的逻辑关系。112课题分析--直接从项目名称中确定检索概念例1:项目“聚乙烯的合成(synthesisofpolyethylene)”主要概念:聚乙烯、合成(synthesis、polyethylene)检索式:聚乙烯and合成Synthesisandpolyethylene113114115116117118课题分析--找出隐含概念例2:项目“灌溉用的橡塑多孔管”Rubber-PlasticPorousPipeForIrrigation橡塑多孔管也称为橡塑渗灌管,其主要原料为橡胶粉(由废旧轮胎制得)和塑料(如粉状聚乙烯)。隐含概念:橡胶、塑料该产品主要用于农林、园艺等方面的灌溉。主要概念:橡胶、塑料、多孔管、灌溉检索式:(橡胶or塑料or橡塑)and多孔管and灌溉119课题分析--泛指概念具体化例3:项目“唐山综合防灾的研究”由于唐山是一个城市,因此该项目实际上是“城市综合防灾的研究”。该项目针对的主要灾害是地震、洪水和火灾,所采用的研究手段是决策支持系统和专家系统。防灾

地震、洪水、火灾研究决策支持系统、专家系统主要概念:城市、地震、洪水、火灾、决策支持系统、 专家系统检索式:城市and(地震or洪水or火灾)and(决策支持系统or专家系统)120排除重复无关的概念可避免漏检,节省检索费用。例4:项目“河豚毒素的液相色谱分析”从项目名称上看,其主要概念为“河豚毒素”、“液相色谱”和“分析”,但由于液相色谱本身就是一种分析方法,它隐含了“分析”这一概念主要概念:河豚毒素、液相色谱检索式:河豚毒素and液相色谱1212.选用合适数据库根据检索目标分析所确定的检索目的、涉及的学科范围和信息类型,选择合适的数据库。具体选择过程中还应考虑数据库的类型(参考、全文还是电子期刊)、内容(专利、标准、会议)、收录的数据学科范围、数据库的更新周期,收录文献的语种等因素。例如,要查新就要选择收录文献最全,更新周期快的数据库;要看全文就要选用全文数据库或电子期刊;要查标准或专利就要选择标准库或专利库。1223.使用适当的检索语言,构造检索表达式分析各个检索词之间的位置关系和逻辑组配关系分析检索词应该限定在哪个字段中检索(是在所有基本索引中检索还是限定在分类、主题、自由词、文摘还是其他辅助索引字段中检索?)1234.上机检索

上机检索是用户的实际操作过程,检索策略输入检索系统后,系统响应的检索结果通常很难一次就能满足课题的要求,例如,有时输出的篇数太多,而且不相关的文献所占的比例很大,而有时输出的文献数量太少,甚至为零。因此在检索的过程中用户需要不断地根据检索结果对检索策略进行调整和修改,包括检索词的重新选取以及检索提问式的重新构造,经过反复的检索最终获得比较满意的检索结果。124(1)输出篇数过多时

此时多数是由误检造成的,原因主要有以下几点:1)没有对检索词进行限制。包括字段限制,时间限制,分类限制等。如在cnki中进行全文检索,结果肯定多很多。2)主题概念不够具体或具有多义性导致误检。例如,仅使用mathematics进行检索结果很多,就需要整检索策略,将概念具体化。如:mathematicsandeconomic再如,检索世界贸易组织仅输入“WTO”,系统可能会检索出“WorldTourismOrganization”(世界旅游组织)3)对所选的检索词截词截得过短。例如,使用math?将有太多的检索结果。125(2)输出篇数过少时

此时多数是由漏检造成的,原因可能有以下几点:1)选用了不规范的主题词或某些产品的俗称、商品名作为检索词。例如,没有使用学名“马铃薯”而使用了俗名“土豆”又如,没有使用“表面活性济”而使用了商品名称“迪恩普”,都会造成漏检。2)同义词没有充分考虑。例如,“检索物理化学”,没有考虑到“物理有机化学”,“物化”等同义词,导致漏检。3)上位概念或下位概念没有完整运用。例如,“燃料”是上位概念,下位概念可以有“固体燃料”、“液体燃料”、“气体燃料”,甚至还有“煤”、“油”、“煤气”、“天然气”等,这些概念在检索“燃料”时都应该加以考虑。1265.整理检索结果并对检索效率进行评价对检索结果进行整理,包括存盘、打印若是参考型数据库要想获取原文还必须记录文献的来源信息,如:题名,作者,来源期刊的刊名,年、卷、期、起止页等。127检索出的相关文献量数据库中的全部相关文献查全率R=(recallratio)x100%检索出的相关文献量检出的文献总量查准率P=(precisionratio)x100%最理想的检索结果是查全率和查准率都达到100%。R100%表示数据库中收录的全部相关文献都被检索出来P100%表示检索出来的文献全部都是相关文献但事实上,检索中有许多因素使这个指标很难达到。衡量检索效果的指标128R0P查全率R与查准率P的关系曲线CADBC.W.Cleverdon(英)进行Granfield试验,得出查全率R与查准率P曲线。R-P之间存在着互逆关系

A点检索词数量多,泛指性强,查全率较高但查准率却非常低B点检索词专指性较强,查准率就高查全率因此降低

C,D两点两种极端的折衷。查全率一般在60%--70%查准率一般在40%--50%无论怎样调整检索策略和改进系统效率,都无法使P和R同时接近100%。129获取全文的途径1.直接找全文数据库2.到图书馆(可以是大连理工大学图书馆、也可以是其他你能够使用的图书馆,如大连市图书馆、辽宁省图书馆、国家图书馆、各高校图书馆)借阅印刷版全文3.到网上找免费资源,如专利、法律法规、新闻、一些电子期刊和科技报告等。国家科技图书文献中心

(http:///index.html)4.发动同学。让同学利用他周围的资源检索,将全文mail给你。5.给作者写信,表明希望拜读的心愿,让作者给你提供全文。6.馆际互借。图书馆503提供馆际互借服务(针对大三以上,有偿服务)130专业核心期刊的查找—中文(1)北京大学图书馆《中文核心期刊要目总览》(2008年),规模最大、历史最久(2)“南京大学”的“CSSCI”来源期刊,是邀请众多专家评选出来的,许多人把它们作为评刊标准(3)中国社会科学院文献信息中心《中国人文社会科学核心期刊要览》(2004年版),侧重于优化科研用刊,为科研服务(4)中国人民大学书报资料中心系列期刊131《中文核心期刊要目总览》2008年印刷版(即第五版)

经过定量评价和定性评审,从我国正在出版的中文期刊中评选出1800种核心期刊,分属七大编75个学科类目该书由各学科核心期刊表、核心期刊简介、专业期刊一览表等几部分组成,不仅可以查询学科核心期刊,还可以检索正在出版的学科专业期刊馆藏:Z87/10-5/2008(基藏、113、洋浦)

132133CNKI核心期刊:将中国期刊全文数据库收录的、2004年被“中文核心期刊要目总览”收录的期刊,按核心期刊表进行分类排序134135136137138专业核心期刊的查找——外文外文核心期刊一般指被SSCI及A&HCI收录的人文社会科学外文期刊(1)通过CASHL查找:8000/search/corejournal.asp(2)通过ISI网站查找http:///mjl/(3)国外人文社会科学核心期刊总览(2004基藏504)(4)很多外文数据库中的“Scholarly/PeerReviewedJournals”同行评审期刊139140141142143介绍:期刊的影响因子

期刊的影响因子(ImpactFact)——E.Carfield

1972年提出期刊的影响因子是国际通行的衡量期刊质量的一个定量指标。通常,期刊的影响因子越大,它的学术影响力和作用也就越大。期刊的影响因子:

该刊前2年发表论文在统计当年被引用的总次数前2年发表论文总数1443、报纸(Newspaper)是一种专门刊载新闻和评论为主的定期出版物特点:出版周期短,时效性强,传递迅速、发行广泛、信息量大、政策性强145〔4〕杨泽文.生态批评:颠覆“文学是人学”〔N〕.中国社会科学院报,2008.10.25.HowtheG.O.P.CanFixHealthCare.By:JAMESP.PINKERTON.NewYorkTimes,2/22/2010,p19,0p;(AN48193584)

1464、特种文献学位论文会议论文科技报告政府出版物专利标准档案产品资料147特种文献的共同点在收藏管理上往往与图书报刊分开,另立体系,分别管理,成为图书馆的“特藏”书或收藏在科技情报研究所等机构原文不如图书、期刊、报纸那样普及易得,一般要借助图书馆和科技情报研究所等专门机构传递原文148(1)学位论文(Dissertation,Thesis)高等学校、研究机构的学生为取得学位而撰写的论文,是经过审查的、具有一定独创性的科学研究成果特点:能够解决具有相当科学意义的某个特定的科学问题或是对某一问题作出理论性的概括各国学位论文,除少数在期刊中刊载以外,多数是非卖品,一般不出版发行中国科技信息研究所是国家法定的学位论文收藏单位;UniversityMicrofilmsInternational(UMI)负责收藏和报道全美的博士、硕士论文,并收集报道其他国家的学位论文研究生毕业都要向图书馆或档案馆提交其学位论文149[003929827]

中国京剧习俗研究[博士论文]

/于建刚著;刘文峰指导.--176页;30cm[2]胡传荣.国际关系的女性主义观照:权力、冲突与发展问题的社会性别分析[D].上海外国语大学,2007

Levy,

L..

AninvestigationofsolosongsettingsofspecificpoetrywrittenbychildrenincarceratedintheTerezinconcentrationcampfrom1942--1944.

D.M.A.dissertation,NorthDakotaStateUniversity,UnitedStates--NorthDakota.RetrievedMarch1,2010,fromDissertations&Theses:A&I.(PublicationNo.AAT3370547).150(2)会议论文(Conferencepaper)指由国内外重要学术会议上发表的论文和报告,也包括一些非学术性会议的报告特点:学术性较强、研究成果较新、尤其是国际性会议或全国性会议的论文可不同程度地反映某一学科在相应范围内的学术水平、发展趋势和研究的进展情况151[1]李晶.改革时代中国人对美态度之演变(1979~1999)[A].近代中国与世界——第二届

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论