版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2020/6/19,1,第二章计算机信息检索技术,郑州大学信息检索教研室,2,2020/6/19,第1节计算机检索概述第2节计算机信息检索系统组成第3节计算机信息检索的分类第4节计算机信息检索技术第5节信息检索的方法*第6节信息检索的策略*,3,2020/6/19,1.1国内外计算机信息检索发展阶段,1975年,从国外引进数据库开展机检服务;1980年,建立国际联机终端开展检索服务;20世纪80年代中后期,自建数据库;90年代初,发展光盘检索;90年代中期,Internet网络化检索阶段。,4,2020/6/19,国外计算机信息检索发展阶段(P5),脱机检索阶段(20世纪50-60年代)联机检
2、索阶段(20世纪60-80年代)光盘检索阶段(20世纪80年代中-90年代)网络信息检索阶段(1995-),5,2020/6/19,1.2计算机信息检索的定义,计算机信息检索的实质就是由计算机将输入的检索策略与系统中存储的文献特征标识及其逻辑组配关系进行类比、匹配的过程,需要人机协同作用来完成。信息存贮是将文献、数值、事实等按一定的格式输入到计算机中,加工处理成可供检索的数据库。信息检索是将检索提问式按一定的要求输入计算机中,经计算机系统与已存贮在计算机中的数据库进行匹配运算,然后将符合检索提问的数据按要求的格式输出。,1.3计算机信息检索特点,检索速度快,效益高;检索功能强,数量大;检索途径
3、多,手段灵活;检索范围广;服务方式多。,7,2020/6/19,1.4计算机信息检索的原理(P8-11),信息存储,原始信息,信息主题,数据库记录及信息特征标识,信息检索,信息需求,检索主题,检索提问式及提问标识,计算机,检索结果,主题,分析,著录,标引,类比,输出,主题,分析,选定,编制,检索语言(主题词表),8,2020/6/19,信息存储过程,信息存储就是按照一定标准,将收集到的原始文献进行主题概念分析,用系统规定的语言(主题词、分类号)进行标引,形成信息的特征标识,进行整理与排序,构成可供检索的数据库,主要包括:信息的采集、著录、标引和整序等过程。,9,2020/6/19,信息的著录,
4、对所收集的原始信息的外表特征(如题名、著者、文献出处等)和内容特征(如分类号、主题词、摘要等)进行描述,形成一条条款目或记录的过程。在数据库中,其外表特征和内容特征通常称之为字段,一条记录由若干个不同字段构成。,10,2020/6/19,信息的标引,标引:根据一定的规则和程序(主题词典或词表),对文献的主题内容进行分析,给予每篇文献主题词、关键词作为存储和检索标识;或者根据文献的学科归属,采用某种文献资料分类法,给予分类号作为检索标识。,11,2020/6/19,信息检索过程,用户对检索课题加以分析,明确检索范围,弄清主题概念,然后用系统检索语言来表示主题概念,形成检索标识及检索策略,输入到计
5、算机进行检索。计算机按照用户的要求将检索策略转换成一系列提问,在专用程序的控制下进行逻辑运算,选出符合要求的信息输出。计算机检索的过程实际上是一个比较、匹配的过程,检索提问只要与数据库中的信息的特征标识及其逻辑组配关系相一致,则属“命中”,即找到了符合要求的信息。,2计算机信息检索系统组成,2.1系统设备硬件:运算器、控制器、存储器、输入输出装置等软件:系统操作程序、数据库管理程序、联机控制程序、应用程序等。通讯线路:电话通讯网、数据通讯网、卫星通讯网等。检索终端:信息用户与检索系统主机进行人机对话,实现联机检索的设备。包括上网设备、调制解调器等。数据库:是计算机检索的对象。是由一个或数个文档
6、构成,并能够满足某一特定目的或某一特定数据处理系统需要的一种数据集合。,13,2020/6/19,2.2数据库的构成,一定专业范围内的信息记录及其索引的集合体,是计算机信息检索系统的重要组成部分,是信息资源,是检索对象。,一定专业范围内的信息记录及其索引的集合体,是计算机信息检索系统的重要组成部分,是信息资源,是检索对象。,构成数据库的三大要素:文档记录字段,检索时,计算机按输入检索词的字顺先从指定的倒排文档中找到相匹配的索引词,然后根据索引词后的记录顺序号到顺排档中调出相应的记录。,14,2020/6/19,文档(File),数据库中一部分记录的集合,文档由若干记录构成。数据库是由一个顺排文
7、档和若干个倒排文档所构成顺排文档是数据库的主体,又称主文档,按每条记录的顺序号大小排列,检索结果都来自于顺排文档。倒排文档是从顺排档中抽取有检索意义的检索标识,如主题词、著者姓名、化学物质名、刊名等,并按索引词的字顺排列,同时在检索标识后注明入藏顺序号,这就是常见的数据库中的主题词索引、著者索引、刊名索引。,15,2020/6/19,16,2020/6/19,由若干字段组成的文献单元,是数据库中的基本文献单元,每条记录描述了原始信息的外部和内部特征。数据库中的一条记录通常代表一篇文献。例如:在书目型数据库中,一条记录相当于一条题录或文摘;在全文型数据库中,一条记录相当于一篇完整的文献;在其它类
8、型数据库中,一条记录则代表一个信息单元。记录越多,数据库的容量就越大。,记录(Record),17,2020/6/19,18,2020/6/19,字段(Field),字段是构成记录的基本单元,是对文献某一方面的特征(包括外表特征和内容特征)进行描述的结果。例如:题名、作者、作者地址、出版年、来源(出处)、主题词、文摘等字段是书目数据库中必备字段。为识别每一个字段所表达的文献特征,通常每个字段都有固定的名称和缩写(或称字段标识符),如,题名字段的标识符为TI,作者字段的标识符为AU等。,19,2020/6/19,2.3数据库的类型*(P3-4),参考(文献书目型)数据库全文数据库事实数据库数值数
9、据库,20,2020/6/19,参考(文献书目型)数据库,是指包含各种数据、信息或知识的原始来源和属性的数据库;是机读的目录、索引和文摘检索工具,检索结果是文献的线索而非原文。存储的是二次文献,包括文献的外部特征、题录、文摘和主题词等。这类数据库占用很大的比例,其代表性的数据库有EICompendexPlus(工程索引)、INSPEC(科学文摘)和全国报刊索引等。图书馆提供的基于网络的联机公共检索目录(OPAC)系统,21,2020/6/19,事实数据库,存储的是用来描述人物、机构、事物等信息的情况、过程、现象的事实数据。如名人录、机构指南、大事记、百科全书、手册、地图集、企事业名录、计算机程
10、序、音乐等,均可归入事实数据库。例如:中国咨询行、国研网、万方数据(中国企业、公司及产品、中国科技名人、中国科研机构等等),22,2020/6/19,数值数据库,主要包含的是数字数据,如各种统计数据、科学实验数据、科学测量数据等。气像数据、地质资料、化学或物理化合物特性的文献数据、人口统计资料、市场调研数据等。,23,2020/6/19,全文数据库,存储的是原始文献的全文,如杂志论文、报纸新闻、法院案例等。全文检索可直接获取原始资料,而不是书目检索时的线索,提高了用户的检索效率。如:中国知网(CNKI)、万方、维普、Elsevier等全文数据库。,3计算机信息检索的分类,1按信息资源的存储形式
11、分2按信息访问模式分,25,2020/6/19,3.1按信息资源的存储形式分*(P7-8),(1)全文检索。以全文数据库存储为基础的检索方式,所谓全文数据库是将一个完整的信息源的全部内容转化为计算机可以识别、处理的信息单元而形成的数据集合。全文检索系统对全文数据库进行词(字)、句、段落等深层次的编辑、加工,同时允许用户采用自然语言表达,借助逻辑组配、截词、邻词匹配等检索手段直接查阅文献原文信息。全文检索的应用范围包括:各种科技期刊、专利文献、新闻报纸、年鉴、百科、手册、图书等全文数据库,例如:我国引进的OCLC的firstsearch、IEL、SpringerLink、EBSCO等全文数据库以
12、及我国CNKI的中国期刊全文数据库、重庆维普的中文科技期刊数据库、超星数字图书馆、万方资源系统的数字化期刊、学位论文、会议论文等。,26,2020/6/19,(2)二次文献检索*,是针对全文检索而言,也就是分别将文献的内部特征(题名、分类等)和外部特征(作者、出处、年代、ISSN、语言等)作为存储和检索的匹配标识而形成的数据集合,利用检索系统的检索结果是文献信息的题录及文摘。学科领域覆盖面广,信息量大,可以利用文献线索获取到一次文献。例如:COMPENDEX、INSPEC、SCI等国外数据库;万方数据的学位论文、会议论文数据库、全国报刊索引、Calis西文期刊目次数据库等,27,2020/6/
13、19,(3)多媒体检索,就是把文字、声音、图像(形)等多种信息的传播载体通过计算机进行数字化加工、处理而形成的一种综合存储技术。利用多媒体检索系统可分别进行视频检索、声音检索、图像检索。多媒体信息检索系统有着广阔的应用前景,它将广泛用于电子会议、远程教学、远程医疗、电子图书馆、艺术收藏和地球资源管理、天气预报、时装设计、智能群体决策、计算机支持协同工作、金融市场、军事指挥系统、防汛指挥系统等方面。各大网站均可进行多媒体信息的检索,如:GOOGLE、百度等搜索引擎、新华社多媒体数据库是国内最大规模的多媒体、多文种新闻信息综合性数据库。,28,2020/6/19,(4)超文本检索,超文本(Hype
14、rtext)是利用计算机将多介质信息按照一定的逻辑联接关系加工、贮存起来,构成可任意连接的、有层次的网状结构数据库,是一种联想式的综合信息管理系统。其中的某些字、符号或短语、图形和图像起着“热链路”(Hotlink)的作用,在显示出来时其字体或颜色变化或者标有下横线、以区别于一般的正文。当鼠标器的光标移到某个热链路上,并且按了一下鼠标键之后,鼠标器光标便沿着这条链路跳到该文件的另一处或另一个文件。计算机信息检索在经历了传统信息检索、全文文本检索之后,随着多媒体技术的发展和应用,出现目前这种超文本检索方式。可用于检索人物、新闻、文档、文艺小说、旅游景点、绘画、古文物、生物等内容广泛的各种信息。,
15、29,2020/6/19,3.2按信息访问模式分(P5),根据检索方式分:(1)脱机检索(2)联机检索(3)国际联机检索(4)光盘检索(5)镜像检索(6)网络检索,(1)脱机信息检索,是六十年代发展起来的批次检索,用户不与检索系统发生直接联系,只需把检索要求送往检索中心,由检索人员在计算机主机进行文献检索的一种方式。优点:价格便宜,无网络通讯费,检索费用由用户平摊,随机存储。缺点:一次机会检索,检索结果延误,委托性检索。,(2)联机信息检索,联机检索是用户利用终端设备,通过通信网络或通信线路与检索系统联机,进行“人机对话”,从检索中心的数据库查找所需要的文献信息过程。特点:检索的速度快,检索结
16、果可以得到及时修改。缺点:检索费用高。,(3)国际联机检索*,该系统是70年代出现的一门现代化情报检索手段,目前已发展到相当高的水平,计算机联机网络和检索终端已遍及世界所有主要国家和地区。优点:(1)可以实现资源共享;(2)检索速度快;(3)信息资源专业化;(4)查全率和查准率较高。,2020/6/19,33,国际联机检索的缺点,检索费用高;对检索系统及其文档(数据库)的收录、标引、特点等问题较难了解、熟悉;检索技术和技巧不易掌握,世界上最著名的国际联机检索系统,1、DIALOG系统*是世界最大的国际联机检索系统1963年,原属美国洛克希德公司,系统设在加洲PaloAlto市,1988年转让给
17、美国Knight-Ridder公司。2000年又转入DIALOG公司经营。目前,该系统的联机服务网遍布世界70多个国家和地区的200多个城市,共设有联机检索终端25000余台。系统中各类型数据库数量的发展速度相当快,拥有数据库约900多个,占全世界机存总量的60%,内容涉及自然科学、社会科学、经济、商业等各个领域。,35,2020/6/19,36,2020/6/19,DIALOGWEB系统检索平台,2020/6/19,37,世界上最著名的国际联机检索系统,2、ORBIT系统:是世界是第二大联机检索系统,他建于1965年,总部设在美国费吉尼亚洲的马库林。提供专利、化学、能源、市场、工程和电子等方
18、面的信息,约有100个数据库,占全世界机存文献量的25%。主要提供补充DIALOG系统而不是与其竞争的数据,特别是在专利、商标和科技信息等领域具有独特优势。,2020/6/19,38,世界上最著名的国际联机检索系统,3、BRS系统:内容涉及医学、生物科学、教育、健康、物理和社会科学及其它综合性学科。有154个公用数据库和40多个私人数据库。4、ESA-IRS系统:是欧洲最大的、也是世界第三大联机情报检索系统,1964年成立于法国,1973年迁移至意大利,目前有100多个数据库。提供有原材料价格、宇航及高技术软件、美国化学数据、综合性数据库等。5、STN系统:由美国化学文摘社、德国Karlsru
19、hl专业信息中心、日本科技信息中心联合开发的国际间网络系统,约有200多个数据库:其中包括各具特色的美、德、日三国专利数据库、化学全文数据库、化学物质结构图形数据库及部分医药数据库等。,(4)光盘数据库检索,光盘:80年代发展起来的激光存储载体,继纸张感光材料、磁性载体之后问世的又一种新型的信息存储介质。能存储数据、文字、图形、图像、声音、动画等各种信息。一张普通的光盘、信息存储量约为650兆。光盘的分类:按存储方式分为(1)只读型光盘:CD-ROM(2)写读光盘:WORM(3)可擦写型光盘:ERM,光盘检索的定义和特点,定义:是一种用激光技术在特制圆盘上记录信息的检索方式。特点:(1)投资成
20、本低;(2)价格低;(3)运行速度快;(4)检索效果好;(5)下载方便;(6)安全性能高。,光盘检索的系统组成,单机光盘检索系统组成:(1)数据库:光盘(2)软件:系统软件和检索软件(3)硬件:计算机、光盘驱动器、显示屏、打印机等网络光盘检索系统组成:(1)光盘塔(2)光盘组网软件(3)光盘塔服务器,42,2020/6/19,(5)镜像数据库检索*,镜像:最原始的含义是在镜子里看到的你自己的像,在IT界中,将“镜像”这个词的含义进行了扩展,指的是完全一样的两个东西。镜像数据库:就是将光盘版、网络版数据库或主网站资源的数据复制到不同的地理位置(某地或本地)的镜像服务器上,成为该服务器的镜像数据库
21、,并为网络用户提供检索服务。目的是分担访问流量;如,CNKI、维普、万方数据、超星等,43,2020/6/19,通过计算机网络系统可以连接世界上各种公用数据库和商用数据库,可以帮助用户获取希望得到的信息。网络化信息检索系统的特点是:一般基于客户机/服务器,客户与服务器是同等关系,只要遵循共同协议(TCP/IP协议是目前最成功的网络体系结构和协议规范),一个服务器可被多个客户访问,一个客户可访问多个服务器。网络的用户数量不受到限制,它是一个开放系统而不是封闭式系统网络化信息检索将在全球范围内实现信息资源共享,全球网络是信息存贮与检索进一步发展的方向。常见检索有:GOOGLE、百度、多媒体、咨询行
22、及所有的外文数据库,(6)网络数据库检索*,4计算机信息检索技术*(P11),1.布尔逻辑检索2.截词检索3.位置运算检索4.字段限定检索,4.1布尔逻辑检索*(P11),布尔逻辑检索(Booleanlogical):是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中。,布尔逻辑运算符:在检索过程中用于表达词与词之间的逻辑关系的算符。分为三种逻辑关系:逻辑与(AND)(*)、逻辑或(OR)(+)、逻辑非(NOT)()表示。,46,2020/6/19,逻辑与,AANDB:检索词A和检索词B同时出现在一条记录中,例如:
23、汽车和飞机发动机。其作用是缩小检索范围,提高查准率。,A=汽车发动机,B=飞机发动机,汽车与飞机发动机,A,B,AandB逻辑“与”运算,47,2020/6/19,逻辑或(OR),AORB:记录中出现检索词A或检索词B或两词同时出现在一条记录中。其作用是扩大检索范围,提高查全率,汽车发动机或飞机发动机,A,B,逻辑“或”运算,48,2020/6/19,逻辑非(NOT),ANOTB:记录必须包含检索词A但不能包含检索词B。即在含有A检索词的文献中去除含有B检索词的文献。其作用是缩小检索范围,提高查准率。,A,汽车发动机,汽车、飞机发动机,飞机发动机,B,AnotB逻辑“非”运算,49,2020/
24、6/19,布尔逻辑算符的运算次序,用布尔逻辑算符组配检索词构成的检索提问式,逻辑算符AND、OR、NOT的运算次序,在不同的检索系统中有不同的规定。在有括号的情况下,括号内的逻辑运算先执行。在无括号的情况下,有下列几种处理顺序:NOT最先执行,其次执行,最后执行。最先执行,其次执行,最后执行。最先执行,其次执行,最后执行。按自然顺序,、谁在先就先执行谁。检索时,要事先了解检索系统的规定,避免逻辑运算次序处理不当而造成错误的检索结果。因为,对同一个布尔逻辑提问式,不同的运算次序会有不同的检索结果。,4.2截词检索,截词检索就是把检索词截断,取其中的一部分,在加上截词符号一起进行检索。主要用于检索
25、词的单复数、词性的词尾变化、词根相同的一类词,以及同一词的拼法变异等。常用的截词符有:“?”、“*”、“$”、“#”,51,2020/6/19,截词的作用:采用截词检索表达式,既能防止漏检,又能节省时间,能有效提高检索效率。截词符的使用:利用截词检索时,注意截词的部位,一定不能截的太深,否则误检率会很大。,52,2020/6/19,截词方法无限截断:即该词根后可跟任何字符,且字符数不限;如:child*,可查到child,children,childish,childhood等所有以child开头的单词。如:coumput?,可检出Compute,Computer,Computing,comp
26、utable有限截断:即该词根后至多可跟n个字符,如需要n个有限词符截词,请输入n个?即可;如,输入stud?表示截3个字母,可检出带有study、studies、studing等的文献。中间截断:又称前后方一致,允许检索词中间有若干变化。如,wom?n可以检索出:woman,women,4.3位置运算检索,位置算符:表示其连接的两个检索词之间的位置关系,不同的系统有不同的位置算符,以DIALOG系统为例:(W)与(nW)算符with的缩写。表示其连接的两个检索词必须按序出现,中间不允许插词,只能有一空格或标点、符号。如:high(W)class(N)与(nN)算符near的缩写。表示其连接的
27、两个检索词的顺序可以互易,但两词间不允许插词。(nN)中的n表示允许插词量少于或等于n个。如:internet(N)accessing命中记录中匹配词可能有:internetaccessing,accessinginternet。,54,2020/6/19,(S)算符Subfield的缩写。表示其连接的两个检索词必须出现在同一子字段中。子字段是指字段中的一部分,如一句句子,一个词组、短语。字段不限,词序不限。如:silicon(S)sensor命中记录出现的匹配情况如:Avacuummagneticsensor(VMS)usingasiliconfieldemittertipwasfabric
28、atedanddemonstrated.(F)算符Field的缩写。表示其连接的两个检索词必须出现在同一字段中,字段不限,词序不限。,55,2020/6/19,4.4字段限制,针对特定年代、特定类别、特定检索点等作限制,包括前缀限制符和后缀限制符,后缀限制符例如:/TI限在题目中查/AB限在文摘中查/DE限在叙词标引中查,前缀限制符例如:AU=限查特定作者JN=限查特定刊名LA=限查特定语种PN=限查特定专利号PY=限查特定年代,56,2020/6/19,5信息检索的方法,检索方法是指查寻文献信息的具体方法。选择科学有效的检索方法,对广、快、精、准地获取文献信息,提高检索效率,是非常重要的。文
29、献的检索方法主要有以下几种类型。,57,2020/6/19,5.1直查法,是指直接从有关的一次文献中获取所需信息的检索方法。利用直查法虽然可以较快地获取最新文献,能切实地掌握文献内容和实质,但面对大量的、无序的文献,存在着很大的盲目性、分散性、偶然性,很难查全,费工费时。许多文献用户都有利用直查法的经历,在长期实践中也摸索出一定的经验。,58,2020/6/19,5.2追溯法,是指利用引文关系获取所需文献信息的检索方法。被引用的参考文献多出自知名作者的论文、专著,所以通过追溯法检索到的文献大都具有较高的学术价值。但是被引用的文献在全部发表的文献中只占少数,有些引文与作者所写著作的主题关系也不大
30、,所以追溯法会漏检和误检。追溯法有两种情况(1)由新及旧的追溯法。当查到一篇适用文献后,根据其后面所附的引文、注释等,向前追溯出一个专题的文献,再根据检出文献提供的线索(参考文献),继续追溯。如此一环扣一环地扩检,有可能找到一系列对口文献。这是一种人们常用的方法,比较方便,但文献信息越检越旧。(2)由旧及新的追溯法。一篇有价值的论文被谁引用过?评论如何?有否发展?有否更新?利用引文索引便可解决这个问题,而且检索的文献越来越新。,59,2020/6/19,5.3工具法,是指利用一定的检索工具或检索系统获取所需文献信息的检索方法。这是科学的正规的文献信息检索方法,它节约检索时间,获取文献全面。工具
31、法在具体应用时还可分为以下三种方式:顺查法倒查法抽查法,60,2020/6/19,顺查法,这是一种以课题起始年代为起点从远到近按时间顺序的查法。顺查法适应于主题复杂,研究范围较大,研究时间较长的课题。,61,2020/6/19,倒查法,倒查法又称逆查法,与顺查法相反。这是利用选定的检索工具,由近而远的按时间逆序的查法。逆查法适用于新兴的学科或课题。,62,2020/6/19,抽查法,抽查法就是针对学科发展特点,抓住该学科发展迅速及文献发表较多的年代,抽出一段时间再进行逐年检索的方法。使用这种方法检索效率较高,但必须在熟悉学科发展特点的情况下才能使用。,63,2020/6/19,4综合法,综合法
32、,又称循环法,是指将直查法、追溯法、工具法综合运用的检索方法。综合法在具体应用时还可以分为以下三种方式:交替检索分段检索间隔检索,64,2020/6/19,(1)交替检索。在检索某个课题的文献时,同时交互使用不同的检索方法。例如,某人在接受了某个课题后,首先利用直查法在核心期刊中查到两篇文章,再根据其后所附参考文献利用追溯法检索出一批文章,而后发现一位著者的文章被多次引用,他又利用工具法从某专业性检索工具的累积著者索引中,检索出这位著者关于该课题的数篇有价值文章。,65,2020/6/19,(2)分段检索。即在检索某个课题的文献时,不同阶段使用不同的检索方法。例如,某人在接受了某个课题后,首先
33、利用倒查法对该课题的文献进行了全面检索;当课题进行到中期时又利用抽查法检索了近期有关该课题的文献;在课题即将完成时还利用追溯法对他在课题进展中发表的有关文章进行了检索,以调查社会上对该课题的反映。,66,2020/6/19,(3)间隔检索。由于引用文献有一个规律,就是最近五年之内发表的重要文献一般都会被近期文献所引用。所以在利用检索工具检索相关文献时,可以间隔五年分段进行。,67,2020/6/19,第6节信息检索的策略,信息检索是一项实践性很强的活动。俗话说:“熟能生巧”,只有在较长期的检索活动中舍得花气力,才能逐步掌握检索规律,使自己成为信息的主人。文献信息检索过程,是根据课题的要求,使用
34、一定的工具,按照可行的步骤、方法、途径,查寻文献线索或事实、数据,获取所需信息的过程。手工检索与计算机检索在步骤与方法上有共性,但也各有特点。,68,2020/6/19,6.1信息检索步骤*,分析课题,确定检索目标选择检索词,制定检索策略选择数据库上机检索及调整检索策略输出和分析结果,69,2020/6/19,明确检索的目的明确用户是要查新、查参考资料还是查询论文被收录或引用情况等,以便对检索的查准、查全和时间范围的指标要求有一个大致的了解,从而制定出符合情况的检索策略。课题分析对课题内容进行分析,找出核心概念和隐含概念,排除无关的概念,明确概念之间相互的逻辑关系。,1、分析课题,确定检索目标
35、,70,2020/6/19,具体可从以下几方面着手:(1)分析主题内容。通过主题分析,形成检索需要的主题概念,以便确定检索途径。(2)分析课题所涉及的内容及学科范围,以便确定有关检索标识(分类号)及选择合适的检索工具或检索文档。(3)分析课题所需信息的类型,包括文献媒体、出版类型、所需文献量、年代范围、涉及语种、有关著者、机构等。,71,2020/6/19,(4)确定课题对查新、查准和查全的指标要求。若要了解某学科理论、课题、工艺过程等最新进展和动态,则要检索最近的文献信息,强调“新”字;若要解决研究中某具体问题,找出技术方案,则要检索有针对性、能解决实际问题的文献信息,强调“准”字;若要撰写
36、综述、述评或专著等,要了解课题、事件的前因后果、历史和发展,则要检索详尽、全面、系统的文献信息,强调“全”字。,72,2020/6/19,2、选择检索词、制定检索式,(1)检索词:是表达文献信息需求的基本元素,是计算机检索系统中有关数据库进行匹配的基本单元。具体说:对课题进行主题分析,掌握课题的内容实质,找出最能代表主题概念的若干检索词。(2)检索式:就是指计算机信息检索系统中用来表达检索提问的逻辑表达式,由检索词和各种运算符及系统规定的其它组配符构成。,73,2020/6/19,(1)该词的所有拼写形式和方法(包括同义词,元素和元素符号、缩写和全称等)(2)该词的广义词、狭义词、相关词及多义
37、词等。(3)确定检索词和词的截断部位,调整词之间的位置关系及组配关系。(4)对于泛指的主题概念词,应选用其包容特性的具体内容来表达。,选择检索词应注意问题,74,2020/6/19,制定检索式,合理运用逻辑运算符构造检索式。符号的使用一定要正确、符合概念逻辑,并力求简洁、优化,还应注意运算符的优先级和括号的使用。例如:纤维混凝土与既有混凝土粘结性能及施工技术1.(纤维混凝土+新混凝土)*(既有混凝土+老混凝土)*粘结*(剪切+劈拉+抗渗+抗冻+断裂+收缩)2.(fiberornew)(2w)old(3w)concrete?(7n)(bond?oradherenceoradhesi?)and(s
38、hear?orsplit?orcleavageorfractureorruptureorshrinkageorcontractionorfrostorfreez?orpermeability),75,2020/6/19,3、选择数据库或检索工具,根据检索目标,确定检索目的、涉及的学科范围和信息类型,选择合适的数据库。具体选择过程中还应考虑数据库的类型(参考、全文还是电子期刊)、内容(专利、标准、会议)、收录的数据学科范围、数据库的更新周期,收录文献的语种等因素。例如,要看全文就要选用全文数据库或电子期刊;要查标准或专利就要选择标准库或专利库,76,2020/6/19,4确定检索途径,进行信息检
39、索时,总是以文献的某种特征作为出发点,按一定的途径进行的。一般地说,文献的内容特征和外表特征都可以成为检索的出发点。4.1内部特征途径(根据课题内容特征查找有关文献资料)与文献信息主题内容密切相关的检索标识称为文献信息的内部特征。表达文献信息内容特征的检索标识主要有各种形式的主题词和分类号。文献内容特征的检索途径包括:分类途径、主题途径(标题、关键词、主题词、文摘、全文),77,2020/6/19,4.2外部特征途径,与文献信息主题内容没有关系或关系不大的信息称为文献信息的外表特征表达文献外部特征的检索标识有:著者、著者单位、文献出处、专利号、报告号等。1)题名途径:根据文献题名来检索文献的途
40、径2)作者途径:根据已知作者姓名查找文献的途径3)文献出处:根据期刊名称、年、卷、期号途径,78,2020/6/19,5、实际检索调整检索策略,在手工检索条件下,通过手翻、眼看、思考作出判断,寻找相应的分类号、主题词、著者姓名、代码等,浏览其中著录的文献,选出对口文献。在计算机检索条件下,需输入检索逻辑表达式,由计算机进行查找和扫描,并打印或显示出命中结果。联机检索时,需要在终端呼叫通讯线路,用口令字表明自己是合法用户,进入检索系统并开始检索对话。在这些过程中都需要使用检索系统认可的“检索指令”。,79,2020/6/19,5、实际检索及调整检索策略,检索后通过查看文献检索结果数量的多少或相关
41、程度的高低,可以评价检索策略的好坏。通常情况下,需要多次修改检索策略,直到检索结果满意为止。在实际检索中,当放宽检索以提高查全率时,就会降低查准率;反之,当缩小检索范围以提高查准率时,就会降低查全率。因此要正确分析误检、漏检原因,及时调整策略。,80,2020/6/19,调整检索策略的具体方法,扩大检索范围的措施降低检索词的专指度,可从词表或检出文献中选择泛指词。调节检索式的网罗度,如删除某个不重要的检索词。进行族性检索,可用分类号或用OR连接一组同义词和近义词。取消某些限制过严的限制符。,81,2020/6/19,缩小检索范围的措施提高检索词的专指度。增加AND连接,进一步限定主题词。把检索
42、词限定在主要字段,如标题字段、主题词字段等。缩短检索年限,或限定某些刊物。,82,2020/6/19,6、输出和分析结果,检索完成后,采用一定的输出方式(套录或打印)和格式输出检索结果。各个数据库提供了多种输出格式,每种格式能得到的文献内容特征和外表特征都不一样,一般情况下,文献检索中篇名、作者、出处、文摘等字段是不可缺少的,因为这些字段有一定的参考意义。结束检索后,对结果进行分析,也是完整检索过程中不可缺少的一步,有助于提高检索质量。,83,2020/6/19,6.2实例:,广播、电视在网络传播中的采集技术主题概念:广播、电视、网络技术主题分类:G文化、科学、教育、体育(中图法)G0文化理论
43、G1世界各国文化与文化事业G2信息与知识传播G20信息与传播理论G21新闻学、新闻事业电子技术及信息科学新闻与传媒信息与传播理论,新闻学、新闻事业,广播电视注意:不同的检索工具或数据库有不同的分类主题条件:网络主题要求:方法、手段、内容等,84,2020/6/19,检索词:广播、电视;传播、传媒;网络、采集、传输检索式:(广播OR电视)and(传播OR主传媒)and(网络)and(采集OR传输)途径:电子技术及信息科学新闻与传媒检索工具:中国期刊全文数据库,85,2020/6/19,检索结果:1、题名:手持电视传播模式与运营模式分析作者:靳一;单位清华大学文化产业研究中心北京100084刊名:河南社会科学年2007期022、题名:基于NDK的数字电视传输流(TS)网络采集系统作者:陈耀华;单位广州大学信息与机电工程学院,刊名:世界电子元器件年2007期0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年热动式疏水阀项目投资价值分析报告
- 2024年液压接头项目可行性研究报告
- 2024至2030年中国水晶蝴蝶吊坠行业投资前景及策略咨询研究报告
- 2024至2030年中国反渗纯水机组数据监测研究报告
- 2024年网安系统项目评估分析报告
- 公共设施周边绿化树木修剪合同
- 二零二四年度广告发布合同具体条款
- 二零二四年度农业机械设备租赁与购买合同
- 二零二四年度城市空气质量监测系统建设承包合同
- 2024年度知识产权保护与维权合同标的(创新)
- 微景观制作课件
- 2023学年西藏省重点中学英语九上期末考试试题含解析
- 三位数除两位数的除法练习题
- 小学心理健康教育人教六年级下册目录生命只有一次教学设计
- 小学劳动课教案三年级上册5篇
- 2021版特种设备目录
- 五年级上册美术课件-第4课 未来的交通工具丨赣美版
- 最新爆破安全规程
- 主题班会课防盗
- 支委会委员选举计票单
- 近三年无重大违法违规情况的说明
评论
0/150
提交评论