计算机检索技术_第1页
计算机检索技术_第2页
计算机检索技术_第3页
计算机检索技术_第4页
计算机检索技术_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息资源检索技术信息资源检索技术 现代信息资源检索系统都支持多种检索技术,以满足用户的需求,但各检索系统支持的检索技术不尽相同,而且即使都支持同一种检索技术,所采用的运算符号也不尽相同,在使用检索系统时应先查看检索帮助了解其支持的检索技术和运算符。1 1 全文检索技术全文检索技术2 2 字段限定检索技术字段限定检索技术3 3 布尔逻辑检索技术布尔逻辑检索技术4 4 优先运算检索技术优先运算检索技术5 5 词间位置检索技术词间位置检索技术6 6 词组词组/ /短语检索技术短语检索技术7 7 截词检索技术截词检索技术8 8 模糊模糊/ /精确检索技术精确检索技术 建立文中自由词索引的全文检索技术可

2、以实现对数据库中全部字段以及字段中的全部内容进行检索。 英文文献的计算机自动分词以词间空格直接抽取,避开禁用词(无检索意义,或作为运算符使用),如有的检索系统规定an、and 、by 、for 、from 、of 、the 、to和with为禁用词。 中文文献或采用单汉字切分法,或采用词典标引法,抽取词语列入索引,等等。 全文检索技术默认的匹配方式为模糊匹配,即部分包含就算匹配,属于模糊检索方式。 将检索词限定在字段中的检索技术,能提高查准率,属于精确检索方式。 一般可利用表单选择相应字段,也可以使用专业检索式,不同检索系统字段限定符不同。 常见的字段有:常见的字段有: TI=TI=篇名;篇名

3、; AU=AU=作者;作者;KY=KY=关键词;关键词;JN=JN=刊名;刊名;AB=AB=文摘;文摘;PY=PY=年代;年代;PN=PN=专利号等。专利号等。例如:TI=信息素质 AU=文格波 PY=2010 中文生物医学数据库CBM字段检索中文名称中文名称代码代码举例说明举例说明著者文摘AAAuthor in AA中文摘要AB肝炎 in AB著者地址AD南华大学 in AD原文出处AFLancet in AF著者AU文格波 in AU(AU=*)国内代码CN“31-1001/R” in CN (CN=*)分类号CLR322.4 in CL特征词CT儿童 in CT资助类别FS 自然科学基金

4、 in FS 在搜索引擎搜索引擎中,欲在网页标题字段中检索“软件设计”,可表述为:“intitleintitle: :软件设计”; 在NSTLNSTL检索系统中,欲在文献题名字段中检索“软件设计”,可表述为:“tit=tit=软件设计”; 在维普维普检索系统中,欲在文献题名字段中检索“软件设计”,可表述为:“T =T =软件设计”; 在Engineering VillageEngineering Village检索系统中,欲在摘要字段中检索“软件设计”,可表述为:“(software design)WnWn AB”;欲在作者字段中检索“Smith,Aaron”,可表述为:“( Smith,Aa

5、ron) WnWn AU”。 3.布尔逻辑检索:用布尔逻辑运算符把具有简单概念的检索词连接并组配成复杂概念的逻辑概念进行检索的方法,主要有逻辑与、或、非三种。 1).逻辑“与”AND(*)用于交叉概念和限定关系组配,它可以缩小检索范围提高检准率。 2).逻辑“或”OR(+)用于并列关系的组配,它可以扩大检索范围,提高检全率。 3).逻辑“非”NOT(-)用于从原来的检索范围中排除不需要的概念,使检索结果更准确。 7AND Both words must be presentOR Either or both words must be presentNOT The first but not

6、the second word must be present891) What Boolean operator would you use to combine the following search terms, Fruit Flies _ Drosophila melanogaster:2) What Boolean operator would you use to combine the following search terms, Morphology _ Appearance:小测验小测验Quiz3) What Boolean operator would you use

7、to combine the following search terms, genes _ eye colour:4) To exclude articles that use the term red eyes, what Boolean operator would you use?One answer only. AND OR NOT A、布尔逻辑的运算按“非(NOT)与(AND)或(OR)”的顺序从左至右进行运算,就象数学中的四则运算的“先乘除后加减”一样。 B、在检索表单里按由上至下的顺序进行运算。1、 TI=肝炎 and KY=治疗2、(KY=阿司匹林 or KY=乙酰水杨酸 )

8、 and TI=副作用3、JN=南华大学学报 and (AU=胡 OR AU =李) and KY=动脉硬化4、中山大学刘祖国教授发表论文被外文数据库收录的情况?PUBMED:Liu ZG AND GUANGZHOU OR ZHEJIANG()Liu ZG AND GUANGZHOU; Liu ZG AND ZHEJIANGLiu ZG AND (GUANGZHOU OR ZHEJIANG)= Liu ZG AND GUANGZHOU OR Liu ZG AND ZHEJIANG () 1)、所有检索系统都支持括号优先符的运算。 2)、括号是半角状态下的圆括号。 3)、当检索式中含有逻辑“或”

9、运算且不知道系统采用哪一种运算顺序时,可以用括号将“或”运算的前后项括起来进行优先运算。例例1 1:检索:检索“胃癌的诊断或其治疗胃癌的诊断或其治疗”1)胃癌胃癌 and 诊断诊断 or 治疗治疗2)胃癌胃癌 and (诊断诊断 or 治疗治疗)例例2 2:在:在EIEI系统中检索系统中检索Aaron SmithAaron Smith所写的有关软件设计的所写的有关软件设计的文献文献(software design) Wn AB) AND (Smith,Aaron) Wn AU)1)、邻接检索或词距检索,是对逻辑“与”检索的改进,国外检索系统常见,中文检索系统只有CNKI具有此功能。2)、用邻近

10、运算符With或Near连接两个检索词,表示要求两个检索词同时出现在同一记录中,两词的相互位置必须符合规定的相邻度才能被命中检出。 A、with:连接两个词检索,所检出的文献同时含有这两个词,并彼此接近,词序不可颠倒。 用“W”表示,如:A (nW) B。 B、near:连接两个词检索,所检出的文献同时含有这两个词,并彼此接近,词序可以颠倒。用“N” ,如:A (nN) B。 注:在W或N前加一个数字n,表示相邻度。WithWith如:communication (1W) satellite 检索结果中含有communication satellite、 communication of sa

11、tellite 、 communication through satellite等 的记录。Near:Near: 如:communication (1N) satellite 检索结果中含有communication satellite、 satellite communication、communication through satellite等 的记录。 如:computer (2N) image (1N) processing 检索结果中含有computer image processing或computer vision and image processing 等的记录。1、Sc

12、ienceDirect:用pre/npre/n表示(n)With,表示两词相邻,词间可插入0-n个词,词序不变(pre代表precious,即在前之意);用w/nw/n表示(n)Near,表示两词相邻,词间可插入0-n个词,词序可变(w代表words)。2、EBSCO host:用WnWn表示两词相邻,词间可插入0-n个词,词序不变;用NnNn表示两词相邻,词间可插入0-n个词,词序可变;1)、有的外文检索系统中默认用空格代替逻辑“与”运算符,中文检索也会自动分词,造成检索词组被拆分的情况。2)、用引号将检索的词组或短语标注起来,计算机就只检索出含有该词组或短语的信息,而不会将词组或短语中的若

13、干个词分开检索。例如,输入带引号的“China culture”,检索结果China culture被作为一个整体,而那些同时有两词但被分开的情况避免了。再如,输入“北京大学”,那些“北京的清华大学”的信息就会排除。注:引号一般是半角状态下的双引号“”,有的检索系统用半角大括号,请注意查看检索规则。截词检索就是用截词符号代替检索词的某一部分,用截出的片断对具有相同词干和相同词根的词进行检索的一种方法。不同数据库有不同的截词符,常用的截词符有:*、?、%、$ 等等。 如用computer*表示以computer词干开头的词,后面变化无数位(当然也包括词干本身)如:包含computer、compu

14、ters、computerize、computerise的记录。截词符可用在词头、词中和词尾的任何部位,分别是后截词(即后方一致,仅DIALOG等少数大检索系统使用)、中截词(前后方一致)、前截词(即前方一致)。各地图书馆的书目查询OPAC系统中提供的前方一致、后方一致、中间一致等检索方式,也属于截词检索。在中文检索系统界面中,一般均选择有“模糊/精确”的交替控件,系统默认为模糊检索。1)、模糊/精确检索技术第一种含义:模糊检索相当于截词检索,如NSTL在关键词字段中检索词“汽车”默认模糊匹配时,可以检出“汽车”、“汽车配件”、“公交汽车线路”等文献;在作者字段中检索“马芳”所写文章,在模糊检索状态

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论