整合现代信息检索技术查询收录的技巧探究_第1页
整合现代信息检索技术查询收录的技巧探究_第2页
整合现代信息检索技术查询收录的技巧探究_第3页
整合现代信息检索技术查询收录的技巧探究_第4页
整合现代信息检索技术查询收录的技巧探究_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、整合现代信息检索技术查询收录的技巧探究 摘要本文着重总结分析了运用EV2平台查询文章收录时可以整合的现代信息检索技术及软件工具,具体包括截词运算、位置运算、公式运算、TAG,运用Refworks订制RSS等。以上技术及工具的综合利用可以提高查全查准率、简化工作程序、提高工作效率。 关键词EV2;截词检索;位置检索;TAG;RSS;RefWorks 1 运用截词检索 截词检索是检索英文数据库的一项常见技术,在EI数据库检索中用“,”代替单个字符,用“*”代替多个字符。笔者从以下课题切入,具体分析该技术在查询收录中的应用。 检索课题:请从查全与查准两个角度出发,分别采取不同的策略,对1995到20

2、05年间哈尔滨工程大学师生公开发表或参会论文被Compendex数据库收录情况进行彻查。 为求查全,我们编制了一条表达式(以下称策略一):(HarbinEng*Univ*)wnafandCOREwndt(注:wn=within,af=authoraffiliation,dt=documenttype) 经检索统计,具体结果见表1。 策略一主要运用了EI检索中的截词技术,“*”是通配符,能够代表所有在该位置出现的字母。CORE用来代表核心数据。从作者机构字段入手,返回所有字段中包含HarbinEng*Univ*字样的数据。用策略一的好处是,一个也漏不掉,保证查全率。关于哈尔滨工程大学的各种写法,

3、缩略语和发生拼写错误的词组也能囊括其中。查全率可以做到百分之百。但它的弊端也是很明显的。 在EI数据库中,由于截词算符不能与位置算符(near、onear)同时使用,因此策略一无法控制检索式中每个单词出现的顺序和位置,数据库除了会返回所有哈尔滨工程大学的文章之外,还会把二级学院中有Engineering字样,机构名称中包含Harbin或University的数据一并返回,如:Institute Of Electrical And Electronic Engineering,Harbin University Of Science And Technology(哈尔滨科技大学);School

4、Of Electrome chanical Engineering,Northeast For estry University(东北林业大学);Department of Electrical Engineering,Northeast Agricultural University(东北农业大学);School Of Computer And Information Engineering,Harbin University Of Commerce(哈尔滨商业大学);Schoolof Electronic Engineering,Heilongjiang University(黑龙江大学)

5、等。因此每一次返回的结果都得进行人工筛选,将其他学校排除。 2 运用位置检索 在EI数据库中,用来表示位置检索的算符有两个:NEAR和ONEAR,其中NEAR不限定词间顺序,ONEAR要求词间顺序。 同样上面的课题,如果采用位置检索,并要求与截词检索有同样的效果,该如何进行呢?为求查准,并力争查全,我们编制了以下八条表达式(下称策略二)。 检索策略二: 检索式一(#1):(Harbinonear/0Engineeringonear/0Univ)wnafandCOREwndt 检索式二(#2):(Harbinonear/0EngOnear/0Univ)wnafandCOREwndt 检索式三(#

6、3):(Harbinonear/0Engineeringonear/0University)wnafandCOREwndt 检索式四(#4):(Harbinonear/0Univofonear/0Engineering)wnafandcorewndt 检索式五(#5):(Harbinonear/0Universityofonear/0Engineering)wnafandcorewndt 检索式六(#6):(Harbinonear/0Univofonear/0Eng)wnafandCOREwndt 检索式七(#7):(Harbinonear/0Engonear/0University)wnaf

7、andcorewndt 检索式八(#8):(Universityofonear/0Harbinonear/0Engineering)wnafandcorewndt (注:wn=within,af=authoraffiliation,dt=documenttype) 实施检索后,具体数据见表2。 策略二主要运用了EI检索中的位置算符(near、onear),其中onear要求词间有严格的顺序。这样做的优点就是顾全了策略一无法兼顾的查准率,使得返回的每一条数据都是我们所需要的。但是这种策略要求我们有统一并且规范的机构名称。通过对十一年间哈尔滨工程大学论文被EI收录的数据的观察整理,笔者一共找到关于

8、哈尔滨工程大学英译名的八种写法,按十年间被使用的频次排序如下: (1)HarbinEngineeringUniversity(462) (2)HarbinEng.Unvi.(299) (3)HarbinEngineeringUniv.(163) (4)UniversityofHarbinEngineering(5) (5)HarbinUniv.ofEngineering(4) (6)HarbinUniversityofEngineering(2) (7)HarbinEng.University(1) (8)HarbinUniv.ofEng(1) (9)HarbinEngineeringUniv

9、rsity(1) 显然,用策略二,为了避免遗漏,得将八个检索式的返回结果相加,才能达到与策略一一样的结果。并且,一旦发生拼写错误,被检到的可能性为零。 3 运用公式检索 我们都知道,EI数据库的数据是每周更新的,如果能够跟踪每周变化的情况,将一段时间的大任务细划到以周为单位的小任务,同样可以实现将工作简化,提高效率的目的。这时,运用公式运算就是最佳的选择。可以将以下这段表达式加入到我们的检索式中: yyyyww-yyyy 比如:如果想锁定哈尔滨工程大学师生发表或参会文章在2007年第一周被EI收录的情况,就可以编制以下表达式: (200701200701)wnwkand(HarbinEng*U

10、niv*)wnaf 利用公式就可以在任意时间之后去检索某一年某一周数据库增加的内容,当这一周过去,这一周增加的内容就凝固在这个公式中,无论何时都可以方便快捷地把它们找出来。 如例中所示,公式运算可以根据需要与截词或位置运算相结合。 4 运用TAG Tags,标签,是EV2平台整合的新功能。Tags作为Web2.0的新应用之一较常出现在BLOG或网页里用来分类,Tags也可以与查询收录结合起来。 在通常的查收查引工作中,我们会将一个自然年内收录的文章发布在学校或图书馆的主页上供在校师生查询,在日常的咨询工作中也经常会接待要求查询文章收录情况的读者。如何让发布与我们的工作同步,Tags是一个不错的思路。 工作人员可以随时将检索出的记录分院系打上Tags,设定为MyInstitution。那么所有老师与同学就可以在打上院系Tags的文章中检索自己发表的内容,最限度地缩小了范围,节省了检索的时间。 另外,共同做查询工作的同事也可以通过Tags建立共享,先设立一个共享团队,通过TAG共享检出的记录,使工作配合更加默契,也可节省大量重复检索的时间。 5 运用RSS订制及Refworks 随时跟踪数据库收录的变化,RSS是一个不错的助手。可以利用RSS订制与推送的功能将成熟的策略订制到任意一款RSS阅读器中。RefWorks作为参考文献管理系统也有RSS订制功能。 第一步:设计策略进行检索

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论