下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、如何提高文献检索的查全率和查准率文献检索是科研的基本功,阅读文献是科研人员获取科研信息的重要途径。评价文献 检索质量的两个最重要的指标是查全率和查准率。查全率指的是检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被 检索出来。查全率=检出相关文献量 /文献库内相关文献总量 X 100%。查准率指的是是指检出 的相关文献量与检出文献总量的比率,是衡量信息检索系统检出文献准确度的尺度。查全 率=检出的相关文献篇数/检出的全部文献篇数 X 100%。查全率与查准率在一定程度上是 成反比关系的,为了提高查全率就要以牺牲部分查准率为代价,反之亦然。在不同
2、的情况 下,对二者的要求也不同,有时文献的全面更为重要,这时就要以提高查全率为重点,有时希望找到的文献准确率更高,就以提高查准率为重点。本文讨论的是怎样提高文献的查 全率。1检索词的转换。常见的转换是同义词、近义词、相关词、单复数及缩写形式,如果是动词还有可能有不同的时态。每一个检索词都有可能有多种表达形式,如果是由英文翻译过来的还有可能有多种翻译方法,所以应该尽可能找全检索词的所有同义词、近义词。相关词指的是与检索词不是同一个意思但是有关联的词。如,META分析的同义词包括元分析、荟萃分析、meta-analysis,近义词包括系统综述,相关词为循证医学。前列腺癌的缩写可能是Pca等等。 值
3、得注意的是,在检索中文文献的时候,有必要把英文的全称和缩写也作为检索词,因为有些中文文章中是直接用英文词汇表示的。2使用截词符。虽然从理论上来说我们找到所有的同义词和近义词可以扩大检索结果,但是要想做到这一点是相当困难的。这时可以利用截词符来帮忙。一般用的截词符是? ”和“*;'在不同的数据库中表示的意思有所不同,常见的意思是? ”表示0-1个字符,而“*表示多个字符。3使用上位词,即指代范围更广的词。有些检索系统有主题词途径,则可以选用上位主题词。例如水果是苹果的上位词,prostatic neoplasm的上位主题词是 prostatic disease4改变布尔运算符,即将连接两
4、个或多个检索词的AND改为OR,即可提高检出数量。5改变检索项。如要求检索词位于标题中或为关键词或主题,检出记录数太少,则可改为 要求位于摘要或全文中,检出记录数即可增加。6减少限制条件,增加副主题词。如果前面的检索中有限制条件,放宽或去掉限制条件;如果采用的是主题词和副主题词搭配的形式,看是否漏掉可能的副主题词。以上说的是在同一个数据库中进行检索。但是,每一个数据库所收录的文献都是有限的,而不同的数据库可能存在一定的互补关系。所以为了提高查全率, 应该多检 索几个数据库,将结果综合起来。当然前提条件是要了解每一个数据库收录期刊的范围、起止年代等,因为不排除有些小的数据库完全是另外一个大数据库
5、的子集的情况,这时当然完全没有必要再检索那个小的数据库了。即使是将目前所有的数据库加起来,也不能囊括所有的文献。例如,有一些年代比较久远的,或者是期刊知名度不高的。所以,除了在数据库中进行检索,还要辅以手工检索。包括对一些重要的而数据库中没有收录的期刊进行手工检索,在已经查到的文献的参考文献”中或有些数据库提供的相关文献”中进行查找,看有无漏网之鱼”,还有,可以请教相关领域的专家,看看是否有重要的文献没有检索到。一般我们检索文献不是英文的就是中文的,对于其它语种的则不做要求。如果是要求查全率很高,则可以检索一些不常用的语种的文献,如日文、法文、德文等等。当然如果自己不会那门语言,即使查到了,阅
6、读也是一个问题。如果真是非常重要,不妨请人翻译过来。一、选择检索工具选择恰当的检索工具,是成功实施检索的关键。选择检索工具一定要根据检索课题的 内容、性质来确定。主要应从以下几个方面来考虑:(1) 从内容上考虑检索工具的报道文献的学科专业范围。对此可利用三次文献如 国外工具书指南、工具书指南、数据库目录等来了解各检索工具(二次文献)的特点、所报道的学科专业范围、所包括的语种及其所收录的文献类型等。(2) 选择检索工具时,应以专业性检索工具为主,综合型检索工具进行配合、补充。(3) 在技术和手段上,由于计算机检索系统适应多点检索、多属性的检索,检索精度高,应首选机检工具,而且应选择合适的数据库,
7、目前许多检索系统如DIALOG OCLC都提供有从学科范畴选择检索工具的功能,可供用户利用。如果只有手工检索工具,应选择专业对口,文种熟悉、收录文献光,索引体系完善、报道及时,揭示文献信息准确,有一定深度的手工检索工具;如果一种检索工具同时具有机读数据库和印刷型文献两种形式,应以检索数据库为主,这样不仅可以提高检索效率, 而且还能提高查准率和查全率。(4) 为避免检索工具在编辑出版过程中的滞后性,在必要时则应补充查找若干主要相关期刊的现刊,以防漏检。二、将分类途径和主题途径结合提高查全率和查准率1. 分类途径和主题途径同时使用,提高查全和查准率。在确定查新点后,查新员必须对照查新点进行初查,即
8、根据用户提供的关键词进行检索,如一旦检索结果为零,查新员需对相应的主题词进行替换或通过扩检(检索其上位类词),以期获得相关文献,扩检的结果一定程度上会提高查全率,但其查准率必然会下降,为了兼顾查全率和查准率,可通过检索系统初步确定课题所属的类目,然后在该类目下进行所选主题词的检索,这样既可覆盖课题类目,又可切准课题主题。即在保证查全率的基 础上提高查准率。如“即食、熟食莲藕软罐头工业化生产技术研究”这一课题,通过分析初步确定的检索策略为:“(即食+熟食)* (藕+莲藕)”,检索后发现检索结果为零,为此检索策略扩大到“藕+莲藕”。检索后虽有相关文献,但检索结果过于泛滥,为了提高查准度,通 过分析
9、,本课题涉及的专业类目为“食品工业”,可在“食品工业”类目下,输入主题词“藕”,结果查到相关文献 26篇,通过阅读“即食藕”可用“方便藕”替代进行检索。2. 从主题途径入手,结合分类途径对检索策略进行修正,提高查全和查准率在确定查新点后,为了提高查全率,查新员需对用户提供的主题词及相关词进行检索, 其中相关词的确定需要通过广泛地阅读相关文献获得,这不仅需要花费大量的时间和精力, 而且由于阅读量的不足还会造成一定程度的漏检,为了提高查新效率和查全率,可通过初 检获取相关主题的大类号,然后在此类号下进一步检索以切准主题。例如课题“差别化纤维气流免浆加工法”,用户提供的关键词为差别化纤维、气流、 免浆等,经初查发现差别化纤维是一类纤维,泛指对常规化纤有所创新或具有某一特性的 化学纤维,如阳离子改性聚酯POY低弹混纤网络丝就属差别化纤维,为了查全其多种组合形式的名称,可先在差别化纤维所属大类 TQ340(化学纤维,一般性问题)、TS342(合成纤维) 和TS102 (纺织纤维)下检索,然后再进行“气流”的二次检索,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网络虚拟财产借钱合同模板
- 高速公路路基施工方案
- 产品质量风险识别与评估服务合同
- 海外房产买卖协议
- 人力资源代理销售合同
- 2024至2030年中国改色水数据监测研究报告
- 产品销售合作协议
- 2024至2030年中国天幕架数据监测研究报告
- 项目推广方案
- 供热合同范例
- PCB镀层与SMT焊接
- 看守所岗位职责
- 2019年青年英才培养计划项目申报表
- Sentaurus在ESD防护器件设计中的应用PPT课件
- 芳香油的提取
- 《抛物线焦点弦的性质探究》学案
- 人教版小学二年级数学上册全册教案【表格式】
- 佛山岭南新天地项目概况.
- 喷码机操作手册
- 会计学-上海汽车集团股份有限公司应收账款管理内部控制问题研究论文
- 甘肃省普通高中毕业生登记表
评论
0/150
提交评论