数据库检索策略_第1页
数据库检索策略_第2页
数据库检索策略_第3页
数据库检索策略_第4页
数据库检索策略_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据库检索策略11 分析课题2 选择检索词3 编制检索式4 查全与查准5 利用各数据库的功能6 检索策略分析举例2通常要解决以下问题:课题的范围、类型及所属的专业领域课题的主要内容和重点课题的核心概念和术语课题所需信息的时间范围和语种课题对查全和查准的倾向性首选手册、百科全书、专著等三次文献作为分析课题的手段,在此基础上去查询新的文献。1 分析课题3检索词的全称、简称、俗称与英文缩写检索词的上下位类扩展外来词的译写变化少用或不用对课题意义不大的词深入课题寻找检索词外文检索词的多种写法2 选择检索词检索词是概括检索需求的简洁词语用于检索的所有词汇都是检索词4 以用户提供的关键词为参考,根据检索要

2、求复核、筛选、补充、精炼检索用词。 选定的检索词应符合检索目的;确认检索词是否为规范词;并列出常用中外文同义词、缩写词, 以及核心词的上下位类词。 充分利用词表、词典、百度、谷歌、读秀,并从已检出的文献中,扩展检索用词。检索词选择技巧5(1) 立足规范词,兼顾自由词 胶粘剂: 黏合剂、粘合剂、粘固剂、粘结剂、粘附剂、 胶黏剂、胶合剂、粘接剂、粘胶剂(2) 注意词的全称、简称及缩写字母 乙型病毒性肝炎(乙型肝炎、乙肝、HBV)(3)必要时应向上下位类词扩检 电阻焊(点焊、缝焊、凸焊)(4)注意外来词的译写变化 波尔兹曼(玻耳兹曼、玻尔兹曼、波耳兹曼、波尔茨曼、Boltzmann ) 欧几里德(欧

3、几里得、欧基里德、欧几理德、欧氏几何、 Euclid )(5)同义词的选择方法 利用数据库的同义词选择功能、利用搜索引擎寻找同义词 从数据库检索结果中寻找同义词、利用自己的专业知识 利用自己平时积累的知识6利用搜索引擎查找同义词7检索词选择要点81)切分 切分是对课题的语句以词为单位进行拆分,转换为检索的最小单元。 例1:检索“妇女吸烟与肺癌的关系研究”相关文献。 直接切分:妇女|吸烟|与|肺癌|的|关系|研究 注意:当词切分后将失去原来的意思时,不应再切分,即必须注意 保持意义的完整。 如“中国科学院”、“电子邮件”不可再切分。92)删除 删除是对自然语言中不具有实质性检索意义的: 虚词(如

4、介词、连词、副词等), 使用频率较低的词, 专指性太高、过分宽泛的词 过分具体的限定词 不能表达课题实质的高频词(研究、发展等) 存在蕴含关系可以合并的词(检索词重复或包含)10 英语或汉语中都有许多虚词,不能作为检索词。 如:汉语中“的、地、得、了”等助词 英语中的a about also and any as at be between by both for some so not this with等介词或冠词等11 例2:检索“中国非常规天然气工业的发展前景研究”方面的相关文献。 进行拆分以后,工业、发展、前景、研究这四个自由词具有一定的检索意义,但是由于或者是意义过于宽泛、或者是不

5、能表达课题实质、或者是存在蕴含关系的原因,没有必要全部作为检索词,根据需要可以保留1-2个作为检索词。 适合在“摘要”或“全文”字段使用! 本课题最主要的核心词汇是“非常规”“天然气”! 123)扩展 想查全应当将核心词汇进行扩展(同义词、近义词、上下位词)。 例1:检索“妇女吸烟与肺癌的关系研究”相关文献。 核心词:吸烟,肺癌 扩展:抽烟,烟,癌症,肿瘤,恶性肿瘤 例2:检索“人工智能技术在计算机辅助教学中的应用与实现”相关文献。 核心词:人工智能、计算机辅助设计 扩展:同义词:智能模拟 下位概念:模式识别、自然语言理解与生成、 专家系统、自动程序设计 、数据智能检索, 计算机辅助教学系统

6、(computer Aided Instruction ,CAD ) 13英文检索词的选择 (请参见后续课件)14 检索策略是检索前制定的检索概念组配和执行顺序的方案,是表达用户具体的检索思想与检索要求。 信息检索成功与否,检索的查全率与查准率能否实现,都与检索策略的关系及其密切。 在计算机检索中,检索策略具体表现为检索式。 检索式将各个检索词之间的逻辑关系、位置关系等用检索系统规定的各种组配算符连接起来,成为计算机可识别和执行的检索命令形式。完整检索式由检索字段、检索词和逻辑算符构成。 检索式中的算符包括:布尔逻辑算符、 位置算符、 截词符、 限制算符、 系统规定的其他组配连接符号3 制定检

7、索策略,编制检索式151、构造的检索式只是一个表达式,该表达式不一定就能在数据库的专业检索方式下直接复制到检索框中检索,要看每个数据库的检索式输入要求;2、检索词的输入以及逻辑算符的输入或选择要遵循所选择的数据库的逻辑运算顺序,以避免输入的经过检索运算后得到的结果与构造的检索表达式不符。3、查看每个数据库的检索帮助和字段代码表。检索式构造注意事项(具体检索式构造请参见课件字段与检索式)163.漏检率 漏检率=1查全率4.误检率 误检率=1查准率4 考虑查全与查准,调整检索策略* 查全与查准相互制约、此消彼长* 检索原则:兼顾查全与查准1.查全率2.查准率17ABCDD:检索系统中所有信息的总量

8、A:在系统中存在着且能满足信息检索需求的相关信息总量B:本次检索输出信息量C:本次检索输出的且与需求相关信息数量 C=AB,即合理命中的信息量 查全率= C / A100% 查准率= C / B100%18选择较大字段:如摘要、主题、全文、任意字段等尽量多用同义词、近义词、反义词、缩写词、上下位类词(增加逻辑或关系)减少逻辑与关系(限制条件)采用模糊匹配功能扩大检索年限使用截词符(*?$)提高查全率的方法19选择较小字段:如篇名(题名)、题名或关键词字段尽量增加核心检索词:从内容中挖掘核心词使用词位检索采用精确匹配/精确短语功能采用“AND” 或“NOT”算符连接检索词或进行二次检索。减少同义

9、词、同族相关词等相关性不强的检索词。提高查准率的方法20(1)未按数据库检索规定运算次序(将逻辑或误填为逻辑与)高级检索在检索框中使用了逻辑算符初级检索在检索框中同时使用逻辑算符和精确匹配(2)检索条件过于严格使用过多的逻辑与对字段限定太严(3)检索词不当选用了不规范的主题词或某些产品的俗称、商品名同义词等没能运用全多数数据库难以实现对命名较复杂化合物的检索检索结果很少或为零的原因及解决方法21(4)望文生义,没有发现隐含概念利用专著、综述、网上资源仔细分析课题阅读检索到的文献,不断调整检索策略(5)确实未曾有此方面研究的报道丢掉一些次要概念,用一两个最核心的检索词进行检索,然后人工筛选A物质

10、+B方法,可借鉴C物质+B方法或A物质+E方法,借鉴一切可以借鉴的前人文献22(1)未按数据库检索规定运算次序(比如逻辑或的关系的检索词没有列在前面)只允许用半角符号错用了全角(2)对课题分析不到位,检索策略不当主题太宽泛检索词太宽泛字段太宽泛缩写引起多义性误检(3)该领域的文献确实很多检索结果太多的原因及解决方法235 利用各数据库的功能(1)各种限制条件 (期刊范围/年限/学科范围/精确/模糊/词频/排序方式/文献类型/语种选择等等)(2)二次检索(3)精炼功能 (哪个数据库有精炼功能,以及可精炼的项目)(4)分析功能 (哪个数据库有分析功能,以及可分析的项目)(5)有无自动截词功能(6)

11、数据库自带的独特功能24 检索课题“抗糖尿病药物罗格列酮的合成”1 分析课题 药物合成领域,重点在于该药物的合成而非应用2 选择检索词 核心词汇为罗格列酮和合成,根据搜索引擎或数据库初步检索或自己的专业知识知道罗格列酮属于噻唑烷二酮类的化合物,俗称TZDs。 还可以从其他结构相近的抗糖尿病药物例如曲格列酮等列同类药物的合成入手检索到可以运用到罗格列酮的合成的方法; 6 检索策略分析举例得到还可以用的检索词为噻唑烷二酮、TZDs、列酮。25 而且“合成” 最主要的替代词是“制备”,还可以衍生为“制造”、“生产”等; 如果还想扩大范围,可将检索主题扩大至“抗糖尿病药物的合成”,糖尿病其实就是因为体内周围组织对胰岛素促进葡萄糖的吸收、转化、利用发生了抵抗而使血糖升高)。 得到还可以用的检索词为制备、制造、生产;糖尿病、血糖、胰岛素 。26 3 制定检索策略,编制检索式 罗格列酮*(合成+制备) (噻唑烷二酮+TZDs+列酮)*(合成+制备) (罗格列酮+噻唑烷二酮+TZDs+列酮)*(合成+制备+制造+生产) (噻唑烷二酮+TZDs+列酮)*(合成+制备+制造+生产) (糖尿病+血糖+胰岛素 )*(合成+制备+制造+生产) 检索式要根据自己的需求以及检索结果不断动态调整,兼顾查全与查准最终检索到满意的结果27(1)明确检索目的(2)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论