《计算机检索》PPT课件.ppt_第1页
《计算机检索》PPT课件.ppt_第2页
《计算机检索》PPT课件.ppt_第3页
《计算机检索》PPT课件.ppt_第4页
《计算机检索》PPT课件.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机检索概论,上海中医药大学文献检索教研室 罗晓兰,主要内容,计算机检索基本概念 数据库的类型 数据库结构 计算机检索途径 计算机检索技术 计算机检索策略,计算机信息检索概念,计算机文献检索经常称为机检,是文献检索的一种方式。 计算机信息检索是指利用计算机存储和检索信息。 指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息的过程。,计算机检索发展的历史,1. 脱机批处理检索阶段 2. 联机检索阶段 3. 光盘检索阶段 4. 网络化检索阶段,计算机信息检索系统的组成,1. 计算机 2. 通信网络 3. 检索终端设备 4. 数据库,计算机检索原理,计算机检索的特点,检索速度快 检索途径多 更新快 资源共享 检索更方便灵活 检索结果可以直接输出,数据库的类型,根据载体不同:联机数据库、光盘数据库、网络数据库 根据数据库的内容和功能: 书目数据库,如CSDL全国期刊联合目录 文摘数据库,如CBM(中国生物医学文献数据库) 全文数据库,如CNKI(期刊、学位等全文) 数值型数据库,如GenBank(基因库) 事实性数据库,如PDR(癌症研究信息) 多媒体数据库(图像、音频、视频),如爱迪克森网上报告厅 ,数据库的结构,文档记录字段 文档:数据库中一部分记录的有序集合 记录:数据库的信息单元,每条记录描述了一个原始信息的外部特征和内部特征。 字段:比记录更小的单位,是组成记录的数据项目。,常用字段,AB 文摘 PO 页码 AD 地址(第一著者) PP 出版社 AU 著者 PY 出版年 CA 索取号 PT 文献类型 CN 中国代码 RF 参考文献数 CL 分类号 IP 期 SO 出处(刊名、年、卷、期、页) TI 中文题目 IS 国际标准连续出版物号 TT 英文题目 TA 期刊名称 TW 关键词 LA 语种 VI 卷 MMH 主要概念主题词 MH 主题词,记录,字段名 对应文献的内部特征和外部特征,检索途径:用记录的某一特征作为检索切入点进行检索。 以文献外部特征为检索途径,如题名(刊名、书名、篇名)、责任者(作者、编者、译者、专利权人、出版机构等)、号码(标准号、专利号、索取号等)。 著者:根据已知责任者的名称来检索文献的途径。 刊名:根据已知期刊名来检索文献的途径。 机构:根据已知机构名来检索文献的途径。 引文:根据已知的引文信息,包括被引用文献的作者、主题词、刊名等。 以文献内容特征为检索途径 分类途径:按照文献资料所属的学科属性进行检索的途径 主题途径“按照文献的内容主题进行检索的途径。,计算机检索途径和技术,计算机检索途径和技术,据用户的需求,提供难易程度不同的检索方式: 分类浏览/导航、基本检索/简单检索、高级检索、专业检索等。,计算机检索途径和技术,数据库检索中提供的其他检索技术: 默认检索:又称“缺省检索”,指按照数据库预先设定的范围进行检索。 二次检索:在前一次检索的结果上,再次进行检索,缩小检索范围。 扩展检索:主要出现在分类和主题检索中,选择扩展功能,可以对主题词或者分类及其所有的下位词或下位类进行查找。 加权检索:出现在主题检索中。检索主要概念主题词的文献。 限定检索:对检索范围进行限制,如学科、文献类型、年龄组、性别等。 模糊检索:允许被检索信息与检索提问之间存在一定的差异,与检索词相关或者相似的词都会被命中,扩大检索范围。 精确检索: 检索范围仅限于输入的检索词,与之完全匹配才能够被命中。,计算机检索途径和技术,计算机检索技术,布尔逻辑检索 截词检索 字段限制检索 短语检索,布尔逻辑运算符(Boolean logic operator),布尔逻辑检索的基础,主要运算符有: 逻辑“与”AND 逻辑“或”OR 逻辑“非”NOT (有的数据库也表示为 AND NOT,BUT NOT) 运算优先级:NOTANDOR 可以用括号改变运算顺序:(),括号里的检索式优先运算。 例:(消渴 OR 糖尿病) AND 药物治疗,逻辑与,A AND B 检出记录中同时含有检索词A和检索词B 例:胃癌与十二指肠溃疡的关系。 胃癌 AND 十二指肠溃疡,逻辑或,A OR B 检出记录中含有检索词A或检索词B的文献 例:糖尿病 OR 消渴,逻辑非,A NOT B 在含检索词A的记录中,去掉含检索词B的记录 例:能源 NOT 核能,逻辑运算习题,1.检索紫外线与皮肤疾病的关系。 紫外线 AND 皮肤病 2.艾滋病的治疗 (获得性免疫缺陷综合征 OR AIDS OR 艾滋病) AND 治疗 3.肝炎的非流行病学研究 肝炎 NOT 流行病学,截词检索与通配符,用符号取代检索中部分字母,保留检索词中的相同部分,可提高查全率 按照位置分为:前截词、中截词、后截词 按照截词符代表的字符数量:有限截词、无限截词 截词符号:*、?、$、#等 各种检索系统采用不同的符号 如child*,可以检索出child,children,childhood wom?n ,可以检索出woman,women,限定符,在指定的字段中检索。 常用字段限制符有:“=”和“ in ” 字段限定的句式为: 检索词 in 字段名 字段名=检索词 例:张三in au au = 张三 针灸 in ti 提问:这两种限定方式有什么不同?,查全率和查准率,查全率(recall ratio) 查准率(pertinency ratio) 检出的相关文献数 查全率= 系统中相关文献总数 *100% 检出的相关文献数 查准率= 输出的文献总数 *100%,计算机检索步骤,分析检索课题,明确检索要求 选择数据库和检索途径 确定检索词,构建检索提问式 执行检索(优化检索策略) 处理检索结果,获取原文,分析检索概念,分析检索课题,明确检索要求,提取主要概念和限定条件。 例:查找2005-2009年高血压引起脑中风方面的学位论文。 分析: 主要概念:高血压 脑中风(同义词) 限定条件:时间限定: 2005-2009年 文献类型限定:学位论文,分析检索概念习题,1. 查找2000年以来张莉发表的关于乳腺癌诊断方面的综述文献。 2. 慢性淋巴细胞性白血病的药物治疗 3.细胞因子在人肝纤维化中的作用 4.2008-2010年动脉粥样硬化动物模型研究进展,优化检索策略的方法,如果检索结果太多,可缩小检索范围,提高查准率。 使用规范词、下位类

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论