计算机检索原理自动化.ppt_第1页
计算机检索原理自动化.ppt_第2页
计算机检索原理自动化.ppt_第3页
计算机检索原理自动化.ppt_第4页
计算机检索原理自动化.ppt_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章计算机检索原理 计算机检索概述1 计算机检索的发展2 计算机检索的原理3 文献数据库简介4 计算机检索中常用的运算符5 计算机检索策略的制定及调整 1 计算机检索的发展历史计算机检索从产生到现在经历了4个阶段 1 20世纪50年代 以批量处理 脱机检索为特点的第一阶段 美国海军兵器中心NOTS 4000条记录 与 不能人机对话 2 20世纪60年代末 联机检索阶段 出现网络 dialog 人机对话 3 20世纪70 80年代 联机检索与光盘检索共同发展阶段 前三阶段以文献数据库检索为主 4 20世纪90年代 基于互连网的数据库检索和Internet网上信息检索并重的第四阶段 因特网成为重要的电子信息源 2 计算机检索的原理 计算机检索的原理就是利用计算机将用户所提出的检索标识与检索系统中的标引标识进行比较 将匹配的文献视为命中 检索标识 检索式 是检索者根据对课题的分析 制定出的既能反映课题的要求 又符合计算机检索要求的检索语言 其中包括适当的检索词 以及合适的逻辑算符和位置算符 3 文献数据库简介 3 1数据库的定义和类型3 1 1定义 按一定方式存储的相互关联的数据集合 它是检索工具的一种 根据ISO DIS5217号标准 数据库至少要由一种文档组成 3 1 2数据库类型 文献目录型数据库 bibliographicdatabase 也称为书目数据库或者目录数据库 是二次文献数据库 包含文摘数据库 题录数据库 索引数据库 各国的MARC格式的图书目录 如EI SCIE等 指南数据库 referencedatabases 也称指示性数据库 其内容是关于某些机构 人物 出版物 项目 程序 活动等对象的简要描述 是指引用户从其他有关的信息源获取更详细的信息的一类数据库 如中国人物数据库 Dialog系统中的邓白氏国际市场情报库 数值数据库 numericdatabase 又称数据型数据库 此类数据库存储的均为数据信息 如中国统计年鉴 Dialog系统中的公司披露数据库 全文型数据库 full textdatabase 是指储存的数据是文献全文或者其主要部分是文献全文的一种数据库 如中国期刊全文数据库 重庆维普期刊全文库 3 2数据库的构成 由文档 记录 字段构成 1 文档 file 若干个逻辑记录构成的信息集合成为文挡 2 记录 record 记录是若干个字段组成的文献单元 3 字段 field 是文献著录的基本单元 用来描述文献主题内容相关的某种属性 4 计算机检索中常用的运算符 4 1逻辑算符4 1 1逻辑 与 用 and 或者 表示 是用以组配不同的概念逻辑符号 表示 and 连接的两个词在一个记录中必须同时出现 如 LibraryandComputer Library Computer 4 1 2逻辑 或 用 or 或 表示 是用来组配相同或相近概念的逻辑算符 表示在记录中出现其一即可作为命中 如 fiberorfibre fiber fibre 4 1 3逻辑 非 在系统中用 not 或者 表示 排除某个概念的逻辑算符 如 PatentnotJapan 表示检中的记录中包含Patent 不包含Japan Patent Japan 4 2优先算符优先算符用 表示 在含有多个运算的检索式中 可以用 将需要优先运算的部分括上 系统会优先运算 中的部分 然后在按照not and or的顺序进行运算 如 S fiberorfibre andoptical 4 3截词符和屏蔽符 4 3 1 截词符 用 或者 不同数据库有不同的规定4 3 2屏蔽符 作为屏蔽符 加在单词中间 可以代表1个字符的变化 如 wom n 表示women和woman 词中使用几个屏蔽符 则代表有几个字符的变化 有的数据库使用 4 4位置算符位置算符是用来规定检索词之间的位置关系的算符 4 4 1 w nW 意思是with 表示它连结的两个词前后位置确定 中间插词不能超过0 n个 w 也写作 实际上是 0W 表示连接的两个词必须紧密相连 中间不能插词 但是中间可以加连字符 如 Smotor W lorry 可以检出motor lorry和motorlorry 4 4 2 N nN 意思是near 表示它连结的两个词前后次序不限 中间可以插入n个词 N 实际上是 0N 表示连结的两个词中间不得插入其他词 如 Scorrosion N resist 可以检索出corrosionresistance corrosionresistant resistingcorrosion Sprotect 2N forest可以检出protectionofforest forestprotection protectingtheforest等 4 4 3 S 意思是subfield或sentence 它表示连结的两个检索词要在同一个子字段或同一句话中出现 如 Scomputer s library是要求computer和library在同一个句子中出现Scs wuhan s university是要求wuhan和university在cs字段中的同一个子字段出现 4 4 4 F 意思是field 表示连结的两个词要在同一个字段中出现 如 Sfieldbus f multimedia是要求fieldbus和multimedia在同一个字段中出现 以上是计算机中常用的位置算符 但并非所有的系统都可用 不同的检索系统有其自己的规定 5 计算机检索策略的制定及调整 1 概念的选取 1 核心概念的选取 变温条件下煤层损伤与瓦斯运移的热流固耦合模型 2 发掘隐含概念 并购 剥离 拍卖 石质文物的保护 3 考虑同义词 保护conservation preservation protection 4 使用规范的用语 行业术语 用词表来规范 单车 自行车 5 排除不必要的概念 使用专业数据库或通用词 6 使用准确的代码 标准号 专利号 产品代码 2 数据库的选择 1 合适的主题范畴 社科 工程技术 化学 医学 2 合适的数据库类型 年度范围 专利 标准 期刊 书 3 检索策略的制定及调整 1 拟定检索式 变温条件下煤层损伤与瓦斯运移的热流固耦合模型 非等温or变温 and 煤层and 损伤or破坏or损坏 or煤岩体and损伤 and 瓦斯or煤层气or煤气 and 运移or漂移or运动 and热流固 2 如果检索结果太少 适当调整策略 以扩大检索范围 增加同义词或隐含概念 a 热流固有没有同义词热 流 固 b 去掉热流固 c 去掉第一个检索词 非等温or变温 3 如果检索结果太多 也要适当调整策略 以缩小检索范围 增加概念或用字段 年代等限制 增加检索词 非等温or变温 and煤层 主题and 损伤or破坏or损坏 and 瓦斯or煤层气 主题and 运移or漂移or运动 and热流固and 耦合模型or数学模型 第一检索式结果为0 去掉热流固还是0 再去掉 变温 非

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论