第3章 文献数据库与计算机检索_第1页
第3章 文献数据库与计算机检索_第2页
第3章 文献数据库与计算机检索_第3页
第3章 文献数据库与计算机检索_第4页
第3章 文献数据库与计算机检索_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文献数据库与计算机检索1.文献信息数据库2.计算机信息检索基础3.检索效果评价及其优化1.文献信息数据库

文献是记录知识的载体。数据库是结构化的数据集合,至少由一种文档组成并能够满足某种特定目的或特定数据处理系统需要的数据集合。当数据库记录的对象为文献信息时,就称为文献信息数据库。文献信息数据库的结构一个数据库通常由一个主文档(MasterFile)和若干个索引文档或称倒排文档(InvertedFile)

组成。文档——是具有某种特征的全部记录的集合。记录——是构成文档的基本单元,由各种反映文献特征的字段组成。如一篇论文、一件专利、一本图书、一个标准的相关信息都能够成为文档中的一条记录。字段——是记录的基本组成元素。一条记录的常见字段通常包含题名字段、著者字段、主题词字段、文献出处字段(如刊名等)多种字段。文献数据库中常见的字段和段码2023/9/22文献数据库的类型按数据库文献记载的详细度可分为——书目型数据库(二次文献数据库):仅提供文献检索,读者根据其提供的线索查找文献原文。可以分为:题录型文摘型EISCI中国科学引文索引文献数据库的类型按数据库文献记载的详细度可分为——全文数据库:不仅提供文献的基本信息及线索,同时还提供原始文献本身的数据库。主要包括全文数据库、术语数据库、图像数据库等等。如:CNKI万方ElsevierIEL文献数据库的类型按数据库文献记载的详细度可分为——混合型数据库:数据中的数据,一部分只是提供参考数据库中的信息(文献的基本情况及线索);另一部分则可以提供全文数据库中的信息(原始文献本身)。如:EBSCO(ASP\BSP)文献数据库的类型按文献数据库收录信息的学科范围可分为——(1)专业性文献信息数据库(CA)(2)综合性文献信息数据库(中国期刊网)文献信息数据库的评价标准①收录内容范围——系统准确。②揭示文献详略——完备详细。③更新速度快慢——及时快速。④检索字段多寡——途径丰富。⑤检索功能强弱——高效完善。⑥用户使用方便——易学易用。⑦维护服务质量——及时到位。计算机信息检索基础计算机信息检索——指利用计算机及相关软件和通信设施,对本地计算机、远程服务器及网上信息进行检索的过程或活动。随着信息技术的快速发展及对各种文献信息的数字化处理,计算机文献信息检索已经成为文献信息检索的主要手段。计算机信息检索发展过程脱机检索阶段(50年代中期到60年代中期)联机检索阶段(60年代中期到70年代中期)光盘数据库检索阶段(70年代中期到80年代末)网络化检索阶段(90初年代至今)

1)分析检索课题,明确检索要求(2)选择适当检索系统(数据库)(3)确定检索途径及检索词(4)构建检索提问式(5)上机检索并调整检索策略(6)输出检索结果(具体)计算机检索的一般程序计算机检索的一般程序主题分析明确检索需求及检索目标(1)检索信息的学科范围(2)检索信息的类型(3)检索的目的选择检索系统(数据库等)(1)根据检索目的确定所需数据库的类型(2)根据信息需求的内容、专业范围选择数据库(3)根据记录来源选择数据库(4)根据熟悉程度选择数据库计算机检索的一般程序主题概念分析(注:是课题检索的重点和难点)检索目的(申报课题、开题报告、学术论文、成果查新、课程论文、商业需求以及其它需求类型等)文献类型(期刊论文、会议论文、科技报告、图书、专利、标准、网站等)?结果形式(全文、文摘、题录、数值、事实等)检索年限(如2000年以来的文献)语种(中文、外文;英文、日文)检索结果数量(100?50?)2.计算机检索基本技术布尔逻辑检索技术布尔检索技术是指利用布尔运算符连接各个检索词,然后由计算机进行相应逻辑运算,以检索出所需信息的方法。常用算符及含义:AND(*)OR(+)NOT(-)布尔逻辑检索技术AND(*)——接不相容的主题概念(或不同字段)检索结果同时出现连接的词限定,缩小范围,提高准确率。OR(+)——?连接同义词,同族词,相关词检索结果至少含有其中一词或同时有扩大,检索范围,提高查全。NOT(-)——缩小检索范围,起到减少文献输出量。布尔逻辑检索技术优先处理算符“()”逻辑算符OR和AND的使用方法,如果归纳成一个模式,比如有A、B、C、D四个检索词(其中A和B,C和D分别为同义概念),检索提问式为:(AORB)AND(CORD)即,同一组检索提问既含有OR算符,又含有AND算符,此时须使用优先处理算符“()”,将OR算符前后的词放入括号中,计算机将优先运算括号内的算符。位置算符位置检索可要求检索词以用户所规定的相对位置出现。比如:以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词以及化学分子式等。位置算符是调整检索策略的一种重要手段。

输入:COMMUNICATIONSATELLITE系统认为:COMMUNICATIONANDSATELLITE结果:communicationsatellite,satellitecommunication,communicationdevicesforsatellite;communicationlinkswithoutsatellite位置算符常用的位置算符及含义:①(W)算符(WITH)表示两个检索词紧挨着,词序不能颠倒,中间不得插入其他词、字母或代码,但允许有空格或标点符号,也可用()表示。例:COMMUNICATION(W)SATELLITE②(nW)算符(nWORD)表示两个检索词中间可插入n个词,但它们之间的顺序不可颠倒。③(N)算符(NEAR)表示两个检索词必须相连,不得插入其他词,但词序可以颠倒。位置算符④(nN)算符(nNEAR)表示两个检索词中间可以插入n个词,且词序可以颠倒。⑤(S)算符(SUBFIELD)表示两个检索词必须出现在同一个子句子中,但两词的词序和插入的词数不限。句子位置算符⑥(F)算符(FIELD)表示两个检索词必须同时出现在同一个字段内,但两词的词序和中间插入的词数不限。字段位置算符⑦(C)算符(CITATION)表示两个检索词必须出现在同一记录中,但两词的词序和所在的字段不限。⑧(L)算符(LINK)表示两个检索词之间存在从属关系或限制关系,如果其中一个为一级主题词,另一个就为二级主题词。截词检索技术截词检索是为扩大检索范围与增加检索结果而采用的一种检索技术。常件的截词符号及含义:“*”可代表多个字符“#”代表单个的字符一个“?”或者“n?”代表0个到9个额外的字符。加权检索技术加权检索是在检索提问式中,根据每个提问词在检索要求中的重要程度,分别给予一定的加权数值加以区别,我们称这个数值为权数。同时再给出检索命中的阈值。当检索结果达到所设定的阈值时,系统将显示为命中记录。采用加权检索的目的在于提高检索结果的准确程度限制检索技术具体形式主要有:(1)字段限制检索(2)使用符号限制(3)进行范围限制(4)采用限制指令字段限制检索基本字段限制字段限制(TI,AB,DE,ID)基本字段限制的用法是在需要指定字段(题目、叙词、识别词和文摘)的检索词后加上后缀运算符“/”和段码。例如,检索策略“OPTICAL/TIANDFIBER/TI”的含义是指定在题目字段中查找含有“optical”和“fiber”两词的所有记录。字段段码可以多个连用,段码之间加“,”即可。例如,检索策略“FIB?/TI,DE”的含义是指定在题目和叙词字段中查找以“fib”为词干的所有记录。字段限制检索辅助字段限制辅助字段运算符的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符“=”。例如检索策略AU=“Robert,S.”的含义是在作者字段中查找含有“Robert,S.”的所有记录。下面是其他常用的辅助字段限制及其实例:指定著者单位字段

CS=SHANGHAIUNIVERSITY指定刊物名称字段JN=APPLIEDMATHEMATICS指定语言字段LA=ENGLISH

指定文献类型字段

DT=JOURNAL3.检索式的调整检索表达式输入检索系统后,输出的检索结果有时不一定能满足课题的要求:检出的篇数过多,而且不相关文献所占比例很大检出的文献数量太少,有时甚至为零,需要调整检索策略。调整检索策略对于输出篇数过多的情况a.选用了多义性的检索词;b.截词截得过短;c.输入的检索词太少;d.应该使用“与(AND)”的使用了“或(OR)”;e.优先运算符“()”使用错误。调整检索策略对于输出篇数过少的情况a.检索词拼写错误;b.遗漏重要的同义词或隐含概念;c.检索词过于冷僻具体;d.没有使用截词算符;e.位置算符和字段算符使用的过多;f.使用过多的“AND”算符。计算机检索实例检索需求查找某概念的确切含义如:什么是“blog”查找某概念的背景知识如:谁最先发现青霉素查找某些事物的数值及量化指标特征型知一般通过事实型、数值型数据库和搜索引擎获得。查找某一学科的一般知识如:关于分子生物学有哪些专著查找学科专业领域的新进展如:有关纳米技术的研究综述查找课题相关的专业文献最常见的!文献数据库电子元器件的技术特性数据,可用有关的电子元器件类手册、产品目录、样本或书查找;查过去某年度某种电气电子类产品的产销、贸易、市场概况,可用有关年鉴类资料;查国内外哪些大学招收电气电子类研究生,可查大学类的机构名录或校方的招生简章资料;查“自动化”一词的概念与含义,可用百科全书、学科术语类解释辞典和相关手册;查电子产品的电路图,可用相应的电路图集或手册;查钱学森的主要论著和贡献,可用名人录;等等。主题分析实例

直接从检索项目中获取相关概念例:项目“聚乙烯的合成(synthesisofpolyethylene)”主要概念:聚乙

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论