自然语言检索广州中医药大学图书馆_第1页
自然语言检索广州中医药大学图书馆_第2页
自然语言检索广州中医药大学图书馆_第3页
自然语言检索广州中医药大学图书馆_第4页
自然语言检索广州中医药大学图书馆_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自然语言检索广州中医药大学图书馆第1页/共45页主要内容电子资源概述电子资源检索我校电子资源现况第2页/共45页电子资源概述

定义特点类型第3页/共45页电子资源:定义电子资源,指一切以数字形式生产和发行的信息资源。所谓数字形式,是以能被计算机识别的、不同序列的“0”和“1”构成的形式。电子资源中的信息,包括文字、图片、声音、动态图像等,都是以数字代码方式存储在磁带、磁盘、光盘等介质上,通过计算机输出设备和网络传送出去,最终显示在用户的计算机终端上。第4页/共45页电子资源概述:特点类型多种多样易得性:不受时间、地域限制,可随时随地存取更新周期短共享性:电子资源使多用户可在同一时刻下共享共用同一信息知识的类聚性:网络环境下,依靠强大的检索软件可以使不同类型的相关信息聚集并有序化。第5页/共45页电子资源概述:类型按性质和功能:一次文献、二次文献、三次文献按载体:光盘、网络数据库等按学科:人文、社科、科技、医学等按照经费:商用资源和免费资源按语种:中文数据库、外文(区别于中文的其它语种)数据库按照内容和文献类型:电子期刊、电子图书、会议论文、学位论文、特种文献(专利文献、科技报告、标准文献)、多媒体文献(视频)按信息加工处理的深度:全文型数据库、参考型数据库、事实型数据库第6页/共45页按信息加工处理的深度全文型数据库,即收录一次文献信息的数据库,如电子图书、期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等数据库,如:中国学术期刊网络出版总库、BMJ、ScienceDirect、Innography、ProQuest学位论文全文数据库参考型数据库,指包含各种数据、信息或知识的原始来源和属性的数据库,如书目、文摘、索引等,如:SINOMED、MEDLINE、SCI数据库、EI数据库等。事实型数据库指包含大量数据、事实的数据库,如数值数据库、指南数据库、术语数据库等,相当于印刷型文献中的字典、辞典、手册、年鉴、百科全书、组织机构指南、人名录、公式与数表、图册(集)等,如:美国GenomeDatabase、EncyclopediaBritannica、MICROMEDEX数据库。电子资源:类型第7页/共45页电子信息资源检索将大量的信息资料或数据进行加工整理,按一定格式存贮在机读载体上,建成机读数据库,利用计算机对机读型数据库进行检索的信息检索方式。

对于信息用户来讲,电子信息资源检索也就是利用电子计算机对不同类型的数据库进行检索。二、电子资源的检索第8页/共45页二、电子资源的检索分析检索课题,明确检索要求选择检索工具,确定检索途径确定检索标识,确定检索运算构筑检索提问,获取初步结果调整检索策略,输出检索结果第9页/共45页电子资源的检索:步骤1分析检索课题,明确检索要求

1.明确检索目的

2.明确课题的主题或主要内容

3.课题涉及的学科范围

4.所需信息的数量、语种、年代范围、类型等具体指标第10页/共45页电子资源的检索:步骤2选择检索工具,确定检索途径

1.选择检索系统和数据库:SCI、EI、ISTP、ISR是世界四大重要检索系统

2.数据库收录的信息内容所涉及的学科范围;

3.数据库收录的文献类型、数量、时间范围以及更新周期;

4.数据库所提供的检索途径、检索功能和服务方式。第11页/共45页

1.自由词检索自由词又称文本词(textword)2.主题词检索主题词是一种规范化的检索语言3.分类检索分类法(classification)是利用学科、专业、概念之间的逻辑关系建立的一种等级体系4.著者检索著者(author)检索是用文献上署名的作者或编者的姓名作为检索词。电子资源的检索:步骤2第12页/共45页5.引文检索(参考文献检索)引文检索是以被引用文献为检索起点来查找引用文献的过程,文献的相互引证直接反映学术研究之间的交流与联系。(SCI,CSCD)6.机构检索机构检索以机构名称为检索词,来查该机构学者发表的文献7.刊(书)名检索刊名检索供检索指定出版物上发表的文献8.默认检索默认(default)检索又称缺省检索,是在检索系统预先设定的多个字段中进行检索,目的是为了查到更多的文献

电子资源的检索:步骤2

第13页/共45页

电子资源的检索:步骤2

9.其他检索途径

专利号(patentnumber)检索,国际标准连续出版物编号(ISSN)检索,化学物质登记号(CASregistrynumber)检索,分子式(formula)检索,记录顺序号(accessionnumber),化合物结构图检索(structuresearch)检索等。第14页/共45页电子资源的检索:步骤2

检索功能

浏览:由系统提供一个树状结构的概念等级知识体系,用户可以沿着这颗“树”进入不同的分支,到达叶子节点,并在节点看到检索结果列表。

索引:提供一个线性的表单,可以将任何一个标引字段中的概念按字母顺序线性排列起来,不分等级。例如:人名索引、出版物索引、地名索引、主题索引、机构索引等。

简单检索:为用户提供一个简单的检索界面,页面上通常只有一个检索框。

复杂检索/高级检索:为专业用户、资深用户提供的比较复杂的检索界面,可以构建比较细致的检索式,帮助用户进行精确检索。

专家检索/专业检索:构建专业的检索策略进行检索

第15页/共45页电子资源的检索:步骤2

二次检索:在检索结果内进一步检索,使检索结果更精练、准确。

自然语言检索:检索系统在检索界面上提供的自然语言检索,指的是用户可以直接输入一句话,就象对人谈话一样。例如:hurricanesintheAtlanticandPacific(大西洋和太平洋的飓风)HowdoesElNinoaffectweather?(厄尔尼诺现象是怎么影响气候的?)到目前为止,限于计算机智能检索技术的发展,尚没有检索系统能够提供很好的自然语言检索功能,因此这方面的功能尚不具备查全查准的实用效果。第16页/共45页第17页/共45页电子资源的检索:步骤3确定检索标识,确定检索运算确定标识选择检索词主题词:《中医药学主题词表》、《中文医学主题词表》(CMeSH)、《

医学主题词》(MeSH词表)数据库规定的代码;常用专业词汇;同义词与相关词:包括同义词、近义词、相关词、缩写词、词形变化等。中药的同义词:中草药;中成药;方剂;汉方药;生药;复方;第18页/共45页中草药

cmeshmesh第19页/共45页电子资源的检索:步骤3确定检索运算:布尔逻辑检索逻辑“与”(and):检索时,命中信息同时含有两个概念,专指性强;逻辑“或”(or):检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围比and扩大。逻辑“非”(not):命中信息只包括逻辑A,不包括逻辑B或同时有A和B的,排除了不需要的检索词。逻辑“异或”(xor):命中信息包含逻辑A,也包含逻辑B,但不包含同时含有A和B的信息。第20页/共45页电子资源的检索:步骤3检索运算第21页/共45页电子资源的检索:步骤3位置符:用于表示两个检索词之间位置的检索符。用于缩小检索范围(仅限于外文数据库)near(相邻检索)1.表示左右两个检索词出现在同一个句子中;2.near后加上数字时,表示左右两个检索词之间所间隔单词的数量最多不能超过该数字减1。形式:ANEAR(n)B实例:prehospitalnear1treatmentWITH(同字段检索)要求左右两个检索词出现在同一个字段中。形式:AWITHB实例:LeukemiawithcomplicationsIN(特指字段检索)检出只出现在特指字段中的记录例,Pathogenesisinti;Jones-Ainau优先级运算()>NOT>NEAR>WITH>AND>OR第22页/共45页电子资源的检索:步骤3其他运算符1.截词符*,代表任何字符串或空格

形式:Diabet*diabetes或diabetic2.通配符?或%代表任何字符或空格

形式:Wom?Nwoman或women;

SINOMED通配符的位置可以置首、置中或置尾。如:胃?癌、肝%疫苗、%PCR第23页/共45页电子资源的检索:步骤4

构筑检索提问,获取初步结果检索提问式就是采用计算机信息检索系统规定使用的组配符号,将反映不同检索途径的检索单元组合在一起而形成的一种逻辑运算表达式。它以计算机系统可以识别和执行的命令形式将检索方案表现出来,表述了各个检索单元之间的逻辑关系和位置关系等。例如:肾通督针刺法结合现代康复治疗痉挛型脑性瘫痪的临床研究检索式:(脑性瘫痪OR脑瘫)AND康复AND(针刺OR电针OR水针OR梅花针OR围针OR火针OR皮肤针)

第24页/共45页第25页/共45页电子资源的检索:步骤5调整检索策略,输出检索结果调整检索策略检索结果信息量过多减少同义词与同族相关词;增加限制概念,采用逻辑“与”连接检索词;使用字段限定,将检索词限定在某个或某些字段范围;使用逻辑”非”算符,排除无关概念;调整位置算符,由松变严。

检索结果信息量过少选全同义词与相关词并用逻辑”或”将它们连接起来,增加网罗度;减少逻辑“与”的运算,丢掉一些次要的或者太专指的概念;去除某些字段限制;调整位置算符,由严变松。第26页/共45页电子资源的检索:步骤5输出检索结果根据检索系统提供的检索结果输出格式,选择需要的记录以及相应的字段(全部字段或部分字段),将结果显示在显示器屏幕上、存储到磁盘或直接打印输出,网络数据库检索系统还提供电子邮件发送、文献管理软件等,至此,完成整个检索过程。第27页/共45页三、我校电子资源现况中文全文期刊19000余种、外文全文期刊近9000种,电子图书180万册,电子学位论文199万种,视频资源5300集,系列数据库30余种90余个子库,其中与生物医学相关的数据库28种,含全文型数据库15种,文摘型数据库7种,事实型数据库3种,综合类数据库11种,医药类数据库17种,中文数据库18种,外文数据库共有13种。第28页/共45页第29页/共45页第30页/共45页全文型:电子期刊中文的电子期刊中国学术期刊网络万方学术期刊中文期刊数据库(维普)博看畅销期刊据库人大“复印报刊资料”全文数据库第31页/共45页全文型:电子期刊

外文的全文电子期刊SpringerLink电子期刊1400种EBSCO:ASP4000种AltHealthWatch180种EBSCOMedlinewithFullText1500种Elsevier500多种OVIDLWW

280种第32页/共45页全文型:电子图书中文图书:超星电子书Elsevier经典医学图书:1,100多种第33页/共45页全文型:学位论文中国知网博硕士学位论文数据库万方学位论文:镜像站第34页/共45页其他全文型中国重要会议论文全文数据库国际会议论文全文数据库中国重要报纸论文数据库第35页/共45页参考型《中国生物医学文献数据库》(SINOMED)MEDLINE:ClinicalKey,EBSCO平台《全国报刊索引》第36页/共45页事实型中国年鉴网络出版总库中国工具书网络出版总库合订版中国科技项目创新成果鉴定意见数据库EBSCODYNAMED第37页/共45页其他超星名师讲坛视频数据库

维普考试资源系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论