计算机基础检索_第1页
计算机基础检索_第2页
计算机基础检索_第3页
计算机基础检索_第4页
计算机基础检索_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、计算机信息检索方式二、数据库

三、计算机检索技术第三节计算机信息检索第1页,共51页,2023年,2月20日,星期四计算机信息检索的基本涵义

定义:简称机检,指利用计算机信息检索系统从文献信息数据库或因特网上查询所需文献信息的过程。

第2页,共51页,2023年,2月20日,星期四计算机检索方式1光盘数据库检索2联机检索3网络信息检索第3页,共51页,2023年,2月20日,星期四计算机检索的对象——数据库

第4页,共51页,2023年,2月20日,星期四数据库(Database)数据库的概念:

是指一定专业范围内的信息记录及其索引的集合体。

第5页,共51页,2023年,2月20日,星期四数据库的类型1文献数据库2数值数据库3事实数据库书目数据库全文数据库2多媒体数据库第6页,共51页,2023年,2月20日,星期四书目数据库(BibliographicDatabase)是检索工具,存储的是二次文献,检索结果是所需文献的线索而非原文。例:CBM、CMCC、CMACMEDLINE、PubMed题录型数据库-文摘型数据库-书目型数据库文献数据库第7页,共51页,2023年,2月20日,星期四全文数据库(FullTextDatabase)

存储的是原始文献的全文(一次文献),如期刊论文、学位论文、会议论文等数据库。例:

中国学术期刊网络出版总库万方数字化期刊中文科技期刊数据库(全文版)

OVID文献数据库第8页,共51页,2023年,2月20日,星期四书目数据库与全文数据库的比较第9页,共51页,2023年,2月20日,星期四数值数据库(NumericDatabase)

主要包含的是数值数据,如各种统计数据、科学实验数据、科学测量数据等。如医学上使用的化学制剂、药物的各种理化参数、人体生理上的各种数值,都可收入数值数据库。例:美国的RTECS核酸序列数值型数据库GENBANK第10页,共51页,2023年,2月20日,星期四事实数据库(FactDatabase)

存储的是用来描述人物、机构、事物等对象的事实性信息。如名人录、机构指南、大事记等。例:美国MEDLARS系统的医生咨询数据库能提供有关癌症治疗和临床实验的相关病因、诊断标准、治疗方案以及最新研究进展等信息。第11页,共51页,2023年,2月20日,星期四多媒体数据库(MultimediaDatabase)是数据库技术和多媒体技术相结合的产物蛋白质结构数据库PDB和可视人计划数据库第12页,共51页,2023年,2月20日,星期四2023/5/7复旦大学图书馆文献检索教研室13第13页,共51页,2023年,2月20日,星期四数据库的结构(掌握)

记录(Record):描述一原始信息的外部特征和内容特征。书目数据库中的一条记录通常代表一篇文献,其它类型数据库中的记录则是某种信息单元

字段(Field):比记录小,组成记录的数据项目文档(File):两种含义

1.数据库的结构(顺排文档和倒排文档)

2.数据库中的一部分记录的集合(子集subset)

第14页,共51页,2023年,2月20日,星期四记录字段举例第15页,共51页,2023年,2月20日,星期四第16页,共51页,2023年,2月20日,星期四第17页,共51页,2023年,2月20日,星期四第18页,共51页,2023年,2月20日,星期四题录(参考文献常用字段)作者、篇名、来源(刊名、年、卷、期、页码)格式:作者.篇名.刊名,年,卷(期):起始页码-终止页码姜春林,刘则渊,梁水霞.H指数和G指数——期刊学术影响力评价的新指标[J].图书情报工作,2006,50(12):63-65SamuelsOB,JosephGJ,LynnMJ,etal.Astandardizedmethodformeasuringintracranialarterialstenosis.AJNRAmJNeuroradiol.

2000;21:643–646.

第19页,共51页,2023年,2月20日,星期四文档的概念第20页,共51页,2023年,2月20日,星期四第21页,共51页,2023年,2月20日,星期四

数据库的结构数据库文档记录字段

若干个记录构成的信息集合称为文档。大型的数据库分割成若干文档。记录是构成数据库的完整的信息单元,每条记录描述了原始信息的外部特征和内部特征。组成记录的数据项目第22页,共51页,2023年,2月20日,星期四数据库的访问1.数据库的存放地点2.数据库使用的免费与收费3.并发用户数与超时退出第23页,共51页,2023年,2月20日,星期四一名北京大学学生2002年10月1日-4日通过图书馆代理服务器批量下载了著名的西文过刊全文库—JSTOR中的数千篇文献。导致JSTOR立刻封锁该馆的访问权限长达数月,并对此明显的恶意侵权行为委托律师向北大图书馆提出法律质询,严重损害了北京大学的声誉。对方律师亲自到场监督该同学删除其之前所下载的全部数据。最直接的经济影响:2万余元庞大国际通讯费用的损失,使得图书馆的代理服务器几乎无以为继。电子资源违规使用案例第24页,共51页,2023年,2月20日,星期四截词检索2限定检索3位置检索4加权检索5计算机检索技术布尔逻辑检索1二次检索6第25页,共51页,2023年,2月20日,星期四举例:高血压高血压的治疗特殊类型高血压的药物治疗术前抗高血压治疗对麻醉诱导血流动力学的影响高血压高血压的治疗特殊类型高血压的药物治疗术前抗高血压治疗对麻醉诱导血流动力学的影响第26页,共51页,2023年,2月20日,星期四230第27页,共51页,2023年,2月20日,星期四15927第28页,共51页,2023年,2月20日,星期四1.布尔逻辑检索布尔逻辑由英国数学家乔治.布尔提出。在检索过程中用于表达词于词之间的逻辑关系的算符就称为布尔逻辑运算符。分为三种逻辑关系:逻辑与、逻辑或、逻辑非;分别用AND、OR、NOT表示。第29页,共51页,2023年,2月20日,星期四逻辑与(积)ANDAANDB:检索词A和检索词B同时出现在一条记录中例如查有关“妇女吸烟”的文献,检索式可写成:Womenandsmoking其作用是缩小检索范围,提高查准率。第30页,共51页,2023年,2月20日,星期四逻辑或(和)ORAORB:记录中出现检索词A或检索词B或两词同时出现在一条记录中。

检索有关“计算机”的文献资料,因为“计算机”也称为“电脑”检索式:计算机OR

电脑其作用是扩大检索范围,提高查全率第31页,共51页,2023年,2月20日,星期四逻辑非(差)NOTANOTB:记录必须包含检索词A但不能包含检索词B。即在含有A检索词的文献中去除含有B检索词的文献。例如检索非小鼠的动物模型,检索式可写成:动物模型NOT

小鼠其作用是缩小检索范围,提高查准率第32页,共51页,2023年,2月20日,星期四运算规则当编制比较复杂的检索式时,通常有两个或多个运算符,此时,布尔逻辑运算符的运算顺序是:not>and>or()改变运算顺序第33页,共51页,2023年,2月20日,星期四

检索有关“艾滋病疫苗”的文献艾滋病

or

爱滋病or获得性免疫缺陷综合症

orAIDSand

疫苗(艾滋病

or

爱滋病or获得性免疫缺陷综合症orAIDS)and

疫苗√第34页,共51页,2023年,2月20日,星期四逻辑“与”第35页,共51页,2023年,2月20日,星期四2.截词检索:概念:是把检索词从某处截断,用特定的符号代替被截去的一个或多个字符。截词符(通配符):有*?#$:作用:扩大检索范围应用:西文数据库较常用第36页,共51页,2023年,2月20日,星期四截词符(通配符)*代表0-n个字符,多用于词尾,也可用于词中,但不能用于词首?代表

0-1个字符,多用于词中,也可用于词尾,但不能用于词首。第37页,共51页,2023年,2月20日,星期四无限截断:medic*

-medicine-medicale*ology-ecology-embryology-etiology-epidemiology有限截断:pain?-pains-paintcol??r-color-colourm?n——man、men叶?平——叶京平、叶选平第38页,共51页,2023年,2月20日,星期四应用截词时注意:1.不能截词过短

car*——cars、care、carry、cardiac、cardial、cardiant、cardia2.要在西文状态时输入第39页,共51页,2023年,2月20日,星期四3.限定检索(1)限定字段检索概念:限定检索词在数据库记录中一个或几个字段范围内查找的一种检索方法。(2)限定条件检索发表时间、研究对象年龄、语种、文献类型等目的:缩小检索范围,提高查准率。第40页,共51页,2023年,2月20日,星期四字段限定符有:

CBM:in,=癌症inTIMEDLINE:in,=CancerinTIOVID:.Cancer.TIPubMed:[]Cancer[TI](1)限定字段检索第41页,共51页,2023年,2月20日,星期四模糊:张平inAU

可检出“张平”、“张平彩”“沈张平、宋张平”等作者

精确:AU=张平只检出“张平”

模糊:癌症inTA检索出的期刊有:《癌症》《中国癌症杂志》《实用癌症杂志》精确:

TA=癌症

只检出《癌症》

有些字段有模糊和精确检索:作者和刊名字段第42页,共51页,2023年,2月20日,星期四精确、模糊匹配第43页,共51页,2023年,2月20日,星期四(2)限定条件检索第44页,共51页,2023年,2月20日,星期四4.位置检索(P24)位置运算符:NearWithFieldSubfield第45页,共51页,2023年,2月20日,星期四5.加权检索加权检索是一种定量检索技术,它能判定检索词或字符串在满足检索条件后对文献重要程度运用加权检索可以命中核心概念文献缩小检索范围提高检准率第46页,共51页,2023年,2月20日,星期四6.二次检索也称“在结果中检索”,是指在最后一个检索式检索结果的范围内进行进一步查询当查询到的文献过多时,利用二次检索,可以缩小检索范围,提高查准率二次检索即是新检索提问标识和最后一次检索结果的提问标识进行了逻辑与(and)的组合第47页,共51页,2023年,2月20日,星期四小结扩大检索范围逻辑或组合(OR)截词检索总结缩小检索范围

逻辑与组合(AND)逻辑非组合(NOT)限定检索位置检索加权检索二次检索第48页,共51页,2023年,2月20日,星期四思考题计算机检索的特点(或缺点)是什么?如何解决这一问题?了解MEDLARS和MEDLINE。计算机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论