医学信息检索(详细)_第1页
医学信息检索(详细)_第2页
医学信息检索(详细)_第3页
医学信息检索(详细)_第4页
医学信息检索(详细)_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学信息检索信息科学技术系文献检索教研室前言

本课程主要采用以问题为基础的教学方法(Problem-basedLearning,PBL),通过检索理论与实践的教学,使学生掌握信息检索的基础知识,熟练掌握临床医学及基础医学的检索技能,能够灵活运用检索工具(如手工检索工具、光盘数据库、网络数据库)进行文献、数据、网络资源等信息的检索及查新咨询服务,理解各种检索语言,并能对检索系统进行评价和优选。2绪论

第一节信息检索的重要性

信息检索课是培养学生的信息意识,掌握从浩如烟海的文献中获取知识和情报的一门方法课,是提高学生自学能力和独立研究问题能力的工具课。本课程的任务是使学生了解各自专业及相关专业文献的基本知识,学会利用计算机技术如何获取与利用信息,增强自学能力和研究能力。3

信息检索在科研活动中作占的比例4

文献信息检索课已经成为高校一门独立的课程,正式列入各类专业、各层次学生的教学计划,深受学生们的欢迎和重视;也受到了教师和科研人员的关注和青睐;是否具有独立获取与利用各种信息的能力,已成为跨世纪、具有创新能力人才的重要标志之一。5第二节信息素养的培养信息素养(informationliteracy)

是指判断何时、何地需要信息,并有效的定位、获取、评价和利用信息的一系列能力的总和。包括:计算机素养、因特网素养、媒体素养、图书馆素养、研究素养、批判性思考的能力。6

信息素养主要体现在:

信息意识:是人们对信息需求的自觉反映,即对信息的捕捉、分析、判断和吸收的敏感性。

信息能力:是人们有效快速的获取加工存储利用和传递信息的能力。

信息道德:是指在整个信息活动中,信息创建者、信息服务提供者和信息使用者所必须要遵守的社会法律法规和行为准则。7第三节教学内容一、信息检索基础知识学习要求:概念明确、理解透彻二、图书馆资源利用学习要求:熟悉了解、课外自学三、数据库检索学习要求:上机操作、熟练掌握四、网络信息资源检索与利用学习要求:提高技能、灵活应用8

随着现代通讯技术和计算机技术的飞速发展,以及网络技术和Internet的广泛普及与应用,查找文献信息的工具和方法发生了巨大的变化,获取信息的手段日益方便和简化,传统的利用印刷型检索期刊进行手工检索的方式逐渐被计算机信息检索方式所取代,信息检索课教学的内容重点也向计算机信息检索转移。9第四节教学方法一、授课形式:采用(三)二、考核形式:采取平时作业和期末考试三、教学相长10第一章信息检索基础学习目标1.掌握信息、情报、文献、知识的基本概念

2.了解科技文献的类型、特点

3.知道数据库的类型与结构

4.掌握信息检索的途径、步骤5.理解检索式的编写与检索策略的调整

6.熟悉信息网络技术与网络信息检索11

第一节信息、情报、文献、知识一、信息(information)

“信息”一词源于拉丁文“Information”,是指一种陈述或一种解释、理解等。《辞海》中将信息定义为音信、消息。《现代汉语词典》的解释是:对信息接受者来说事先不知道的报道。信息概念的含义在不断地演变。“信息”一词已经成为一个含义非常深刻、包括内容相当丰富的概念。13信息概念的发展

今天人们对信息的理解所处的时代,好比牛顿之前人们对力的理解所处的时代一样。那时侯动能、位能的动量、冲量、转动惯量等等概念统统称之为力,到了牛顿才把这种概念科学地区分开来,并给予严密的数学形式描述。——佩特利14香农(1948)(美国数学家、信息论创始人)香农认为,信息是通信的内容,是“用来消除未来的某种不确定性的东西”,信息的多少反映了消除了的不确定性的大小。不确定性:对客观事物的不了解、不肯定。

通信的直接目的:就是要消除接受端(信宿)对于发出端(信源)可能会发出哪些消息的不确定性。15维纳(1950)(美国数学家、控制论创始人)

维纳(N.Wiener)将人与外部环境交换信息的过程看成是一种广义的通信过程,认为信息是人们在适应客观世界的过程中与客观世界进行交换的内容的名称,是人与外部世界的中介。如果没有信息作为中介,人就会同外部世界隔绝,就不能认识世界和改造世界。16

具有广泛影响的定义

信息是认知主体对物质运动的本质特征、运动方式、运动状态以及运动的有序性的反映和揭示,是事物之间相互联系、相互作用的状态的描述。通俗地讲,信息泛指包含于消息、情报、指令、数据、图像、信号等形式之中的新的知识和内容。17

二、情报(information)《辞源》:“定敌情如何,而报于上官者”为情报。《辞海》:“战时关于敌情之报告,曰情报。

情报是指运用一定的形式,传递给用户,并产生效益的知识或信息。

三个属性:知识性、传递性、效用性。

18三、知识(knowledge)《汉语词典》中解释为:人们在改造世界的实践中所获得的认识和经验的总和。知识是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。也就是人的大脑通过思维重新组合的系统化的信息集合。因此,系统化、理论化的信息就称为知识。19四、文献(document)是指记录有知识的一切载体。也就是说用文字、图形、符号、声频、视频等手段记录下来的人类知识都可以称之为文献。

三个要素:

知识、信息、情报;

载体;

文字、图形、符号、视频、声频。

一个特点:记录20信息、知识、情报、文献四者的关系

认识激活

信息

知识

情报

检索记录

文献21第二节文献与信息的类型一、按文献载体划分书写型文献(HandWritingDocument)载体是竹简、纸张、帛等,人工抄写而成。例如,写在竹简、帛等上的古代文献、书法作品、原始记录等。印刷型文献(PrintedDocument)载体是纸张,它是一种传统类型的文献。如书、刊、特种文献。22缩微型文献(MicroFormDocument)载体是感光材料,如缩微平片、缩微胶卷。另外,还有一种计算机输出缩微胶片。视听型文献(Audio-visualDocument)又称声像型,载体是感光材料或磁性材料,如录像带、录音带、科技电影、幻灯片等。电子型文献(ElectronicDocument)是指以数字化技术将文献存储在光、磁载体上,通过计算机或网络进行阅读的文献。例如,数据库文献和网络文献信息。23二、按文献出版形式划分图书(Book)期刊(Journal)特种文献(SpecialDocument)①科技报告②专利文献③会议文献④政府出版物⑤学位论文⑥标准文献⑦技术档案⑧产品资料等24三、以信息加工的深度划分一次文献是以作者本人的研究工作或研制成果为依据撰写,以公开发行进入社会流通的专著、学术论文、专利说明书、科技报告等。二次文献是把大量的、分散的、无序的一次文献信息资源收集起来,按一定的方法进行整理、加工,使之系统化而形成的各种目录、索引、和文摘,或各种书目型数据库。25三次文献信息资源是根据一定的目的和需求,在大量利用一二次文献信息资源的基础上,对有关知识信息进行综合、分析、提炼、重组而生成的再生信息资源。26三、网络信息资源1.图书馆馆藏目录2.电子书刊3.网络数据库4.专业网站5.网络检索工具6.网络信息导航7.其它类型信息27第三节数据库的类型和结构数据库的定义

计算机把大量相关的数据项有机地集中起来存放在数据文件中,构成一个存放数据的整体,即数据库。28一、数据库类型(按内容分型)(一)书目数据库(BibliographicDatabases)

:存储文摘、题录、目录等书目数据的一类数据库,又称为二次文献数据库。(二)数值数据库(FactDatabases):为用户提供能够直接使用的数值类信息,无需再追查原文。(三)事实数据库(NumericDatabases)

:存储描述人物、机构、事物的等非文献信息源的数据库。29(四)全文数据库(FullTextDatabases)

:存储文献全文或节选其中主要部分的数据库。可以直接获取原始资料。(五)图像数据库(ImageDatabases):以图像为信息主体,配有文字解释。30字段1字段2字段3记录1记录2记录3文档1文档2文档3数据库二、数据库结构31记录与字段

记录(Record)是构成数据库的信息单元,每条记录都描述了一原始信息的外表和内容特征。

字段(Field)是记录的下级数据单位,用来描述实体的某一属性。

32顺序文档(Sequentialfile)以文献记录作为信息存储单元,按文献记录入藏的存取号从小到大顺序排列而形成的目录式文档,由于它存储有关于每篇文献的最完整信息,所以通常又把它称为主文档(MasterFile),相当于印刷型检索工具的正文部分。倒排文档(Invertedfile)就是把记录中一切可检字段或属性值抽出,按某种顺序重新加以组织后所得到的一种文档.倒排档从主文档中派生出来,所以,又叫做辅助文档.33001专家系统在情报检索中的应用(标引词:专家系统;智能检索系统)002一种新的倒排档溢出处理算法(标引词:倒排档;溢出处理)003情报检索专家系统的特点与发展(标引词:专家系统;智能检索系统)004提问式中的位置算符(标引词:提问逻辑式;位置算符)005提问式准波兰变换算法的研究(标引词:提问逻辑式;准波兰变换)006智能检索系统的设计与开发(标引词:智能检索系统)34001专家系统在情报检索中的应用#002一种新的倒排档溢出处理算法#003情报检索专家系统的特点与发展#004提问式中的位置算符#005提问式准波兰变换算法的研究#006智能检索系统的设计与开发#倒排档002提问逻辑式004,005位置算符004溢出处理002智能检索系统001,003,006专家系统001,003准波兰变换005

主文档倒排档35第四节、计算机检索的途径与步骤

信息检索的原理

是将描述特定用户所需信息的提问特征,与信息存储的检索表示进行一同的比较,从中找出与提问特征一致或基本一致的信息。37文献的情报内容主题概念检索者的情报需要信息检索语言

标识检索系统检索结果主题分析主题分析标引标引输入检索输出情报存贮情报检索主题概念

标识38一、检索途径(一)自由词检索自由词:来自于文献的标题、文摘或正文,是一种没有规范化的自然语言。如:医学词汇的简称(乙肝、恶性疟、心衰),生活常用语(打摆子、拉肚子)。特点:没有严格的语法规范,个人使用的爱好不同自由词选择不同(乙肝、乙型肝炎,病毒性乙型肝炎、HB等)缺点:要查出所有的有关乙肝的文献,需要把各种可能的用词都列出来分别查询。39(二)主题词检索主题词:是以自然语言为基础,以概念组配为基本原理,并经过规范化处理,表达主题的最小概念单元,作为信息存储和检索依据的一种检索语言。

特点:

a.词义、词类、词形规范保证词语与概念的唯一对应关系,具有直观性、专指性;40b.采用参照系统显示词语之间的相关关系

用代参照:

用——see代——X如:脑溢血用脑血管意外脑血管意外代脑溢血

CancerseeNeoplasmsNeoplasmsXCancer

相关参照:参——seerelated被参——XR

41c.采用主题词分类索引(范畴表或树状结构)显示词语之间的等级(从属)关系,增强了族性检索能力。

如:MetebolicDiseases

Achlorhydria

AcidosisAcidosis,Lactic42d.组成主题词表:

如<MedicalSubjectHeadings>

简称(MeSH)《汉语主题词表》CMeSH43e.具有组配(组合)功能:

概念相交组配:

胃溃疡+消化性溃疡出血出血性胃溃疡

概念限定组配:

卡托普利/治疗应用

概念并列组配:

胃溃疡+十二脂肠溃疡消化道溃疡

44检索举例:冠心病的治疗自由词冠心病冠状动脉疾病冠状动脉粥样硬化性心脏病冠状动脉心脏病冠状动脉疾病主题词文献治疗治疗45(三)分类检索

根据文献内容在学科分类体系中的位置作为文献信息的检索途径,它的检索标识是分类号,是一种族性检索。

我国按《中国图书资料分类法》进行分类。如,R医药卫生、R28中药学、R5内科学、R9药学国外有《国际十进分类法,UDC》;

《杜威法,DDC》。46《中国图书资料分类法》将人类全部知识分为五大部类(马列主义、毛泽东思想;哲学;社会科学;自然科学;综合性图书),其中社会科学部类分为9个基本大类,自然科学部类分为10个基本大类。自然科学部类的10个基本大类的序列如右图:N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学、安全科学Z综合性图书47R1预防医学、卫生学

2中国医学3基础医学4临床医学5内科学6外科学71妇产科学72儿科学73肿瘤学R74神经病学与精神病学75皮肤病学与性病学76耳鼻咽喉科学77眼科学78口腔科学79外国民族医学8特种医学

9药学R医药、卫生49学科分类(正文部分)

是依分类目次的类目次序编排的题录部分,是检索工具的主题。50(四)著者检索用文献的著者、编者、译者的姓名或机构团体名称编制而成的索引按著者姓名字顺编排书写格式姓前(全称)、名后(缩写,即用首字母)

如:WillianHenryHarrison

→HarrisonWH

RenShuMin→RenSM51(五)引文检索是以被引用文献为检索起点来查找引用文献的过程。(六)机构检索以机构名称为检索词,来查该机构学者发表的文献。(七)刊名检索检索制定刊物上发表的文献,可用刊名全称或缩写。52(八)默认检索

又称缺省检索、隐含检索,是指在检索系统预先设定的多个字段中进行检索。(九)限定检索

常用的有语种(LA)、文献类型(PT)、出版日期(PD)、仅要含全文的记录(fulltextonly)等。(十)其他检索途径专利号检索、化学物质登记号检索、分子式检索53计算机检索途径的另一种划分:

分类浏览简单检索高级检索专家检索54二、检索步骤分析检索课题,明确检索要求用户的检索需求大致分为3类:新:及时获得最新的内容,对查全没有过高要求。准:要解决研究中的具体问题,要求检出的文献有针对性,对查准要求较高。全:要全面了解某一特定领域的发生、发展和现状,是一种回溯性检索,对查全有较高要求。552.选择数据库和检索途径

根据课题的学科专业范围、主题内容,选择合适的数据库,确定检索途径。3.确定检索标识,构筑检索提问式

根据数据库的词表,把主题内容转换成检索系统采用的检索标识和检索词,并准备若干自由词。4.编写检索式表达课题的检索要求,然后输入计算机检索5.浏览检索结果,获取全文56

索取原文的方法:(1)记录文献线索(2)掌握各种缩写的还原(3)向著者索取(4)利用馆藏目录、公共查询系统、联合目录57(5)利用网上全文传递服务国家科技图书文献中心,NSTLhttp://www.nstl.gov.cn中国高等教育文献保障系统,CALIShttp://www.calis.edu.cnPubMed/Order

http://www.ncbi.nlm.nih.gov/PubMed全国医学文献信息中心(北医大图书馆)

http://library.bjmu.edu.cn解放军医学图书馆

http://www.mlpla.org.cn58(6)利用网上出版社、杂志*Springer出版社http//www.springer.com

提供电子全文期刊439种(近400种英文刊)Amedeogrouphttp://freemedicaljournals.com

网上有990种免费医学期刊HighWirePress的电子期刊

http://intl.highwire.org免费标识:freesite;freetrial;freeissuePubMedCentral

http://www.pubmedcentral.com59

(7)检索网上全文数据库中文全文数据库

1中国期刊全文数据库(CNKI)http://www.CNKI.net.cn2万方数据库http://www.wanfangdata.com.cn外文全文数据库

1EBSCOhttp://search.china.epnet.com(专线访问)2Ovid系统

http://gateway-di.ovid.com/autologin.html60检索步骤图示:分析课题,明确检索需求选择数据库和检索途径确定检索标识,构筑检索提问式输入计算机浏览检索结果选出满意的结果获取全文61第五节编写检索式与调整检索策略检索式是检索策略的逻辑表达式,也称检索提问式。是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成62

一、运算符又称逻辑算符,是表达检索词之间逻辑关系和限制关系的运算符号,是复合检索式不可缺少的构件。63(一)布尔算符

1.“and”

称为逻辑“与”,文字表示为“and”,符号表示为“*”。检索词A与检索词B用and组配,提问式可写为:

AandB或者A*B

表示:检索结果中每条记录必须同时含有A和B检索词,增强检索的专指性,缩小检索范围,提高了查全率。64举例:逻辑运算AND65

2.“or”

称为逻辑“或”,文字表示为“or”,用符号表示为“+”。检索词A与B用or组配,提问式可写为:

AorB或者A+B

表示包含检索词A的文献或包含检索词B的文献或同时包含检索词A和检索词B的文献均为命中文献,逻辑“或”扩大了检索范围,提高查全率。66举例:逻辑运算OR673.“not”

称为逻辑“非”,用文字表示为“not”,用符号表示为“-”。检索词A与检索词B用not组配,提问式可写为:

AnotB或者A–B

表示检索结果中每条记录必须包含检索词A,但不包含检索词B。排除了不希望出现的检索词,缩小了检索范围,提高查准率。68举例:逻辑运算NOT69(二)位置算符

near

with位置算符:表示所连接的各个检索词之间位置关系的符号,在不同的系统中往往以不同的符号表示。常用的位置算符有near

with等。near算符

表示此算符两侧的检索词的距离最近。

Anear(n)B表示命中记录中左右两个检索词出现在同一句子中。

70with算符表示此算符两侧的检索词在命中记录中必须出现在同一字段中。Awith(n)B表示同时出现于篇名或文摘中,但前后位置可以颠倒。以上运算符的优先次序是NOT>NEAR>WITH>AND>OR

如果有(),则先运行()71(三)字段限制符“in”、“=”

检索系统中,缩小或约束检索结果的方法成为限制检索。常用的有特定字段的限制检索,限制符为“in”和“=”。例如:

“in”

对某一指定数据项进行检索如:hepatitisinTI

“=”

用于限定性字段的检索如:LA=ENGLISH

限制符还有其他形式:

py

<2000表示检索2000年前发表的文献记录。72(四)截词符“*”和“?”

后截断,将截词符号放在一个字符串的右方,以表示其右的有限或无限个字符不影响该字符串的检索。例如:immun*

涉及到词的单复数、作者、年代、同根词等方面的检索时,选用后截断技术。73前截断,将截词符号放在一个字符串的左方,以表示其左的有限或无限个字符不影响该字符串的检索。例如:*sighted,可查到farsighted与nearsighted。

前截断只检索后缀相同的一类词,常用于检索化学化工文献与复合词较多的文献。74二、检索式编写检索式的定义概括地说,检索式是检索策略的逻辑表达式,是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。75查找有关肿瘤引起的贫血的非英文文献首先确定检索词:neoplasms/complications(并发症)anemia/etiology(病因学)English#11687NEOPLASMS/complications#2179ANEMIA/etiology#323867EnglishinLA(LA=English)#420(#1and#2)not#376三、检索要领与检索策略的调整检索要领是为实现检索结果的全和准:因为检索结果主要通过查全率、查准率两个指标来进行评价。

查全率:系统进行检索时,检出的相关文献量与系统文献库中相关文献总量的比率。

查准率:系统中检出的相关文献量与检出的文献总量的比率。77

调整检索策略提高查全率和查准率

提高查全率的方法:降低检索词的专指度,选出一些上位词和相关词补充到检索式中。调节检索式的网罗度,减少逻辑“与”的组配面。进行族性检索,可采用分类检索,或用一组同义词、近义词和相关词,用“或”连接在检索式中。采用截词技术,取消某些限制过严的限制符。78

提高查准率的方法:提高检索词的专指度,换用专指度较强的规范词或自由词。增加“与”连接,进一步限定主题概念。限定检索词所在的可检字段,用位置算符控制检索词的词间顺序与位置。限制输出文献的外部特征,如限制年限、语种、文献类型等。用逻辑“非”限制与提问不相关的文献的输出。用主题词检索,不用或少用自由词检索。79对文献查新的建议:(1)用Medline检索改为用PubMed检索;(2)检索PubMed与CBMdisc数据库时,除了用主题词检索外,用自由词检索进行补充,因为一部分最新入库的文献尚未进行主题词标引;(3)借用Update字段限定检索最近入库的文献;(4)显示检索结果时将最新文献排序在前;(5)进行引文检索;(6)检索和收集最新召开的学术会议论文。80第七节网络信息检索一、网络信息资源类型(见教材P7)二、网络信息资源的特性(见教材P20)81三、获取网络信息资源的主要工具(一)电子邮件(二)FTP(三)Archie(四)Telnet(五)Gopher(六)Usenet(七)www浏览器(八)搜索引擎82FTP资源及其使用FTP是英文TransterProtocol(文件传输协议)的缩写,和TCP/IP一样是因特网上广泛使用的一种通讯协议,是互联网上传送文件的标准。如果说TCP/IP是实现不同机器,不同操作系统、不同网络间互联的一座桥梁的话,那么FTP则是把资料从此岸传输至彼岸的货车。通过FTP协议,我们就可以跟互联网上的FTP服务器进行文件的上传(upload)或下载(download)等动作。83和使用自己的硬盘不同,FTP服务器并不是可以随意使用的,上载和下载通常只对部分用户,因此登录FTP服务器需要用户帐号和口令。不过,在互联网上有很多匿名的FTP服务器,这些服务器向全世界开放,可以公开访问。这些FTP服务器在登录时使用“anonymous”作为用户名,而将你的E-mail地址作为口令进行登录。84用IE或Netscape浏览器进行文件传输:

IE或Netscape不仅可以访问WWW主页,也可以访问FTP服务器。只要在地址栏中输入相应的服务器地址,然后按回车键。

一个典型的FTP地址如:大学北京ftp://ftp.lib.pku.edu.cn济宁医学院69/85FTP搜索引擎如同搜索主页一样,可以用FTP搜索引擎来搜索一个文件存在于哪些互联网的FTP服务器上。为什么要使用FTP搜索引擎呢?1.在WWW主页上搜索到的文件往往要经过多重链接才能下载;2.下载速度慢(用http方式下载)且大多数不能断线连续传;3.更多的文件只是放在FTP的主机上,并没有做http链接,用户经常舍近求远。86CERNET内的主要的FTP搜索引擎北大天网的FTP搜索引擎http://bingle.pku.edu.cn星空互联之FTP星空搜索http://sheenk.com/ftpsearch/search.html南京理工大学的“一网打尽”搜索引擎http://search.njust.edu.cn西安交通大学思源搜索引擎http://search.xjtu.edu.cn北京科技大学幻想FTP搜索.cn中国科技大学天狼中英文搜索引擎http://search.ustc.edu.cn87中国教育科研网内主要FTP站点北京大学ftp://ftp.pku.edu.cn允许匿名方式北大图书馆ftp://ftp.lib.pku.edu.cn允许匿名方式访问清华大学ftp://ftp.tsinghua.edu.cn北京邮电大学ftp://ftp.bupt.edu.cn允许匿名方式访问,人数限制8088国内其他FTP站点中国下载FTP服务器:.cn/黄金眼FTP服务器:2EastDoor亦多下载中心FTP服务器:20中经网自由软件FTP服务器:f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论