医学信息检索_第1页
医学信息检索_第2页
医学信息检索_第3页
医学信息检索_第4页
医学信息检索_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学信息检索主讲教师:杨晓雯该课的内涵

——什么是医学信息检索“信息检索”一词消失于20世纪50年月,又称信息存贮与检索,是指将信息按肯定的方式组织和存储起来,并依据用户的需要找出有关信息的过程和技术。广义上说,“信息检索”包括“存”和“取”两个环节和内容。狭义的信息检索就是信息检索过程的后半局部,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查询。医学信息检索,即为如何“存”和“取”医学信息。开设此课的意义信息是当今社会最重要的资源之一,信息素养已成为评价人才综合素养的一项重要指标,是信息化社会人们生存与进展的根本素养之一。1992年由美国学者杜尔对信息素养的阐述,较好地概括了信息素养的内涵:一个具有信息素养的人,能够生疏到准确的和完整的信息是作出合理决策的根底。能够确定对信息的需求,形成基于信息需求的问题,确定潜在的信息源,承受成功的检索方式,从包括计算机和其他信息源猎取信息、评价信息、组织信息并应用于实际。将新信息与原有的学问体系进展协作以及在批判性思维和问题解决的过程中使用信息。信息素养的诠释可以看出:信息素养包括信息猎取的意识,评价、推断信息的力量,查找、收集、组织信息的力量,信息决策及处理力量。学校的信息素养教育,开设的主要课程包括计算机根底和文献检索课。前者主要培育学生的信息技能,后者作为信息素养教育的主要课程,应全方位地从信息学问、信息意识、信息力量和信息道德四方面系统开展。第一章信息检索根底〔一〕、信息、学问、情报、文献1.信息(information):在自然界、人类社会以及人类思维活动中普遍存在,是物质的一种根本属性,是物质存在方式及其运动的规律、特点的外在表现。2.学问(knowledge):人们通过信息对自然界、人类社会以及思维活动规律的生疏与把握,是人的大脑通过思维重新组合的系统化信息的集合。3.文献(literature):以文字、图形、符号、声频、视频等手段记录和传播学问的载体就是文献。4.情报(information):传递着的有特定效用的学问。信息>学问>情报信息、学问、情报的联系与区分情报学问信息

信息源是个人为满足其信息需要而获得信息的来源。

1.3.1信息源的类型信息源的类型可依不同的标准划分如下:

〔二〕信息源1.3.1.5按信息的产生次序和加工整理的程度不同,可将信息源划分为四个层次构造:(1)零次信息指未经正式发表或不宜公开和大范围内沟通的比较原始的素材、底稿、手稿、书信、工作文稿、工程图纸、考察记录、试验记录、调查稿、原始统计数字,以及各种口头沟通的学问、阅历或意见论点等。这类文献在较小的范围内沟通、使用、参考,其传播渠道少,或常保密,或限制使用以及因珍稀的缘由,不为人们知晓。其形式多是抄件、打字件、油印件以及内部录音、录像等等。其特点是信息来源直接、真实,内容新颖。因特网的普及,为宽阔网民供给了跨越空间的口头沟通便利,如各种谈天工具。(2)一次信息又称原始文献,也称原始信息源,它是作者依据本人的科研和工作成果而形成的文献,这类文献是脑力劳动的正式产品,是科研成果的一种主要表述方式,代表新学问,组成了可供沟通的系统性信息。此类文献主要包括:专著、期刊和报纸、科学考察报告、争论报告、会谈论文、学位论文、专利说明书、技术标准、政府出版物、产品样本等。(3)二次信息指依据实际需要,依据肯定的科学方法,将特定范围内的分散的一次信息进展加工整理使之简化和有序化而形成的文献信息。它能较为全面地系统地反映某学科某专业文献的线索,是检索一次信息的工具。这类文献有:书目、题录、索引和文摘等。(4)三次信息指通过二次信息供给的线索,选用一次信息的内容,进展分析、综合、争论后而编成的信息。一般包括专题述评、动态综述、系统评价、进展报告、学科年度总结、年鉴、指南和百科全书等。

1.3.1.4按信息的出版类型划分,可分为以下十种类型

〔1〕图书大多是对已发表的成果和阅历,或某一学问领域的系统论述或总结。它往往以期刊论文、会谈论文、争论报告等一次文献为根本素材,经作者的分析、归纳、重新组织而成。图书供给的学问一般比较系统、全面、牢靠,起着综合、积存和传递学问的重要作用。从时间上看,图书报道的学问比期刊和特种文献晚,且出版周期较长。〔2〕期刊论文指承受统一名称,定期或不定期出版的连续出版物。其特点是出版周期短,报道速度快,数量大、内容多,发行面广。期刊的内容一般是一次文献,即原始文献,很多新的争论成果大多首先在期刊上发表,因此,期刊论文是猎取新信息的主要来源,是极其重要的信息源。〔3〕科技报告是关于某项科学争论和革新成果的报告或争论过程中的阶段进展状况的实际记录。它反映的科学争论和技术革新成果比期刊论文快,内容高度特地化,且具有肯定的保密性。一般以单行本的形式出版。〔4〕专利文献专利是国家对制造制造的法律爱护。广义的专利文献应当是一切与专利有关的文献,包括专利说明书、专利公告、专利分类表、专利文摘等。狭义的专利文献一般指专利说明书,它是专利文献的主体。专利文献是极其重要的信息源,隐藏着丰富的科技信息。〔5〕会议文献一般是各种科技会议上的论文或书面发言。随着科学技术的进展,各种科技会议日益增多,已成为科技沟通的一种重要渠道。很多学科中的重要觉察有很大一局部是在会议文献中公开的,加上一些会谈论文不在其它刊物或出版物上发表,或者即使发表,也要经过较长一段时间,因此,会议文献越来越受到科技界的重视,它已成为科技人员了解本专业的进展水平和最新争论成果的有效工具。〔6〕政府出版物指各国政府部门及所属机构发表、出版的文件,大体上可分为行政性文件〔如法令、方针政策、规章制度、统计资料等〕和科技文献两大类。科技文献中包括政府各部门的科研报告、技术政策等,对了解某一国家的科学技术和经济政策及其演化等状况有肯定的参考价值。〔7〕学位论文是为了取得某一级学位而提交的论文,包括学士论文、硕士论文和博士论文。它们的特点是:论文的水平和质量差异较大,论题比较专一,阐述系统、具体,有肯定的独创性观点,且经过肯定的审查,故有肯定的参考价值。〔8〕标准文献是对工农业产品和工程建设的质量、规格及检验方法等方面做出的技术规定。它是从事生产、建设的共同技术依据,是一种规章性的文献,有肯定的法律约束力。标准文献属于三次文献,其反映的信息传达了当时的技术标准和技术水平。因此,其技术新颖性和准时性低于专利等文献。〔9〕产品样本是厂商为推销产品而印发的一种宣传性出版物,包括产品的性能、规格、尺寸、重量、构造、用途、使用方法等。产品样本的特点是技术上比较新颖,参数比较牢靠,能给人以直观形象。利用它可了解国内外技术水平及有关技术的演化和进展动向,可获得设计、制造、使用中所需要的数据和方法,也可以为推断产品的价值供给依据。〔10〕科技档案是在科研生产活动中形成的有肯定具体工程对象的技术文件、图样、照片、原始记录的原本或复制本,内容包括任务书、技术指标、争论方案、试验记录、设计图纸等。它是科技活动的真实记录,内容一般真实、准确牢靠。〔三〕信息沟通和信息素养信息沟通:个体之间借助于共同的符号系统所进展的信息传播、交换和共享。信息需要:就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需求。信息动机:指鼓励和推动个体发动并维持其信息行为导向某一目标的心理过程。信息行为:人们满足自己信息需要的社会活动的过程。用户的信息行为主要有信息检索行为、信息的选择行为和信息利用行为。信息需要是信息行为发生的根本根底,而信息动机则是信息行为发生的根本动力。信息需要信息需要的层次①未知的信息需要有些现实问题过于简单和隐蔽,或个人的认知力量有限或缺乏信息意识,因此没有、或没有意识到自己处于信息需要的状态,属客观信息需要。②潜在信息需要有些人可能生疏到了自己的信息需要,但却没有表达出来,致使信息需求无法用信息符号表达出来而处于“意会”的状态。人们生疏到而未表达出来的信息需要称为潜在信息需要。③现实的信息需要当人们意识到信息需要,而且明确表达出来的,称之为现实信息需要。用户在表达出来后,向信息效劳机构提出具体的信息要求的称之为信息提问,用户自己动手查找信息的称之为信息自问。信息素养:包括信息猎取的意识,评价、推断信息的力量,查找、收集、组织信息的力量,信息决策及处理力量。标准:2023年1月18日,美国大学与争论图书馆协会(ACRL)通过了《美国高等教育信息素养力量标准》标准一能够确认信息需求的特性与范围。标准二能有效而又高效地猎取所需要的信息。标准三能评判性地评价信息及其来源,并能把所 筛选出的信息融入自己的学问根底。标准四能有效地利用信息去完成一个具体任务。标准五了解利用信息过程中所涉及的经济、法律 和社会问题,合理、合法地检索、搜集和 利用信息。〔四〕信息检索信息检索:是从任何信息集合中识别和猎取所需信息的过程及其所实行的一系列方法和策略。广义的信息检索包括信息的存储和信息的检索,所以又称为“信息存储与检索”。信息检索按存储和检索的内容划分:

文献信息检索数据信息检索事实信息检索

〔1〕文献信息检索文献信息检索是以文献为检索对象,将存储于数据库中的关于某一主题文献查找出来的检索。它通常以原始文献的出处为检索目的,通过对名目、索引、文摘等二次文献的检索,向用户供给有关原一次文献的信息。〔2〕数据信息检索是将经过选择、整理、鉴定的数值数据存入数据库中,依据需要查出可答复某一问题的数据的检索。这些数值型数据各种各样,包括物理性能常数、统计数据、人口数据、国民生产总值、气象数据等。〔3〕事实信息检索事实信息检索是将存储于事实数据库中的关于某一大事发生的时间、地点、过程等状况查找出来的检索。一般先从系统中检索出所需信息后,加以规律推理得出结论。例如,HIS数据库包括大量医院治理中有关人员、工资、病床周转率、药房销售统计等信息,这类信息主要是用于治理决策。事实信息检索比数据信息简单。〔五〕信息检索系统信息检索系统是为了信息检索而建立的,可以依据某种(或某些)文献特征信息从其中查检出含有特定信息(学问和情报)的文献的文献特征信息规律系统,是对巨大的不断增长的文献流进展掌握的手段。所谓文献特征信息,是指文献所固有的,可找出某一或某些文献并将其从其他文献中识别出来的特征信息。如文献的题名、著者、出版者和出版年份、发表文献的刊物名称和期号、文献原始编号(如专利号)、文献主题内容等等。将某一文献的各种特征信息加以记载,成为一条文献记录,再将属于肯定范围的全部文献记录按肯定规章组织起来,就成为一个信息检索系统。〔六〕信息检索语言〔1〕自然语言:指文献作者或文摘提要的作者原来使用的语言,即 消失在文献题名、摘要或正文中的语词。自然语言检索缺乏:(1)不能简洁明白而又专指地表达文献及检索课题的主题概念;(2)不能够语词与概念一一对应,不能够排解多词一义、一词多义和词义模糊现象;例如:艾滋病、爱滋病、aids获得性免疫缺陷综合症(3)不能显示出概念之间的关系;(4)不能将概念进展系统排列;(5)不能够在检索时便于将标引用语和检索用语进展相符 性比较。自然语言检索应留意的问题为了弥补自然语言的缺乏,人们对自然语言的进展人为掌握,依据一定的规章对其进展事先标准,于是诞生了人工语言——情报检索语言。〔2〕人工语言——情报检索语言:情报检索语言是依据情报检索的需要而创制的人工语言,特地用于各种手工的和计算机化的情报检索系统,表达文献主题概念和检索课题概念。其实质是一系列概括文献情报内容的概念及其相互关系的概念标示系统。情报检索语言可分为分类检索语言、主题检索语言和代码检索语言三大语系。举例:如何运用人工语言在存储文献时,文献标引人员首先要对各种文献进展主题分析,即把它所包含的情报内容分析出来,使之形成假设干能代表文献主题的概念,并用情报检索语言的语词(标识)把这些概念标示出来,然后纳入检索系统。

在检索文献时,检索人员首先要对检索课题进展主题分析,即把它所涉及的检索范围明确起来,使之形成假设干能代表情报需要的概念,并把这些概念转换成情报检索语言的语词,然后从检索系统中查找用该语词标引的文献,从而找到含有所需情报的文献。人工语言的具体表现形式——医学主题词表什么是医学主题词表主题词又称叙词,在标引和检索中用以表达文献主题的标准化的词或词组。主题词是标准化的检索语言,它对文献中消失的同义词、近义词、多义词以及同一概念的不同书写形式等进展严格的掌握和标准,使每个主题词都含义明确,以便准确检索,防止误检、漏检。如:白介素2、白细胞介素2、IL2、IL-2等表达同一概念的不同书写形式标准为“白细胞介素2”。主题词表是对主题词进展标准化处理的依据,也是文献处理者和检索者共同参照的依据。医学主题词表《美国医学主题词表》〔mesh〕荷兰医学文摘的主题词表〔EMTree〕《中国中医药学主题词表》〔pubmed〕主题词表考察检索效率的常用指标

检全率与漏检率检全率与漏检率是可以说是同一问题的两个相对的概念。检全率高则漏检率就低,而漏检率高则检全率就低:假设检全率为65%,则漏检率就是35%。检全率是情报检索质量的主要标志,由于漏检率高说明重要情报被遗漏的危急性大,所以在情报检索中,总是力求提高检全率,或者说力求降低漏检率。检准率与误检率检准率也是文献检索质量的重要标志,由于误检率高说明用于甄别所检出文献是否真正有用的劳动的增加利时间的延误,虽不如遗漏重要文献那样严峻,但对检索效率也有重大影响,所以在文献检索中,总是力求提高检准率.或者说力求降低误检率。(七)文献数据库

文献数据库是指记录各种文献信息的数据库,它是计算机可读的、有组织的相关文献信息的集合。在文献数据库中,文献信息以数字化方式,按肯定的数据构造,有组织地存储在计算机中,使计算机能够识别和处理。文献数据库的构造文献数据库一般由记录、字段、文档组成。文档在数据库中有顺排文档和倒排文档之分。顺排文档是数据库的主体,又称主文档,它按每条记录的挨次号排列。数据库中得到的检索结果都来自于顺排文档。倒排文档是供检索顺排文档的工具,在一个数据库中可能有假设干个倒排文档,如主题词索引、著者索引、刊名索引等,它按索引的字顺排列。检索时,计算机按输入检索词的字顺先从指定的倒排文档〔索引〕中找到匹配的索引词,然后依据索引词后的记录挨次号到主文档中调出记录。记录是构成文献数据库的一个完整的信息单元,每条记录描述了一原始信息的外部特征和内部特征。例如,书目数据库中的一条记录通常代表一篇文献,其他类型数据库中的记录可能是一种治疗方案、一组理化指数。字段是组成记录的数据工程。例如,在MEDLINE中一条记录代表一篇书目文献,在这条记录中有题名、著者、来源、文摘、主题词等字段。每个字段都有自己的字段标识符〔Fieldtag〕,如TI〔篇名〕、AU〔著者〕、SO〔文献出处〕、AB〔文摘〕、AD〔著者所在构造〕、AN〔记录挨次号〕等。将记录细划成字段作用是:帮助识别记录内容,便利检索结果输出时格式的选择,便于进展字段检索。

文献数据库的类型〔1〕按文献数据库的记录内容划分:书目数据库全文数据库混合数据库〔p31页〕。〔2〕按文献数据库的运行方式划分:光盘数据库联机数据库网络数据库几种主要的文献数据库〔1〕题录数据库:〔论文构造〕题录”是指文献的根本信息,也称为名目。包括题名、作者、关键词、作者机构、文献来源、摘要等。题录数据库是用各种索引方法制作的二次文献数据库,又称题录数据库或篇名数据库,以简单的形式向用户供给文献的信息。如:中国生物医学文献效劳系统(Sinomed)、〔2〕文摘数据库〔3〕图书馆馆藏名目数据库〔联合名目p32〕〔4〕全文数据库〔5〕光盘数据库〔6〕多媒体数据库〔7〕网络数据库文献检索方式手工检索:人工查找文献信息的检索方式,检索过程 主要是利用各种印刷型检索工具。计算机检索:依据信息特定的需求,利用计算机从相 关数据库中识别并提取所需要的信息过程。网络信息检索:通过互联网上供给的网络信息查询工 具,从网上猎取和享用电子信息效劳。〔八〕计算机检索技术〔1〕计算机检索的根本原理当有检索提问式输入计算机时,计算机将提问标识和数据库文档中的特征标识依据肯定的运算规章进展比较,假设根本一样,就将该记录存取号保存下来,即为命中信息;假设找不到一样的字符,则检索结果为零。这种匹配是字面上的匹配过程,而不是概念匹配检索提问字符串数据库中特征标识字符串匹配〔2〕计算机检索特点:检索速度快,效益高检索功能强,数量大检索途径多,手段敏捷检索范围广效劳方式多更新速度快文献套录便利用户使用便利〔3〕计算机检索方法1布尔规律检索2位置规律检索3截词检索4字段检索5范围运算6准确检索7加权检索1布尔规律检索布尔规律根本运算形式共有三种:规律“与”规律“或”规律“非”〔1〕规律“与”:规律“与”一般用AND或“*”号表示。设提问集A和B,假设文献C同时满足A和B中的每一个提问项,则为命中文献,否则为不命中。用数学模型来表示,则C为A和B的交集。如检索“流行性感冒引起咳嗽”,应写成:流行性感冒and咳嗽C〔2〕规律“或”:规律“或”一般用OR或“+”号表示。设提问集A和B,假设文献C满足A或者满足B,即为命中文献,否则为不命中。用数学模型来表示,则C为A和B的并集。如检索“流行性感冒或者咳嗽”,应写成:流行性感冒or咳嗽C〔3〕规律“非”:规律“非”一般用NOT或“-”号表示。设提问集A和B,假设文献C满足A,且不包含B为命中,否则为不命中。规律“非”实际上反映了A集合对B集合的差运算。如检索“流行性感冒不带咳嗽”,应写成:流行性感冒not咳嗽C布尔运算符的优先级为:-、*、+,使用括号可转变运算挨次。假设含两个或两个以上的规律算符,应先算NOT,然后算AND,最终算OR。也可以用〔〕来转变计算次序,由于〔〕里的局部可最先算。例如:〔〔T=大学生*T=信息素养〕+T=大学生〕*T=检索力量2位置规律检索位置规律检索,又称邻近检索、相邻度检索。它是基于文献中或文献记录中语词之间的相对次序或位置不同,它们所表达的意思可能不同;相应地,一个检索提问中语词之间的相对次序和位置不同,其表达的检索意图也不一样。因此,可以使用一些特定曲位置规律算符来限定检索词之间的位置关系,使检索提问式尽可能表达检索者真正的检索意图,从而既提高检准率,又提高见检全率。〔举例p43〕3截词检索截词检索是指在检索词中保存一样的局部,用截词符号代替可变化的局部。它是为了局部解决由于检索式中对同义词列举不全造成的漏检现象而提出的,相当于用规律“或”扩展检索范围。截词符号一般用“?”或“*”等。?代表零或一个字母;*代表两个或两个以上字母举例:Child*可代表child,children,childly,childhoodColo?r可检索出color,colourDra???t可检索出drat,draft,draught截词检索主要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论