




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章
文献信息检索基础第一章文献信息检索基础1第一章
文献信息检索基础第一节文献信息资源及其检索概述第二节文献信息检索系统第三节文献信息检索技术第四节文献信息检索策略第一章文献信息检索基础第一节文献信息资源及其检索概述2一、文献信息的概念1.文献2.知识3.信息一、文献信息的概念1.文献3第一节信息检索概述一、信息、知识、情报、文献(一)定义信息(Information):是物质存在的一种方式、形态或运动状态,是事物的一种普遍属性。知识(Knowledge):是人们在认识和改造客观世界的实践中所获得的认识和经验的总和。是人们对客观事物的本质和规律的认识。情报(intelligence)
:是满足一定需求的、激活了的知识第一节信息检索概述一、信息、知识、情报、文献4文献(Literature,Document):是记录有知识的一切载体。记录知识的具体内容;记录知识的手段:如文字、图像、符号、声频、视频等;记录知识的物质载体:如纸张、光盘、录像带等;记录知识的表现形态:如图书、期刊、专利说明书等。文献(Literature,Document):是记录有知识5(二)关系
信息知识情报文献(二)关系信息知识情报文献6二、文献信息的类型按载体的不同,常将文献划分为:1.印刷型2.电子型3.声像型按出版类型,又常将文献划分为:1.图书2.期刊3.会议文献4.学位论文5.科技报告6.专利文献7.WHO出版物教科书——参考书——专著——综述——期刊论文论文——综述——专著——教科书二、文献信息的类型按载体的不同,常将文献划分为:7(1)图书图书:通常被认为是由正式出版社出版的出版物。其范围很广,包括专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等。特征为出版社名称(Publication、Press)、ISBN号等分为阅读型和工具型(1)图书图书:通常被认为是由正式出版社出版的出版物。8特点:成熟,全面,可靠,时效性差用途:初步了解一般性问题
实例:作者:胡鞍钢著出版社:北京大学出版社出版时间:2007-1-1字数:297000版次:1页数:395印刷时间:2007/01/01开本:印次:纸张:胶版纸ISBN:9787301115367包装:平装特点:成熟,全面,可靠,时效性差作者:胡鞍钢著9(2)期刊期刊:俗称杂志。是定期或不定期周期性出的连续出版物,特征为刊名、卷Vol.、期No.、国际标准刊号ISSN期刊分为:学术性(Journal)
情报型:工具型(Abstracts,Index)报导型(News)综合型(Review)(2)期刊期刊:俗称杂志。是定期或不定期周期性出的连续出版物10特点:数量大,品种多,内容丰富,出版周期短用途:获取最新研究成果和动态实例:主管:中国科学技术协会主办:中华医学会编辑:中华医学杂志编辑委员会总主编:巴德年编辑部主任:陈新石出版:中华医学会杂志社ISSN0376-2491CN11-2137/R
特点:数量大,品种多,内容丰富,出版周期短主管:中国科学技术11(3)特种文献
特种文献:形式比较独特,一般是单独成册,主要出版特征是号码,主要特种文献有以下八种类型。(3)特种文献特种文献:形式比较独特,一般是单独成册12①学位论文学位论文:是高等院校硕士(Ms.D)或博士(Ph.D)毕业生为申请学位而提交的毕业论文。
特征:学校名称及学位①学位论文学位论文:是高等院校硕士(Ms.D)或博士(13布尔逻辑检索技术课件14布尔逻辑检索技术课件15②科技报告科技报告:研究机构关于某项科研成果的正式报告,或者是对研究过程中阶段进展情况的实际记录。国防与航空航天方面居多。
特征:报告号
②科技报告科技报告:研究机构关于某项科研成果的正式报告16例如:NASA20050082846(美国宇航局科技报告)ADA207606(美国国防系统研究报告)DE91011930(美国能源系统研究报告)PB90226341(美国民用系统研究报告)AGARDR775(北大西洋公约组织研究报告)HY93007(航空信息研究报告)例如:17
实例:
中国核科技报告
ChinaNuclearScienceandTechnologyReport主办:《中国核科技报告》编辑部周期:
半年出版地:北京市语种:
中英开本:
16开
ISSN1671-7430CN11-9253/TL创刊年:1985
中国核科技报告
ChinaNuclear18③会议论文会议文献:主要是学术会议上宣读的论文或交流的书面论文,形式有单行本(会议预印本preprint)和会议论文集。特征为:会议名称、时间、地点③会议论文会议文献:主要是学术会议上宣读的论文或交流的19会议论文特点:文献论题集中,内容新颖、丰富、专、深、学术性强,能反映出一个国家、一个地区或国际上当前某一科学技术领域的最新成就、最高水平和发展趋势。
实例会议论文特点:文献论题集中,内容新颖、丰富、专、深、学术性强20④专利
专利:发明人申请专利时呈交的申请说明书。一般包括:发明人、发明的详细说明、专利权范围、插图等。特征:专利号④专利21实例:输液自动呼叫器
福建省大田星海科技开发有限公司程开海1、输液过程中瓶内药液将要滴尽时能提前自动发出声响信号,提醒护理人员注意;2、旋动呼叫器上的旋钮可直接选择用于各种规格容量药瓶(袋)输液终了的自动呼叫;3、自动呼叫后病人躺在床上可直接拉动拉线控制停呼。实例:输液自动呼叫器22⑤政府出版物政府出版物:这是各国政府部门及其设立的专门机构发表、出版的文件,分为行政性文件(如法令.统计等)和科技文献(30%~40%)。⑤政府出版物政府出版物:这是各国政府部门及其设立的专门23⑥标准标准:主要是对工农业产品和工程建设的质量、规格及其检验方法等方面所作的技术规定,是从事生产、建设的一种共同技术依据。特征为:标准号⑥标准标准:主要是对工农业产品和工程建设的质量、规格及24⑦产品资料产品资料:产品资料是制造厂商为了推销产品而发出的,以介绍产品性能为主的出版物。⑦产品资料产品资料:产品资料是制造厂商为了推销产品而发25实例:实例:26⑧科技档案科技档案:科技档案是科学技术研究和生产建设部门,在科学技术研究和生产建设活动中形成的,有具体工程对象的技术文件、图样、图表、图片、原始记录的原本或代替原本的复制本等⑧科技档案科技档案:科技档案是科学技术研究和生产建设部门,在27282.认识不同内容层次的文献一次文献零次文献二次文献三次文献文献整理知识重组知识浓缩282.认识不同内容层次的文献一次文献零次文献二次文献三次文28(1)零次文献(ZeroDocument)
零次文献指未经正式发表或未进入学术交流的最原始的文献。(2)一次文献(PrimaryDocument):是指作者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作,如专著、期刊论文、科技报告、学位论文等。(1)零次文献(ZeroDocument)29(3)二次文献(SecondaryDocument):是将大量无序、分散的一次文献收集、整理、加工、著录其特征,如著者、篇名、分类、主题、出处等,并按一定的顺序加以编排,形成供读者检索所需一次文献线索的新的文献形式,如索引、文摘、目录以及其相应的数据库等。因其具有的检索功能而称之为检索工具或检索系统。(3)二次文献(SecondaryDocument):是将30(4)三次文献(TertiaryDocument):是科技人员围绕某一专题,借助于二次文献,在充分研究与利用大量一次文献的基础上,经过阅读、分析、归纳、概括,撰写而成的新的文献。表现形式主要有:综述(Review)、述评(Comment)、进展(Progress、Advance)、现状(Update)、发展趋势(Trend)等期刊文献和百科全书、年鉴、手册等参考工具书。(4)三次文献(TertiaryDocument):是科技31文献级别举例一次文献
二次文献文献级别举例32文献级别举例三次文献零次文献文献级别举例33
科技文献层次结构知识产生
记录原始文献知识重组
知识浓缩词典名录指南手册年鉴书目等述评专著教科书论文丛集百科全书等三次文献
期刊论文会议论文科技报告学位论文专利说明书文献整理目录
索引文摘新书通报等二次文献一次文献零次文献 科技文献层次结构知识产生记录原始文献知识重组34
研究活动(实验、观察、思考)
信息的直接记录或传递
零次文献(创造知识的素材)
将知识以文字等形式固化
一次文献(初始的知识产品)
将分散的文献序列化
二次文献(一次文献的替代品)将知识重新组合,使知识序列化
三次文献(浓缩的新的信息产品)研究活动(实验、观察、思考)信息的直353.认识不同载体的文献
印刷型文献:纸质电子型文献:
缩微型文献声像型文献机读型文献(电子文献)多媒体型文献3.认识不同载体的文献36四、文献信息的特点1.数量庞大,增长迅速2.文种繁多,但呈明显的英文化趋势3.内容交叉重复4.文献形式呈现多样化5.文献分布既集中又分散,但呈专题化或专集化趋势6.知识老化加快,文献寿命(半衰期)缩短7.交流传播及变化速度加快四、文献信息的特点1.数量庞大,增长迅速37五、文献信息的社会功能1.科技文献是科学表现的存在形式,是汇集人类财富的主要场所。2.科技文献是衡量科学技术水平的重要依据。3.科技文献是传播科学知识的最基本、最主要的手段4.科技文献是确认科学发现与技术发明优先权的认证记录。五、文献信息的社会功能1.科技文献是科学表现的存在形式,是汇38六、检索基本原理经选择的信息主题分析标引语言表达文献特征标识经确立的课题主题分析检索语言表达文献需求标识信息集合词表存储检索检索结果什么样的文献信息能够得以输出呢?匹配检索时匹配的究竟是什么?六、检索基本原理经选择的信息主题分析标引语言表达文献特征标识39第二节 文献信息检索系统一、文献信息检索系统的构成二、数据库的结构三、文献信息检索系统的分类四、文献信息检索系统的功能第二节 文献信息检索系统一、文献信息检索系统的构成40一、文献信息检索系统的构成1.信息资源2.硬件设备3.软件条件4.人力资源上述四方面内容构成了文献信息检索系统的空间结构,是系统运行的最基本前提。一、文献信息检索系统的构成1.信息资源4142二、类型手工检索检索手段计算机检联机检索光盘检索网络检索42二、类型检索手段4243二、类型文本信息检索数据格式和检索技术多媒体信息检索超媒体和超文本检索43二、类型文本信息检索数据格式和检索技术多媒体信息检索超媒43三、数据库的结构(一)从数据库组成的层次来划分1.文档(File)2.记录(Record)3.字段(Field)(二)从数据库组成的方式来划分1.顺排文档2.倒排文档三、数据库的结构(一)从数据库组成的层次来划分44字段1字段2字段3记录1记录2记录3文档1文档2文档3数据库数据库结构字段1字段2字段3记录1记录2记录3文档1文档2文档3数据库45上述数据库的结构,可用英文单词的单复数形式更直观地表述为:
Record
Fields(记录)
Database
Flies(数据库)
File
Records(文档)
Field
searchingentry(字段)(检索入口上述数据库的结构,可用英文单词的单复数形式更直观地表述为:46主文档序号:N5序号:N4序号:N3序号:N2序号:N1主题词:S1著者:Au1标题:t1……S1:N1,N3S2:N2,N3S3:N1,N4……Au1:N1,N4Au2:N3Au3:N4……主题词倒排档著者倒排档……主题词检索途径著者检索途径其它检索途径主文档和倒排文档的关系示意图主文档序号:N5序号:N4序号:N3序号:N2序号:N1S147四、文献信息检索系统的分类1.书目型数据库2.事实数值型数据库3.全文型数据库四、文献信息检索系统的分类1.书目型数据库4849
书目型数据库全文型数据库事实型数据库数值型数据库类型文献信息数据库49书目型数据库全文型数据库事实型数据库数值型数据库类型文49书目型数据库(bibliographicdatabase):是二次文献数据库,主要存贮相关主题领域的各类文献资料的书目信息,包括机读版的文摘、题录、目录、索引等。用户可从大量文献记录中筛选出有参考价值的文献源,并依据记录提供的来源指示获取一次文献。举例:中国生物医学文献数据库、PubMed(P84)、EMBASE(P93)等。1、书目型数据库书目型数据库(bibliographicdatabase)50布尔逻辑检索技术课件51全文型数据库(Full-textDatabase):收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。优点:能直接获取文献原文,集文献检索和全文提供于一体;提供全文字段检索。举例:中国学术期刊网络出版总库(CNKI)、万方数据资源的数字化期刊、OVID全文数据库、ElsevierScience的SDOS等。2、全文型数据库全文型数据库(Full-textDatabase):收录52布尔逻辑检索技术课件53布尔逻辑检索技术课件543、事实型数据库事实型数据库(FactDatabase):提供有关事物、人物、机构等方面的事实性信息。举例:ClinicalTrials(临床试验数据库)是通过对自愿接受试验患者的临床研究,观测药物、诊断方法、疫苗和其他治疗方法对某一种疾病或症状是否安全和有效。3、事实型数据库事实型数据库(FactDatabase):55布尔逻辑检索技术课件56数据型数据库(NumericDatabase):提供数值性信息,包括各种统计数据、科学实验数据、各种测量数据等。举例:WHOSIS:可以获取以下统计数据和资料:疾病负担统计、死亡原因统计、世界卫生报告年度统计、卫生从业人员统计、人口统计、HIV/AIDS信息与数据、精神病死亡率统计、免疫接种统计等统计数据,以及疾病负担计划、国际疾病分类法及WHO术语信息系统、卫生系统成就、全球酒精数据库(GlobalAlcoholDatabase)等与卫生和卫生统计有关的资料。(P264)美国疾病控制与预防中心(CDC)的DataandStatistics等。(P266)4、数据型数据库数据型数据库(NumericDatabase):提供数值性57布尔逻辑检索技术课件58布尔逻辑检索技术课件59四、文献信息检索系统的功能1.汇集文献信息2.组织文献信息3.检索文献信息上述三者之间的关系如何?理解这个问题对于整个文献检索课学习的意义何在?四、文献信息检索系统的功能1.汇集文献信息60思考题:1.信息、知识、情报三者的联系与区别。2.分别用抽象文字与具体图示表达上述三者关系的意义。3.文献级别演化的本质及意义。4.文献信息综合应用中“综合”二字的含义。5.科技图书与科技期刊之与学术生涯。6.信息检索系统中“系统”二字的含义。7.信息检索系统构成与信息检索原理的关系。8.如何理解信息检索系统的诸多功能。思考题:1.信息、知识、情报三者的联系与区别。61第三节文献信息检索技术第三节文献信息检索技术62一、信息检索技术概念广义的包括信息组织、数据库建设在内的涉及信息科学、情报学、计算机科学等诸多学科领域的技术方法;狭义仅指从现有的信息资源中提取相关信息的技术方法。一、信息检索技术概念63信息检索技术发展阶段手工检索方式:包括纸质文献的检索和缩微式检索;脱机检索方式:包括机读磁带、磁盘检索、光盘数据库检索等;计算机联机检索方式;网络化信息检索方式:如:SCI、EI、SpringerLink数据库、EBSCO数据库等。信息检索技术发展阶段64布尔逻辑检索技术最常用的方法;用户的信息需求通过检索提问式表达;采用布尔代数中的逻辑符AND、OR和NOT作为逻辑组配算符;计算机根据表达式确定命中文献的基本条件与查找途径,同文档中各篇文献的标识进行匹配。凡符合条件的文献即为命中文献,予以输出。布尔逻辑检索技术最常用的方法;65布尔逻辑检索技术布尔运算符AND、OR、NOT,分别表示逻辑与、逻辑或、逻辑非三种逻辑运算关系,如图1-3-1所示。
AandBAorBAnotB图1-3-1布尔逻辑运算示意图
布尔逻辑检索技术布尔运算符AandB66布尔逻辑检索技术名称符号表达式功能逻辑与ANDAANDB同时含有提问词A和B的文献,为命中文献逻辑或ORAORB凡是含有提问词A或B的文献,为命中文献逻辑非NOTANOTB凡是含有提问词A但不含有B的文献,为命中文献布尔逻辑运算一览表布尔逻辑检索技术名称符号表达式功能逻辑与ANDAANDB67布尔逻辑检索技术逻辑“与”,检索表达式为“AandB”。数据库中同时含有检索同A和B的文献为命中文献;作用是缩小检索范围,提高查准率;例如,查找“胰岛素治疗糖尿病”的文献,检索式为
insulin(胰岛素)anddiabetes(糖尿病)。布尔逻辑检索技术逻辑“与”,检索表达式为“AandB”68布尔逻辑检索技术逻辑“或”,检索表达式为“AorB”。数据库中的文献中含有检索词A或B的文献为命中文献;作用是扩大检索范围;例如,查找“肿瘤”的文献,检索式为cancer(癌)ortumor(瘤)orcarcinoma(癌)orneoplasm(新生物)。布尔逻辑检索技术逻辑“或”,检索表达式为“AorB”。69布尔逻辑检索技术逻辑“非”,检索表达式为“AnotB”。数据库中凡含有检索词A而不含B的文献为命中文献;作用是缩小检索范围,提高查准率;例如,查“动物的乙肝病毒(不要人的)”的文献,检索式为
hepatitisBvirus(乙肝病毒)nothuman(人类)。布尔逻辑检索技术逻辑“非”,检索表达式为“AnotB”。70布尔逻辑检索技术布尔逻辑运算的优先顺序当一个检索表达式含有多个布尔算符时,执行的顺序为not优先运算,and其次,or最后。可用圆括号改变运算顺序,将需要优先运算者置于圆括号中。例如,查找“维生素C或维生素E对糖尿病患者肾脏的保护作用”,检索式为:(维生素Cor
维生素E)and糖尿病
and
肾。布尔逻辑检索技术布尔逻辑运算的优先顺序71截词检索截词检索,利用截断的词的一个局部即截词,进行检索的技术;自动地对同一概念检索词的不同词尾变化、词根相同等一类提问词进行检索,并自动用OR连接各词的检出结果,避免文献的漏检和逐词键入的麻烦,提高查全率;常用的截词符号有“*”、“
?”。截词检索截词检索,利用截断的词的一个局部即截词,进行检索的技72布尔逻辑检索技术课件73截词检索分类按是否采用截词符号分为,采用截词符号、不用截词符号;按截断位置的不同分为,右截词、左截词、中间截词;按截断的字符数量的不同分为,无限截词、有限截词。截词检索分类74邻近检索邻近检索(ProximitySearching)是用来表示检索词与检索词之间位置关系的检索技术,通常用位置算符来实现;采用的位置算符有near,with。“near”,表示检索词位置相邻,检索词出现的顺序可前可后,如geneNEARapoptosis;“with”,表示检索词位置相邻,且两词出现的顺序与输入顺序一致,如liverWITHcancer。邻近检索邻近检索(ProximitySearching)是75限定检索限定检索(limitSearching)又称限定字段检索(limitFieldSearching),是利用检索词出现的字段进行的检索;用户可以指定检索某一字段或某几个字段以使检索结果更为准确,减少误检;检索系统的限定检索会采用缩写形式的字段标识符;如TI表示Title,AD表示Address。限定检索限定检索(limitSearching)又称限定字76布尔逻辑检索技术课件77扩展检索扩展检索(ExpandSearching)是同时对多个相关检索词执行逻辑或检索的技术;即当用户输入一个检索词后,系统不仅能检出该检索词的文献,还能检出与该检索词同属于一个概念的同义词或下位词的文献,如PubMed中主题词的扩展检索。扩展检索扩展检索(ExpandSearching)是同时对78加权检索加权检索(weighingsearching)不仅检索提问词是否存在,而且计算提问词的权值,当权值之和超过阈值的记录才能在数据库中被检出来。在某些数据库中表现为仅检索主要概念主题词,如MEDLINE;而有些数据库表现为词频检索,如中国学术期刊全文数据库。加权检索加权检索(weighingsearching)不仅79精确检索和模糊检索精确检索(ExactSearching)是指所检信息与输入的词组完全一致的匹配检索技术;在许多系统中用引号来表示,如检索“AcutePancreatitis”;模糊检索(FuzzySearching)允许所检信息与检索提问之间存在一定的差异。如检索AcutePancreatitis,可检索出AcutenecrotizingPancreatitis、AcutegallstonePancreatitis等。精确检索和模糊检索精确检索(ExactSearching)80跨库检索跨库检索(Crossdatabasesearching、One-stopsearching)是一次对多个数据库同时进行检索的技术。跨库检索能为用户提供统一的检索接口,将用户检索需求转化为不同数据库的检索表达式,并发地检索本地和广域网上的多个分布式异构数据库,并对检索结果加以整合,以统一的格式将结果呈现给用户。跨库检索跨库检索(Crossdatabasesearch81跨库检索跨库检索82相关信息反馈检索相关信息反馈检索,是将与已检结果存在某种程度相关的信息检索出来的检索技术,多由检索系统自动进行检索。如Google()的“类似网页”、PubMed的“RelatedArticles”。相关信息反馈检索相关信息反馈检索,是将与已检结果存在某种程度83相关信息反馈检索相关信息反馈检索84布尔逻辑检索技术课件85智能检索自动实现检索词、检索词对应主题词及该主题词所含下位词的同步检索。如中国生物医学文献服务系统(SinoMed)的智能检索。PubMed的“自动词语匹配检索”属于智能检索。智能检索自动实现检索词、检索词对应主题词及该主题词所含下位词86二、多媒体信息检索技术基于内容的检索基于内容的检索(ContentBasedRetrieval,CBR),主要是对多媒体对象的语义、媒体的视觉特征或听觉特征进行检索。基于内容的图像检索基于内容的图像检索(ContentBasedImageRetrieval,CBIR)使用了可以直接从图像中获得的客观的视觉内容特征,如颜色、纹理、形状等来判断图像之间的相似性。二、多媒体信息检索技术基于内容的检索87基于内容的图像检索现有图像检索技术研究的主流。与传统数据库技术相结合,可以方便地实现海量多媒体数据的存储和管理;与传统Web搜索引擎技术相结合,可以用来检索html网页中丰富的多媒体信息;还可以广泛应用在多媒体数据库、知识产权保护、数字图书馆、网络多媒体搜索引擎、交互电视、艺术收藏和博物馆管理、遥感和地球资源管理等许多领域中。基于内容的图像检索现有图像检索技术研究的主流。88三、可视化信息检索技术信息可视化(Informationvisualization)是将抽象数据用可视的形式表示出来,以利于分析数据、发现规律和决策制定。可实现对信息数据的分析和提取,以图形、图像、虚拟现实等易为人们所认识、可视的方式,展示数据间的复杂关系、潜在信息和发展趋势,以便更好地掌握和利用信息资源。三、可视化信息检索技术信息可视化(Information89可视化检索可视化检索(VisualRetrieval)是信息可视化的一种。是指把文献信息、用户提问、各类情报检索模型以及利用检索模型进行信息检索的过程中不可见的内部语义关系转换成图形,在一个二维或三维的可视化空间中显示出来。可视化检索可视化检索(VisualRetrieval)是信90可视化检索的特点检索过程透明化检索结果输出高效性更为有效的检索结果排序机制有效的用户反馈机制可视化检索的特点检索过程透明化91第一章
文献信息检索基础第四节文献信息检索策略第一章文献信息检索基础第四节文献信息检索策略92一、文献信息检索途径检索途径为检索系统的检索入口,即检索系统所提供的、用以查询获取资源的各种标识,在计算机检索系统中通常表现为字段检索。一、文献信息检索途径检索途径为检索系统的检索入口,即检索系93主题词检索主题词检索途径,是利用主题词(SubjectHeadings)作为检索入口来查找文献;主题词是经过优选和规范化处理的词汇,由主题词表来控制;目前支持主题词途径的检索系统主要有,CBMDisc和PubMed。主题词检索主题词检索途径,是利用主题词(SubjectHe94自由词检索通过从文献篇名、正文或文摘中抽取出来的能表达文献主要内容的单词或词组查找文献的检索途径。自由词途径,灵活、自由、直观、符合用户习惯,为目前检索系统中应用最为广泛的一种检索途径;但自由词因未经规范化处理,检索时必须同时考虑到与检索词相关的同义词、近义词等,容易造成漏检。自由词检索通过从文献篇名、正文或文摘中抽取出来的能表达文献95分类检索分类检索途径是利用文献在分类体系中的位置(类目名称或分类号)作为检索入口查找文献的途径,可满足用户从学科、专业等内容出发获取文献的需要。例如,CBMDisc提供的分类途径,即以文献在《中国图书馆分类法》中的分类号作为检索入口来查找文献。分类检索分类检索途径是利用文献在分类体系中的位置(类目名称或96引文检索引文检索途径,是利用引文(citation,即文章末尾所附参考文献)这一特征作为检索入口查找文献的途径;许多检索工具提供的引文检索途径允许以引文中出现的任何信息(如作者、题名、出处)等作为检索入口。如WebofScience的CitedReferenceSearch(引文检索)。引文检索引文检索途径,是利用引文(citation,即文章末97缺省检索缺省检索是指自动在脊索系统预先设定的多个字段中同时进行检索。例如,在CBMDisc的基本检索界面直接输入检索词,系统默认在缺省字段中进行检索即同时在中文题名、关键词、主题词、文摘、刊名、特征词等字段进行检索。缺省检索缺省检索是指自动在脊索系统预先设定的多个字段中同时进98其它途径著者检索利用文献上署名的作者、编者或机关团体名称作为检索入口查找文献的途径。题名检索利用题名(Title,如书名、刊名、篇名等)作为检索入口查找文献的途径。序号检索机构检索其它途径著者检索99二、文献信息检索策略检索策略的含义广义的检索策略是指用户根据检索需求选择相应的数据库、确定检索方式、检索途径及相应检索表达式进行检索的一系列操作或方案,是用户检索目标的体现;狭义的检索策略仅指用户确定检索表达式进行检索的系列操作。二、文献信息检索策略检索策略的含义100检索策略的构建1.分析研究课题,明确检索要求;分析课题要解决的问题,即它所包含的概念和具体要求及它们之间的关系;是制定检索策略的根本出发点,也是检索效率高低或成败的关键。分析课题的主题内容确定课题的文献类型确定检索时间范围分析用户的检索评价要求检索策略的构建1.分析研究课题,明确检索要求;101检索策略的构建2.选择检索系统,确定检索方法;根据检索课题的要求,选择最能满足检索要求的检索系统或工具书;数据库的选择原则,即3C原则:Content,即数据库的内容、学科范畴、文献质量、数据库类型和文献来源;Coverage,即数据库和及时性,数据库的更新频率和周期;Cost,即检索成本。检索策略的构建2.选择检索系统,确定检索方法;102检索策略的构建3.确定检索途径,编写检索策略表达式;根据信息需求或检索课题的已知条件和检索要求,以及所选定的信息检索系统所提供的检索功能,确定适宜的检索途径。检索途径确定后,编写检索策略表达式。检索策略的构建3.确定检索途径,编写检索策略表达式;103检索策略的构建4.评价检索结果,修正检索策略;按照预定的检索策略进行检索,并对检索结果的相关性进行分析、评价;如果满足自己的检索需求,将检索结果输出;如对检索结果不甚满意,应对检索策略进行调整,以获取更好的检索结果。检索策略的构建4.评价检索结果,修正检索策略;104检索策略的调整扩大检索重新选择数据库:选择多个数据库进行检索,或增加所检数据库的检索年限;选择多种检索方式:采用多种检索方式相结合,可以适当扩大检索;重新选择检索途径:如选择篇名字段检出结果较少时,可选择文摘、组合字段或全文字段,获取较多检出结果。检索策略的调整扩大检索105检索策略的调整重新建构检索表达式:主题词检索时采用扩展检索,选用所有副主题词或扩展下位副主题词;自由词检索时考虑其同义词、近义词等,并用OR相连;采用截词检索,且截词不宜太长;去掉次要的主题词或非核心的检索词,减少AND组配面;对检索词不做限定;采用邻近算符检索时,不要过于严格等。检索策略的调整重新建构检索表达式:106检索策略的调整缩小检索重新选择数据库:减少所检数据库的数量,或减少所检数据库的检索年限;选择最佳检索方式:如选择高级检索或专家检索,输入较多的限定条件,可以适当缩小检索;重新选择检索途径:如全文字段检出文献较多时,可重新选择在篇名、关键词和文摘等字段。检索策略的调整缩小检索107检索策略的调整重新建构检索表达式尽量采用主题词检索,并借助主题词表选择更专指的下位词进行检索,选择特定的限定词进行组配检索;自由词检索时进行各种限定;采用文献形式特征进行限定;增加AND的组配面,使检索表达式更为准确第表达检索需求;减少OR的组配面;用运算符(如NOT、-)排除带有干扰性的概念或不需要包含的概念;词语检索时采用精确检索等。检索策略的调整重新建构检索表达式108文献信息检索的步骤分析课题,明确实质需求选择合适的工具数据库概念分析,并转换成系统检索用词拟订检索提问式或检索途径检索检索结果是否满意修正调整检索策略输出检索结果yesno图1-4-1检索流程图
文献信息检索的步骤分析课题,明确实质需求选择合适的工具数据库109第一章
文献信息检索基础第一章文献信息检索基础110第一章
文献信息检索基础第一节文献信息资源及其检索概述第二节文献信息检索系统第三节文献信息检索技术第四节文献信息检索策略第一章文献信息检索基础第一节文献信息资源及其检索概述111一、文献信息的概念1.文献2.知识3.信息一、文献信息的概念1.文献112第一节信息检索概述一、信息、知识、情报、文献(一)定义信息(Information):是物质存在的一种方式、形态或运动状态,是事物的一种普遍属性。知识(Knowledge):是人们在认识和改造客观世界的实践中所获得的认识和经验的总和。是人们对客观事物的本质和规律的认识。情报(intelligence)
:是满足一定需求的、激活了的知识第一节信息检索概述一、信息、知识、情报、文献113文献(Literature,Document):是记录有知识的一切载体。记录知识的具体内容;记录知识的手段:如文字、图像、符号、声频、视频等;记录知识的物质载体:如纸张、光盘、录像带等;记录知识的表现形态:如图书、期刊、专利说明书等。文献(Literature,Document):是记录有知识114(二)关系
信息知识情报文献(二)关系信息知识情报文献115二、文献信息的类型按载体的不同,常将文献划分为:1.印刷型2.电子型3.声像型按出版类型,又常将文献划分为:1.图书2.期刊3.会议文献4.学位论文5.科技报告6.专利文献7.WHO出版物教科书——参考书——专著——综述——期刊论文论文——综述——专著——教科书二、文献信息的类型按载体的不同,常将文献划分为:116(1)图书图书:通常被认为是由正式出版社出版的出版物。其范围很广,包括专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等。特征为出版社名称(Publication、Press)、ISBN号等分为阅读型和工具型(1)图书图书:通常被认为是由正式出版社出版的出版物。117特点:成熟,全面,可靠,时效性差用途:初步了解一般性问题
实例:作者:胡鞍钢著出版社:北京大学出版社出版时间:2007-1-1字数:297000版次:1页数:395印刷时间:2007/01/01开本:印次:纸张:胶版纸ISBN:9787301115367包装:平装特点:成熟,全面,可靠,时效性差作者:胡鞍钢著118(2)期刊期刊:俗称杂志。是定期或不定期周期性出的连续出版物,特征为刊名、卷Vol.、期No.、国际标准刊号ISSN期刊分为:学术性(Journal)
情报型:工具型(Abstracts,Index)报导型(News)综合型(Review)(2)期刊期刊:俗称杂志。是定期或不定期周期性出的连续出版物119特点:数量大,品种多,内容丰富,出版周期短用途:获取最新研究成果和动态实例:主管:中国科学技术协会主办:中华医学会编辑:中华医学杂志编辑委员会总主编:巴德年编辑部主任:陈新石出版:中华医学会杂志社ISSN0376-2491CN11-2137/R
特点:数量大,品种多,内容丰富,出版周期短主管:中国科学技术120(3)特种文献
特种文献:形式比较独特,一般是单独成册,主要出版特征是号码,主要特种文献有以下八种类型。(3)特种文献特种文献:形式比较独特,一般是单独成册121①学位论文学位论文:是高等院校硕士(Ms.D)或博士(Ph.D)毕业生为申请学位而提交的毕业论文。
特征:学校名称及学位①学位论文学位论文:是高等院校硕士(Ms.D)或博士(122布尔逻辑检索技术课件123布尔逻辑检索技术课件124②科技报告科技报告:研究机构关于某项科研成果的正式报告,或者是对研究过程中阶段进展情况的实际记录。国防与航空航天方面居多。
特征:报告号
②科技报告科技报告:研究机构关于某项科研成果的正式报告125例如:NASA20050082846(美国宇航局科技报告)ADA207606(美国国防系统研究报告)DE91011930(美国能源系统研究报告)PB90226341(美国民用系统研究报告)AGARDR775(北大西洋公约组织研究报告)HY93007(航空信息研究报告)例如:126
实例:
中国核科技报告
ChinaNuclearScienceandTechnologyReport主办:《中国核科技报告》编辑部周期:
半年出版地:北京市语种:
中英开本:
16开
ISSN1671-7430CN11-9253/TL创刊年:1985
中国核科技报告
ChinaNuclear127③会议论文会议文献:主要是学术会议上宣读的论文或交流的书面论文,形式有单行本(会议预印本preprint)和会议论文集。特征为:会议名称、时间、地点③会议论文会议文献:主要是学术会议上宣读的论文或交流的128会议论文特点:文献论题集中,内容新颖、丰富、专、深、学术性强,能反映出一个国家、一个地区或国际上当前某一科学技术领域的最新成就、最高水平和发展趋势。
实例会议论文特点:文献论题集中,内容新颖、丰富、专、深、学术性强129④专利
专利:发明人申请专利时呈交的申请说明书。一般包括:发明人、发明的详细说明、专利权范围、插图等。特征:专利号④专利130实例:输液自动呼叫器
福建省大田星海科技开发有限公司程开海1、输液过程中瓶内药液将要滴尽时能提前自动发出声响信号,提醒护理人员注意;2、旋动呼叫器上的旋钮可直接选择用于各种规格容量药瓶(袋)输液终了的自动呼叫;3、自动呼叫后病人躺在床上可直接拉动拉线控制停呼。实例:输液自动呼叫器131⑤政府出版物政府出版物:这是各国政府部门及其设立的专门机构发表、出版的文件,分为行政性文件(如法令.统计等)和科技文献(30%~40%)。⑤政府出版物政府出版物:这是各国政府部门及其设立的专门132⑥标准标准:主要是对工农业产品和工程建设的质量、规格及其检验方法等方面所作的技术规定,是从事生产、建设的一种共同技术依据。特征为:标准号⑥标准标准:主要是对工农业产品和工程建设的质量、规格及133⑦产品资料产品资料:产品资料是制造厂商为了推销产品而发出的,以介绍产品性能为主的出版物。⑦产品资料产品资料:产品资料是制造厂商为了推销产品而发134实例:实例:135⑧科技档案科技档案:科技档案是科学技术研究和生产建设部门,在科学技术研究和生产建设活动中形成的,有具体工程对象的技术文件、图样、图表、图片、原始记录的原本或代替原本的复制本等⑧科技档案科技档案:科技档案是科学技术研究和生产建设部门,在1361372.认识不同内容层次的文献一次文献零次文献二次文献三次文献文献整理知识重组知识浓缩282.认识不同内容层次的文献一次文献零次文献二次文献三次文137(1)零次文献(ZeroDocument)
零次文献指未经正式发表或未进入学术交流的最原始的文献。(2)一次文献(PrimaryDocument):是指作者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作,如专著、期刊论文、科技报告、学位论文等。(1)零次文献(ZeroDocument)138(3)二次文献(SecondaryDocument):是将大量无序、分散的一次文献收集、整理、加工、著录其特征,如著者、篇名、分类、主题、出处等,并按一定的顺序加以编排,形成供读者检索所需一次文献线索的新的文献形式,如索引、文摘、目录以及其相应的数据库等。因其具有的检索功能而称之为检索工具或检索系统。(3)二次文献(SecondaryDocument):是将139(4)三次文献(TertiaryDocument):是科技人员围绕某一专题,借助于二次文献,在充分研究与利用大量一次文献的基础上,经过阅读、分析、归纳、概括,撰写而成的新的文献。表现形式主要有:综述(Review)、述评(Comment)、进展(Progress、Advance)、现状(Update)、发展趋势(Trend)等期刊文献和百科全书、年鉴、手册等参考工具书。(4)三次文献(TertiaryDocument):是科技140文献级别举例一次文献
二次文献文献级别举例141文献级别举例三次文献零次文献文献级别举例142
科技文献层次结构知识产生
记录原始文献知识重组
知识浓缩词典名录指南手册年鉴书目等述评专著教科书论文丛集百科全书等三次文献
期刊论文会议论文科技报告学位论文专利说明书文献整理目录
索引文摘新书通报等二次文献一次文献零次文献 科技文献层次结构知识产生记录原始文献知识重组143
研究活动(实验、观察、思考)
信息的直接记录或传递
零次文献(创造知识的素材)
将知识以文字等形式固化
一次文献(初始的知识产品)
将分散的文献序列化
二次文献(一次文献的替代品)将知识重新组合,使知识序列化
三次文献(浓缩的新的信息产品)研究活动(实验、观察、思考)信息的直1443.认识不同载体的文献
印刷型文献:纸质电子型文献:
缩微型文献声像型文献机读型文献(电子文献)多媒体型文献3.认识不同载体的文献145四、文献信息的特点1.数量庞大,增长迅速2.文种繁多,但呈明显的英文化趋势3.内容交叉重复4.文献形式呈现多样化5.文献分布既集中又分散,但呈专题化或专集化趋势6.知识老化加快,文献寿命(半衰期)缩短7.交流传播及变化速度加快四、文献信息的特点1.数量庞大,增长迅速146五、文献信息的社会功能1.科技文献是科学表现的存在形式,是汇集人类财富的主要场所。2.科技文献是衡量科学技术水平的重要依据。3.科技文献是传播科学知识的最基本、最主要的手段4.科技文献是确认科学发现与技术发明优先权的认证记录。五、文献信息的社会功能1.科技文献是科学表现的存在形式,是汇147六、检索基本原理经选择的信息主题分析标引语言表达文献特征标识经确立的课题主题分析检索语言表达文献需求标识信息集合词表存储检索检索结果什么样的文献信息能够得以输出呢?匹配检索时匹配的究竟是什么?六、检索基本原理经选择的信息主题分析标引语言表达文献特征标识148第二节 文献信息检索系统一、文献信息检索系统的构成二、数据库的结构三、文献信息检索系统的分类四、文献信息检索系统的功能第二节 文献信息检索系统一、文献信息检索系统的构成149一、文献信息检索系统的构成1.信息资源2.硬件设备3.软件条件4.人力资源上述四方面内容构成了文献信息检索系统的空间结构,是系统运行的最基本前提。一、文献信息检索系统的构成1.信息资源150151二、类型手工检索检索手段计算机检联机检索光盘检索网络检索42二、类型检索手段151152二、类型文本信息检索数据格式和检索技术多媒体信息检索超媒体和超文本检索43二、类型文本信息检索数据格式和检索技术多媒体信息检索超媒152三、数据库的结构(一)从数据库组成的层次来划分1.文档(File)2.记录(Record)3.字段(Field)(二)从数据库组成的方式来划分1.顺排文档2.倒排文档三、数据库的结构(一)从数据库组成的层次来划分153字段1字段2字段3记录1记录2记录3文档1文档2文档3数据库数据库结构字段1字段2字段3记录1记录2记录3文档1文档2文档3数据库154上述数据库的结构,可用英文单词的单复数形式更直观地表述为:
Record
Fields(记录)
Database
Flies(数据库)
File
Records(文档)
Field
searchingentry(字段)(检索入口上述数据库的结构,可用英文单词的单复数形式更直观地表述为:155主文档序号:N5序号:N4序号:N3序号:N2序号:N1主题词:S1著者:Au1标题:t1……S1:N1,N3S2:N2,N3S3:N1,N4……Au1:N1,N4Au2:N3Au3:N4……主题词倒排档著者倒排档……主题词检索途径著者检索途径其它检索途径主文档和倒排文档的关系示意图主文档序号:N5序号:N4序号:N3序号:N2序号:N1S1156四、文献信息检索系统的分类1.书目型数据库2.事实数值型数据库3.全文型数据库四、文献信息检索系统的分类1.书目型数据库157158
书目型数据库全文型数据库事实型数据库数值型数据库类型文献信息数据库49书目型数据库全文型数据库事实型数据库数值型数据库类型文158书目型数据库(bibliographicdatabase):是二次文献数据库,主要存贮相关主题领域的各类文献资料的书目信息,包括机读版的文摘、题录、目录、索引等。用户可从大量文献记录中筛选出有参考价值的文献源,并依据记录提供的来源指示获取一次文献。举例:中国生物医学文献数据库、PubMed(P84)、EMBASE(P93)等。1、书目型数据库书目型数据库(bibliographicdatabase)159布尔逻辑检索技术课件160全文型数据库(Full-textDatabase):收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。优点:能直接获取文献原文,集文献检索和全文提供于一体;提供全文字段检索。举例:中国学术期刊网络出版总库(CNKI)、万方数据资源的数字化期刊、OVID全文数据库、ElsevierScience的SDOS等。2、全文型数据库全文型数据库(Full-textDatabase):收录161布尔逻辑检索技术课件162布尔逻辑检索技术课件1633、事实型数据库事实型数据库(FactDatabase):提供有关事物、人物、机构等方面的事实性信息。举例:ClinicalTrials(临床试验数据库)是通过对自愿接受试验患者的临床研究,观测药物、诊断方法、疫苗和其他治疗方法对某一种疾病或症状是否安全和有效。3、事实型数据库事实型数据库(FactDatabase):164布尔逻辑检索技术课件165数据型数据库(NumericDatabase):提供数值性信息,包括各种统计数据、科学实验数据、各种测量数据等。举例:WHOSIS:可以获取以下统计数据和资料:疾病负担统计、死亡原因统计、世界卫生报告年度统计、卫生从业人员统计、人口统计、HIV/AIDS信息与数据、精神病死亡率统计、免疫接种统计等统计数据,以及疾病负担计划、国际疾病分类法及WHO术语信息系统、卫生系统成就、全球酒精数据库(GlobalAlcoholDatabase)等与卫生和卫生统计有关的资料。(P264)美国疾病控制与预防中心(CDC)的DataandStatistics等。(P266)4、数据型数据库数据型数据库(NumericDatabase):提供数值性166布尔逻辑检索技术课件167布尔逻辑检索技术课件168四、文献信息检索系统的功能1.汇集文献信息2.组织文献信息3.检索文献信息上述三者之间的关系如何?理解这个问题对于整个文献检索课学习的意义何在?四、文献信息检索系统的功能1.汇集文献信息169思考题:1.信息、知识、情报三者的联系与区别。2.分别用抽象文字与具体图示表达上述三者关系的意义。3.文献级别演化的本质及意义。4.文献信息综合应用中“综合”二字的含义。5.科技图书与科技期刊之与学术生涯。6.信息检索系统中“系统”二字的含义。7.信息检索系统构成与信息检索原理的关系。8.如何理解信息检索系统的诸多功能。思考题:1.信息、知识、情报三者的联系与区别。170第三节文献信息检索技术第三节文献信息检索技术171一、信息检索技术概念广义的包括信息组织、数据库建设在内的涉及信息科学、情报学、计算机科学等诸多学科领域的技术方法;狭义仅指从现有的信息资源中提取相关信息的技术方法。一、信息检索技术概念172信息检索技术发展阶段手工检索方式:包括纸质文献的检索和缩微式检索;脱机检索方式:包括机读磁带、磁盘检索、光盘数据库检索等;计算机联机检索方式;网络化信息检索方式:如:SCI、EI、SpringerLink数据库、EBSCO数据库等。信息检索技术发展阶段173布尔逻辑检索技术最常用的方法;用户的信息需求通过检索提问式表达;采用布尔代数中的逻辑符AND、OR和NOT作为逻辑组配算符;计算机根据表达式确定命中文献的基本条件与查找途径,同文档中各篇文献的标识进行匹配。凡符合条件的文献即为命中文献,予以输出。布尔逻辑检索技术最常用的方法;174布尔逻辑检索技术布尔运算符AND、OR、NOT,分别表示逻辑与、逻辑或、逻辑非三种逻辑运算关系,如图1-3-1所示。
AandBAorBAnotB图1-3-1布尔逻辑运算示意图
布尔逻辑检索技术布尔运算符AandB175布尔逻辑检索技术名称符号表达式功能逻辑与ANDAANDB同时含有提问词A和B的文献,为命中文献逻辑或ORAORB凡是含有提问词A或B的文献,为命中文献逻辑非NOTANOTB凡是含有提问词A但不含有B的文献,为命中文献布尔逻辑运算一览表布尔逻辑检索技术名称符号表达式功能逻辑与ANDAANDB176布尔逻辑检索技术逻辑“与”,检索表达式为“AandB”。数据库中同时含有检索同A和B的文献为命中文献;作用是缩小检索范围,提高查准率;例如,查找“胰岛素治疗糖尿病”的文献,检索式为
insulin(胰岛素)anddiabetes(糖尿病)。布尔逻辑检索技术逻辑“与”,检索表达式为“AandB”177布尔逻辑检索技术逻辑“或”,检索表达式为“AorB”。数据库中的文献中含有检索词A或B的文献为命中文献;作用是扩大检索范围;例如,查找“肿瘤”的文献,检索式为cancer(癌)ortumor(瘤)orcarcinoma(癌)orneoplasm(新生物)。布尔逻辑检索技术逻辑“或”,检索表达式为“AorB”。178布尔逻辑检索技术逻辑“非”,检索表达式为“AnotB”。数据库中凡含有检索词A而不含B的文献为命中文献;作用是缩小检索范围,提高查准率;例如,查“动物的乙肝病毒(不要人的)”的文献,检索式为
hepatitisBvirus(乙肝病毒)nothuman(人类)。布尔逻辑检索技术逻辑“非”,检索表达式为“AnotB”。179布尔逻辑检索技术布尔逻辑运算的优先顺序当一个检索表达式含有多个布尔算符时,执行的顺序为not优先运算,and其次,or最后。可用圆括号改变运算顺序,将需要优先运算者置于圆括号中。例如,查找“维生素C或维生素E对糖尿病患者肾脏的保护作用”,检索式为:(维生素Cor
维生素E)and糖尿病
and
肾。布尔逻辑检索技术布尔逻辑运算的优先顺序180截词检索截词检索,利用截断的词的一个局部即截词,进行检索的技术;自动地对同一概念检索词的不同词尾变化、词根相同等一类提问词进行检索,并自动用OR连接各词的检出结果,避免文献的漏检和逐词键入的麻烦,提高查全率;常用的截词符号有“*”、“
?”。截词检索截词检索,利用截断的词的一个局部即截词,进行检索的技181布尔逻辑检索技术课件182截词检索分类按是否采用截词符号分为,采用截词符号、不用截词符号;按截断位置的不同分为,右截词、左截词、中间截词;按截断的字符数量的不同分为,无限截词、有限截词。截词检索分类183邻近检索邻近检索(ProximitySearching)是用来表示检索词与检索词之间位置关系的检索技术,通常用位置算符来实现;采用的位置算符有near,with。“near”,表示检索词位置相邻,检索词出现的顺序可前可后,如geneNEARapoptosis;“with”,表示检索词位置相邻,且两词出现的顺序与输入顺序一致,如liverWITHcancer。邻近检索邻近检索(ProximitySearching)是184限定检索限定检索(limitSearching)又称限定字段检索(limitFieldSearching),是利用检索词出现的字段进行的检索;用户可以指定检索某一字段或某几个字段以使检索结果更为准确,减少误检;检索系统的限定检索会采用缩写形式的字段标识符;如TI表示Title,AD表示Address。限定检索限定检索(limitSearching)又称限定字185布尔逻辑检索技术课件186扩展检索扩展检索(ExpandSearching)是同时对多个相关检索词执行逻辑或检索的技术;即当用户输入一个检索词后,系统不仅能检出该检索词的文献,还能检出与该检索词同属于一个概念的同义词或下位词的文献,如PubMed中主题词的扩展检索。扩展检索扩展检索(ExpandSearching)是同时对187加权检索加权检索(weighingsearching)不仅检索提问词是否存在,而且计算提问词的权值,当权值之和超过阈值的记录才能在数据库中被检出来。在某些数据库中表现为仅检索主要概念主题词,如MEDLINE;而有些数据库表现为词频检索,如中国学术期刊全文数据库。加权检索加权检索(weighingsearching)不仅188精确检索和模糊检索精确检索(ExactSearching)是指所检信息与输入的词组完全一致的匹配检索技术;在许多系统中用引号来表示,如检索“AcutePancreatitis”;模糊检索(FuzzySearching)允许所检信息与检索提问之间存在一定的差异。如检索AcutePancreatitis,可检索出AcutenecrotizingPancreatitis、AcutegallstonePancreatitis等。精确检索和模糊检索精确检索(ExactSearching)189跨库检索跨库检索(Crossdatabasesearching、One-stopsearching)是一次对多个数据库同时进行检索的技术。跨库检索能为用户提供统一的检索接口,将用户检索需求转化为不同数据库的检索表达式,并发地检索本地和广域网上的多个分布式异构数据库,并对检索结果加以整合,以统一的格式将结果呈现给用户。跨库检索跨库检索(Crossdatabasesearch190跨库检索跨库检索191相关信息反馈检索相关信息反馈检索,是将与已检结果存在某种程度相关的信息检索出来的检索技术,多由检索系统自动进行检索。如Google()的“类似网页”、PubMed的“RelatedArticles”。相关信息反馈检索相关信息反馈检索,是将与已检结果存在某种程度192相关信息反馈检索相关信息反馈检索193布尔逻辑检索技术课件194智能检索自动实现检索词、检索词对应主题词及该主题词所含下位词的同步检索。如中国生物医学文献服务系统(SinoMed)的智能检索。PubMed的“自动词语匹配检索”属于智能检索。智能检索自动实现检索词、检索词对应主题词及该主题词所含下位词195二、多媒体信息检索技术基于内容的检索基于内容的检索(ContentBasedRetrieval,CBR),主要是对多媒体对象的语义、媒体的视觉特征或听觉特征进行检索。基于内容的图像检索基于内容的图像检索(ContentBasedImageRetrieval,CBIR)使用了可以直接从图像中获得的客观的视觉内容特征,如颜色、纹理、形状等来判断图像之间的相似性。二、多媒体信息检索技术基于内容的检索196基于内容的图像检索现有图像检索技术研究的主流。与传统数据库技术相结合,可以方便地实现海量多媒体数据的存储和管理;与传统Web搜索引擎技术相结合,可以用来检索html网页中丰富的多媒体信息;还可以广泛应用在多媒体数据库、知识产权保护、数字图书馆、网络多媒体搜索引擎、交互电视、艺术收藏和博物馆管理、遥感和地球资源管理等许多领域中。基于内容的图像检索现有图像检索技术研究的主流。197三、可视化信息检索技术信息可视化(Informationvisualization)是将抽象数据用可视的形式表示出来,以利于分析数据、发现规律和决策制定。可实现对信息数据的分析和提取,以图形、图像、虚拟现实等易为人们所认识、可视的方式,展示数据间的复杂关系、潜在信息和发展趋势,以便更好地掌握和利用信息资源
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025初级中式烹调师职业技能精练考试题库及答案(浓缩400题)
- 稀有金属矿资源评价-全面剖析
- 2024年中国工商银行山东临沂支行春季校招笔试题带答案
- 2024年中国工商银行江苏无锡支行春季校招笔试题带答案
- 2024年中国工商银行黑龙江佳木斯支行春季校招笔试题带答案
- 2025年度节能优化服务合同模板
- 智能调度节能策略-全面剖析
- 矿山生态功能恢复机理研究-全面剖析
- 七岁中国画课件下载
- 社会分层的性别与种族视角-全面剖析
- 啤酒分销合同协议
- SL631水利水电工程单元工程施工质量验收标准第2部分:混凝土工程
- 直销队管理制度
- 股份代持协议合同6篇
- 2024-2025学年苏教版七年级生物下册知识点复习提纲
- DB32-T 5082-2025 建筑工程消防施工质量验收标准
- 室速的观察及护理
- 餐饮公司绩效考核办法
- 2025年03月春季河北邯郸市丛台区博硕人才引进50人笔试历年参考题库考点剖析附解题思路及答案详解
- 2025年新高考历史模拟试卷2(含答案解析)
- 社保系统保密培训
评论
0/150
提交评论