第二讲 信息检索策略课件_第1页
第二讲 信息检索策略课件_第2页
第二讲 信息检索策略课件_第3页
第二讲 信息检索策略课件_第4页
第二讲 信息检索策略课件_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索与利用主讲人潘定红第二讲信息检索策略-1第二讲信息检索策略(1)信息及其类型信息检索策略

-检索工具/检索系统

-检索方法

-检索途径

-检索技术

-检索策略*2第二讲信息检索策略-1信息检索信息检索(InformationRetrieval)就是借助于某些信息检索工具或检索系统,采用不同的信息检索方法和途径,通过一定的检索技术,从印刷型或数字型文献信息集合中查找所需文献信息的过程与方法3第二讲信息检索策略-1信息检索的类型以检索内容区分:

—事实检索:通过百科全书、年鉴、手册、字词典等查询名词术语、概念、定义、事件、事实、机构、人物、图谱等

—数据检索:统计年鉴、统计资料汇编、数值型数据库

—文献检索:线索检索与原文检索以检索方式区分:

—手工检索:利用印刷型工具书查找

—计算机检索:通过计算机及网络设备,利用光磁等媒介存贮、检索文献信息的过程4第二讲信息检索策略-1信息处理人员原始信息信息分析、著录和标引检索工具/检索系统检索结果用户检索课题课题分析主题词/分类号存储过程检索过程存入检索信息检索原理示意图5第二讲信息检索策略-1第二讲信息检索策略(1)信息及其类型信息检索策略

-检索工具/检索系统

-检索方法

-检索途径

-检索技术

-检索策略*6第二讲信息检索策略-1一、信息检索工具/检索系统检索工具是人们用来存储、报道和查找各类信息的工具主要类型印刷型手工检索工具—目录、题录、索引、文摘、参考工具书数字型检索工具——数据库检索系统类型划分按性质和功能(加工深度):全文数据库/参考数据库/事实数据库按照内容和文献类型分:数据库、电子期刊、电子图书、电子报纸等……按照经费:商用资源和免费资源7第二讲信息检索策略-11、印刷型手工检索工具指示型检索工具(二次文献)书目索引文摘指示性文摘报道性文摘提供具体内容的参考型检索工具(三次文献)词典/辞典手册百科全书(类书、政书)资料汇编年鉴名录工具书题录表谱图册第二讲信息检索策略-1获取专业性的检索工具/检索系统9第二讲信息检索策略-110第二讲信息检索策略-111第二讲信息检索策略-112第二讲信息检索策略-12、数字型检索工具数据库(database)由计算机进行处理的一定数量同类信息的有序集合,是用来存储和查找文献信息的电子化检索工具其他数字型检索工具搜索引擎网络免费资源-OA资源学科信息门户网站13第二讲信息检索策略-1数据库的类型事实数据库(factualdatabases):指包含大量数据、事实的数据库,如数值数据库、指南数据库、术语数据库等,相当于印刷型文献中的字典、辞典、手册、年鉴、百科全书、组织机构指南、人名录、公式与数表、图册(集)等。如:Gale数据库、万方数据库系统的成果、新方志、法规、机构、科技专家等栏目参考数据库(referencedatabase):指包含各种数据、信息或知识的原始来源和属性的数据库,有书目、文摘、索引等。如:CCC、PQDD、全国报刊索引数据库等全文数据库(full-textdatabases):即收录有原始文献全文的数据库,以期刊论文、会议论文、报纸、政府出版物、研究报告等为主。如:中国期刊网、万方数字化期刊、《中文科技期刊数据库》(维普)、方正Apabi电子图书、超星电子图书、四库全书、Elsevier全文期刊、JohnWiley全文期刊及来自Proquest、EBSCO数据库的电子报纸等14第二讲信息检索策略-1Gale数据库的LiteratureResourceCenter(文学资源中心):可提供检索13万名全球作家的传记、书目、作家评论分析、作品概述、文学术语定义、经过专家严格挑选的相关站点链接,及全文文学学术期刊中的45万篇全文文章15第二讲信息检索策略-116第二讲信息检索策略-117第二讲信息检索策略-118第二讲信息检索策略-12010年我馆数据库使用统计(中文)数据库万方数据各数据库中国知网各数据库中国科技期刊数据库(维普)读秀学术搜索全文下载(次)440256198735检索次数(次)31051摘要浏览次数163537登录次数23133746547498314参考咨询页数306212全文链接点击(次)177110第二讲信息检索策略-12010年我馆数据库使用统计(外文)数据库Elsevier

OCLC

Wiley-Blackwell

Proquest

全文下载(次)205476388217239检索次数(次)1034611675412850查看文摘/引文3587第二讲信息检索策略-1选择检索工具/检索系统学科属性是考察参考资源是否适用的首选因素。首先要保证所选择的资源与检索课题的学科一致,其次应考虑所选资源在该学科领域的权威性如何,尽量使用权威性的专业数据库作为检索工具了解参考资源收编的范围和特色收藏,包括资源收录的资料跨越的历史年代、覆盖的地理范围、是单语种还是包括多种语言、信息类型是什么等等了解参考资源的检索方法和系统功能:检索的速度、数量、方便程度

21第二讲信息检索策略-1第二讲信息检索策略(1)信息及其类型信息检索策略

-检索工具/检索系统

-检索方法

-检索途径

-检索技术

-检索策略*22第二讲信息检索策略-1二、信息检索方法1、直检法:如专业核心期刊跟踪、重要作者跟踪等23第二讲信息检索策略-12、常规法:利用检索工具查找有关文献顺查法优点:查的文献较完整,查全率较高缺点:工作量大,效率不高,而且起始年代难以确定逆查法优点:比较省时省力缺点:可能漏查一些有用的文献

抽查法优点:检索时间较少,查的文献较多缺点:有漏检的可能,并要求检索者对课题研究的历史情况有较多的了解和掌握24第二讲信息检索策略-13、引文法文献之间的引证和被引证关系揭示了文献之间存在的某种内在联系引文法就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释等查找相关文献的方法引文法又可分为两种由远及近地搜寻由近及远地追溯注意:最好是选择综述、评论和质量较高的文献作为起点,它们所附的参考文献筛选严格,有时还附有评论25第二讲信息检索策略-1(1)由远及近地搜寻(越查越新):从被引文献查找信息26第二讲信息检索策略-127第二讲信息检索策略-1(2)由近及远地追溯(越查越旧)28第二讲信息检索策略-129第二讲信息检索策略-11998引文查找的作用1988References参考文献

该课题如何起源、修正、变迁和发展2008该课题的演变、最新进展和趋势Cited被引文献从一篇高质量的文献出发沿着科学研究的发展道路…参考文献——

越查越旧被引文献——

越查越新相关文献——

越查越广30第二讲信息检索策略-1优点:在没有检索工具或检索工具不全的情况下,可较快地获得相关文献,查找方法简单缺点:漏检和误检的可能性较高31第二讲信息检索策略-1例:用引文法进行扩检在标题:计量史学经济史→1条记录:浅谈计量史学在经济史研究中的应用(阅读文章,价值不大)(扩检)→引文扩检:罗德里克·弗拉德.计量史学方法导论[M].上海:上海译文出版社,1997在标题:经济史计量OR数学OR统计OR数量OR定量OR量化OR数值→13条记录→(至少显示摘要)→8条记录→增加1条有效记录:定量分析法在中国经济史中的应用(上)伍丹戈-复旦学报(社会科学版),198532第二讲信息检索策略-133第二讲信息检索策略-134第二讲信息检索策略-14、交替法*交替法就是把引文法和常规法结合起来查找文献的方法:即先利用常规检索工具找出一批有用文献,然后利用这些文献所附的引文进行追溯查找两种方法交替使用,直到满足读者需要为止,它可得到较高的查全率和查准率。此法的优点在于检索工具缺年、缺卷时,也能连续获得所需年限内的文献资料,是采用较多的方法之一35第二讲信息检索策略-1第二讲信息检索策略(1)信息及其类型信息检索策略

-检索工具/检索系统

-检索方法

-检索途径

-检索技术

-检索策略*36第二讲信息检索策略-1三、信息检索途径/入口/字段检索途径就是利用信息的某一特征作为检索标识通过检索工具查到所需的信息指定字段检索可提高检索资料的相关性和精确性37第二讲信息检索策略-1文献的特征外表特征内容特征题名著者序号分类主题关键词检索途径38第二讲信息检索策略-1几种中文数据库检索途径对照39第二讲信息检索策略-1西文数据库常用字段及其代码中文数据库常用字段Abstract-AB文摘ClassNo.-CC分类Author-AU著者Corporate-CS机构名称Descriptor/subject-DE叙词/主题词Document-DT文献类型Full-text-FT全文ISBN-ISSN国际标准书号/国际标准连续出版物号Journalname/publicationtitle-JN期刊名称Keyword/topic-KW关键词Language-LA语言Publicationyear-PY出版年Title-TI标题中外数据库常用的检索字段全文>文摘>关键词>标题第二讲信息检索策略-141第二讲信息检索策略-11、关键词/主题词途径关键词是从文献的题名、文摘、正文中抽取出来,未经过规范的、能表征文献主题特征的具有实质意义的词汇。属于自然语言、非规范语言主题是一组具有共性的事物的总称,用以表达文献所论述和研究的具体对象和问题,即文献的“中心内容”。表达主题概念的词汇就是主题词,通过主题词表对文献检索用语的概念加以人工控制和规范主要/首选途径经常结合分类途径42第二讲信息检索策略-1冠词、介词、连词、代词等虚词及某些动词、高频词等一般不能做检索关键词杨增新时期的民族政策

方国瑜先生与中国民族史研究

从冯氏家族的兴衰看岭南汉族社会的嬗变丽江白沙壁画研究

略论谢灵运山水诗的清旷美43第二讲信息检索策略-1关键词/主题词检索的特点和优势在常用的检索途径中,用户最容易掌握优势:直接性、专指性、集中性、(增删)灵活性,满足特性检索需求,查准率高44第二讲信息检索策略-12、分类号/索书号途径分类法检索是传统的文献检索方法之一,目前的许多中文数据库都有分类检索路径虽然主题法是文献检索的重要途径,但由于文献中关键词、自由词的广泛性和不确定性,用主题法检索往往会造成较多漏检。所以,检索不能忽视分类途径准确的分类号的查询效率是最高的经常结合主题途径45第二讲信息检索策略-1分类法文献分类法是以科学分类为基础,结合文献内容性质及其他特征(如地区、时代、形式、体裁等),按照一定的逻辑体系,区分、组织和检索文献的一种方法

46第二讲信息检索策略-1世界三大图书分类法《杜威十进分类法》(DDC)(DeweydecimalClassification)《国际十进分类法》(UDC)(UniversalDecimalClassification)《国会图书馆图书分类法》(LCC)(Librarycongressclassification)中国图书分类法《中国图书馆分类法》(中图法)《中国科学院图书馆分类法》(科图法)《中国人民大学图书馆分类法》(人大法)第二讲信息检索策略-1《杜威十进分类法》简表

000Generalities總類100Philosophy&psychology哲學及心理學200Religion宗教學300Socialsciences社會科學400Language語言學500Naturalsciences&mathematics自然科學與數學600Technology(Appliedsciences)科技(應用科學)700TheArts

藝術800Literature&rhetoric文學、詩歌900History&geography歷史及地理學48第二讲信息检索策略-149第二讲信息检索策略-150第二讲信息检索策略-1社会科学A马克思主义、列宁主义、毛泽东思想、邓小平理论B哲学、宗教C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理自然科学N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学、安全科学Z综合性图书《中图法》基本大类51第二讲信息检索策略-152第二讲信息检索策略-153第二讲信息检索策略-1例:文学类的类目设置Ⅰ文学Ⅰ0文学理论Ⅰ1世界文学Ⅰ2中国文学Ⅰ3/7各国文学Ⅰ22诗歌、韵文Ⅰ23戏剧文学Ⅰ24小说Ⅰ25报告文学Ⅰ26散文Ⅰ27民间文学……………..Ⅰ222古代至近代作品(~1919年)Ⅰ226当代作品(1919~1949年)Ⅰ227现代作品(1949年~)Ⅰ227.1自由诗Ⅰ227.2抒情诗Ⅰ227.3叙事诗Ⅰ227.7格律诗Ⅰ227.8词Ⅰ227.9其他中国现代自由诗第二讲信息检索策略-155第二讲信息检索策略-156第二讲信息检索策略-157第二讲信息检索策略-1对比:主题词检索58第二讲信息检索策略-1启示:对课题/专业进行分类,以实现某些用关键词难以达到的检索需求59第二讲信息检索策略-1查询分类号的方法查印刷版或网络版分类表:用维普“分类检索”查中图法分类表:用关键词查询相关检索系统60第二讲信息检索策略-161第二讲信息检索策略-162第二讲信息检索策略-163第二讲信息检索策略-1B82伦理学(道德哲学)B83美学G20信息与传播理论G21新闻学、新闻事业G257.35史学目录学(历史文献学)H0语言学H08应用语言学H12(汉语)文字学I01文艺美学K0史学理论K09史学史K25中国近、现代史K890民俗学Q-02生物学哲学(馆藏、国图均如此分类;在版编目:入Q类)第二讲信息检索策略-1难以分类:未列专类-有多个类号现当代文学:文学评论和研究、各体文学评论和研究、诗歌、韵文、小说、散文、杂著、民间文学、儿童文学、少数民族文学等世界史:各大洲史马克思主义哲学65第二讲信息检索策略-166第二讲信息检索策略-1通过关键词查出的各类型分类号,核对分类表以后得到类目名称33条:K890——民俗学——12891.1——891-EastIndo-European&Celticliteratures-9390——Customs,etiquette,folklore——2K89——风俗习惯K892——中国风俗习惯F590——旅游经济理论与方法YB910.19——YB9-心理学YD519.12——婚礼史YD97——风俗习惯YD970.7——YD97-风俗习惯393——Deathcustoms881.1——881-ClassicalGreekpoetry方正电子图书67第二讲信息检索策略-1云大图书馆使用过的三种分类法纯数字型Y+英文字母+数字英文字母+数字*分别对应不同年代到馆的文献需查询三种分类表(或对应书名知道大体的类名)68第二讲信息检索策略-169第二讲信息检索策略-1读懂分类号-加上上位类的限制-中国民间文化艺术专志70第二讲信息检索策略-171第二讲信息检索策略-1分类号查询举例汉语言文字学专业:误入:H314语法应入:H12民族法:用”民族法”检本馆书目系统:选择题名、主题字段共有13条,其中7条经对照分类表,往前推为:D922.15——华侨、民族事务管理法令72第二讲信息检索策略-173第二讲信息检索策略-1利用总论复分号进行学科史检索!I207.7——(中国)民间文学(评论和研究)74第二讲信息检索策略-1利用总论复分号进行工具书检索!75第二讲信息检索策略-1利用总论复分号进行专科检索工具查找!76第二讲信息检索策略-1总论复分表:利用-0

理论与方法论-1科学现状、概况-2机关、团体、会议-3研究方法-4教育与普及-5丛书、文集、连续性出版物-6

参考工具书-7文献检索工具书77第二讲信息检索策略-1《哲学辞典》的类号为B-61,-61是总论复分号,表示辞典《法国的邮电事业》:F635.65,F63代表世界各国邮电事业,565为世界地区复分号,是法国的代号《上海市现代摄影作品集》:J426.51,J426代表现代摄影作品集,51为中国地区复分号,指上海市《美国现代诗歌》:I712.25,712为世界地区复分号,代表美国;2为各国文学专类复分表的复分号,代表诗歌78第二讲信息检索策略-1分类法组织与检索知识的优点:(1)分类法的等级结构便于用户在查找时进行浏览。当用户的检索目的不明确或检索词不确定时,分类浏览方式更有效率,它引导着用户按照初始的目标一步一步接近需求的信息(2)具有族性检索功能,查全率较高——按照学科专业而不是词汇集中文献(3)检索语言的通用性。分类法以知识分类为基础.以符号为标识,具备成为不同语言转换中介的条件(4)能检出检索词的上下文内容,消除同形异义词,有助于消除主题法选词中的”揣测”成分(5)运用分类法可灵活进行文献的扩检和缩检,充分发挥检索技能(6)运用分类法可居高临下,洞察课题在专业学科系统中的定位、上下关系、来龙去脉(7)通过分类号的引导,有助于对检出文献内容的理解第二讲信息检索策略-1缺点不适用于特性检索,查准率比主题词低不能适应学科发展中的变化,难以反映新学科和新名词术语人们认识的不统一,往往造成分类不一致及排检的错误,不易反映边缘学科、交叉学科:如管理心理学注意:

应从几个类目入手查找并加以比较,才不致漏检和误检,如“人类学”-Q98人类学C912.4文化人类学、社会人类学80第二讲信息检索策略-1分类-主题组合检索主题语言和分类语言各有所长将分类-主题组合检索,两种途径互为补充,往往能得到更好的检索效果在检索策略中,若将主题法和分类法的检索思路综合一体,可使检索式结构简捷、兼备包容性和针对性81第二讲信息检索策略-1例:地名的语言与文化研究82第二讲信息检索策略-1对比:83第二讲信息检索策略-13、题名途径具有查找特定文献的便捷功能还可以在搜集某一专题资料的时候,提高检索资料的相关性和精确性,这是因为文章的标题往往反映文章中心内容的焦点,符合人们的思维习惯但要注意部分文献的篇名并不能充分揭示文献内容,容易造成漏检在试检时常用84第二讲信息检索策略-14、著者途径就是根据文献的外部持征,利用著者目录和著者索引进行检索著者途径的利用:由于同一著者的文章往往具有一定的逻辑联系,以著者为线索可以系统、连续地掌握他们的研究水平和研究方向,因此著者途径能满足一定族性检索功能要求85第二讲信息检索策略-1中国著者姓名翻译为英文如何处理A、团体著者:音译+意译+缩写【实例】原西南师范大学在欧洲专利数据库有三种写法:SouthwestChinaNormalUniversity/SouthwestNormalUniversity/XinanTeachers,University《工程索引》中西南农业大学缩写成“swagriuniver”。B、个人著者:音译+缩写+连接符【例】在英文数据库检索作者“金长青”的论文,作者名除了“Jin,ChangQing”还有其他拼写形式?【题解】Jin,Chang-Qing/Jin,CQ/Jin,C.Q/Jin,C.Q./Jin,C.-Q86第二讲信息检索策略-187第二讲信息检索策略-188第二讲信息检索策略-189第二讲信息检索策略-190第二讲信息检索策略-1朱光潜的英文名称国图:Zhu,Guangqian,

1897-1986

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论