第二讲信息检索基础演示文稿_第1页
第二讲信息检索基础演示文稿_第2页
第二讲信息检索基础演示文稿_第3页
第二讲信息检索基础演示文稿_第4页
第二讲信息检索基础演示文稿_第5页
已阅读5页,还剩154页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二讲信息检索基础演示文稿现在是1页\一共有159页\编辑于星期一优选第二讲信息检索基础现在是2页\一共有159页\编辑于星期一______的主要功能是检索、通报、控制一次文献,帮助人们在较短时间内获取较多的文献信息。A.三次文献B.二次文献C.一次文献D.零次文献文献是记录有知识的________。A载体B纸张C光盘D磁盘图书馆主页登陆“我的图书馆”可以________。A.查阅书刊借阅信息B.可以借阅城东高校的图书C.续借图书D.以上都是回顾

利用文献后面所附的参考文献进行检索的方法称为:A.追溯法B.直接法C.抽查法D.综合法报告范围主要为能源方面的科技报告为:

A.ADB.PBC.NASAD.DOE用来报道、存储、检索一次文献的是:A.零次文献B.一次文献C.二次文献D.三次文献现在是3页\一共有159页\编辑于星期一本讲主要内容●信息检索类型●信息检索原理●信息检索方法●信息检索途径●信息检索意义●信息检索技术●信息检索步骤●信息检索语言●信息检索利用●信息检索概念●信息检索策略现在是4页\一共有159页\编辑于星期一有一种能力与生俱来有一种能力终身受用------信息检索现在是5页\一共有159页\编辑于星期一信息检索概念现在是6页\一共有159页\编辑于星期一现在是7页\一共有159页\编辑于星期一南航学生事务服务中心:【名家讲坛】4月8日19:00在一号楼四楼报告厅,延参法师邀请你一起《快乐看人生》!本次讲座将凭票入场,但入场券只提供入场资格,现场座位先到先得!入场券将在本周日(3月31日)16:00在学生事务服务中心办公室免费领取,领完为止,同样先到先得哦!邀你的同学一起聆听大师的教诲吧!现在是8页\一共有159页\编辑于星期一现在是9页\一共有159页\编辑于星期一现在是10页\一共有159页\编辑于星期一

广义:存储和检索

狭义:检索

信息检索是根据特定的需求、运用某种检索工具、按照一定的方法查找所需信息的过程。信息检索是从信息集合中迅速、准确地查找出所需信息的程序和方法信息检索的概念现在是11页\一共有159页\编辑于星期一找什么?What?信息检索的要素哪里找?Where?怎么找?HOW?现在是12页\一共有159页\编辑于星期一

信息检索的三个层次知道在哪里能找到信息(了解不同的信息源)能从信息源中检索出合适的信息(课题分析能力和检索技术)能对检索结果进行评价和分析(选择、综合利用)第一层次:知道什么信息在什么地方(熟悉了解信息源)第二层次:从检索系统中检索出信息(检索技术)第三层次:信息选取与综合利用(信息增值)现在是13页\一共有159页\编辑于星期一信息检索意义现在是14页\一共有159页\编辑于星期一节省时间,提高效率

科学技术的迅猛发展加速了信息的增长,加重了信息用户搜集信息的负担。许多研究人员在承接某个课题之后,也意识到应该查找资料,但是他们以为整天泡在图书馆,“普查”一次信息就是信息检索,结果浪费了许多时间,而有价值的信息没有查到几篇,查全率非常低。信息检索是研究工作的基础和必要环节,成功的信息检索无疑会节省研究人员的大量时间,使其能用更多的时间和精力进行科学研究。信息检索的意义1现在是15页\一共有159页\编辑于星期一美国科学基金会凯斯工学院基金委员会、

日本国家统计局的数字思考计划科学实验查阅文献编写报告现在是16页\一共有159页\编辑于星期一

科学研究中,每一个课题的选题、设计、实验、成果、鉴定,都离不开信息。只有通过信息检索,弄清古今中外是否进行过该方面的课题研究,用的是什么方法,获得了什么成果,达到了什么水平,那些研究还没有人做过等,才能明确开展研究的可行性,并把自己的研究建立在一个较高的起点上。在他人研究的基础上进行再创造,从而避免重复研究,少走或不走弯路。现在是17页\一共有159页\编辑于星期一科学研究的向导知己知彼,少走弯路我国某研究所用了约十年时间研制成功“以镁代银”新工艺,满怀信心地去申请专利,可是美国某公司早在20世纪20年代末就已经获得了这项工艺的专利,而该专利的说明书就收藏在当地的科技信息所。“以镁代银”专利信息检索的意义2现在是18页\一共有159页\编辑于星期一美国在实施“阿波罗登月计划”中,对阿波罗飞船的燃料箱进行压力实验时,发现甲醇会引起钛应力腐蚀,为此付出了数百万美元来研究解决这一问题,事后查明,早在十多年前,就有人研究出来了,方法非常简单,只需在甲醇中加入2%的水即可,检索这篇文献的时间是10多分钟。在科研开发领域里,重复劳动在世界各国都不同程度地存在。据统计,美国每年由于重复研究所造成的损失,约占全年研究经费的38%,达20亿美元之巨。日本有关化学化工方面的研究课题与国外重复的,大学占40%、民间占47%、国家研究机构占40%,平均重复率在40%以上;我国的重复率则更高。现在是19页\一共有159页\编辑于星期一追踪学术发展前沿获取新知识的捷径掌握国际竞争主动权信息检索意义3新形势要求培养的是能力型和创造型人才,具备这些能力的人才首先需要具备自学能力和独立的研究能力。大学生在校期间,已经掌握了一定的基础知识和专业知识。但是,“授之以鱼”只能让其享用一时。如果掌握了信息检索的方法便可以无师自通,找到一条吸收和利用大量新知识的捷径,把大家引导到更广阔的知识领域中去,对未知世界进行探索。是谓“教人以渔”,才能终身受用无穷。

提升自身的信息素养终身教育的基础现在是20页\一共有159页\编辑于星期一美国普林斯顿大学物理系一个年轻大学生名叫约瀚·菲利普,在图书馆里借阅有关公开资料,仅用四个月时间,就画出一张制造原子弹的设计图。他设计的原子弹,体积小(棒球大小)、重量轻(7.5公斤)、威力大(相当广岛原子弹3/4的威力),造价低(当时仅需两千美元),致使一些国家(法国、巴基斯坦等)纷纷致函美国大使馆,争相购买他的设计拷贝。二十世纪七十年代,美国核专家泰勒收到一份题为《制造核弹的方法》的报告,他被报告精湛的技术设计所吸引,惊叹地说:“至今我看到的报告中,它是最详细、最全面的一份。”但使他更为惊异的是,这份报告竟出于哈佛大学经济专业的青年学生之手,而这个四百多页的技术报告的全部信息来源又都是从图书馆那些极为平常的、完全公开的图书资料中所获得的。现在是21页\一共有159页\编辑于星期一信息检索原理现在是22页\一共有159页\编辑于星期一通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。信息检索原理将特定的用户信息需求与检索系统中文献线索进行有无、异同、大小的比较与匹配,选取两者相同或者部分相同的文献予以输出现在是23页\一共有159页\编辑于星期一信息内容提取概念标识检索需求

提出检索标识信息检索语言索引标识检索标识检索系统检索结果信息存储信息检索特征分析需求分析标引检索对文献内容特征和外部特征进行分析形成概念标识,再依据检索检索语言,如分类号、主题词、关键词及著者选用规则等将其用相应的标识充分、准确地表达出来分类语言、关键词语言、主题词语言信息检索原理现在是24页\一共有159页\编辑于星期一信息检索工具现在是25页\一共有159页\编辑于星期一存贮、报道和查找信息或原始信息全文的工具,它是我们查找资料的主要手段著录:对文献进行加工,将其两种特征(内部、外部)抽取出来并记录下来的过程标引:用信息检索语言(主题、分类语言)反映文献的主题和内容的过程,一篇原文加工成一条条目(entry),通过标引,就把先前零散的款目构造成有条理的结构体系现在是26页\一共有159页\编辑于星期一信息检索类型现在是27页\一共有159页\编辑于星期一按检索对象性质:文献检索:凡是以文献(包括文献线索、文摘、题录和全文)为检索对象的一种检索。检索结果是特定文献线索。移动通信病毒文献有哪些?数据检索:凡是以数据(包括计算公式、化学分子式、数值、图表(参考工具书))为检索对象的叫数据检索。检索结果是数值性数据。今日人民币对美元汇率事实检索:统计资料、百科知识、人物传记、案例等世界上最长的斜拉桥是哪座,该桥位于什么地方,何时建成?按检索方式:手工检索计算机检索信息检索类型现在是28页\一共有159页\编辑于星期一手工检索现在是29页\一共有159页\编辑于星期一简称机检,是指利用计算机查找文献信息的过程计算机信息检索从广义上讲,包括信息的存储和检索两个方面。计算机检索计算机检索系统包括:联机检索系统、光盘检索系统、网络检索系统现在是30页\一共有159页\编辑于星期一计算机检索特点同时检索多个数据库数据库更新较快信息资源具有较高的系统性和完整性多种信息服务方式费用较高检索命令和方法较复杂,需培训后上机现在是31页\一共有159页\编辑于星期一存储方式检索原理检索策略检索途径检索技术检索效率手检印刷型比较匹配脑海中较少不完善较低机检电子型比较匹配检索式较多完善较高信息检索方式对比现在是32页\一共有159页\编辑于星期一信息检索途径现在是33页\一共有159页\编辑于星期一检索途径是一个打开大门的钥匙Akeytothedoor现在是34页\一共有159页\编辑于星期一是由提取信息源的外部与内部特征形成的,又称为检索点或检索入口

信息(文献)

题名责任者号码(专利号、标准号等)出版信息丛编装帧责任者单位分类主题信息检索途径文献外部特征主要检索途径:题名责任者号码

文献内部特征主要检索途径:分类主题外部特征内部特征现在是35页\一共有159页\编辑于星期一信息检索方法现在是36页\一共有159页\编辑于星期一德国柏林图书馆门前有这样一段话:“这里是知识的宝库,你若掌握了它的钥匙,这里的全部知识都是属于你的。”这里所说的“钥匙”即是指信息检索的方法。现在是37页\一共有159页\编辑于星期一引文法:追溯检索法

常规法:顺查法:时间上,远

信息检索方法综合法:循环使用常规法和引文法近,查全率高抽查法:研究的高级阶段,检索效率高倒查法:时间上,近远,查准率高用较少的文献引出较多的文献、了解科学研究的前期工作、相关文献、经典著作、主要作者、重点期刊等

一次文献参考文献新的一次文献参考文献。。。近远一次文献引用该一次文献的文献新的一次文献。。。实际是:远近越查文献越新引文索引法(SCI、SSCI)现在是38页\一共有159页\编辑于星期一信息检索技术现在是39页\一共有159页\编辑于星期一布尔逻辑检索截词检索限制检索位置逻辑检索短语检索提问逻辑式(电子)信息检索技术现在是40页\一共有159页\编辑于星期一布尔逻辑检索现在是41页\一共有159页\编辑于星期一通过布尔逻辑运算符来表达检索词与检索词间逻辑关系与:

AND“*”表示它所连接的两个检索词必须同时出现在结果中非:NOT“-”表示它所连接的两个检索词中从第个概念

中排除第二个概念或:OR“+”表示它所连接的两个检索词中任意一个出

现在结果中现在是42页\一共有159页\编辑于星期一在计算机信息检索时,“与”(and或*或空格)是表达概念交叉和限定关系的一种组配,具有缩小检索范围和提高专指性的功能。表达式为:

AANDB、A*B或AB逻辑与例:computerandcontrol(SCI)

computer*control(Dialog)

computercontrol(Google)例如:A=法国B=红酒AandB=法国红酒现在是43页\一共有159页\编辑于星期一逻辑“或”算符,表示主题概念之间的同义、近义、相关或多个并列的检索概念。具有扩大检索范围,减少漏检的功能。表达式为:AORB或A+B逻辑或例:AirplaneorAircraft(Google)

或Airplane+Aircraft例如:A=教育学家B=哲学家AorB=教育学家+哲学家=(教育哲学家)现在是44页\一共有159页\编辑于星期一逻辑“非”算符,是具有概念包含关系的一种组配,可以从原检索范围中排除某一内容。具有缩小命中范围,提高查准率,增强检索的专指性,减少输出量的作用。表达式为:ANOTBA–B逻辑非例:Energynotnuclear例如:A=能源B=核能A-B=不包括核能的能源现在是45页\一共有159页\编辑于星期一逻辑或(OR):扩大检索范围,有利于提高查全率。ABABAB逻辑或A+B逻辑与A*B逻辑非A-B逻辑与(AND):缩小检索范围,有利于提高查准率。逻辑非(NOT):缩小检索范围,有利于提高查准率。现在是46页\一共有159页\编辑于星期一运用“布尔算符”的注意事项:布尔逻辑运算符运算顺序为:

not→and→or运算符遵循数学运算法则;

(a)括号优先;(AorB)andCnotD

(b)在检索式中只有and或or前后的检索标识可以交换;

(c)检索式中有not时前后检索词不能交换。

备注:()必须在半角和英文状态下输入(AandB)notC注意事项现在是47页\一共有159页\编辑于星期一上海零售业的现状与发展趋势上海零售业现状发展趋势上海and

零售业and(现状

or

发展趋势)实例现在是48页\一共有159页\编辑于星期一截词检索现在是49页\一共有159页\编辑于星期一英文词形和词性的变化cook,cooks,cooking,cookery,cookbookdrive,drove,driving,driven现在是50页\一共有159页\编辑于星期一截词检索(truncationretrieval)是指在检索词的适当位置截断,用截断的词的一个局部进行的检索。由于检索词与数据库所存储信息字符是部分一致性匹配,所以又称部分一致检索。截词检索是针对西文的近义词、同一词根、单复数等原因,造成检索词列举不全形成漏检现象而提出的特殊检索技术。在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。截词符号:一般用的截词符是“?”和“*”,在不同的数据库中表示的意思有所不同,常见的意思是“?”表示0-1个字符,而“*”表示多个字符。截词符具有“OR”运算符的功能,能够扩大检索范围,而且减少了输入检索词的时间。截词检索:用截词符号表示检索词的某一部分允许有词

形的变化,广泛用于西文检索现在是51页\一共有159页\编辑于星期一*——EiVillage,WebofScience,Elsevier,EBSCOJane‘s航空数据库

?——PQDD,INSPEC,Dialog截词的分类按位置前截词*magnetic:Magnetic;electro-magnetic…中间截词Defen?e:defencedefense…后截词physic*:physicphysicalphysician…前后截词?comput?minicomputer,microcomputers按取代数量分

有限截词有限截断“?”organi?tion:organization;orgnasation…无限截词无限截断“*”econom*:economic;economics;economism;economize…现在是52页\一共有159页\编辑于星期一限制检索现在是53页\一共有159页\编辑于星期一限制检索:是限定检索词出现在数据库记录中某一字段范围的一种检索技术。检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。基本检索字段标题、文摘、叙词、自由标引词

Title、abstract、descriptor、identifier辅助检索字段作者、刊名、语种、年代、专利号等

author、journal、language、publicationyear、patentnumber现在是54页\一共有159页\编辑于星期一字段检索常用代码现在是55页\一共有159页\编辑于星期一前缀限制符例如:

AU=限查特定作者

JN=限查特定刊名

LA=限查特定语种

PN=限查特定专利号

PY=限查特定年代后缀限制符例如:

/TI限在题目中查

/AB限在文摘中查

/DE限在叙词标引中查现在是56页\一共有159页\编辑于星期一目前各个检索系统所设立的字段是各不相同的,即同一字段,也可能采用不同的字段代码表示。注意事项如题名字段Ei中,用highwaytransport*withinTI来表示;

OCLCFirstsearch中,用TI:highwaytransport*来表示。例:EiCPXWeb网络版数据库主要字段的字段代码如下:

CVEi叙词表受控语

TI题名AB文摘

AU著者姓

AF著者机构名称ST连续出版物名称PN出版时间在进行字段检索时,应先看一下该数据库的使用指南。现在是57页\一共有159页\编辑于星期一=><>=<=时间上的限定例如:PY>=2005表示检索2005年以来(包括2005)发表的文献。现在是58页\一共有159页\编辑于星期一检索2005年以后在《情报学报》上发表的有关信息价值计算方法的文献限定范围:2005以后;《情报学报》检索词:信息价值、计算检索式:

(年>=2005)*(刊名=情报学报)*(主题=信息价值*计算)例现在是59页\一共有159页\编辑于星期一短语检索现在是60页\一共有159页\编辑于星期一短语检索:通常用双引号“”将一个词组括起,作为一个不可分的检索整体来进行现在是61页\一共有159页\编辑于星期一位置逻辑检索现在是62页\一共有159页\编辑于星期一利用位置算符来表示检索词之间的位置关系,以实现位置逻辑检索功能。位置逻辑特征这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。可表达复合内容属于提高专指度的方法引入位置算符的目的是增加检索式的灵活性,表达复杂专深的概念,从而提高检索的专指度,弥补布尔逻辑算符难以表达某些复杂提问的不足。现在是63页\一共有159页\编辑于星期一

位置逻辑又称邻近检索,用位置算符表示检索词之间的位置邻近关系。常用的位置算符有以下几种:位置逻辑(W)算符(nW)算符(N)算符(nN)算符(S)算符(F)算符现在是64页\一共有159页\编辑于星期一(W)算符是“With”的缩写,表示该算符两侧的检索

词相邻,且两者之间只允许只有一个空格或标点符

号,不允许有任何字母或词,顺序不能颠倒。(W)

也可以简写为()。(W)算符例如:Aircraft()design可检索出含有

Aircraftdesign的文

献记录。现在是65页\一共有159页\编辑于星期一(nW)算符是“nWords”的缩写,表示此算符两侧的

检索词之间允许插入n个实词或虚词,但两个检索

词的次序还是不能颠倒。(nW)算符例如:laser(1W)printer

可检索出包含“laserprinter”、“lasercolorprinter”

和“laserandprinter”的记录。现在是66页\一共有159页\编辑于星期一(N)算符是“Near”的缩写,表示此算符两侧的检索词彼此相邻接,但两个检索词的前后关系可以颠倒。(N)算符例如:computer(N)network可检出含有computer

network、networkcomputer形式的文献记录。现在是67页\一共有159页\编辑于星期一(nN)算符是“nNear”的缩写,表示此算符两边的检

索词之间插入词的最多数目是

n

个,且两个检索词

的次序可以任意颠倒。(nN)算符例如:computer(2N)system可检出

含有computersystem,computercodesystem,

computeraideddesignsystem,systemusingmodern

computer等形式的文献记录。现在是68页\一共有159页\编辑于星期一(S)算符是“Sub-field/Sentence”的缩写,表示其两侧

的检索词必须是在文献记录的同一子字段中,用(S)

连接的两个词都出现在同一个子字段中词序不限。检索式为A(S)B(S)在文摘字段中,一个句子就是一个子字段,用

句号或豆号结束。(S)算符例如computer()control(s)system可检出文摘中含有“Thispaperisconcernedwithanapplicationofthecomputercontroltechniqueinaintelligentsystemfortestinginnerwallsofpipes.”这样一句话的文献记录。现在是69页\一共有159页\编辑于星期一(F)算符是“Field”的缩写,表示其两侧的检索词必须是在文献记录的同一字段中,而它们在该字段中的相对次序不限。检索式为A(F)B例如:computer(F)control,只要这两个词在一个字段同时出现就算命中。例如:water()pollution(F)control表示在同一个字段中(如篇名、文摘、叙词等)同时含有waterpollution和control的文献记录均可检索出来。例如:environmental(F)impact/DE,TI表示这两个词必须同时出现在叙词字段和篇名字段中。(F)算符现在是70页\一共有159页\编辑于星期一位置逻辑检索精确度排序(W)(nW)(N)(nN)(S)(F)高低现在是71页\一共有159页\编辑于星期一提问逻辑式现在是72页\一共有159页\编辑于星期一提问逻辑式是表达用户提问需求的逻辑算式,又称“检索逻辑式”、“提问式”、“检索式”。常由检索条件、检索词、布尔逻辑算符、表示运算优先级的括号、结束号等组成。提问逻辑式的要求是:(1)应完整而准确地反映出用户提问的主题内容;(2)要适应所查文献数据库的索引体系和检索用词规则;(3)要符合检索系统的功能及限制条件的规定;(4)要遵守概念组配原则;(5)提问逻辑式尽量简化。提问逻辑式现在是73页\一共有159页\编辑于星期一检索有关轻金属焊接方面的文献轻金属:lightmetal

焊接:weld

在检索文档中,除了上述两个专指词外检索有关轻金属方面的文献还应包括其他具体的轻金属的概念,如镁、铝等。而焊接这个概念的族面还应包括结合、铜焊、粘接等。举例(lightmetalORmagnesiumORaluminiumOR…)and(weldORjointOR…)

该检索式运用逻辑运算符及括号等包括了较全面的概念组面,但由于检全率与词形的规范化的要求,还可以适当地采用截词符。因此,有关“轻金属焊接”这一提问比较完整的提问逻辑式构造如下:(lightmetal?①OR②magnesium③ORaluminiumOR….)and(weld?ORjointOR…)式中①截词符②逻辑运算符③检索词提问逻辑式现在是74页\一共有159页\编辑于星期一布尔逻辑检索表达式的特点布尔检索表达式是目前信息检索系统中使用最多的一种方法。优点:表达直观清晰,方便扩检和缩检。易于计算机实现。缺点:不能反映文献内容(或信息需求)所涉及的多个概念的相对重要性。没有反应概念之间的内在语义关系。现在是75页\一共有159页\编辑于星期一写出课题的中英文检索式检索有关涡轮叶片的三维设计系统的文献提示:涡轮turbine

叶片blade

三维threedimensional/dimension

设计系统designsystem

英文检索式以dialog系统为例现在是76页\一共有159页\编辑于星期一答案中文:涡轮*叶片*(三维+3D)英文:turbine??*blade??*(three()dimension??+3()D)*design()system??现在是77页\一共有159页\编辑于星期一信息检索策略现在是78页\一共有159页\编辑于星期一1.指为了保证用户获得最好的检索效果,在检索过程中所

应具有的一些措施和工作方法。2.指用以指导检索的理论和方法。3.指科学地运用检索词和逻辑正确构造逻辑提问式的原则

和方法。执行一个课题的检索是有过程、分步来完成的。检索步骤的科学安排称为检索策略。是为实现检索目标而制定的全盘计划和方案。特别是在计算机检索中,策略是明确提出来的,必须慎重。完成的是一个比较复杂、精细的检索课题,又是在人与机器的对话、交互中实现。信息检索策略现在是79页\一共有159页\编辑于星期一信息检索步骤现在是80页\一共有159页\编辑于星期一分析检索课题明确信息需求选择检索工具了解检索系统确定检索途径选定检索方法实施检索策略浏览初步结果调整检索策略获取所需信息信息检索步骤现在是81页\一共有159页\编辑于星期一分析检索课题、明确信息需求

分析研究课题,是实施检索中最重要的一步,也是影响检索效果和效率的关键因素。在课题分析中,要明确以下几个问题。(1)明确研究课题所需的信息内容,提出能准确反

映核心内容的主题概念。(2)确定课题需要查找的文献类型、语种及出版年

代等方面的要求。(3)明确课题对查新、查准、查全的指标要求及其

侧重点。现在是82页\一共有159页\编辑于星期一分析检索课题、明确信息需求1、分析主题内容,找出显性、隐性主题概念,排除无关和重复概念(如展望、现状、应用、作用等),确定核心概念如:芸豆天然食用色素的提取(芸豆天然食用色素提取)2、据检索的主题概念,确定课题涉及的学科范围(以主要学科为检索重点,次要学科为补充,以全面系统地检索所需文献。

如:超声波技术在兽医上的应用(兽医学为检索重点,医学科学为次要学科)现在是83页\一共有159页\编辑于星期一主题内容分析*基础理论性研究?*应用技术性研究?*完整、独立的课题?*一大问题下的局部问题?*主题内容的科学属性,在整个科学体系中的

位置?现在是84页\一共有159页\编辑于星期一课题属理论探讨性质——侧重查学术会议录、学会刊物、大学学报、学术性期刊。课题属尖端技术——侧重查科技报告课题属工艺革新、发明创造——侧重查专利文献课题属定型产品的设计、生产造型——侧重查技术标准、产品样本现在是85页\一共有159页\编辑于星期一例:分析主题概念高温下使用的不锈钢耐热钢不锈钢现在是86页\一共有159页\编辑于星期一在明确了课题的检索范围和要求后,就要据此来选择检索工具。首先,根据检索要求和检索工具的学科特点和收录范围,初步选择一些符合要求的检索工具,然后,再根据这些工具的质量、性能以及检索人员以往使用的经验,来最终确定一个或几个合适的检索工具。选择检索工具应参考的原则是:(1)学科属性(2)收编的范围和特色(3)参考资源的检索方法和系统功能。(4)了解并有效利用检索系统的助检手段和辅助工

具,如检索帮助、培训课程。选择检索工具,了解检索系统现在是87页\一共有159页\编辑于星期一手工检索系统:目录卡片、工具书、手册、百科全书、

专著机检系统:学术数据库、联机检索系统(Dialog:多个

数据库同时检索)、网络检索系统老课题首选手册、百科全书、专著等三次文献。有高度、深度和广度,对该领域的研究有一种全局的了解和把握,同时可以对背景知识和相关名词术语作全面的了解。

新颖课题直接由学术数据库、网上资源,作为检索起点。课题属理论探讨性质——侧重查学术会议录、学会刊物、大学学报、学术性期刊。课题属尖端技术——侧重查科技报告、科技论文、学位论文、会议文献课题属工艺革新、发明创造、产品的设计——侧重查技术标准、产品样本专利说明书现在是88页\一共有159页\编辑于星期一检索途径是开始查找的入口点。常用的有分类检索途径、主题检索途径、著者检索途径、题名检索途径。采取哪种检索途径,要从课题检索要求出发。如果课题检索要求泛指性强,所需文献范围较广,则最好选择分类途径;如果课题检索要求专指性强,所需文献比较专深,则最好选择主题途径;题名途径等进行检索为好。同时根据用户检索的目的,期望的文献数量以及有关主题在学科中的状况,选用适当的检索方法。确定检索途径,选定检索方法现在是89页\一共有159页\编辑于星期一确定了具体的检索方法后,就要利用所用的检索工具的索引,在一定的年代范围内具体查找,以获得文献线索。实施检索策略,浏览初步结果现在是90页\一共有159页\编辑于星期一在具体的检索过程中,当结果中出现了太多的不相关记录或太少的相关记录时,则需要对我们的检索策略进行调整和优化。调整检索策略现在是91页\一共有159页\编辑于星期一■检查检索词的正确性、准确性

检索结果太少■增加检索词的普遍性—查阅工具:主题词表、字

典、分类表等

■拓宽检索策略—减少使用AND;使用OR连接增加的同义词和近义词

■增加检索数据库—确定其他数据库是否覆盖你所

需要的检索主题

现在是92页\一共有159页\编辑于星期一检索结果太少拓展检索词同义词意义相近、相同;缩写与全称、学名与俗名、名称的更迭、数字与日期的不同表达方式;英文关键词词形变化(人称、数、时态、语态),英美的不同拼写等等。乙酰水杨酸与阿司匹林(学名与俗名)上位词、下位词植物—花—鲜花音乐—流行音乐—爵士乐法律—民法—婚姻法,继承法相关词与检索词有联系的、但不是同义词、上位词和下位词glass-ceiling(玻璃天花板,意指在公司企业和机关团体中,限制女性晋升到某一职位以上的障碍)相关词有:promotion(升迁)discrimination(性别歧视)personnelmanagement(个人管理)参考文献现在是93页\一共有159页\编辑于星期一现在是94页\一共有159页\编辑于星期一■设定限制条件、特定的检索字段及年代检索结果太多■增加检索名词的准确性—查阅工具:主题词表、

字典、分类表等

■修改检索策略—增加使用AND,减少使用OR现在是95页\一共有159页\编辑于星期一检索结果太多细化检索词专业词汇乙酰水杨酸与阿司匹林短语和词组限定年代、语言和文献类型选择检索途径检索结果太多:主题词-----书名检索结果太少:书名----主题词现在是96页\一共有159页\编辑于星期一检索结果太多现在是97页\一共有159页\编辑于星期一信息检索的最终目的是获取有用的原始文献。原文获取的方式获取所需信息主要有以下几种:利用全文数据库直接获取。现在有许多全文数据库,通过检索均可直接获得原文。如“中国期刊全文数据库”、”万方数据化期刊”等。利用文摘数据库传递系统获取。利用OPAC检索系统,进行馆际互借(原文传递)现在是98页\一共有159页\编辑于星期一检索效果是指检索结果的有效程度,反映了检索系统的检索性能和检索能力评价检索效果。常用的指标有收录范围、查全率、查准率、响应时间和输出形式等,其中,查全率和查准率是最重要的也是最常用的指标。检索效果评价现在是99页\一共有159页\编辑于星期一查全率是衡量系统在实施某一检索作业时检出

相关文献能力的一种测度指标,其计算

方法为:查全率(R)=查出的相关文献/库中所有的相关文献X100%由于在系统的数据库中,针对某一提问的全部相关文献数量不能精确获知,因此R的计算结果一般都是近似值。现在是100页\一共有159页\编辑于星期一查准率是衡量系统在实施某一检索作业时检索精确度的一个测度指标,其计算方法为:

查准率(P)=查出的相关文献量/查出的文献总量X100%现在是101页\一共有159页\编辑于星期一

查全率与查准率的关系A点:检索词数量多,泛指性强,查全率较

高,但查准率却很低B点:检索词专指性较强,查准率高,查全

率降低;C,D两点:两种极端的折衷。R和P各自的最佳状态是逼近100%,但同时只能满足一个。要提高查全率,则要付出查准率降低的代价;要提高查准率,也要使查全率下降。克兰弗登进行试验后得出了查全率R与查准率P曲线,并且证明R~P之间存在着“互逆”关系。

查全率一般在60%~70%查准率一般在40%~50%

现在是102页\一共有159页\编辑于星期一镁合金方向盘分析检索课题,明确信息需求镁合金方向盘选择检索工具,了解检索系统计算机检索、CNKI确定检索途径,选定检索方法主题词:镁合金方向盘实施检索策略,浏览初步结果检索策略:镁合金*方向盘

调整检索策略,获取所需信息CNKI为例例现在是103页\一共有159页\编辑于星期一现在是104页\一共有159页\编辑于星期一现在是105页\一共有159页\编辑于星期一[1]刘亚南;江利;万义兴;镁合金方向盘骨架压铸过程的数值模拟[J].铸造技术,2012,(07):826-829.  [2]记者徐诗涵.德国科浦集团镁合金压铸项目落户大石桥[N]营口日报,2012-04-26(001)[3]石光华;张才;.镁合金方向盘骨架气孔缺陷的防止[A]..2011重庆市铸造年会论文集[C].中国重庆:,2011:184-185-186-187-188

[4]刘琦;.镁合金方向盘孔隙率的工艺控制[A]..2011重庆市铸造年会论文集[C].中国重庆:,2011:193-194

[5].重庆大学,.镁合金产品应用技术[Z].项目立项编号:.鉴定单位:.鉴定日期:。。。。。。。检索结果现在是106页\一共有159页\编辑于星期一信息检索语言现在是107页\一共有159页\编辑于星期一信息检索语言的概念信息检索语言的种类分类检索语言主题检索语言分类检索语言与主题检索语言的比较信息检索语言现在是108页\一共有159页\编辑于星期一信息检索语言概念现在是109页\一共有159页\编辑于星期一信息检索语言是人们在加工、存储及检索信息时所使用的标识符号,也就是一组有规则的、能够反映出信息内容及特征的标识符。检索语言是标引人员与检索人员之间进行交流的媒介,也是人与检索系统之间进行交流的桥梁,实质上就是双方之间约定的共同语言。现在是110页\一共有159页\编辑于星期一信息检索语言种类现在是111页\一共有159页\编辑于星期一检索语言描述文献内容特征的语言(主观性、非确定性)描述文献外表特征的语言(客观性、确定性)分类语言主题语言单元词语言标题词语言关键词语言叙词语言题名(书名、篇名)著者文献序号(ISBN号、专利号)文献类型出版事项现在是112页\一共有159页\编辑于星期一人工语言:是对检索语言的概念加以控制和规范,把检索与语言中各种同义词、多义词、同形异义词等进行规范化处理,使每个检索词只能表达一个概念,或者说同一个概念只用一个词进行标识。(分类款目、标题词)自然语言:是人工语言相对应的一个概念,是对检索语言中的同义词、多义词不加处理,取其自然状态。(单元词和关键词)

按受控划分现在是113页\一共有159页\编辑于星期一先组式检索语言:在实施检索前,检索词已被预先组配好。检索时,用户只能严格按预先设定好的检索词去查找信息而不能任意组配。(分类检索、标题检索)后组式检索语言:后组式检索语言是指检索词在检索系统中没有预先组配,检索时可以任意对词语进行组配,表达所需检索的概念。(单元词、叙词、关键词)按组配方式划分现在是114页\一共有159页\编辑于星期一分类语言:指以数字、字母或字母与数字组合作为基本字符,采用字符直接连接并以圆点作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。

主题语言:是一种选自自然语言的规范化检索语言。利用词语表达文献的主题概念,按词语字顺组织文献的检索语言。按内容性质划分现在是115页\一共有159页\编辑于星期一分类检索语言现在是116页\一共有159页\编辑于星期一将代表各种概念的类目用号码来标识以学科属性为主并加以系统排列来组织、检索文献它是按分类途径排检文献的基本工具和重要依据分类检索语言即文献分类法,简称分类法1概念分析现在是117页\一共有159页\编辑于星期一2结构原理又称列举式分类法、枚举式分类法、等级体系分类法。中图法、科图法、人大法均为体系分类法。采用体系、组配相结合的方法。国际十进分类法为体系-组配分类法。体系分类法组配分类法体系-组配分类法又称分面分类法、组面分类法。冒号分类法是组配分类法的一种。现在是118页\一共有159页\编辑于星期一3体系分类法的标识与组织方式

以中图法为例,介绍体系分类法的功能原理1体系分类法中的标识符号又称为分类号。分类号是采用由字母、数字或二者混合的号码体系,作为大小类目的标识符号。标识符号2体系分类表是按科学划分、等级层累的逻辑分类进行编排,能充分揭示事物之间的等级关系和相关关系,便于进行信息检索。体系编排3主要依据类目的等级划分,显示上下位类目之间的隶属关系。同位类目之间的并列关系,采用相应方法,显示出类目之间的同义、相交关系。类目语义关系现在是119页\一共有159页\编辑于星期一4体系分类法的组成体系分类法编制说明分类表复分表分类表是分类法的主要组成部分,是由众多类目组成的,通过隶属关系、并列、交互参照等方式来显示类目之间关系的一览表。现在是120页\一共有159页\编辑于星期一中图法

中国图书馆分类法编制说明基本大类简表详表通用复分表现在是121页\一共有159页\编辑于星期一采用的是字母与阿拉伯数字相结合的混合小数层累制标记符号。分为5大部类,22个基本大类。N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学、安全科学Z综合性图书A马克思主义、列宁主义、毛泽东思想、邓小平理论B哲学、宗教C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理基本大类现在是122页\一共有159页\编辑于星期一其中T工业技术的二级类目采用两个字母标识T工业技术TB一般工业技术TL原子能技术TD矿业工程TM电工技术TE石油、天然气工业TN无线电电子学、电信技术TF冶金工业TP自动化技术、计算技术TG金属学、金属工艺TQ化学工业TH机械、仪表工业TS轻工业、手工业TJ武器工业TU建筑科学TK动力工程TV水利工程现在是123页\一共有159页\编辑于星期一由于只用22个类别来划分图书是远远不够的,《中图法》采用等级列举的方法,来表达从属关系。类目逐级展开,一级一级细分,依次类推。被划分的类叫上位类,划分出来的类叫下位类,从同一类划分出来的若干个类,称为同位类。每一个类目都给以一个固定号码,这个号码就叫做分类号。F经济…………一级类目F4工业经济……二级类目F42中国工业经济…三级类目F423工业计划与管理………………四级类目

现在是124页\一共有159页\编辑于星期一例如要查找“公路斜拉桥”方面的文献U交通运输

U44桥涵工程

U448.27斜拉桥根据“U448.27”这一类号,查找图书馆馆藏分类目录,就能检索到有关“斜拉桥”的馆藏文献。现在是125页\一共有159页\编辑于星期一《中国图书馆图书分类法》(简称〈中图法〉)分类号和索书号索书号的用途、组成图书如何分类排架我馆的分类及排架现在是126页\一共有159页\编辑于星期一

对文献进行主题分析,按照文献主

题内容的学科属性和特征,分门别

类组织,给予一定意义的标识号码。

V2-49/1030分类号分类号现在是127页\一共有159页\编辑于星期一图书馆的藏书都是按分类号排架的。分类号的排列采用由左至右逐位对比的方法进行排列,先比较字母部,再比较数字部分。

——字母部分按英文字母固有的次序排列。例:

B2中国哲学

B3世界哲学

E27各种武装力量

E512苏联军事

TM92电气化、电能应用

TU201建筑设计原理

——分类号中的阿拉伯数字依小数制排列。例:

B021辩证唯物主义的物质论

B022辩证唯物主义的意识论

B022.2客观规律性与主观能动性

D035.37交通公安管理

D035.4监察、监督分类号的排列次序现在是128页\一共有159页\编辑于星期一分类号的排列次序——数字之后如还有字母,则在前部类号相同的基础上,再按字母顺序排列例:

TP312ALALGOL程序语言

TP312BABASIC程序语言

TP312COCOBOL程序语言

——总论复分号“-”要排在数字“0”的前面例:

H-61,H0,…,H31-61,H310,…

——总论复分号“-”要排在组配符号“:”的前面例:

H31,H31-62,H31:F,H31:I,…,H319,H319.4,H319.4-44,H319.4:B,H319.4:C,…现在是129页\一共有159页\编辑于星期一图书馆的文献就是按照索书号的顺序排架管理的。(图书馆的每本书都按索书号有顺序的排列在书架上)索书号=分类号+书次号中文书索书号如:TP312C/1139西文书索书号如:O6/WC56《高等数学》O13/1163《大学英语语法》H313/1245《会计学》F23/1302《C语言大全》TP312/1146

是图书馆赋予每一种馆藏图书的号码。

在馆藏系统中,索书号确定馆藏图书在书架上的排列位置,是读者查找图书非常必要的代码信息。在馆藏系统中,每种图书的索书号是唯一的。索书号组成:分类号+书次号(种次号)索书号现在是130页\一共有159页\编辑于星期一——不同的索书号确定排列先后顺序的步骤是,先比较分类号码;如分类号码相同再比较著者号码或顺序号码。分类号比较:先英文字母排,后阿拉伯数字按小数制排。分类号中“-”排在0之前,例如:先排F-43再排F0。分类号的数字排列比较采用对位比较法,字符序列以ASCII字符集为依据。比如:B11、B111、B112、B12,书次号的数字排列比较采用自然顺序排列方法,即1,2,3,...,9,10,11,...,99,100,101,…。索书号排列现在是131页\一共有159页\编辑于星期一

图书如何进行分类排架排架都是按分类法大类排列,按字母顺序排列,每一架的图书的排列都是从左到右,从上到下的顺序,小号排在左边,大号排在右边。首先按分类号,再按种次号排。现在是132页\一共有159页\编辑于星期一请给下列图书排序1、TP3-43/30602、TP3/10443、TP311.13/17134、TP311.13/10915、TP32/40276、TP39-43/47237、TP383/77328、TP273/16969、TP316.89/110310、TP316/203911、TP316.84/100512、TP312VH/105913、TP312XM/10318-2-1-4-3-12-13-10-11-9-5-7-6现在是133页\一共有159页\编辑于星期一是当今世界上最大型的列举式分类法。英文缩写为LCC,是世界上目录最多的一部图书分类法。LCC的体系结构美国国会图书馆分类法共有21个大类,涉及21个英文字母,还有I、O、W、X、Y五个字母尚未使用美国国会图书馆图书分类法的具体分类如下:

A一般内容B哲学、心理学及宗教(注:有不少心理学内容其实归入了社会科学,如青少年问题、性学等)

C历史学及相关科学总论D古代史及世界各国史E美国历史F美洲历史G地理、人类学、休闲活动H社会科学

J政治学

K法律L教育

M音乐N艺术P语言及文学Q科学R医学S农业T技术及工程U军事科学V航海科学Z图书馆学美国国会分类法现在是134页\一共有159页\编辑于星期一中图法与美国国会分类法比较现在是135页\一共有159页\编辑于星期一主题检索语言现在是136页\一共有159页\编辑于星期一主题检索语言

主题词就是我们常说的主题词检索语言,它所使用的检索标识是将自然语言中的词汇经过人工规范化后的语言词汇。所以我们将主题词检索语言叫做规范主题检索语言,它是在手工信息检索和计算机数据库检索中运用较为广泛的检索语言。以自然语言为基础,经过标准化处理的词语。它能直接表达文献所论及或涉及的事物——主题,而不管该文献是从哪个角度、从什么学科来论述该事物——主题。自然词汇具有一词多义和一义多词的现象,如学名和俗称、简称和全称等。现在是137页\一共有159页\编辑于星期一

种类:标题词—先组式

单元词—后组式单词组配

叙词—后组式概念组配

关键词—后组式自然语言特点:直观性强、专指性强、灵活性强现在是138页\一共有159页\编辑于星期一《汉语主题词表》是由中国科技情报所和北京图书馆主编,由科学技术文献出版社出版的我国唯一的一部大型、综合性词表。该词表由主表(字顺表)、附表、词族索引、范畴索引和英汉对照索引组成,共分3卷10个分册。汉语主题词表现在是139页\一共有159页\编辑于星期一字顺表和辅助表组成字顺表:款目词、标号、注释、参照系统

标号:对应与主题词的范畴分类号

参照项:用(Y)、代(D)、属(S)、分

(F)、参(C)、族(Z)辅助表:范畴表、词族表、语言对照表汉语主题词表词表结构现在是140页\一共有159页\编辑于星期一主题词款目示例(以《汉语主题词表》为例)XianXiangGuan

显象管[56CE]

Picturetube

(引导词)

D

电视显象管监视管

(下位词)

F彩色显象管固体显象管黑白显象管

(上位词)

S电子束管(最上位词)Z电子管

(相关词)

C显示管指示管汉语主题词表现在是141页\一共有159页\编辑于星期一EI(Thesaurus)EI叙词表现在是142页\一共有159页\编辑于星期一分类检索语言与主题检索语言的比较现在是143页\一共有159页\编辑于星期一分类法:按照文献资料的学科属性

分类法的特征在于知识的系统性,不仅揭示图书的学科知识内容,而且把有关同一学科内容的文献资料集中在一起,使学科临近的文献排在相近的位置,根据各类图书之间的亲疏关系将藏书组织成一个系统.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论