文献检索与利用-2014_第1页
文献检索与利用-2014_第2页
文献检索与利用-2014_第3页
文献检索与利用-2014_第4页
文献检索与利用-2014_第5页
已阅读5页,还剩123页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文献检索与利用宋晓夏2014-10

课程概要课程特点

目的意义:培养信息获取能力

教学方式:讲课(22学时)+上机(10学时)课本科技信息检索(第五版),陈英主编,科学出版社,2012

参考书

《信息检索与利用讲义(修订版)》,太原理工大学文献检索教研室

检查考核

实验报告(30%),考试(70%)文献获取意识:是人们主动获取所需情报的内在动因,具体表现为对情报的敏感性(时、地、事)、选择能力和消化吸收能力。文献获取技能:寻求有关新知识的能力,具体来说就是通过这门课的学习,应掌握文献检索的基本知识和基本技能,熟练使用一些必要的检索工具。学会到什么地方找和如何找。文献基本理论文献检索基本方法常用数据库及工具的检索方法课程概要“信息检索与文献阅读是一切科学研究的入口。”

“科学研究的过程同时也是科学信息积累与交流的过程。”

课程概要知识是积累性的,人类历史上每一次突破性的重大发现在很大程度上都是前人研究成果的继续延伸。

——引自YaleBulletinandCalendar2000年29(34)卷

信息检索、分析。。。SynthesisofAminoAcids1JACS19952JOC1987SynthesisofAminoAcids问题?创意?实验、计算。。。发表:口头报告、论文、专利。。。1JACS19952JOC1987SynthesisofAminoAcidsSynthesisofAminoAcids新的问题?发展、延伸。。。同行评价、引用、应用。。。课程概要

据美国科学基金会统计,一个科研人员花费在查找和消化科技资料上的时间需占全部科研时间的51%,计划思考占8%,实验研究占32%,书面总结占9%。由上述统计数字可以看出,科研人员花费在科技出版物上的时间为全部科研时间的60%。课程概要

2014年7月,世界知识产权组织发布了《2014年全球创新指数》报告,报告列举了三个例证。第一,揭示作者与论文数量关系的洛特卡定律(又称“倒数平方定律”)表明,写两篇论文的作者数量约为写一篇论文的作者数量的1/4,写三篇论文的作者数量约为写一篇论文作者数量的1/9,写n篇论文的作者数量约为写一篇论文作者数量的1/n。根据该定律,10%的作者生产了50%的论文,5%的作者生产了39%的论文。如若按照略显保守的估计,则是8%的作者产生了25%的论文。第二,科学论文的被引频次遵循指数分布,少数论文(低于论文总量的0.001%)的被引频次高于每篇400次。由于被引频次能反映研究的水平和影响,这说明只有少量论文,亦即少数作者会对全球研究界产生重大影响。第三,美国大学的许可收入也有很大差异,少数大学的许可收入很高,而大多数大学的许可收入很低。课程概要借鉴前人、节约时间、少走弯路我们生活在一个信息过度膨胀的年代,各种各样的信息,有用的和没用的,都充斥在我们周围。如何从中选取其中有利的信息以达到我们的目的,以及如何快速准确的选取信息以提高我们的效率是一个值得也是必要学习的内容信息爆炸,文献数量迅猛增加。

—每年全世界发表科技论文500~600万篇

—出版图书80万种以上;期刊10万种以上

—专利约50万件;标准75万件数量激增,种类翻新。文献有效期缩短,新陈代谢加快文献半衰期:基础学科8~10年;化学8.1年;化工4.8年学科交叉课程概要某一方面的研究以前都有什么人用什么方法做过?现在人们对这方面的研究有什么最新进展和认识?目前同一研究领域,不同的实验室是否用了不同的方法展开研究,哪种方法更合理?

通常只有回答了这两个问题,才能说对课题有了一定的了解。当我们对学术领域中的某个课题产生兴趣的时候,可以利用文献检索来了解这样两个问题……课程概要围绕着某一个课题,利用文献数据库帮助科研人员获得:该课题的重要文献的全文该研究领域中的高影响力学者的信息文献中实验相关的事实性数据该研究领域中的核心期刊、热点课题研究成果如何向某种学术期刊投稿发表如何提高论文的引用率如何跟踪该研究领域的最新进展科研人员如何尽快获得信息资源,从中获取想法,激发思想课程概要利用参考数据库进行课题选题利用著名综合性参考数据库(文摘数据库)进行课题选题参考数据库,指包含各种数据、信息或知识的原始领域和属性的数据库。

参考数据库最重要的用途是用于搜集文献线索,快速和全面地查询某个学科、领域或主题的文献。

参考数据库可以用来进行各类统计和评估工作,如统计期刊、个人或机构等的发文量、统计文章被转载和引证的情况,评估期刊的影响力等。

课程概要利用参考数据库进行课题选题著名综合性参考数据库主要有:

WebofScience引文数据库

包括科学引文索引(ScienceCitationIndex简称SCI)、社会科学引文索引(SocialSciencesCitationIndex,简称SSCI)和艺术与人文科学引文索引(Arts&HumanitiesCitationIndex,简称A&HCI)EICompendexWeb

工程索引(TheEngineeringIndex,简称EI)ISIProceedings

包括科学技术会议录索引(IndextoScientific&TechnicalProceedings,简称ISTP)和社会科学与人文科学会议录索引(SocialSciences&HumanitiesProceedings,简称ISSHP)

Scopus综合性文摘与引文数据库课程概要文献检索与利用第一章文献信息检索基础理论

一、信息(information)

定义:信息是事物运动的状态及其改变方式(钟义信);信息是用来消除随机不确定性的东西(信息奠基人香农Shannon);信息是人们在适应外部世界,并使这种适应反作用于外部世界的过程中,同外部世界进行互相交换的内容和名称(控制论创始人维纳

Wiener)。“信息”一词在英文、法文、德文中均是“information”,日文中为“情报”,我国台湾称之为“资讯”,我国古代用的是“消息”。信息-知识-文献信息的一般特性

普遍性:只要有事物的地方,就必然的存在信息。信息在自然界和人类社会活动中广泛存在。客观性:信息是客观现实的反映,不随人的主观意志而改变。如果人为地篡改信息,那么信息就会失去它的价值,甚至不能称之为“信息”了。动态性:事物是在不断变化发展的,信息也必然的随之运动发展,其内容,形式,容量都会随时间而改变。时效性:由于信息的动态性,那么一个固定的信息的使用价值必然会随着时间的流逝而衰减。时效性实际上是与信息的价值性联系在一起,如果信息没有价值也就无所谓时效。识别性:人类可以通过感觉器官和科学仪器等方式来获取,整理,认知信息。这是人类利用信息的前提。传递性:信息是可以通过各种媒介在人-人,人-物,物-物等之间传递。信息-知识-文献信息的一般特性

共享性:信息与物质、能量显著不同的是。信息在传递过程中并不是“此消彼长”,同一讯息可以在同一时间被多个主体共有,而且还能够无限的复制、传递。依附性:信息不能独立存在,需要依附于一定的载体,而且,同一个信息可以依附于不同的载体。价值性:信息有价值。物质、能量和讯息是构成世界的三大要素,缺一不可。但是,信息与物质、能量不同,其价值主要体现在两方面:可以满足人们对精神领域的需求,如学习材料、娱乐信息等;可以促进物质能量的生产和使用,如通过获取有效的供销信息提高产品流通效率。增值性:在加工与使用信息的过程中,经过选择、重组、分析、统计以及其他方式的处理,可以获得更重要的信息,使原有信息增值,从而更有效地服务于不同的对象或不同的领域。信息-知识-文献互联网分布的视觉图二、知识(knowledge)

定义:

知识的定义在认识论中仍然是一个争论不止的问题。一个经典的定义来自于柏拉图:一条陈述能称得上是知识必须满足三个条件,它一定是被验证过的(justified)、正确的(true)和被人们相信的(believed)。其他学者对知识的定义:

奎因Quinn(1996):知识是存在于专业人员身上的技能财产,可分为:实证知识、高级技能、系统认知、自我激励创造力等。

哈里斯Harris(1996):知识是资讯、文化脉络及经验的组合。

Qunitas(1997):知识是企业无形资产。

野中郁次郎Nonaka(1994):认为当讯息(message)被赋予意义后,就成为资讯(information),而资讯再经过整理后,才转化为知识(knowledge)。知识是人类理解与学习的结果。信息-知识-文献知识的属性

意识性信息性实践性规律性继承性渗透性信息-知识-文献知识阶层递进图知识的类型

世界经合组织(OECD)在1996年的年度报告《以知识为基础的经济》中将知识分为四大类:(a)知道是什么的知识(Knowwhat),主要是叙述事实方面的知识;(b)知道为什么的知识(Knowwhy),主要是自然原理和规律方面的知识;(c)知道怎么做的知识(Knowhow),主要是指对某些事物的技能和能力;(d)知道是谁的知识(Knowwho),涉及谁知道和谁知道如何做某些事的知识。

信息-知识-文献二、文献(document,literature)

定义:记录知识的一切载体。

基本属性:知识性、传递性、动态性

信息、知识、文献三者的关系:

信息是生产知识的原料,知识是人类系统化后的信息,文献是存储、传递知识信息的载体。信息-知识-文献科技文献的主要类型按载体形式、记录读取方式分为:印刷型Printedform

最古老的一种文献形式,以纸张为载体,以手写、石印、油印、胶印、影印、铅印等为手段来记录知识的文献,目前仍然是文献的主要形式其优点是读取方便,流传广泛、价格便宜、不受时空的局限;其不足是存储信息密度低,占据空间大,保存期短,难于实现自动输入和检索。

缩微型Microform

以感光材料为载体,利用光学记录技术,使印刷型文献缩小了许多倍的文献,包括缩微胶卷Microfilm、缩微平片microfiche等。其优点上信息存贮密度高,文献体积小、可节省95%以上的贮存空间(相对于印刷型),便于收藏、保存和传递,能安全贮存珍贵资料、方便管理,在某种程度上能弥补印刷型文献的不足。但缩微型号文献的阅读必须借助于缩微阅读机或其他辅助设备,不便携带,保存条件要求严格,难于普及。科技文献的主要类型蒋介石日记的缩微胶卷样

声像型(视听型)Audio-Visualform:以磁性材料或感光材料为存贮介质,以光学感光或电磁转换为记录手段产生出来的一种文献,直接记录声音和图像,并通过视听设备存贮与播放信息知识的文献形式,有唱片、录音带、录像带、电影胶片等。其优点是声情并茂,形象逼真,直观性强,动静交替,易于接受,在其传递信息知识方面有着其他文献不可替代的优势;缺点是必须借助一定的设备才能使用。

科技文献的主要类型机读型(电子型)

MachineReadableform(ElectronicPublication):

电子版本(floppy,Magnetictape,CD-ROM,online,network)

通过编码和程序设计,把文字、资料转换成数字语言和机器语言,以磁性材料为介质以打字、穿孔或光学玻璃字符识别装置为记录手段,输入计算机,存贮的磁盘、磁带、光盘上阅读时再由要求输出的文献。如磁盘、磁带、光盘等。其优点是信息丰富量大,存储密度高,处理速度很快,查找方便快捷,原有记录可以改变、抹去或更新,不足是相应设备的投入较大。科技文献的主要类型根据内容、性质和加工深度的不同,科技文献可分为:一次文献/信息primaryliterature/info二次文献/信息secondaryliterature/info三次文献/信息tertiaryliterature/info

科技文献的主要类型一次文献primaryliterature概念:也称为原始文献。凡是文献作者根据自己的研究成果、发明创造、工作经验和实践体会为原始依据,撰写的第一次报道的或第一次出版的那些文献。如期刊论文、科技报告、会议论文、专利说明书等。一次文献是以科研生产活动的第一手成果为依据而创作的文献(判断是否为一次文献),内容丰富,参考价值大,是文献的主体、文献检索的对象。特点:创造性、原始性、分散性

如:PaperSci-Techreport,ProceedingsPatentspecificationDissertation...二次文献secondaryliterature概念:将大量的分散的、无序的一次文献按照一定的规则进行加工、提炼和浓缩,组织成为系统的便于查找的文献。二次文献是图书情报工作者在大量收集原始文献的基础上,经过分析、归纳、重组后出版的。二次文献是一次文献的集约化、有序化的再次出版,是贮藏、利用一次文献的主要的、科学的途径。特点:汇集性、浓缩性、工具性、系统性条目Entry目录Catalog题录Bibliography文摘Abstract索引Index三次文献tertiaryliterature概念:选用大量有关的文献,经过综合、分析、研究而编写出来的文献。它通常是围绕某个特定的课题,利用二次文献,搜集大量的有关文献,采用科学的方法,对文献内容进行深度的加工,经综合、分析和评述编写而成再度出版的文献,如各种述评、进展报告、动态综述、手册、年鉴和百科全书等。我们常把这类文献称为“情报研究”的成果。特点:综合性高、使用价值高、针对性强、系统性好、信息面广根据文献的知识内容和出版类型可将科技文献划为:科技图书Sci-Techbook科技期刊

Sci-Techperiodical(magazine,serial)科技报告

Sci-TechReport专利文献

PatentDocument会议文献

Conferencepaper标准文献

Standard学位论文

Dissertation,Thesis产品样本,技术档案,政府出版物科技文献的主要类型科技图书Sci-Techbook论述或介绍某一领域知识的出版物。ISO将书定义为:49页及49页以上构成一个书单元的文献(不包括封面和扉页)。任何一种用印刷或手抄方式把原文或图表加以再现,装订成册,不定期出版的文献。图书又可分为两类:一类是阅读类图书;有教科书、科普读物和一般生产技术图书,以及含有独创性内容的专著,它属原始文献,属阅读性的图书;一类是辞典、手册和百科全书等,属工具性的图书;图书往往是著者在收集大量第一手资料基础上,经分析归纳后编写而成的。其特点是内容比较系统、全面、成熟、可靠,但出版周期较长,报道速度相对较慢。图书主要用于需对大范围的问题获得一般性的知识或对陌生的问题需要初步了解的场合。ReadingBook:Monograph专著,Anthology文集,Textbook…

Referencebook:Encyclopedia,Handbook…识别图书的主要依据有:书名、作者、出版地、出版社、出版时间、总页数、国际标准书号(ISBN)等。ISBN:InternationalStandardBookNumber1969年4月,ISO在斯德哥尔摩起草,1971年实施。我国1986年。例如:0-471-81086-X0-组号(语种、地区,0-英、美、加等英语区;7-中国)

471-出版社编号

81086-图书序号

X-校验码978-7-04-010649-7无机化学第三版天津大学无机化学教研室图书的级别与出版社科技图书Sci-Techbook科技期刊Sci-Techperiodical一种定期或不定期连续出版,并计划无限期出版下去,有固定的名称,每期具有统一的连续序号,以发表作者新作的出版物。根据期刊内容和用途的不同,可分为:学术性

Journal,Acta,Annales年鉴,Transactions会报,Reviews,Progress,Advances快报性

Letters,Communications,Bulletin消息性

News资料性

Data检索性

Abstracts特点:数量大、品种多;内容丰富多样;出版周期短,报道速度较块;发行、流通面很广泛;连续性强,伴随着相应的学科领域发展前进。识别期刊的主要依据:期刊名称、期刊出版的年、卷、期,国际标准刊号(ISSN)InternationalStandardSerialNumberISSN1007-9432太原理工大学学报例子:SCI期刊号期刊的级别与主办机构、出版社科技期刊Sci-Techperiodical科技报告Sci-TechReport科技报告是重要、特殊的一类科技文献。说它特殊,一是指它的出版形式的非书非刊的特点;二是指产生于二战期间的历史根源;三是指它往往还带着不同程度的保密性质,是世界各先进国家在进行经济竞争中竟相搜求/猎取的对象;四是难于搜索。特点:科技报告内容大多专深、新颖,往往涉及尖端学科或世界最新研究课题;内容丰富、信息量大,科技报告对问题研究的论述往往既系统又完整,并针对问题的难点技术,不但有包括技术研究的整个试验过程,而且记录有各种数据和图表甚至对试验失败也有穷究原因的详尽分析;是此类文献数量巨大、形式多样。据报导每年产生的科技报告在100万件以上。美国政府四大报告:PB工业、AD军事、NASA宇航、DOE能源科技报告著录的特点是:有表示报告的词,如Report,Technicalnotes,Memorandum

备忘录等;有报告号,如AD-A233725。专利文献PatentDocument指有专利局公布或归档所有与专利申请案有关的文件和资料。从狭义上讲是指专利说明书。所谓专利说明书是指专利申请人向专利局递交的有关发明目的、构成和效果的技术文件。它经专利局审核后,向全世界出版发行。广义上讲,还包括专利局出版的各种专利检索工具如专利公报、专利文摘、分类表等专利说明书的内容比较具体,有的还有附图,通过它可以了解该项专利的主要技术内容。由于只有符合新颖性、创造性和实用性的发明创造才能获得专利权,所以专利说明书对于工程技术人员,特别是产品工艺设计人员来说,是一种切合实际、启迪思维的重要情报源。专利说明书著录的特点是:通常有表示专利的词(Patent);有专利号。专利号按国际规定由两个字母表示的国家代码和其后的顺序号构成。如:CN1478055、GB1494047patentspecification、Bulletin、Abstracts会议文献Conferencepaper这是指在国际或国内重要的学术或专业性会议上发表的论文。会议文献内容新颖,专业性和针对性强,传递信息迅速。往往代表着某一领域内的最新成就,反映了国内外科技发展水平和趋势,是获得最新情报的一个重要来源。会议文献可分为会前文献,如会议日程预报和会议论文预印本,以及会后文献,如各种会议录。会后文献是主要的会议文献。会议文献著录的特点是:有会议的举办者、举办地、举办时间;有表示会议的专门用词,如Conference,Symposium,Convention,Workshop,Meeting,Congress,Assembly等;有表示会议录的一些词,如Proceedingsof...,Collectionof...;有的有会议届次、编辑以及会议录的出版社、出版地、出版时间等。标准文献Standard指标准化工作的文件。其中主要为工业产品和工程建设的质量、规格和检验方法等的技术规定文件。作为一种规章性文献,它具有一定的法律约束力。一个国家的标准文献反映着该国的生产工艺水平和技术经济政策,而国际现行标准则代表了当前世界水平。国际标准和工业先进国家的标准常是科研生产活动的重要依据和情报来源。国际上最重要的两个标准化组织是国际标准化组织(ISO)和国际电工委员会(IEC)。标准文献著录的特点是:通常有表示标准的词如standard等;有标准号。标准号每个标准一个号,并按惯例由标准颁布机构代码,顺序号和颁布年份三部分构成,如GB1904-2005(食品添加剂羧甲基纤维素钠)。国家标准号中有T字母的为推荐标准,如GB/T752-2006(工业氯酸钾),无T的则为强制性标准。国际标准ISO,IEC区域标准CEN国家标准GB行业标准MT企业标准Q学位论文Dissertation学位论文是指为申请硕士、博士等学位而提交的学术论文。学位论文的质量参差不齐,但都是就某一专题进行研究而作的总结,多数有一定的独创性。学位论文是非卖品,除极少数以科技报告、期刊论文的形式发表外,一般不出版,属难得文献。学位论文常见的著录形式如下例所示:

如:钟立峰,Keggin杂多酸化合物催化材料制备〔D〕,暨南大学,2003

学位论文著录的特点是:通常有表示学位论文的词,如Thesis(英),Dissertation等;有的有论文作者所在学校的校名。目前,我国每年约招收近60万硕士研究生,8万博士研究生。产品技术资料指产品目录、产品样本和产品说明书一类的厂商产品宣传和使用资料。产品样本通常对定型产品的性能、构造、用途、用法和操作规程等作具体说明,内容成熟,数据可靠,有的有外观照片和结构图,可直接用于产品的设计制造中参考。产品技术资料的常见著录形式如下例所示:

IntegratedcircuitsBookIC11-LinearProducts,1988,PhilipsDatahandbookofPhilipsElectronicComponentsandMaterialsDivision,p.3-131.产品技术资料著录的特点是:通常有表示产品样本一类资料的词,如Catalog目录,Guidebook,Masterof,Databookof等;有公司名称。产品技术资料一般向厂商直接索取,在情报所可以查到一部分,有些以汇编形式正式出版的可以在图书馆查到。技术档案指科研生产活动中形成的,有具体事物的技术文件、图纸、图表、照片和原始记录等。详细内容包括任务书、协议书、技术指标、审批文件、研究计划、方案大纲、技术措施、调查材料、设计资料、试验和工艺记录等。这些材料是科研生产工作中用以积累经验、吸取教训的重要文献。技术档案一般为内部使用,不公开出版发行,有些有密级限制,因此在参考文献和检索工具中极少引用。政府出版物指各国政府部门及其设立的专门机构发表的文献。政府出版物的内容十分广泛,既有科学技术方面的,也有社会经济方面的。就文献的性质而言,政府出版物可分为行政性文件(如国会记录、政府法令、方针政策、规章制度以及调查统计资料等)和科学技术文献两部分。我国政府发表的“科学技术白皮书”就是一种科技类政府出版物。分两类:行政性文献—60%~70%科技性文献—30%~40%

白皮书可能是一本书,也可能是一篇文章。白皮书作为一种官方文件,代表政府立场,讲究事实清楚、立场明确、行文规范、文字简练,没有文学色彩。白皮书既可以是系列的,比如,中国国防白皮书自1998年以来就是每两年一次;也可能是在某个特定环境下专门发表的,如为驳斥西方国家对中国人权政策的歪曲报道,我国相继发表了若干有关中国人权状况的白皮书。此外,有些具有官方性质的年度报告、资料或情况汇总,原来不作为白皮书发表,后为显示其权威性,扩大影响,也改称白皮书。比如,由外交部政策研究室编辑、介绍中国一年外交工作和对外关系情况的《中国外交》一书,原称《中国外交概览》,每年一本,后改称《中国外交》,自2004年起则以白皮书相称。文献检索概述1.文献检索的定义从存贮的文献中查找出特定文献的过程。即是把文献按一定的方式予以排列、贮存,并根据用户需要检出所需文献的过程。2.检索的类型根据检索对象的形式进行划分文献检索(DocumentRetrieval):以文献(包括文摘、题录或全文)为检索对象的信息检索。从已存贮的文献库中查找出特定的文献的过程。文献检索是相关性检索,即不直接解答用户所提出的技术问题本身。

信息(情报)检索、文献检索的关系

信息检索:从信息存贮系统中查找出特定信息的过程。包括事实检索、数据检索和文献检索事实检索:凡是能直接回答情报提问的事实数据为检索对象的。数据检索:凡是能直接回答情报提问的科学数据为检索对象的。信息存储和检索过程的基本原理

输出一次信息信息特征检索语言信息特征标识检索结果信息需求检索提问检索提问标识分析标引标引输入检索信息检索系统(工具)存储过程检索过程分析检索的本质匹配:文献需求文献集合文献存储过程就是文献加工人员按照一定原则对原始文献信息进行处理,形成文献特征标识,为检索提供有序的文献集合的过程;检索过程则是按照同样的主题词表或分类表及组配原则分析课题形成检索提问标识,根据存储所提供的检索途径,从文献集合中查与检索提问标识相符的文献特征标识的过程。文献检索的基本原理就是用检索标识与文献存储标识相比如果能够取得一致就叫匹配就可得到命中文献。检索点(途径):AccessPoint

用文献各种内外特征,作为检索出发点,从不同角度来检索文献信息。文献检索的作用充分利用信息资源,避免重复劳动

科研具有继承和创新两重性。必须了解国内外,前人和他人对拟研究的问题已做过哪些工作?取得哪些成就?有何不足?发展动向如何?为更新知识,终身学习提供途径根据检索手段进行划分:

手工检索(手检):使用手工检索设备、利用检索语言、对文献库等进行检索。

机器检索(机检):使用相应的机器设备进行检索。根据检索使用文献级别可分为两类:

直接检索:直接进入文献集合进行检索。

间接检索:借助于文献检索工具,先查找文献记录(替代文献),然后获取原始文献。检索语言的种类按描述文献信息内容特征分:

分类语言

Classfication

(体系分类语言)

主题语言,又分为:标题词语言SubjectHeading

单元词语言Uniterm

叙词语言Descriptor

关键词语言Keyword描述文献外部特征的检索语言:题名、作者、号码等(在文献上清楚标明显而易见的特征与内容没有明显的关系,具有客观性、确定性、唯一性)按词语的组配方式分为:

先组式检索语言后组式检索语言检索语言的类型描述内容特征语言描述外表特征语言主题语言分类语言代码语言责任者题名其他自然语言受控语言关键词语言——(keyword)标题词语言——(heading)单元词语言——(uniterm)叙词语言——(descriptor)分类语言(图书分类法)

分类语言是以文献内容的学科性质为对象,运用概念概括与划分的方法,按照知识门类的逻辑次序从一般到具体、从简单到复杂层层划分,所形成的一种等级体系。

《中国图书馆图书分类法》(中图法)《中国科学院图书馆图书分类法》(科图法)《DeweyDecimalClassificationSystem》(杜威十进分类法)《LibraryofCongressClassification》(美国国会图书馆图书分类法)

《UniversalDecimalClassification》(国际十进分类法)中国图书馆图书分类法基本部类基本大类(22个)1.马克思主义、列宁主义、毛泽东思想、邓小平理论A.马克思主义、列宁主义、毛泽东思想、邓小平理论2.哲学B.哲学3.社会科学C.社会科学总论D.政治、法律E.军事F.经济G.文化、科学、教育、体育H.语言、文字I.文学J.艺术K.历史、地理4.自然科学N.自然科学总论O.数理科学P.天文学、地球科学Q.生物科学R.医药、卫生S.农业科学T.工业技术U.交通运输V.航空、航天X.环境科学、安全科学5.综合性图书Z.综合性图书《中图法》T工业技术大类二级类目TB一般工业技术TL原子能技术TD矿业工程TM电工技术TE石油、天然气工业TN无线电电子学、电信技术TF冶金工业TP自动化技术、计算机技术TG金属学与金属工艺TQ化学工业TH机械、仪表TS轻工业、手工业TJ武器工业TU建筑科学TK能源与动力工程TV水利工程

TD矿业工程TD1矿山地质与测量TD2矿山设计与建设TD3矿山压力与支护TD4矿山机械TD40一般性问题TD5矿山运输与设备TD6矿山电工TD7矿山安全与劳动保护TD8矿山开采TD9选矿TD98矿产资源的综合利用TE石油天然气工业TE0能源与节能TE1石油、天然气地质与勘探TE2钻井工程TE3油气田开发与开采TE4油气田建设TE5海上油气田勘探与开发TE6石油、天然气加工工业TE8石油、天然气储存与运输TE9石油机械设备与自动化TE99石油、天然气工业环境保护与综合利用P1天文学(天文史学、天体测量学、天体力学……)

P2测绘学P3地球物理学P4大气科学(气象学)P5地质学P7海洋学P9自然地理学(区域自然地理学、自然资源学……)

《中图法》P天文学、地球科学大类二级类目图书馆的藏书都是按分类号排架的。分类号的排列采用由左至右逐位对比的方法进行排列,先比较字母部分,再比较数字部分。

——字母部分按英文字母固有的次序排列。例:

B2中国哲学

B3世界哲学

E27各种武装力量

E512苏联军事

TM92电气化、电能应用

TU201建筑设计原理

——分类号中的阿拉伯数字依小数制排列。例:

B021辩证唯物主义的物质论

B022辩证唯物主义的意识论

B022.2客观规律性与主观能动性

D035.37交通公安管理

D035.4监察、监督分类号的排列次序

读者实际利用图书馆时,往往需要知道书刊的分类号和索书号(又称索取号)。

索书号是图书馆赋予每一种馆藏图书的号码,是读者查找图书非常必要的代码信息。它的第一部分是分类号,第二部分是书次号。索书号的两部分之间有一个空格或一条斜线“/”。书次号或者是按照图书作者姓名所编排的著者号码,或者是按照图书进入馆藏时间的先后所取用的顺序号码。不同的索书号确定排列先后顺序的步骤是,先比较分类号码;如分类号码相同再比较著者号码或顺序号码。分类号和索书号主题语言表达主题概念、反应文献内容特征的词语就叫主题词。主题词可分为:标题词、单元词、叙词、关键词标题词:是从文献的题目、正文或摘要中抽选出来,经过规范化处理,用以描述文献内容特征的词和词组。例如:一篇文章用“微型计算机”这个术语来叙述它的研究对象,另一篇文章用“微型电脑”来叙述,第三篇文章用“微机”来叙述,虽然都表示同一概念,这时就不能直接用“微型电脑”或“微机”来作标题词,这三篇文章都必须用“微型计算机”作标题词。叙词叙词特点:从文献中抽取出来的名词术语;经过规范化处理;词与词之间有严格的语义关系;具有组配性能(概念组配)。

叙词语言构词原理和方法字面组配

概念组配模拟+控制模拟控制模拟+控制模拟控制香蕉+苹果≠香蕉苹果香蕉味食品+苹果香蕉苹果彩虹+电器≠彩虹电器彩虹牌商品+电器彩虹电器a.它保留了单元词法组配的基本原理;b.采用了组配分类法的概念组配,以及适当采用标题词语言的预先组配方法;c.采用并进一步完善了标题词语言的参照系统,采用了体系分类法的基本原理,采用叙词轮排索引。叙词的概念组配是用布尔逻辑运算来实现的。常用的检索技术

检索技术是指应用于信息检索过程的原理、技术、方法、策略的总称,是检索系统为了提高检索效率,从概念相关性、位置相关性等方面对检索提问进行组配、加权、扩展、截词、邻近、限定的比较和运算处理技术。

布尔检索布尔检索(booleanretrieval)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配的一种技术,也是目前最常用的一种检索技术。A.逻辑“与”

具有概念交叉或概念限定关系的组配,用“*”或“AND”算符表示(少数工具用“+”或空格表示)。

检索词A和检索词B用“与”组配,检索式为:

AANDB,或者A*B它表示检出同时含有A、B两个检索词的记录。

布尔是英国的数学家,在1847年发明了处理二值之间关系的逻辑数学计算法,包括联合、相交、相减。在图形处理操作中引用了这种逻辑运算方法以使简单的基本图形组合产生新的形体。并由二维布尔运算发展到三维图形的布尔运算。

B.逻辑“或”逻辑“或”是一种具有概念并列关系的组配,用“+”或“OR”算符表示(也有用“|”或“/”表示)。检索词A和检索词B用“或”组配,检索式为:

AORB,或者A+B

它表示检出所有含有A词或者B词的记录。

C.逻辑“非”

逻辑“非”是一种具有概念排除关系的组配,用“–”或“NOT”算符表示。检索词A和检索词B用“非”组配,检索式为:

ANotB,或者A-B

它表示检出含有A词,但同时不含B词的记录。

邻近检索(proximityretrieval),又称为“位置检索”、“词位检索”、“全文检索”是一种可以不依赖叙词表而直接使用自由词进行检索的一种技术,它以数据库原始记录中词语的相对次序或者位置关系为对象进行组配运算。

常用的逻辑算符有(W,with的缩写)与(nW)、(N)与(nN)邻近检索

截词检索

截词检索(truncationretrieval)是指在检索词的适当位置截断,用截断的词的一个局部进行的检索。由于检索词与数据库所存储信息字符是部分一致性匹配,所以又称部分一致检索。由于西文的构词特性:单复数形式不一致、英美拼写不一致、词干+前缀、词干+后缀。检索时,计算机会将所有含有相同部分标识的记录全部检索出来。在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。按截断的位置来分;按截断的字符数量来分。截词符多采用通配符“?”、“$”、“*”等,因此,截词检索有时也称为通配符(wildcard)检索。

后截断中截断无限截断如:economic???有限截断截词检索与截词检索算符economiceconomicseconomicsteconomicalismeconomiceconomicseconomicst如:economic*如:wom?nwomanwomen一般仅允许有限截断sul*ur

sulfursulphur

无限截断有限截断前后截断如:?computer?可检出:computer、computers、computerize、computerized、minicomputer、minicomputers、microcomputer、microcomputers

字段限定检索

使用邻近检索,只能限制检索词之间的相对位置,不能完全确定检索词在数据库记录中出现的字段位置。使用截词检索,简化了布尔检索中的逻辑“或”功能,但并没有改善布尔检索的性质。字段限定检索(fieldlimitingretrieval)是用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,是提高检索效果的一种有效检索方法。

例如:(minicomputer/DE,TIORpersonalcomputer/ID,TI)ANDPY=2008ANDLA=English这个检索式所表达的检索要求是:查找2008年出版的关于微电脑或者个人电脑的英文文献,并要求“微电脑”一词在命中文献的叙词字段、标题字段出现,“个人电脑”一词在命中文献的自由词字段出现。在互联网搜索引擎中,限定字段也是常用的语法。例如,“filetype:”表示在某种文件类型(如doc、pdf)中查找资料。详细的介绍请参见搜索引擎部分。1、查全率(P17)2、查准率

信息检索效率

文献检索与利用第二章中文检索工具

2.1CNKI中国期刊全文数据库

CNKI即“中国知识基础设施工程”,又称“中国知识资源总库”或“中国知网”,是以实现全社会知识资源传播共享与增值利用为目标的国家信息化建设重点项目,始建于1999年6月。

《中国期刊全文数据库》是CNKI重要数据库之一,收录1994年(部分刊物回溯至创刊)至今的9100多种期刊,按学科分为10个专辑、168个专题,现有文献3500多万篇;另有“世纪期刊”数据库,遴选4195种高质量刊物进行完整回溯,累积文献量达540多万篇,目前最早回溯到1915年。每日更新5000-7000篇。

检索字段系统提供16个检索字段(即“检索项”),常用的有:

检索项检索范围主题中/英文篇名、关键词、摘要、机标关键词篇名中/英文篇名作者中/英文作者名关键词中/英文关键词、机标关键词摘要中/英文摘要全文文章正文检索方式

系统提供4种检索方式,即:初级检索、高级检索、专业检索、期刊导航,其中“初级检索”是系统默认的检索方式,“高级检索”的功能更加全面,“专业检索”需要根据系统的检索语法编制检索式,而“期刊导航”则提供整刊检索功能。

除此之外,系统还具有“跨库检索”的功能,即可以输入一次检索条件,对CNKI中的多个数据库同时进行检索。

检索方式初级检索单一字段检索,必要时也可通过“逻辑”项下的“+”、“-”按钮实现字段的增、减输入内容可以是检索词,也可以是检索式检索式中以“*”、“+”分别表示逻辑“与”、“或”输入框后面设有“词频”等3个检索控制按钮检索方式初级检索检索方式高级检索检索方式高级检索检索方式专业检索检索方式期刊导航2.2VIP(维普资讯)--另转PPT试用,功能受限,文献数量有限…

“万方数据资源系统”是一个以Internet为网络平台,涵盖自然科学和社会科学各专业领域的大型信息服务系统。

“万方”数字化期刊子系统是万方数据资源系统的重要组成部分,基本囊括了我国自然科学统计源期刊和社会科学核心源期刊的全文资源,分为理、工、农、医、哲学、人文、社会科学、经济管理与教科文艺等8个类别,提供论文的全文检索及显示、下载。

2.3万方数据2.3万方数据2.3万方数据2.4中国优秀硕士学位论文全文数据库2.4中国博士学位论文全文数据库2.5国内外重要会议论文全文数据库

国内、国际,全文,会议信息…2.6超星电子图书

2.7超星学术视频

文献检索与利用第三章国外网络数据信息检索EiVillage2

美国《工程索引》(TheEngineeringindex,简称Ei)创刊于1884年,报道内容涉及工程技术领域各个学科及其相邻学科,几乎覆盖应用工程技术的各个领域。其中,化工、计算机、电子与通信、应用物理、土木工程和机械工程学科所占比例最大。收录信息来源于50多个国家,语种近20个,期刊5400多种,1000多种国际会议录、论文集、学术专题报告,以及一些重要的工程科技图书、年鉴、标准等,内容包括文献的书目信息和文摘。EiVillage2

EiVillage收录的论文分两个档次:(1)Ei

Compendex。该数据库的文字出版物即为《工程索引》。它收录论文的题录、摘要、标引主题词和分类号等,并进行深加工。(2)Ei

PageOne题录。一般不录入文摘,不标引主题词和分类号。文章只有被Ei

Compendex收录才算被Ei收录。识别EiVillage中的数据是Compendex数据还是PageOne数据有以下几点:Compendex的数据内容全面,主要包括:论文标题(Ti)、作者(AU)、作者单位(AF)、英文文摘(Abstract);论文所在期刊名称(ST)、卷,期(IS,VO)、论文页码(XP)、分类码(LL)、主题词(MH,CV),等等。其中:分类码(LL)、主题词(MH,CV)由Ei

Compendex专业人员单独给出,是识别Compendex收录主要标识。而PageOne的数据内容少,主要包括:论文标题、作者、作者单位、论文所在期刊名称、卷期、论文页码,少数数据带有英文文摘。EiVillage2的快速检索EiVillage2的专家检索EiVillage2的叙词检索WebofScience(SCI/ISTP/CCR/IC)

美国科技信息所(ISI-InstituteforScientificInformation)著名的科学引文索引数据库(SCI:ScienceCitationIndex),是世界上有影响的多学科的学术文献文摘索引数据库。我馆可检索的WebofScience数据包括:1.ScienceCitationIndexExpanded(SCI-EXPANDED)--2008-至今;WebofScience(SCI/ISTP/CCR/IC)

2.CurrentChemicalReactions最新化学反应(CCR-EXPANDED)--2008-至今(包括InstitutNationaldelaPropriete

Industrielle

化学结构数据)IndexChemicus(IC)--2008-至今;

3.ConferenceProceedingsCitationIndex-Science(CPCI-S,2001年至今)ConferenceProceedingsCitationIndex-SocialScience&Humanities(CPCI-SSH,2009年至今)。CPCI-S的前身是IndextoScientific&TechnicalProceedings(简称ISTP,科学技术会议录索引)是美国ISI(科学情报研究所)四大检索工具之一,它的Web版WebofScienceProceedings(简称WOSP),包括科技会议录索引ISTP和社会科学及人文科学会议录索引ISSHP(IndextoSocialScience&HumanitiesProceeding)。WOSP最明显的特点是增加了会议论文的摘要信息(光盘版没有论文摘要)。

WebofScience检索方式WebofScience检索方式时间限制,精炼检索结果,调整检索结果设置

JournalCitationReports(JCR)JournalCitationReports®

是一个独特的多学科期刊评价工具,网络版JCR是唯一提供基于引文数据的统计信息的期刊评价资源。通过对参考文献的统计汇编,JCR可以在期刊层面衡量某项研究的影响力,显示引用和被引期刊之间的相互关系。JCR可计量的统计数据提供了一种系统客观测定某个主题类目中大量期刊相对重要性的方法。JournalCitationReports®

有自然科学(即JCR-SCI版)和社会科学版(JCR-SSCI版)两个版本。

JournalCitationReports(JCR)引文(Citation)和来源文献(SourceItem):一篇文章的参考文献称为引文(被引文献),该篇文章称为来源文献(引用文献)。刊载来源文献的期刊或专著丛书等称为来源出版物(SourcePublications)。被引作者或引文作者(CitedAuthor):即参考文献的作者。来源作者或引用作者(CitingAuthor):即来源文献的作者。根据估计,在期刊论文中,大约90%的论文都有参考文献。每篇论文所引用到的参考文献平均约为15篇,其中约有12篇来自定期刊物。论文之间的这种相互引证的关系使论文彼此联系起来构成一个论文网,从而向读者提供一种独特的检索途径。引文分析是一种按论文被引用的次数来评价成果的思想,也就是除了和其他检索系统一样,收录文献的作者、题目、源期刊、摘要、主题词等以外,还将论文的参考文献收录起来,从而把一篇论文和其它论文之间有意义的联系勾划出来,也就是把发表论文的两位作者或两个作者群体之间的学术联系显示出来。JournalCitationReports(JCR)引文索引:反映文献之间引用和被引用关系及规律的一种新型的索引工具。以作者姓名(被引作者或引文作者)为检索起点,查找该作者历年发表的论文曾被哪些人(引用作者)、哪些文章(来源文献)引用过,并查出这些来源文献的题录和引用作者所在的单位。引文索引的作用和意义:文献之间的引用和被引用关系体现了:

学术上的相关性理论与方法:借鉴与利用技术与手段:应用与发展横向上的对应性实践与方法:相互参照与借鉴结果与讨论:比较与应用纵向上的继承性课题:基础与起源、发展与进步反引:学术争鸣JournalCitationReports(JCR)JournalCitationReports(JCR)引文索引的主要作用是:(1)通过文献间的引用和被引用关系,了解某一学术问题或观点的起源、发展、修正及最新的研究进展。(2)评价科学文献、学术期刊和专著的学术水平的参考工具。一般来说,高质量的学术期刊的被引频次较高。根据引文索引提供的引证数据有助于评价科技期刊的质量,确定某个学某个学科的核心期刊。JournalCitationReports(JCR)(3)作为科研机构和科研人员绩效评价的参考工具。引文索引有助于评价科学著作的价值和生命力、科

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论