文献检索与利用教案1市公开课一等奖百校联赛特等奖课件_第1页
文献检索与利用教案1市公开课一等奖百校联赛特等奖课件_第2页
文献检索与利用教案1市公开课一等奖百校联赛特等奖课件_第3页
文献检索与利用教案1市公开课一等奖百校联赛特等奖课件_第4页
文献检索与利用教案1市公开课一等奖百校联赛特等奖课件_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文件检索与利用主讲人:李昌彩电话:806043413593815646lccserver@126.com密码:lccserver第1页教学参考书:

1、穆安民编著。科技文件检索实用教材(第二版),重庆大学出版社。8月。2、徐庆宁主编。《信息检索与利用》。华东理工大学出版社。年8月。3、陈雅芝等主编。《信息检索》。清华大学出版社。201月。4、邓学军等编著。科技信息检索,西北工业大学出版。208月。5、李跃珍主编。信息检索与利用,浙江大学出版社。208月。第2页1文件检索基本理论与方法

1.1基本术语及文件检索目标意义1.2文件类型与检索工具1.3文件检索原理与检索语言1.4文件检索方法及检索步骤

第3页1.1基本术语及

文件检索目标意义1.1.1信息、情报、知识、文件等基本术语(1)信息●信息定义是物质存在、运动表征(即物质存在一个方式);普通指数据、消息中所包含意义,能够使消息中所描述事件不确定性降低。信息属性普遍性、无限性、相对性、转移性、时效性、有序性、共享性、轮换性、转化性。第4页(2)知识知识是经过精心研究、领会后有用信息,是人类对信息加工处理产物,并非全部信息都可称为知识。知识是关于事实和思想有组织、有系统陈说。知识是有组织大量信息。信息只是知识得以形成和传输中介,而不是知识本身。知识属性意识性、信息性、实践性、规律性、继承性、渗透性第5页(3)情报●情报普通定义为:针对特定目标、特定对象、特定时间所提供或寻找能起借鉴和参考作用有用信息或知识。

●情报是一个很特殊概念,任何信息都能够成为情报,惟一判别特征是“是否有用”。一旦产生需要,信息马上转化为情报,而一旦不再需要,则情报马上返回到信息或知识。情报属性情报知识性、情报传递性、情报效用性第6页(4)文件●文件定义为统计知识一切载体。文件是信息主要组成部分,它和非文件信息组成了信息全部内容.文件属性知识信息性、物质实体性、人工统计性、动态发展性第7页(5)情报、信息和知识相互关系

西方学者习惯把文件情报与自然信息等同(information),而把相关国家安全之类情报叫做elligence这个词最惯用却是“智力、聪明”意思。汉字“情报”一词,则把文件信息与相关敌情信息混同,尽管同时存在着现成“谍报”一词。因为“信息”和“情报”在英语中都用同一个词(information)来表示,所以科技情报机构轻易被人误解,于是我国国家科委在1992年9月决定逐步用“科技信息”名称取代“科技情报”,并要求各科技情报所随之更名。第8页●信息概念十分广泛。信息是无处不在,它是物质存在、运动表征。人类经过信息来认识世界,而在认识世界过程中,又把这种已经取得信息,经过大脑思维组合、汇成知识。

●情报是针对特定目标、特定对象、特定时间所提供或寻找能起借鉴和参考作用有用信息或知识。第9页●知识是系统化了信息,是人类对客观事物存在和运动规律认识。客观知识经过交流、传递而转变为情报,人们借助情报进行思维、决议,又不停产生新知识。这是情报与知识循环往复辩征过程。知识在需要时可变为情报,不需要时又还原为知识。《辞海》对于知识解释是:人类认识客观事物结果或结晶。

●知识是一个客观存在信息,而情报则是运动中、交流中知识或信息。

☆情报、知识都属于信息这个大范围,三者都能够被统计、储存、传递,而且在一定条件下可相互转化。第10页(6)其它概念术语信息资源是人类经过加工处理,使之有序化并大量积累后可供利用信息集合。信息资源几个分类介绍以下:1、孟广均以开发程度为依据,将信息资源划分为潜在信息资源和现实信息资源两大类。又按表述方式将现实信息资源分为口语信息资源、体语信息资源、文件信息资源和实物信息资源。第11页2、代根兴依据其载体将现实信息资源分为体载信息资源、文件信息资源、实物信息资源和网络信息资源。3、刘兹恒从信息媒体角度将信息资源分为纸质信息资源(如图书、期刊、特种文件等)和非纸质信息资源(如缩微型、视听型、机读型、光盘型、其它电子型、电子出版物等)两大类型。伴随信息革命快速发展和知识经济降临,信息资源已成为国家建设和企业发展主要资源,它与物质资源和能源资源一起组成当代社会发展三大支柱。第12页信息高速公路……信息污染我国学者陆宝益等将信息污染表现形式归结为:信息过载、信息失真、信息过时、信息重复、信息堵塞、信息错位、信息误导、信息干扰、信息无序、信息缺损、信息病毒、信息渗透等12种。信息素质(Informationliteracy),又称信息素养,即“利用大量信息工具及主要信息源使问题得到解答技术和技能”;以后又被解释为“人们在处理问题时利用信息技能”。信息素质这一概念,最早由美国信息产业协会主席波尔(PaulZurkowski)于1974年提出。1983年美国信息学家(Horton)认为教育部门应开展信息素质教育,以提升人们对联机数据库、通讯服务、电子邮件、数据分析以及图书馆网络使用能力。信息素质主要包含:信息意识、信息能力和信息道德三方面素养。第13页1.1.2文件信息检索概念

文件信息检索(InformationRetrieval)是指从文件信息集合中查找所需文件或文件中包含信息内容过程。广义信息检索包含还信息存放,二者中往往合并称为“信息存放与检索”(Informationstorageandretrieval)。对使用者来说,往往指是后者——信息检索与查找过程。这也是本课所要学习内容。第14页依据检索对象不一样,可分为数据检索(Data-)、事实检索(Fact-)、文件检索(DocumentRetrieval)三种。“数据检索”是以数据为对象检索,如查找某一数学公式、数据图表、某一个材料成份、性能等都属于这一范围。“事实检索”是以特定事实为检索对象(是以各种史实、结果、现实状况为检索对象);如要查找某一事物发生时间、地点与过程;某类产品是哪些厂家生产、哪个品牌最好;某一高校或科研机构简况等均属于这一范围。凡是查找某一课题、某一著者、某一地域、某一机构、某一事物相关文件出处和收藏单位等,均属于“文件检索”范围。如要查找有否:“高层建筑结构抗震”相关文件及相关文件出处,即属于文件检索。

第15页1.1.3文件检索目标和意义

就文件检索高等教育目标来说:对大学生主要培养五种能力即自学能力、研究能力、思维能力、表示能力和组织管理能力。科技文件检索技能是培养学生这些能力基础。对硕士生来说,在学习阶段中,主要是学会怎样独立地从事研究工作,在查找文件基础上,总结前人经验,在此基础上有所创新。对一个博士生来说,主要是经过文件检索,总结前人经验,培养选择含有创造性研究方向能力,开辟出新研究领域。第16页掌握信息检索方法和技能主要

意义,最少有以下几个方面:

(1)防止重复劳动

科研含有继承创造两重性,科研两重性要求科研人员尽可能多地占有相关资料、情报。从实践经验看,科研中出现绝大多数问题都有必要而且有可能经过查找科技文件得到启发甚至得到处理。能够说一项科研结果中95%是他人,5%是个人创造。所以研究人员在开始着手一项课题研究前,必须利用科学文件检索方法来了解这个课题情况,即前人在这方面做过哪些工作,还存在什么问题,以及相邻学科发展对研究这项课题提供了哪些新有利条件等与研究课题相关科技信息,只有这么,才能正确地制订研究方案,预防重复研究,并少走弯路。第17页据统计,科研人员大约花全部工作时间40%查找文件,假如没有掌握科学检索方法,则此时间还会加长。甚至使自己全部工作成为“重复劳动”。比如:美国20世纪50年代为了搞“继电器接点电路合成研究”,曾经联合几家试验室研究了,耗资50万美元,终于成功;但当发表结果时,才发觉该项目早已被他人完成。美国某轧钢厂一位化学家,花了一万美元完成了一系列试验,并处理了问题,当他不无得意地向图书馆员谈起此事时,后者告诉他,有一份德国人汇报,就是做这个试验,全部资料只要花5美元就行了。第18页(2)节约查找文件时间,

提升科研效率

据美国科学基金委员会、凯萨工学院研究基金会以及日本国家统计局初步统计,一个科研人员在一个科研项目中,用在查找和阅读情报资料时间要占完成该研究课题时间50.9%,而计划思索时间占7.7%;试验和研究时间占32.1%;编写研究汇报时间占9.3%。第19页(3)促进专业学习

科技文件检索学习将把学生引导到超越教学纲领更广知识范围中去。一个学生在大学学习中已取得了进行科研最基本知识,但在校学习时间毕竟有限,参加工作以后,仍需不停更新知识,才能适应科技快速发展,掌握了文件检索方法与技能,就可无师自通,很快找到一条吸收和利用大量新鲜知识捷径,进入旺盛创造期。第20页1.2文件类型与检索工具

文件组成两个基本要素:一是要有知识内容;二是要有记载知识物质形式,即载体。

第21页1.2.1文件特点

1、文件量急剧增大。据统计,非科技内容文件量每30年左右增加1倍,而科技文件每7至8年就增加1倍。2、载体多样化。有印刷品与缩微声像、机读等资料共存。3、传输速度快。经过互联网传输,突破了空间界限。4、知识更新速度快。各类文件平均使用寿命:科技图书10至,期刊论文3至5年,大部分文件5至7年。5、学种间交叉渗透,造成文件重复和质量下降现象愈加突出。第22页1.2.2文件类型

文件划分有不一样标准,依据不一样划分标准可分为不一样文件类型。按文件载体划分按文件加工程度划分按文件出版形式划分

第23页(1)按文件载体划分:

▼印刷型文件;▼缩微型文件(它利用感光材料每张大小为10×15cm2胶片上,可容纳98页印刷型文件资料;必须借助于缩微阅读机);▼机机读型文件(磁带、磁盘、光盘.它利用计算机技术和磁性存贮技术);▼声像型文件又称视听型文件(唱片、录音带、幻灯片、电影胶片、电视片、录相片)。▼实物型文件(各种文物、展品、样品等)第24页(2)按文件加工程度划分:

一次文件指以本人研究结果为基本素材创作文件,也称第一手文件或原始文件。它包含期刊论文、科技汇报、会议论文、专利说明书、学位论文等。一些不公开发表文件,如试验统计、备忘录、科技档案、日志、信件等也能够属于一次文件,也有称为零次文件。第25页二次文件指在一次文件基础上进行加工后产生含有有序化和浓缩化特征文件。如目录、题录、文摘、索引等。二次文件作用不但在于报道,更主要是用于检索一次文件。第26页三次文件指利用二次文件,选取原始文件内容进行分析、研究和综合而成评论性、综述性文件。如百科全书、手册、年鉴、述评、指南、大全等。第27页从文件情报角度看,一次文件是检索对象(目标),二次文件是检索工具(伎俩),三次文件是情报研究结果(既可作检索目标,又可作检索伎俩)。第28页(3)按文件出版形式划分:科技图书、科技期刊、报纸、专利文件、会议文件、科技汇报、政府出版物、学位论文、标准文件、产品资料、其它文件(十一大类型)。第29页1〉科技图书

科技图书,大多是对科学研究结果和生产技术经验概括叙述,经常是作者搜集大量资料,经过筛选、判别、融会贯通,进行全方面归纳总结产物。现在科技图书(一次文件,但又含三次文件性质),都有一个ISBN号,即国际标准书号(InternationalStandardBookNumber),其定长为10个数字。这10个数字组合,可把全世界书都管理起来。第30页以《计算机网络基本原理》一书书号为例:ISBN7—5609—2141—8/TP.365。这10位数字分为四段,各段之间用短横线相连。7为第一段组号,是语言区域代码(代表国家、地域、语言区)。比如:7指中国,O和1指英语国家,2指法语语言区(如法国和加拿大法语区),3指德语区,4指日语区,5指前苏联,88指意大利,9971指新加坡等等。5609为第二段组号,是出版者代号。2141是第三段组号,又叫书序号或书名号。这里2141是指这家出版社出版第2142种图书,因为第一个为零。8为第四段组号,又叫计算机校验位、检验码或校验号。它作用是可用其检验ISBN后面数字是否有误.第31页ISBN号前3部分都是变长结构,但总长不变(它采取弹性存放方法,即可变长存放技术,IP地址划分子网时也用到这一技术)。依据ISO相关标准,计算机校验位是用前9位数字分别对10,9,8,7,6,5,4,3,2乘积之和,对11模数求余,再用模11减去余数而得。如此例ISBN7—5609—2141—8:第32页ISBN756092141

×109876543270+45+48+0+54+10+4+12+2=245245/11=22┅┅余311–3=8所以,该书核校验位是8。注意一个数对11模数求余,可能余数集合是0,1,2,3,4,┅10,当余数为1时,11-1=10,为了确保ISBN号全长10位,故用大写字母X表示.第33页但中国ISBN号却还要在国际ISBN号后而加上中图法大类号和小类号,如此例:ISBN7—5609—2141—8/TP.365。“TP”为中图法大类号(自动化及计算机)。第34页将升成13位ISBN1)13位码起源背景当前国际公认用于商品包装编码系统称为EAN-UCC系统,该系统由国际物品编码协会(EAN)与美国统一代码委员会(UCC)共同开发和维护,是全球统一和通用商业标识系统,是对全球多行业供给链进行有效管理一套开放性国际标准。EAN-UCC系统编码有两种①UPC条形码,该条码主要在美国使用。②EAN-13条形码,EAN是EuropeanArticleNumber,是欧共体“欧洲物品编码协会”吸收了UPC经验而确立物品表示符号。该协会于1997年更名为“国际物品编码协会”。使用EAN条形码组员国除欧洲外,亚洲多国也使用此码,我国于1991年7月参加该协会。第35页EAN-UCC系统致力于编码全球唯一性,并处理编码混乱、重复和错误译码问题,EAN组员组织和UCC经过特定前缀协议确保代码在全世界唯一性。国际物品编码协会(EANInternational)指定给国际标准书号(ISBN)系统专用前缀码是978。第36页2),国际ISBN中心(IIA)出版了《13位国际标准书号指南》(GuidelinesfortheImplementationof13-DigitISBNs),描述了将于年启用13位ISBN概况。国际标准化组织ISO将于201月出版新标准,该标准将以13位数字BooklandEAN条形码,作为图书和图书相关产品唯一条形码。到年1月1日起,全世界全部ISBN代理机构将只公布13位ISBN。所以,出版社将有两年时间来完成10位ISBN到13位ISBN升级。过渡期间内(2005-年),勉励出版社依据国际ISBN中心(InternationalISBNAgency)出版《13位国际标准书号指南》为同一个文件提供10位和13位ISBN号。第37页

3)新ISBN实际上就是现在EAN(欧洲物品号)。现在出版图书外封底(outsideofbackcover)ISBN下面就有一个13位号码,这就是EAN-13号,比如:CALIS联机合作编目手册外封底ISBN下面就有一个13位号ISBN:7-301-04815-7EAN-13:978-7-301-04815-3第38页前缀978(代表图书),中间一部分与ISBN相同,最终一位是校验码,校验位加权算法与10位ISBN算法不一样。详细算法是:用1分别乘ISBN前9位中奇数位,用3乘以偶数位,成绩之和以10为模即可得到校验位值,其值范围应该为0-9。第39页BooklandEAN-13=978-0-393-04002-?校验位:81/10=8……余110-1=9位置

Total

12345678910111213ISBN978039304002?权重131313131313-乘积

8192180327304006-第40页1月1日以前,各国ISBN机构尚没有分配完10位ISBN能够在前面加前缀978,一旦现有10位ISBN号用完了,新申请ISBN号码全部以979开始。即979前缀当前用于两种情况,一是新建出版社首次申请ISBN和已经有出版社在1月1日以后申请ISBN号,二是假如以978为前缀号码先用完,那么就只能用979。13位号码与10位号码能够经过算法相互转换,转换方法见ISBN中心主页(/)详细说明。第41页2〉科技期刊

期刊(journal)又称杂志(magazine),是一个有固定名称,有一定出版规律连续出版物,其特点是出版周期短、报道速度快、数量大、内容丰富新奇、能及时反应当代社会和科技发展水平和动向。期刊普通都有一个比较稳定编辑部,按照一定宗旨和编辑标准,选登众多著者文章,有时,也采取增刊和特辑形式登载某一著者专著。期刊论文是最经典一次文件。第42页同图书一样,期刊现有国内标准刊号--CN号,也有国际标准刊号--ISSN号(InternationalSeriesStandardNumber),实现对全世界期刊文件管理。ISSN号全长8位数,前7位是刊物代号,末位是计算机校验位(算法同ISBN号,模数仍用11,只是加权数用8,7,6,5,4,3,2这7个数)。如ISSN1000—0402(这是《图书馆学通讯》期刊国际标准刊号),中间“—”只是为了便于阅读而设置。计算机校验位2求出以下:第43页ISSN1000040?×8765432

8+0+0+0+0+12+0=2020/11=1┅余911-9=2.期刊出版周期常见有旬刊、半月刊、月刊、双月刊、季刊、年刊等。如查得ActaAstroautV10.N3.Mar1983,即《星际航行学报》1983年3月第10卷,第3期。第44页3〉报纸报纸是一个出版周期最短、发行量最大出版物,它报道内容极为广泛,和人们生活息息相关,是人们日常生活中最常接触到信息源。报纸信息含有极强时效性,信息量大,但这也造成了报纸查找不便。不过,现在很多主要报纸都已送上网,能够在线阅读和查阅了。第45页4〉专利文件

专利文件(集技术、经济、法律为一体一次文件)主要指专利局公布申请文件和专利说明书。专利有专利号,国家用两个字母代替,US是美国,GB是英国,FR是法国,CH是瑞士,CA是加拿大,中国是CN。第46页5〉科技汇报

科技汇报是科学工作者从事科学研究工作阶段进展情况和最终研究结果汇报。其中美国最多,它主要是AD汇报、PB汇报、DOE汇报和NASA汇报。每篇汇报一个号码。科技汇报代号有:机构代号,如TID-7641代表美国原子能委员会技术情报局科技汇报。又如STAN-CS-82-916是美国斯坦福大学计算机系83年出汇报。类型代号,如TN代表技术札记,TT代表技术译文。密级代号,如C表示是保密汇报,ARR是绝密汇报。科技汇报(既像书、又像期刊一次文件)在我国国家图书馆、中国科技信息研究所和上海图书馆收藏科技汇报比较完善齐全。第47页6〉会议文件

在各种学术会议上发表文件统称为会议文件(会议文件是报道最新科技动向一次文件)。它含有大量最新情报信息,是了解世界科学技术发展动向、水平和最新成就主要渠道,是参考价值很高科技文件。会议文件出版形式普通有几个:一是以单卷式(图书)出版,以会议名称作为出版物名称,按会议届次编号(如﹡﹡会议论文集),定时或不定时出版文集。如Proceedingsofthe9thNationalAnalysisInstrumentationSymposium(第九届国家分析仪表会议论文集);二是以期刊形式出版会议专号、会议特辑或增刊;三是以科技汇报、视听资料等形式出版。会议类型较多,文件出版形式多样,命名方式复杂,以及文件收藏分散等等,给文件检索带来困难。第48页7〉政府出版物

政府出版物系政府所属各部门出版(是表达政府科技发展政策三次文件),是政府设置或指定专门机构印刷发行文件。其内容包括两大方面:即行政性文件--如国会统计、政府法令、方针政策、规章制度、决议指示、调查统计等等;科技性文件--如科研汇报、科普资料、技术政策等等。科技性文件约占30-40%。其出版形式多样化,有图书、期刊;有印刷品,也有视听资料。对于了解一个国家科技政策、经济政策以及科技活动和水平,含有一定参考价值。第49页8〉学位论文

高等院校毕业生参加不一样学位考试时,提交学术论文。有博士论文、硕士论文和学士论文。(学位论文是表达毕业生学术水平和能力一次文件。)学位论文是原始研究结果,有一定独创性,对研究工作有一定参考价值。学位论文除少数在相关期刊上登载全文或摘要,或以书本形式单册发行外,大多数学位论文不对外发行,属非卖品,仅供内部参考。因为学位论文数量不停增加,质量参差不齐,多数未公开发行,难以搜集和利用。我国学位论文在学位授予单位、北京图书馆和中国科技信息研究所收藏。第50页9〉标准文件

标准文件(是促进社会产品质量进步三次文件)是对工农业产品和工程建设质量、规格及检验方法等方面所作技术要求,是标准化工作产物。它包含各种标准化期刊、图书专著、标准化组织机构发表相关手册、通报、汇编、以及各种标准及检索工具等等。按其使用范围可分:国际标准、区域标准、国家标准、专业标准或部颁标准、企业标准。按其内容分:基础标准、产品标准、方法标准。按其成熟程度分:正式标准、试行标准、推荐标准。它含有四个特点:严厉性、法律性、时效性、滞后性。第51页10〉产品资料

厂商为了推销产品而出版发行一个商业性宣传资料(是提供产品技术细节和规格一次文件)。它包含:产品目录、产品样本和产品说明书等等。产品资料普通都要包括到产品性能、结构、原理、用途、使用方法和维修、保管等各方面技术问题,含有技术情报价值。利用产品资料,能够调查了解和分析国外同类产品技术发展过程、水平和发展动向等。还可作为引进技术,判断其质量和价值主要依据。第52页11〉其它科技文件

有新闻稿、统计资料、科技档案(忠实统计工程项目标一次文件)、科技电影和数据等。

在以上11类文件中,普通把图书、期刊作为普通文件,其它九种均列入特种文件。特种文件:它通常是指那些在出版发行方面或获取路径方面比较特殊文件,或难于搜求(如科技汇报),或含有一些处理纠纷意义(如专利和标准)文件。第53页1.2.3文件类型识别

1、期刊论文期刊论文出处于文摘中都是缩写,其特点在于它有卷、期、年、页。比如:AmOilChem.Soc

V74N4Apr1997

P445-450V74---表示74卷N4---表示第4期P445-450---第445-450页第54页2、会议文件会议文件出处普通著录有会议名称、开会时间、地点、出版时间等等,判断是否是会议文件还可依据表示会议特征英文名称(conference,proceeding,congress,symposium,paper)来决定。比如:PracticalApplications,ProcConfTracklessPipelineProj1997Proceedingsofthe1997ASCEConferenceon...,Boston,MA,USA,Jun8-1111997,ASME,NEWYork,NY,USA,P383-389第55页3、科技汇报科技汇报标识有“科技汇报号,汇报入藏号”。比如:PB89-215783LA-8098-MS1989PB表示PB汇报,89表示年份AD、DOE、NASA、PB是美国四大汇报AD---军事汇报DOE---能源汇报NASA---航天汇报PB---政府汇报第56页4、学位论文学位论文【英国习惯称之为Thesis(复These),美国则称为Dissertation】出版著录有学位名称,颁发大学名称及其地址、授予学位年份等。比如:J.A.George,“ComputerImplementationoftheFiniteElementMethod”,Ph.D.Dissertation,StanfordUniversity,Stanford,CA.1971.Ph.D.Dissertation或者Ph.D.Thesis—博士学位论文BachelorThesis—学士学位MasterThesis—硕士学位第57页5、科技图书科技图书除著录作者姓名和书名外,主要还有出版社名称、出版地点、出版时间等。比如:Thisbookcontains...PublbyApplSciPublLtd

,London,Eng,1998,372Pcontains---文摘ApplSciPublLtd---出版机构London,Eng,1998,372P---出版地点、文种、年份和图书页数第58页6、专利文件专利文件除著录创造专利题目及创造人姓名外,其后为专利文件起源出处,即专利国别代码及专利号,说明书出版时间,有著有页码。普通有“Patent(专利)”字样。比如:U.S.PatentNO:4,142,783.1979第59页7、标准文件标准普通有“standard(stand标准)”字样。比如:ANSIStandnB109.11973,36PANSIStand---美国国家标准109.1---标准号1973,36P---年份及总页数第60页1.2.4检索工具

一、检索工具概念

检索工具是用以存放和检索文件线索、或报道、累积和查找文件线索工具;它是在一次文件基础上经过加工、整理,而形成二次文件。所以,它含有存放和检索功效。如前所述,科技文件数量庞大、交叉重复、高度分散,而且增加速度越来越快,这就给文件利用带来了很大困难。为此,人们在长久实践过程中,提出了压缩文件内容方法,即提取文件特征,加以标引,并按一定次序排列起来,从而形成检索工具,便于人们用较少时间从不一样角度获取大量文件。手工检索工具主要指各种目录、题录、文摘和索引。第61页*普通检索工具必须具备四个基本条件:1、必须详细著录文件外部特征和内容特征。2、必须含有既定检索标识。如主题词、分类号、著者姓名和文件序号等。3、必须依据标识次序,系统地科学地排列文件,使其成为一个有机整体。4、能够提供各种检索路径。第62页二、检索工具作用1、检索工具能将不一样类型、不一样语种文件按学科或主题加以集中组织在一起,防止了直接检索分散性、盲目性和偶然性,从而在查全率和查准率两个方面都能确保其检索效率。2、借助于检索工具检索文件能够缩短检索过程、节约读者时间。检索者无须去阅读大量分散各种类型及文种原始文件。因为检索工具使科技人员所面正确不再是文件全文,而只是反应原文情况一些著录事项,因而大大加紧了检索速度。第63页3、检索工具中标识(分类号、主题词等)是按照一定检索语言来编排,所以,它能够提供有规律检索路径,使检索者能够依据需要灵活地从各种角度进行检索。4、帮助科技人员消除了语言文字障碍。当前世界上出版科技文件所使用语言有60~70种之多,科技人员直接查阅文件时,经常受到语种限制而漏查一些有主要参考价值文件,而一个检索工具能够用一个语言来收录和报道不一样文种文件,检索者只要掌握少数几个语言后,就能查阅各种文字文件资料。第64页三、检索工具类型

(普通分为目录、题录和文摘三种)1、目录(Catalogue)目录是图书或其它单位出版物外表特征揭示和报道,它以完整单位出版物为著录基本单位。所谓单位出版物是指以文件名称作为一个完整出版物单位出版物(如同一本书或一个杂志),并不包括书中详细章节或杂志中详细文章。目录仅著录出版物外表特征,按类编排,主要用于查找出版物出版或收藏单位。依据编制目标和其社会职能,目录可分为国家目录、馆藏目录、专题目录、联合目录、出版目录与书商目录等。第65页2、题录(Citation)题录是单篇文件外表特征揭示和报道。题录普通只著录文件题目、著者、出处、文种等,没有内容摘要。题录以出版物中单篇文件为著录对象。准期刊中一篇论文。因为题录和索引在功效上有相同之处,有时人们把题录也称作索引,比如我国《全国报刊索引》就是经典题录型检索工具。第66页3、文摘(Abstracts)文摘是揭示文件外部特征,摘录文件关键点,报道文件内容检索工具。文摘著录项目与题录基本相同,但增加了内容摘要。文摘依据对文件内容深度或详细程度报道,可分为指示性文件和报道性文件。

第67页提醒性文摘(IndicativeAbstracts),其文摘内容比较简单,普通在100字左右,简明扼要地介绍原文主题范围、研究方法、结论、用途等;不包括详细技术内容,以使读者对原文内容不产生误解为标准,所以也有些人将其简称为介绍。第68页报道性文摘(InformationAbstracts),是对原文内容高度浓缩,报道原文论点、方法、设备、结论、详细数据等。我国国家标准要求,报道性文摘普通字数为200~300字(西文为250个实词),如有特殊需要字数可略多。这种文摘信息含量大,参考价值高。(另外,还有资料性摘要,它用于单独出版研究文集中。)第69页文摘类检索刊物主要由文摘和索引两大部分组成。文摘部分主要起报道作用,大多数按分类(或主题)编排,组成检索刊物正文,索引部分起检索作用。所以索引种类是否全方面,编制是否合理,使用是否简便,直接影响整个检索工具检索效率,它是衡量一个文摘刊物质量主要标志。第70页(索引Index索引就是将文件中含有检索意义文件特征标识,如文件标题、著者、分类号、主题词、序号等加以编排,并注明文件地址供检索使用检索工具。索引普通包含主题索引、分类索引、著者索引、题名索引和序号索引等。除上述四种索引工具外,还有“文件指南”、“书目之书目”之类检索工具。)第71页四、检索工具普通结构

(一个完整检索工具普通由五部分组成)①使用说明为使用者编写必要指导。普通包含编制目标、收录范围、著录格式、代号说明及注意事项等。使用前请认真阅读。②目次表检索工具正文普通都按分类组织编排。所以前面都有详简不等目次表。作为从分类查找文件依据。第72页③正文这是检索工具主体部分。存放在检索工具中内容不是原始文件,而是描述文件外表特征与内容特征著录。著录本身由若干著录项目所组成,比如,篇名、著者、出处、文摘等。著录后每篇文件都有一个固定序号以与其它著录相区分,这个序号称为文摘号或次序号。把大量文件按一定规则(普通是分类)组织起来(著录),就组成检索工具正文。第73页④辅助索引为了快速、准确、全方面地查到所需文件,仅从分类路径入手是不够,还要有主题、著者、序号等各种路径,所以索引也就有各种形式,但任何索引都不能单独存在,它们是依附于正文主体辅助部分,也是检索工具关键所在。掌握检索工具实质就是掌握各种辅助索引使用方法。第74页⑤附录附录部分主要是使用该检索工具必须参考一些内容。比如,引用期刊一览表、文件起源名称缩写与全称对照表、缩略语解释以及收藏单位代码等。同学们在学习使用新检索工具时,应首先阅读其使用说明,然后依据所查文件逮属学科或专业,查找目次或分类表,经过浏览选汉字献。假如已知主题词、著者名、机构名或其它代码(如专利号、科技汇报号、化学分子式等),则利用索引抵达正文,可快速、准确地查得所需文件。第75页使用说明:为使用者编写必要指导

目录:通常以分类方法给出本检索工具内容、

分类号及其页次

正文:能够有目录、题录和文摘等形式。普通按照

分类次序排列,每一篇文件都有次序号、期

刊等简称或全称

索引:包含主题索引、附录:引用文件一览表、

著者索引、号引用期刊、图书、

码索引等会议论文等

图1-1检索工具普通结构示意图第76页1.3文件检索原理与检索语言1.3.1文件检索原理

各种检索系统检索原理基本相同,文件(信息)检索就是将检索提问标识与存放在检索工具中标引标识进行比较,二者一致或信息标引标识中包含着检索提问标识,则含有该标识信息就从检索工具中输出。第77页文件存放过程就是按照检索语言(主题词表或分类表)及其使用标准对原始信息进行处理,形成信息特征标识,为检索提供经整序了信息集合过程。详细来说,信息存放包含对信息著录、标引及编排正文和辅助索引等。对信息著录是按一定规则对信息外表特征和内容特征加以简单明确表述。信息标引是对其内容按一定分类表或主题词表给出分类号或主题词。第78页文件检索过程则是按照一样主题词表或分类表及组配标准分析课题,形成检索提问标识,依据检索工具所提供检索路径,从信息集合中查找与检索提问标识相符合信息特征标识过程。第79页信息处理人员存放过程用户检索过程原始信息信息分析、著录和标引检索课题课题分析检索语言(主题/分类)检索工具检索结果图1-2文件存放与检索原理第80页1.3.2检索语言

检索语言概念:检索语言是依据文件存放与检索需要,在自然语言基础上规范化了一个人工语言(又称为情报语言,标引语言,索引语言等)。它贯通于文件存放和检索全过程,是沟通标引人员与检索人员思想之间约定语言。第81页检索语言功效:

⑴能够准确地标引文件内容及特征,确保不一样标引者在标引文件时表示一致;⑵能使主题内容相同或相关文件集中,提升检索效率;⑶能在标引者与检索者之间起到桥梁作用,使二者在文件主题概念了解和表示上到达一致,提升检索准确性。第82页检索语言类型:检索语言种类很多。按描述文件特征不一样,检索语言可分为描述文件外表特征检索语言和描述文件内容特征检索语言。描述文件外表特征检索语言包含题名(书名、篇名)、著者姓名、代码(专利号、汇报号、标准号等)和引文语言(被引用著者姓名和被引用文件出处)等。描述文件内容特征检索语言包含分类语言和主题语言两种。其中主题语言又相关键词语言和叙词语言等之分。﹡描述文件外部特征检索语言,如篇名、著者姓名、文件序号,它们作为文件标识与检索依据,直接明了,使用时较为简单。而描述文件内容特征语言,也就是分类语言和主题语言原理和使用方法是我们主要学习对象。第83页一、分类语言“类”是指含有许多共同属性事物集合。每一个事物都有各种属性,用其某一个属性作为划分依据来对一类事物进行划分就称为分类。分类是人类逻辑思维一个最基本形式。分类语言是用分类号来表示学科体系各种概念,将各种概念按学科性质进行分类和系统排列。详细地说,它是以学科分类为基础,按照概念划分原理,将知识概念从详细到普通,从简单到复杂、从低级到高级逐层划分,每划分一次就形成一批并列概念--下位概念,它们同属于一个被划分概念--上位概念。第84页比如:“科学”这个类可分“自然科学”和“社会科学”两个子类。“自然科学”又划分为“数学”、“物理”、“化学”等等子类。“自然科学”为被划分类,即上位类(上位概念),它所划分出几个子类,即下位类(下位概念)。这几个下位概念之间表达是平行关系,而上下位类之间则是逮属关系。每个类目都用分类号作为标识,每个分类号就代表特定知识概念。表达这种分类体系就是图书分类法。第85页分类法很多,比较有影响有《中国图书馆图书分类法》(简称《中图法》)、《中国科学院图书馆图书分类法》(简称科图法),《国际十进制图书分类法》(UniversalDecimalClassification)和《杜威分类法》等。《中图法》作为我国文件分类标引工作国家标准,被我国图书情报界广泛应用。第86页分类语言包含等级体系分类语言(体系分类法)和分析-综合分类语言(组配分类法)。前者主要应用概念划分与概括方法;后者主要是应用概念分析与综合方法,并在前者基础上发展起来,《中图法》就是采取体系分类法。体系分类语言《中图法》优点和不足:

﹡优点:按学科或专业集中而系统地揭示文件。

﹡不足:一是间接性,检索时要经过多重间接转换(主题概念→学科概念→语言标识符号),转换过程难以掌握,不便于检索。二是不足,因为体系分类法含有相正确稳定性,难以适应新学科,新技术,新理论改变。第87页

《中国法》分类结构以下:5大部22大类2级目录3级目录马列主义A马列主义.毛泽东思想哲学B哲学C社会科学总论D政治,法律E军事F经济社会科学G文化,科学TB普通工业技术教育,体育TD矿工工程H语言,文字TE石油,天然气工厂TU建筑基础科学I文学TF冶金工业TU19建筑勘测J艺术TG金属学TU2建筑设计K历史,地理TH机械,仪表工业TU3建筑结构N自然科学总论TJ武器工业TU4工力学,地基,O数理科学和化学TK动力工业基础工程P天文学,地球科学TL原子能技术TU5建筑材料Q生物科学TM电工技术TU6建筑施工机自然科学R医药,卫生TN无线电电子学,械和设备S农业科学电讯技术TU7建筑施工T工业科学TP自动化技术,计算技术TU8房屋建筑设U交通运输TQ化学工业TU9地下建筑V航空,航天TS轻工业,手工业TU97高层建筑X环境科学TU建筑科学TU98区域规划TV水利工程城市规划综合性图书Z综合性图书TU99市政工程第88页注:在26个英文字母中,有4个英文字母L、M、W、Y没有用到《中国法》分类中.第89页二、主题语言主题语言是一个描述性语言,它用词语直接表示文件主题,这些词语就是表示主题概念标识。将这些标识语词按字顺排列并使用参考系统来间接表示各种概念之间关系,这就是主题语言。第90页1、依据词语选词标准、组配方式、规范方法,主题词语言又分为标题词语言(它属于先组式语言,如美国《EI》早期使用〈工程标题词表〉)、关键词语言和叙词语言。标题词语言是以标题词作为文件内容标识和检索依据一个主题法语言。标题词是来自自然语言中比较定型事物名称,并经规范化处理能表示文件主题内容词、词组或短语。第91页*所谓规范化处理主要指对词义、词形及词组组合方式进行处理。规范化处理普通包含同义词(如“激光”与“菜塞”)规范、近义词(如“试验”与“试验”)规范、词型(如汉字简写、繁体、异体)规范、词组组合方式(正叙、倒叙、并列)规范以及用注释方式对标题词内涵进行限制规范。比如:同义词“计算机”和“电脑”,选择“计算机”作为正式标题,则排除“电脑”一词。第92页关键词语言是以关键词作为文件内容标识和检索依据一个主题法语言(是对表示文件主题含有实质意义并在揭示和表示文件主题内容上起关键作用词或词组)。关键词选自文件题目、文摘乃至正文中含有实质意义词语。关键词语言是不受词表控制非规范化语言。美国《化学文摘》期关键词索引和《化学题录》主题索引均以关键词语言编辑。第93页叙词语言是主题语言高级形式(是在自然语言基础上经严格规范化处理主题法检索语言)。叙词是从文件内容中抽选出来,从概念上不可再分基本概念单元词汇。检索时利用这些表示概念单元叙词进行组配,以表示一个复杂概念。叙词语言是近代用途较广、既适合用于手工检索,又适合用于计算机检索后组式检索语言。怎样利用主题语言中关键词、叙词语言查找文件要在讲解相关检索工具时详细介绍。第94页2、按组配方式划分,检索语言能够分为先组式检索语言和后组式检索语言。先组式检索语言--在检索之前已事先组配好了检索语言。它又可分定组型和散组型。前者是在编制词表时已预选固定组配好,后者则是依据标引文件时实际情况,按组配标准暂时组配。分类语言即是先组式检索语言。后组式检索语言--在检索之中依据实际需要按组配规则暂时组配,称之谓后组式检索语言,比如叙词语言即是。怎样利用叙词语言查找文件要在讲解相关检索工具时详细介绍。第95页检索语言种类很多,但在手工检索时主要使用体系分类语言、标题词语言、叙词语言和关键词语言;在计算机检索时,主要使用叙词语言,偶然也用关键词语言。检索语言归纳以下列图:

检分类法语言体系分类法语言索组配分类法语言

语主题法语言标题词语言

关键词语言言叙词语言

图1-3描述文件内容特征检索语言第96页1.4文件检索方法及检索步骤

一、检索方法文件检索方法能够归纳为追溯法、工具法和循环法(又叫综正当)三种。第97页1、追溯法

是一个传统方法,它是利用参考文件进行深入查找相关文件方法。现在追溯法包含两种方法,一个是利用原始文件所附参考文件进行追溯;另一个是利用引文索引检索工具(数据库)进行追溯,如《科学引文索引》(SCI)检索原理就是后者。第98页利用原始文件所附参考文件进行追溯查找,科学研究边缘性和继承性决定了学术论文之间相互参考与借鉴。一篇学术论文往往要参加或引用几篇、几十篇,甚至上百篇其它论文内容,并在文末将其作为参考文件列出。利用参考文件进行追溯查找,在某种程度上能够扩大文件起源。但参考文件数量有限,查找文件不够全方面,而且往往追溯年代越远,文件内容越旧,与课题关系越小;所以,普通在没有检索工具或检索工具不齐备情况下,把追溯法作为查找文件一个辅助方法来利用。第99页2、工具法

也称惯使用方法,即利用检索工具查找文件方法。它又能够分为顺查法、倒查法和抽查法三种。顺查法是按课题起始年代,由远及近逐年查找检索方法。因为逐年查找,故查全率较高,而且在检索过程中能够不停地筛选、剔除参考价值较小文件,因而误检可能性也较小。利用这种方法检索文件比较全方面、系统,但耗时费劲,效率较低。这种方法比较适合于内容复杂、时间较长、范围较广研究课题。倒查法与顺查法相反,是利用选定检索工具,由近及远地逐年逐卷地进行查找文件方法。依据课题需求获取近期文件,即以“查准”为主时,最好采取倒查法,这么比顺查法节约时间,效率较高。抽查法就是集中查找课题所包括学科内容发展高峰时期方法。这种方法要求检索者必须熟悉学科发展特点,了解该学科文件发表较为集中时间范围,才能取得很好效果,因而适合用于要求快速检索课题。第100页3、循环法又称分段或交替法。它是惯使用方法和追溯法结合,即先利用检索工具查出一批相关文件,然后利用这些文件所附参考文件进行追溯查找,由此取得更多相关文件。经过对已取得相关文件主题分析,提出新检索项,再利用检索工具检索,如此循环使用惯使用方法和追溯法进行检索,直至检索结果满足检索提问需要为止。这种方法兼有上述两种方法优点,但前提是原始文件收藏必须丰富,不然有可能造成漏检。第101页二、检索步骤

文件信息检索大致有分析研究课题、选择检索方法、确定检索工具和检索路径、查找文件线索以及索取原文五个步骤。第102页1、分析研究课题任何检索都是在一定范围内依据书籍条件查找未知情报过程。每一项检索课题都有明确目标和详细要求,而目标越明确,范围越详细,掌握线索越多,查获所需信息可能性就越大。首先要分析研究课题主题内容、所属学科性质,明确研究课题所需情报内容,从而提出能准确反应课题关键内容主题概念。其次要经过分析确定文件类型。假如属于基础理论性探讨,要侧重于查找期刊论文、会议论文。假如是尖端技术,应侧重于科技汇报。如属于创造创造和技术革新,则应侧重于专利文件。如为产品定型设计,则需利用标准文件及产品样本。明确课题对检索深度要求,要求提供题录、文摘,或者提供论文。另外依据课题研究起始年代和研究高峰期确定检索时间范围。第103页2、选择检索方法:①追溯法:假如检索工具不齐备,研究课题主题概念不太复杂,包括面不广,不要求查全率情况下,可用追溯法。②顺查法:假如研究课题要求信息要“全”和“准”,像课题立项审查和科研结果判定类项目可用顺查法。③倒查法:假如研究课题属于边缘学科或新兴学科及老课题补充新资料,要求信息“快”和“准”,可用倒查法。④抽查法:假如要掌握研究课题发展特点规律以及对所属学科发展改变进行详细地了解,可用抽查法。⑤综正当:在研究课题包括范围广、主题概念复杂、连续时间长情况下,可采取综正当。第104页3、确定检索工具

检索工具种类繁多,仅书本式文摘杂志全世界就有近两千种,中国有一百各种,所以必须有针对性加以选择。选择检索工具标准是要看其存放内容是否广泛全方面,标引深度怎样,提供检索路径是否方便有效,报道时差怎样,同时还要注意专业特点,选择专业对口检索工具。不但要重视利用权威性综合性检索工具(如《全国报刊索引》),而且还要注意利用针对性强专业性检索工具(如美国《工程索引》),同时还要善于利用单一类型检索工具(如《中国农业文摘-植物保护》)。第105页4、确定检索路径因为文件有各种不一样特征,提取文件特征编制检索工具就可能提供各种不一样路径。检索路径普通有以下几个。(1)、篇名路径依据已知书名或篇名进行查找路径。使用工具如“图书书名目录”、“期刊刊名目录”等(国内检索工含有《全国新书目》、《中国国家书目》、《中国关键期刊要目总览》等)。这类目录索引,均按书刊资料名称字顺来排列。因为文件篇名较长,检索者难以记忆,加之按篇名字顺编排,造成相同内容文件分散,不能满足族性检索要求。第106页(2)、著者路径依据已知著者姓名查找文件路径。文件著者包含个人著者和团体著者。普通检索工具都有“著者索引”和“机构索引”等。这类索引均按著者姓名字顺排列和检索,故使用方便。因为科研人员研究方向相对稳定,同一著者名下往往集中了学科内容相近或有内在联络文件,所以这种检索路径能在一定程度上满足族性检索要求。不过某一个人或团体著者,发表文件是有很大不足,所以著者路径不能满足全方面检索某一课题需求,属于一个辅助性检索路径。另外还有题中人名路径。第107页(3)、序号路径按文件资料特有序号进行检索路径。序号路径使用索引包含汇报号索引、协议号索引、入藏号索引、专利号索引等等。在已知文件特定序号前提下,利用序号路径检索文件非常简便。(序号包含文摘号、汇报号、专利号、标准号、协议号等。)第108页(4)、分类路径按照文件主题内容所属学科体系和事物性质进行分类编排所形成检索路径。常经过分类号来进行检索。比如国内编制科技文件检索工具,主要是按《中图法》分类,以固定号码表示对应学科门类。如“T”代表工业技术大类,“F”表示经济学大类,F23代表“会计”类,这么凡是经济类文件都集中在F类,凡是包括会计类文件都在F23类。这一路径是以学科概念体系为中心排检文件,能很好地满足族性检索需要。使用这一路径必须了解学科分门别类体系,并将文字概念转换成份类检索标识。分类路径在转换分类号过程中,因为受专业知识和分类方法影响,常易发生差错,造成漏检和误检,影响检索结果。第109页分类路径

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论