信息检索与利用2_第1页
信息检索与利用2_第2页
信息检索与利用2_第3页
信息检索与利用2_第4页
信息检索与利用2_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人类历史上发生的五次信息技术革命:第一次是语言的产生。第二次是文字的出现。第三次是造纸术和印刷术的发明。第四次是电报、电话、电视的问世。第五次信息技术革命是电子计算机和现代通讯技术的结合。

一千多年前,唐代诗人李中在《碧云集·暮春怀古人》中留下“梦断美人沉信息,目穿长路倚楼台”的佳句。这里,信息就指的是音信、消息。1.2信息与知识1.2信息与知识1.2.1信息香农在《通信的数学理论》中把信息定义为“人们对事物了解不定性的减少和消除,是两次不定性之差。”信息是用来减少随机不定性的东西。香农逆定义:信息是确定性的增加与信息相关的几个概念(1)信息(information)是从记录客观事物的运动状态和运动方式的数据中提取出来的,对人们的决策提供帮助的一种特定形式的数据。与信息相关的几个概念(1)知识是系统化的信息,是人类认识世界的成果和结晶。知识的类型:“知事(Know-what)”“知因(Know-why)”“知道怎样做的知识(Know-how)”“知道谁能提供知识(Know-who)”与信息相关的几个概念(2)情报情报是特定对象为特定目的而搜集的有使用价值的知识或信息。数据

是对客观事物进行记录并可以辨别的符号,它不仅指狭义上的数字,还可以是文字、图形和声音等。信息是加载在数据之上,对数据作具有意义的解释。文献是记录有知识的一切载体。文献由四个基本要素组成:①所记录的知识和信息,即文献的内容。②记录知识和信息的符号,文献中的知识和信息是借助于文字、图表、声音、记录下来并为人们所感知的。③用于记录知识和信息的物质载体,如竹简、纸张、胶卷、胶片等,它是文献形式。④记录的方式或手段,如铸刻、书写、印刷、复制、录音、录像等,它们是知息与载体的联系方式(摘自《中国大百科全书·图书馆学情报学档案学》)。

文献具有认识、存储和交流知识的作用。与信息相关的几个概念(2)印刷型文献载体:纸张实例:教科书记录手段:油印、石印、铅印、胶印、复印特点:可直接阅读,方便使用;但难于实现机械化和自动化;收藏文献占用空间大。缩微型文献载体:感光材料实例:缩微平片、缩微胶片记录手段:光学缩微技术特点:体积小;价格低;不能直接阅读

声像型文献载体:磁性材料、感光材料实例:录像带、幻灯片记录手段:磁记录、光学技术特点:直观、生动、形象;成本高;不易检索和更新。电子型文献载体:磁性材料实例:磁盘、光盘记录手段:计算机输入特点:存储密度高、速度快;易复制;成本高;不能直接阅读。几个概念的相互关系事实>数据>信息>知识>情报信息资源的含义信息资源是经过人类开发与组织的信息的集合。信息开发是指人类根据自身需求以感知、思维、创造等方式从物质和能量中提取、生产信息的过程。信息组织是指人类根据一定的规则以语言、文字等符号为手段对所开发的信息实施有序化的过程。信息的类型:按照出版形式图书期刊特种信息其它标准科技报告政府出版物学位论文专利信息信息会议信息信息资源的类型

1、按出版形式分类图书信息内容成熟、定型论述系统、全面、可靠出版周期长,知识的新颖性不够报纸时事性、普及性、大众性、服务性;传递信息迅速、信息量大系统性、专业性不足期刊出版周期短,报道信息速度快,内容新颖,发行及影响面广,定向选择性强信息容量受限制图书什么是图书国际上通常把48页以上,不定期出版的印刷品称为图书。我国国家标准对图书的定义是:“以印刷方式单本刊行的出版物。”特点带有总结性、成熟定型;出版周期长,信息传递慢;传授知识,而不是报道最新信息。图书一般分为两类阅读型:教科书、专著等工具型:字典、百科全书、年鉴、手册如何通过网络获取电子图书中文超星数字图书馆书生之家方正APABI数字图书馆外文电子图书SPRINGER电子丛书NetLibrary电子图书期刊论文期刊一般是指名称固定、开本一致的定期或不定期连续出版物。期刊论文内容新颖,报道速度快,信息含量大,是传递科技情报、交流学术思想最基本的信息形式。据估计,期刊情报约占整个情报源的60-70%,因此,受到科技工作者的高度重视。大多数检索工具也以期刊论文作为报道的主要对象。对某一问题需要深入了解时,较普遍的办法是查阅期刊论文。期刊的特点A、期刊以品种为单位形成知识流;B、内容新颖、及时、广泛,但不如图书成熟;C、期刊一般不修订再版。D、科技期刊是最重要的一次文献。核心期刊*少数刊载某一学科大量高质量专业论文的期刊。*特点(1)刊载专业文献密度高,信息含量高;2)水平较高,代表本学科的最新发展水平;3)出版相对稳定,所载文献寿命较长;4)利用率和被引率较高。目前,许多单位核心期刊的判定是以《中文核心期刊要目总览》为标准如何获取期刊论文电子资源中文中国期刊网、重庆维普、万方数据库外文ElsevierElectronicJournalsEmeraldFulltextJSTOR……输入期刊名点击“检索”点击“来源数据库”中相应的链接信息资源的类型

1、按出版形式分类(续)科技报告政府出版物会议信息专利信息政府出版物

政府出版物是指由政府机构制作出版或由政府指定出版商出版的文献。政府出版物的类型(1)行政性文件包括会议记录、司法资料、条约、决议、规章制度以及调查统计资料等。

(2)科技文献包括研究报告、科普资料、技术政策文件等。

政府出版物政府出版物政府出版物的特点(1)内容广泛,涉及各学科领域;(2)数量巨大;(3)资料可靠性强;(4)出版发行方式多样,有重复现象;(5)保密性;(6)售价低廉。会议信息会议信息是指国内外各种学术会议上宣读或交流的论文、报告、会议记录等信息资料价值会议信息是公布新研究成果的重要场所,大约30%的科技成果首次公布在科技会议上对本领域重大事件的首次报道率最高,一些新的理论、方案和重要发现、发明等往往首先在会议上发布并交流及时全面了解有关领域发展情况的重要渠道如何获取会议信息电子资源——中文万方数据库《中国学术会议论文全文数据库》主要收录1998年以来国家级学会、协会、研究会组织召开的全国性学术会议论文CNKI《中国重要会议论文全文数据库》收录我国2000年以来国家二级以上学会、协会、高等院校、科研院所、学术机构等单位的论文集,年更新约10万篇论文。如何获取会议信息电子资源——英文ISTP(科学技术会议录索引)和ISSHP(社会科学及人文科学会议录索引)系统本身不提供全文。IEL美国的电气和电子工程师学会(IEEE)与英国的电机工程师学会(IEE)共同推出的全文数据库。提供1988年以来两个学会的期刊150多种、标准1350多种、会议信息5150多种信息资源的类型

1、按出版形式分类(续2)学位论文技术标准科技档案产品说明书音像出版物注意:还有大量非出版形式的信息标准文献与标准化活动有关的一切文献都称为标准文献。其主体是标准,还包括标准形成过程的各种档案、宣传推广标准的手册及其它出版物。标准是按规定程序制订,经权威机构公认或主管部门批准的在特定范围内执行的规格、规则、技术要求等规范性文件。标准的主要特点(1)标准的制订、审批程序有专门规定,并有固定的代号,格式整齐划一;(2)一个标准一般只能解决一个问题;(3)时效性强;(4)不同种类、不同级别的标准在不同范围内执行;(5)有一定的法律效力和约束力;(6)有自身的检索系统。中国标准概况*1957年中国成立了国家标准局,并于1958年颁布了第一批国家标准;*1978年成立国家标准总局,1979年颁布“中华人民共和国标准管理条例”*1978年中国标准化协会(CAS)加入了国际标准化组织(ISO)*中国标准的等级:国家标准、行业标准、地方标准、企业标准*中国标准的分类:按《中国标准文献分类法》学位论文学位论文是指高等院校和科研单位中的本科生、研究生为获得学士、硕士和博士学位,在导师指导下完成的科学研究、科学试验成果的书面报告。*1180年巴黎大学授予了第一批神学博士学位。*学位论文答辩制度是由德语国家首创的。信息资源的类型

2、按信息加工层次分类零次信息(灰色信息):是指未经过任何加工的原始文献,如实验记录、手稿、原始录音、原始录像、谈话记录等。一次信息(原始信息):是指作者以本人的观察、发现及研究成果为素材而创作或撰写的文献,如阅读性图书、期刊论文、科技报告、专利文献、会议文献、学位论文、技术档案等都是一次文献。

信息资源的类型

2、按信息加工层次分类(续)二次信息(检索性信息):是人们对一次信息进行搜集、提炼、浓缩、加工、整理,并按一定的科学方法组织编排后,便于存储和检索的信息。二次信息的主要用途是报道、检索、管理、控制一次信息。如各种目录、题录、文摘及机读型书目数据库、网上检索引擎等都属于二次信息。三次信息(参考性信息):是指对有关的一次信息和二次二次进行分析、研究、对比、综合、评述、概括而撰写的信息,如综述、述评、年度进展报告、百科全书、手册、年鉴、辞典等。其特点是文字精炼、叙述简明扼要,具有系统性、综合性、知识性和工具性等特点。信息资源的类型

2、按信息加工层次分类(续2)以上三级信息资源的关系:

零次信息是一次信息的素材;

一次信息是二次、三次信息的来源和基础;

二次、三次信息是对一次信息进行组织、加工、综合后形成的所谓“信息检索”主要是对二、三次信息的检索。有益信息:对社会发展有积极作用的、能够消除人们对未知事物不确定性的信息,它是人类社会的资源和财富。无用信息:指对信息使用者所从事的某种活动没有作用的、多余的信息。有害信息:指对社会发展和信息用户有消极和阻碍作用的不真实或庸俗、媚俗的信息,主要有虚假信息和色情信息等。信息资源的类型

以信息的逻辑意义和利害关系划分信息资源的开发和利用信息资源开发潜在信息资源开发如市场调查、社会调查现实信息资源开发文献信息资源开发如文献数据库、文献索引,资料汇编网上信息资源开发如网络搜索引擎,行业或专业门户网站,数据挖掘产品,行业研究报告信息检索的定义和分类信息检索:简单地说就是将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。信息检索的类型,按检索手段分为:(1)手工检索(简称手检):例:以前到图书馆使用卡片目录找书。(2)计算机检索(简称机检):又分为几个阶段:脱机信息检索、联机信息检索、光盘信息检索、网络信息检索。按信息检索手段划分:(1)传统信息检索:就是手工信息检索,是利用各种印刷型检索工具来查找文献的一种方法。(2)现代信息检索:现代信息检索即计算机信息检索,是指利用计算机和网络来处理和查找文献信息的检索方式。1.6信息检索原理原始信息检索课题主题概念分析课题内容分析检索语言(主题法、分类法等)信息标引标识检索标识检索工具和系统检索结果信息存储过程信息检索过程文献检索的步骤1、明确检索要求2、选择检索工具:根据课题要求及检索工具的特点和检索者的外语水平选择最合适的检索工具。3、选择检索途径:一般检索工具都有分类目次、著者、主题词等检索标志。4、查找文献线索:将检索词与检索工具中的文献标志进行比较而决定文献的取舍过程。5、找到原始文献:根据文献线索提供的文献出处,再利用馆藏目录查找文献收藏单位,而后复制。1.7检索语言1.7.1检索语言的概念

检索语言是用来描述文献内部特征、外表特征和表达信息提问的一种人工语言。检索语言是保证和检索一致的一种共同性的人工语言,它把文献的存储与检索联系起来,使文献的标引者和检索者取得共同理解,从而实现检索。检索语言是应文献信息的加工、存贮和检索的共同需要而编制的专门语言,它是表达概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。1.7检索语言1.7.2检索语言的类型1.7检索语言1.7.3主题语言

主题语言,也称主题法,是一种用语词标识处理原始信息、组织主题检索工具或检索系统的检索语言。主题语言又分为标题词语言、单元词语言、关键词语言和叙词语言。1.7检索语言关键词语言

关键词语言是直接选用文献信息中的自然语言作基本词汇,并将那些能够揭示文献信息题名或主题意旨的关键性自然语词作为关键词进行标引的一种检索语言。1.7检索语言叙词语言

叙词语言是以自然语言词汇为基础,以概念组配为基本特征,适应现代信息需求而发展起来的一种信息检索语言类型。叙词又称描述词、叙述词,是以概念为基础,经过优选和规范化处理并具有概念组配和词间语义关系显示功能,用以表达文献主题和检索需要的语词。叙词语言的特点:直观,专指性强,组配性高,结构严谨,标引能力强。叙词语言示例:《汉语主题词表》、英国《科学文摘》使用的《INSPECThesaurus》、美国《工程索引》93年后使用的《EiThesaurus》等。1.7检索语言

《INSPECThesaurus》叙词主表Laserbeammachining激光发热切割器

UFLaserdrilling激光钻孔器Lasermachining激光切割器Lasertrimming激光整修BTLaserbeamapplications激光发热应用Machining制造TTLasterbeanapplications激光发热应用Manufacturingprocesses加工过程RTLaserbeametching激光发热雕刻Lasermaterialsprocessing激光材料制作Micromachining微切削加工CCB0170G;B2575F;B4360B;B8620;C3355C分类号DTJuly1973使用年PTLaserbeamapplications激光的发热应用Machining制造1.7检索语言

《INSPECThesaurus》

叙词主表:按叙词的英文字顺排列,每个叙词下都列出该词的使用范围说明、使用时间、上位词、下位词等相关信息,检索者根据从叙词表中获得的主题词信息,可以相应扩大或缩小检索用词范围,达到最佳检索效果。1.7检索语言主题语言的优缺点优点不必知道学科门类,只需使用关键性词汇进行标引。简单直接,不像分类语言需要转换为分类号。能形成专指度高的检索标识,查准率高。主题词在词表中按照字顺排列,没有等级性,便于增删、修改。规范化主题语言有一套较完整的参照系统,能显示词间关系,可供扩检和缩检用。1.7检索语言主题语言的优缺点缺点分散文献学科体系。词表收录有限,很多概念在词表中没有反映。表达概念的受限,词汇转换的失真,标引、检索前处理量大且难以达到统一。查全率低。1.7检索语言1.7.4分类语言

分类语言,又称分类法,是将文献主题概念按知识学科性质进行分类和系统排列,并用号码(分类号)表达各种概念的检索语言,包括体系分类法和组配分类法。54文献信息分类语言分类语言是一种按学科范畴和体系来划分事物的检索语言国内

《中国图书馆分类法》[中图法]

《中国科学院图书馆图书分类法》[科图法]

《中国人民大学图书馆图书分类法》[人大法]

《中国图书分类法》台湾赖永祥编订国外

《杜威十进分类法》[DDC]

《国会图书馆分类法》[LCC]55《中图法》结构示意图A马克思主义、列宁主义毛泽东思想、邓小平理论B哲学、宗教C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学、安全科学Z综合性图书U1综合运输U2铁路运输U4公路运输U6水路运输[U8]航空运输U41道路工程U44桥涵工程U45隧道工程U46汽车工程U48其他道路运输工具U49交通工程与公路运输技术管理U441结构原理、结构力学U442勘测、设计与计算U443桥梁构造U444桥梁建筑材料U445桥梁施工U446桥梁试验观测与检定U447桥梁安全与事故U448各种桥型U449涵洞工程

基本大类简表详表A马克思主义、列宁主义毛泽东思想、邓小平理论B哲学、宗教C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学、安全科学Z综合性图书F经济F0经济学F1世界各国经济概况、经济史、经济地理F2经济计划与管理F20国民经济管理F21经济计划F22经济计算、经济数学方法F23会计F230会计学F231会计簿记方法F232会计设备F233会计工作组织与制度F234各种会计和簿记F234.1社会会计F234.2成本会计F234.3管理会计F234.4财务会计F234.5国际会计

…..F3农业经济F4工业经济57中国科学院图书馆图书分类法简表(第三版)00马克思列宁主义毛泽东思想10哲学20社会科学(总论)21历史、历史学27经济、经济学31政治、社会生活34法律、法学36军事、军事学37文化、科学、教育、体育41语言、文字学42文学48艺术49无神论、宗教学50自然科学(总论)51数学52力学53物理学54化学55天文学56地球科学(地学)58生物科学61医药、卫生65农业科学66农作物67园艺68林业、林业科学71工程技术72能源学、动力工程73电技术、电子技术74矿业工程75金属学(物理冶金)76冶金学77金属工艺、金属加工78机械工程、机器制造81化学83食品工业85轻工业、手工业及生活供应技术86土木建筑工程87运输工程90综合性图书58人大法简表1.马克思主义、列宁主义、毛泽东思想2.哲学3.社会科学、政治4.经济5.军事6.法律7.文化、教育、科学、体育8.艺术9.语言、文字10.文学11.历史12.地理13.自然科学14.医药卫生15.工程技术16.农业科学技术17.综合参考59《中国图书分类法》(台湾)000总论100哲学200宗教300自然科学400应用科学600历史、地理700历史、地理800语文900美术310数学320天文330物理340化学350地质360生物、博物370植物380动物390人类学410医学420家政430农业440工程450矿冶460化学工业470制造480商业490商学441土木工程442道路工程443水利工程444船舶工程445市政工程446机械工程447陆空交通448电气工程449核子工程1.7检索语言《杜威十进分类法》(DDC)

《杜威十进分类法》:1873年美国图书馆学家杜威所创,目前该分类法已经被翻译成30多种语言,在全球超过135个国家的20多万个图书馆使用,在美国,95%的公共图书馆,25%的学院图书馆大学图书馆以及20%的专门图书馆使用该分类法。61《杜威十进分类法》(DDC)000总论100哲学200宗教300社会科学400语言500自然科学600应用科学700艺术800文学900历史、地理510数学520天文学530物理学540化学550地球科学560古生物学570生命科学580植物学590动物学621应用物理学622采矿623军事及航海工程624土木工程625道路工程627水力工程628卫生及市政工程629其它工程610医学620工程与应用科学630农业640家政650管理科学660化学工业670制造业680特种制造业690建筑《杜威十进分类法》(DDC)310普通统计学000总类320政治学371学校管理100哲学类330经济学特殊教育200宗教类340法律372初等教育300社会科学类350公共行政管理373中等教育400语言类360社会机构社会团体374成人教育500纯科学类370教育375课程600应用科学类380商务、通讯、运输376妇女教育700艺术类390习俗、礼仪、民俗377学校与宗教800文学类378高等教育900地理历史类379政府法规

63《美国国会图书馆分类法》(LCC)A综合性类目B哲学、宗教C历史-辅助科学D历史与地方志(美洲以外)E~F美洲历史与地方志G地理学、人类学H社会科学J政治学K法律L教育M音乐N艺术P语言、文字学Q自然科学R医学S农业、矿业T工业技术U军事科学V海军Z目录学、图书馆学QA数学QB天文学QC物理学QD化学QE地质学TA工程总论TC水力工程TD卫生工程和市政工程TF铁道工程和运输TG桥梁工程TH建筑工程641.3.2网络信息分类[很多情况下并不很清楚自己的信息需求,或者无法清楚表达信息需要,需要通过类目浏览,获得一些基本信息,然后再选择检索关键词]搜索引擎【目录

专题网站】

google网页目录

搜狗目录学科信息门户

/

/开放目录

/

/

特殊资源分类[电影分类/软件分类/商业分类]651.3.3数据库信息分类如《CNKI中国学术文献网络出版总库》

信息检索类型●根据检索对象的不同可以划分为:文献检索、事实检索、数据检索。●根据信息检索结果的内容可以划分为:书目检索、数据检索、全文检索、事实检索、声像检索。●按照信息检索技术的发展可划分为:全文文本检索、多媒体检索、超文本检索、网络信息检索资源检索。(一)文献检索(DocumentRetrieval)

文献检索是以查找文献线索为对象的检索。从文献中查出关于某一主题、某一著者、某一机构、某一地域、某一时代的有关信息以及查找某篇论文出处以及某一出版物的收藏处等均属文献检索范畴。馆藏文献信息资源的组织和分类1.文献的组织TG659/64索书号TG659分类号加工中心培训教程王荣兴主编北京:2006.5,机械工业出版社,5000册,16K,48元索书号——是索取文献的号码。包括分类号(TG659)和种次号(64)

2.文献资源的分类

文献的分类是指按照文献所反映内容的学科性质和其它特征的异同分门别类地整理和组织文献的过程。为了对文献进行分类而制定的各种分类标准称为文献分类法。进行分类的工具书(1)《中图法》(2)《科图法》(3)《人大法》(4)DDC(DeweyDecimalClassification)杜威十进分类法(5)UDC(UniversalDecimalClassification)国际十进分类法(二)事实检索是信息检索中最复杂的一种。(三)数据检索包括数值、参数、常数、公式、化合物分子式、化学结构、产品名称、规格、市场行情、图表、各种统计数据(四)书目检索书目检索指查出某一主题的文献条目的检索,按检索结果可分为题录检索、文摘检索、图书与期刊等目录检索。(五)声像检索声像检索主要是指对声音、图像和其他图文信息的检索。(六)全文检索全文检索是指利用原始文献库进行的检索,检索的结果可以是原始文献的全文,也可以是其部分内容。(七)全文文本检索

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论