版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、信息检索概论1. 信息的概念在不同的学科领域中其概念不同辞海:信息是指对消息接受者来说预先不知道的报道。简明自然辩证法词典:信息一般泛指我们听说的消息、情报、指令、数据、信号等有关周围环境的知识。一些专家:信息是可供人们参考的事实和思想。可以理解为:信息是指信息资源(各种载体)中所包含的事物事件的事实、思想或知识,即信息载体中传递的内容,信息系统传输和处理的对象。信息2. 信息的特征可量度 可采用某种度量单位进行度量,并进行信息编码。可识别 可采取直观识别、比较识别和间接识别等多种方式来把 握。可转换 可以从一种形态转换为另一种形态。可存储 人脑、人类发明的文字、摄影、录音、录像以及计算机。可
2、处理 人脑、计算机。可传递 语言、表情、动作、报刊、书籍、广播、电视、电话等。可再生 信息经过处理后,可以其他形式再生。可压缩 可以用不同的信息量来描述同一事物。可利用 具有一定的实效性和可利用性。可共享 可以被多个用户共同享用。知识人类通过信息对自然界、人类社会及思维方式与运动规律的认识与概括,是人的大脑通过思维重新组合和系统化了的信息,是信息中最有价值的部分。知识来自于信息,知识是信息的一部分。知识一经产生,就以声像信息、实物信息、文献信息的形式加以传播。1. 文献的概念国际标准化组织的文献情报术语国际标准:在存贮、检索、利用或传递记录信息的过程中,可以作为一个单元处理的,在载体内、载体上
3、或依附载体而存贮有信息或数据的载体。我国国家标准:文献是记录有知识的一切载体。一些专家:文献是以文字、图形、符号、声频、视频、数字化等手段记录和传播知识的载体。更广义的理解:含有知识内容的信息载体就是文献。文献经人类开发与重新组织后的信息称信息资源。信息资源是信息世界中对人类有价值的那一部分信息,是附加了人类劳动的、可供人类利用的信息。构成信息资源的基本要素信息:组成信息资源的原料;人:信息资源的生产者和利用者;符号:生产信息资源的媒介和手段;载体:存储和利用信息资源的物质形式。就本课程而言,将信息资源等同于文献信息资源按表达方式和载体划分口语信息资源 讲演、授课、讨论体语信息资源 表情、手势
4、、姿态、表演、舞蹈实物信息资源 样品、模型、雕塑文献信息资源 人类用文字、数据、图像、声频、视频等方式记录在一定载体上的信息资源。只要这些载体不损坏或消失,文献信息资源就可以跨越时空无限循环地为人类所利用,还可以按人类的需求整理成具有优化结构的文献信息资源体系。 本门课程研究的主体信息资源的类型2. 缩微型以感光材料为载体,以印刷型文献为母体,采用光学摄影技术,将文字、图形、图像按规定比例缩小记录的文献形式。如缩微卡片、平片、胶卷等。优点:信息存储密度高,体积小,平均可以节约存储空间95%以上,易于传递,并且保存期较长,不易损坏和变质。缺点:必须借助缩微阅读机阅读,不便携带。3. 声像型 以磁
5、性材料或感光材料为存储载体,借助特定的设备采用磁录技术和光录技术直接记录声音信息和图像信息所形成的文献,如录音带、录像带、唱片、幻灯片等。优点:直观性强,易于接受,在传递信息知识方面有着不可替代的优势。缺点:需要借助一定的设备。4. 电子型 采用电子手段,利用计算机及现代通信方式提供信息的一种新型文献。电子出版物内容丰富,类型多。按信息存储介质划分,主要有软磁盘与光盘两大类;按出版物类型划分,主要有电子期刊、电子图书、电子报纸、电子名录、电子地图、各种联机信息库和光盘数据库或磁带、软盘等产品;按媒体的信息结构组织形式划分,主要有文本型出版物、超文本出版物、多媒体出版物以及超媒体出版物等。二、按
6、照文献的出版形式划分1. 图书(Book)将文字、图画或其他符号书写或印刷于纸张上的具有完整装帧形式的非连续出版物。图书是文献中最古老、最重要的一类。图书范围较广,包括专著、科普读物、教科书、丛书、文集、工具书等。图书的内容一般比较成熟、系统、全面。图书的著录特征(外部特征)有:书名、作者、版次、出版社、出版年、国际标准书号(International Standard Book Number,简称ISBN)、图书定价等。超星电子图书馆、读秀图书搜索参考工具书,简称工具书作为工具使用的一种特殊类型的图书用特定的编制方法,将大量分散在原始文献中的知识、理论、数据、图表等,用简明扼要的形式,全面、
7、系统地组织起来,供人们迅速查检资料线索和解决疑难问题。类型很多,主要有字典、词典、手册、百科全书、名录(人名录、地名录、机构名录)等。词典:汇集各科名词和术语,进行科学的解释,作出恰当的定义。手册:汇集某一范围内的基本知识和数据。百科全书:又称大全,系统地汇集一定领域范围内的全部知识的大型参考工具书。将搜集到的专门术语、重要名词分列条目,加以详细的叙述和说明,并附有参考文献。综合性百科全书(如大英百科全书)和专业性百科全书。期刊论文(文献)的著录格式包含作者论文的篇名(题名、题目、标题)期刊名称即刊名(外文刊名一般用缩写)卷号、期号、年、月、起止页码期刊上刊载的论文大多数是原始文献,包含许多新
8、成果、新水平、新动向从期刊上得到的科技信息约占信息来源的65%以上CNKI-中文期刊全文数据库、维普、ScienceDirect、IEEE、SCI、EI (2)报纸每期版式基本相同的、以报道新闻及其评论为主的一种定期出版物。包括日报、隔日报、三日报、周报、旬报等出版周期更短,信息传递更及时CNKI-中国重要报纸全文数据库 3. 会议文献(Conference Paper)在国内外各种学术会议上发表的文献,如论文、记录、发言、评述以及总结等。会议文献有会前和会后两个类,会前文献又称预印本,会后文献是会议结束后的正式出版物,又称会议录。科学上的许多新发现、新观点、新成果都是在学术会议上首次发表的。
9、因此会议文献具有较高的学术参考价值,是一种重要的信息资源。ISTP(科技会议录索引)、中国重要会议论文全文数据库、万方-中国学术会议论文全文库4. 学位论文著者为取得专业资格的学位而提出的,介绍他的发现与某种结论的调查或研究文献。包括博士论文、硕士论文和学士论文都是就某一专题进行研究所作的总结,对问题的论述比较详细、系统,具有一定的独创性,对科研有一定的参考价值。质量参差不齐一般不公开出版,仅由学位授予单位和国家指定单位收藏。PQDD、中国博士/优秀硕士学位论文全文数据库、万方-中国学术会议论文全文库 5. 科技报告(Technical Report)国家政府部门和科研生产单位关于某项研究成果
10、的总结报告,或是研究过程中的阶段进展报告。特点是各篇单独成册,统一编号由主管机构连续出版。比期刊论文新颖专深、详尽、可靠,出版周期短、报道速度快,能反映一个国家或某一学科领域的科研水平,是一种不可多得的信息资源。NTIS:收录国际著名的报告是美国的四大报告,即PB(Publishing Board)报告、AD(ASTIA Documents)报告、NASA(National Aeronautics and Space Administration)报告和DOE(Department of Energy)报告 6. 专利文献专利申请人向自己国家或国外的专利局提出申请保护某项发明时所呈交的一份详细
11、的技术说明,经专利局审查,公开出版或授权后所形成的文献。专利说明书在内容上具有广泛性、详尽性、实用性、新颖性、独创性。技术信息的主要来源国家知识产权局专利数据库、中国专利信息网、万方-中国专利数据库、DII 、美国专利、欧洲专利 单行本和汇编本(图书形式)两种出版发行方式其标志性著录项目有:标准号。例如,GB190(中国国家标准)万方-中外标准数据库8. 政府出版物政府部门及其专门研究机构发布或出版的文献,分为行政性和科技性两大类。行政性文件包括政府报告、会议记录、法令、条约、决议、规章制度、调查统计资料等;科技性文件包括科研报告、科普资料、科技政策、技术法则等。特点是具有正式性和权威性,通过
12、政府出版物可以了解国家的有关科技、经济发展政策以及有关研究状况,有助于正确地确定科研方向,选择课题。10技术档案技术档案是指生产建设活动中形成的对具体事物对象的真实记录材料,包括任务书、协议书、技术指标、审批文件、研究计划、方案大纲、技术措施、调查材料、试验和工艺记录等。技术档案是生产建设和科技工作的重要文献。技术档案一般由参与该技术活动的单位收藏,通常为内部使用,不公开出版发行,有些有密级限制,因此在参考文献和检索工具中极少引用。三、加工深度划分1. 零次文献还没有形成一次文献的非出版物如实验记录、设计草图、论文草稿、谈话记录、会议记录、内部档案等2. 一次文献又称原始文献(简称原文,现多称
13、全文)。作者以自己的经验和研究成果为依据而撰写的、未经加工的原始文献,不论其载体形式或出版类型如何。包括大部分期刊论文、科技报告、专利文献、会议文献、学位论文等。特点是具有新颖性、创造性、价值性和分散性等。数量庞大、种类繁多,是最基本的信息资源,是科技文献的主体,也是信息检索的主要对象。3. 二次文献按一定的方法对一次文献进行整理加工,使之有序化而形成的文献。将分散的、无组织的各类一次文献收集起来,进行加工、整理、简化和组织,作为查找一次文献的工具。包括目录、题录、索引、文摘等特点:汇集性、综合性和系统性学习信息检索主要就是学习怎样利用二次文献的方法4. 三次文献围绕某个专题或出于特定目的,根
14、据二次文献提供的线索,选用大量一次文献的内容,经过筛选、分析、综合和浓缩等深度加工而形成的文献。包括各种述评、进展报告、动态综述、专著、教科书、字典、词典、手册、年鉴和百科全书等。从一次文献到二次文献、三次文献是一个从分散到集中、从无序到有序、从片面到全面的文献加工过程。从信息检索的角度看,一次文献是检索对象,二次文献是检索手段,三次文献是信息研究的成果。1. 信息检索的概念大多数专家与文献:使用科学的方法,在文献信息集合中查找出含有自己所需信息的文献的过程。含义广义:信息检索包含信息组织、存储和信息查找、获取两个过程。狭义:信息检索仅指信息查找。信息检索拓宽知识面,改善知识结构启迪创造性思维
15、提高自学和独立工作能力避免重复研究,节省科研经费和时间信息检索的重要意义1. 按检索对象数据信息检索 以数据作为检索对象,除了各类调查数据、统计数据、特性数据,还包括图形、图表、数学表达式、化合物分子式、化学结构式等。利用各种手册、年鉴、图谱、表谱等检索系统。例如,检索“尼罗河的长度是多少”。信息检索的类型事实信息检索 以事实、事项为检索对象,一般不能通过简单检索直接提供问题的答案,而必须进行比较复杂的对比、分析、推理后才能得出最终结果。利用各种百科全书、年鉴和名录等检索系统。例如,检索“克隆羊最早是由谁研制成功的”文献检索以承载信息内容的文献为检索对象,查找原始文献或原始文献的替代品。一般以某一研究课题为需要,查找各类文献中与之相关的信息内容。例如,检索“太阳能电池”方面的文献。这里所说的“文献”是指文献单元,即包含一个完整内容的单元,如一篇论文、一本图书、一份报告等,而忽略其物理载体(如纸、磁、光
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《常规压井技术》课件
- 《电火花取断丝锥机》课件
- 电容测试仪课程设计
- 电子香烟行业研究报告
- 电子转速控制课程设计
- 电子认证行业研究报告
- 2024【合同范本】江西房屋租赁服务合同
- 电子线路设计cad课程设计
- 电子竞技产业研究报告
- 电子电工系列课程设计
- 公务员2023年国考《申论》(副省卷)题和参考答案
- 宫颈癌保留生育能力的手术
- 网页设计试题及答案
- 名创优品课件教学课件
- 2024苏教版科学小学六年级上册第5单元《科技改变生活》教学设计及教学反思
- 人教版八年级英语上册期末专项复习-完形填空和阅读理解(含答案)
- 第5课 互联网接入 教学设计 2023-2024学年浙教版(2023)初中信息技术七年级上册
- 中小学劳动教育实践基地建设标准
- 传感器技术-武汉大学
- 模块二 途中导游服务
- 2024黑龙江省交通投资集团招聘38人高频500题难、易错点模拟试题附带答案详解
评论
0/150
提交评论