版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第3章 信息存储与信息检索3.1 3.1 信息存储信息存储3.1.1 3.1.1 信息存储的作用和原则信息存储的作用和原则3.1.2 3.1.2 信息存储技术信息存储技术3.1.3 3.1.3 信息存储体系信息存储体系3.2 3.2 信息检索信息检索3.2.1 3.2.1 信息检索的作用和原则信息检索的作用和原则3.2.2 3.2.2 信息检索的过程信息检索的过程3.2.3 3.2.3 信息检索的类型信息检索的类型3.2.4 3.2.4 信息检索的效率信息检索的效率3.2.5 3.2.5 信息检索系统信息检索系统3.2.6 3.2.6 网络信息检索网络信息检索 学习目标 (1)理解信息存储、信
2、息检索的作用和原则;了解信息存储的 技术和存储体系;(2)了解信息检索的过程、类型和系统;理解信息检索的效率;(3)掌握网络信息检索的特点和原理;掌握网络信息检索的方 法和技巧。信息存储信息存储是指通过多种形式记录和排序信息的过程。是指通过多种形式记录和排序信息的过程。3.1.1 3.1.1 信息存储的作用和原则信息存储的作用和原则l信息存储的作用:(1)方便检索; (2)利于共享(3)延长寿命; (4)方便管理 l信息存储的基本原则:(1)统一性原则; (2)便利性原则(3)有序性原则; (4)先进性原则 3.1 信息存储3.1.2 3.1.2 信息存储技术信息存储技术1. 1. 信息的印刷
3、存储信息的印刷存储l造纸和印刷术造纸和印刷术的发明,对信息的存储与交流带来了深刻的影响。 l纸质文献纸质文献对信息的揭示和组织的四个基本要素:信息内容、载体材料、记录符号和记录方式。l按照文献编纂方法和出版特点划分,可将纸质文献分为图书、期刊、报纸、会议文献、科技报告、标准文献、专利文献、学位论文、产品说明书等。 3.1 信息存储2. 2. 信息的磁存储信息的磁存储l在现代信息存储技术中,磁存储是信息存储的主要手段。磁存储信息系统,尤其是硬磁盘存储系统,是当今各类计算机系统的最主要存储设备。l磁存储的特点:磁存储的特点: (1 1)长久保存、重复使用和重新记录;)长久保存、重复使用和重新记录;
4、 (2 2)多路存储;)多路存储; (3 3)存储频带宽广。)存储频带宽广。l几种主要磁存储介质:几种主要磁存储介质: (1 1)计算机磁带)计算机磁带 (2 2)硬盘)硬盘 (3 3)软盘)软盘 (4 4)移动存储磁盘)移动存储磁盘IBM System Storage TS3100 磁带库磁带库软盘软盘 移动硬盘(移动硬盘(U盘、盘、MP3)台式机硬盘台式机硬盘 3.1 信息存储3. 3. 信息的缩微存储信息的缩微存储l信息的缩微存储是用缩微摄影机将文件资料缩小拍摄 在感光胶片上,经加工处理后作为信息载体保存起来。l缩微存储技术的特点: (1)缩微品的信息存储容量大,密度高; (2)存储介质
5、占用空间小,可节省大量空间; (3)缩微品忠于原件,不易出差错; (4)保存时间长; (5)便于计算机检索。 l主要成就: (1)计算机输出缩微胶片(COM) 技术 (2)计算机输入缩微胶片(CIM) 技术 (3)计算机辅助缩微品检索系统 (4)视频缩微系统 缩微胶片阅读器缩微胶片阅读器缩微胶片缩微胶片缩微胶片扫描仪缩微胶片扫描仪3.1 信息存储4. 4. 信息的光存储信息的光存储l光存储以激光为光源,以薄膜作为信息存储材料。 l特点:特点: (1)数据存储密度高、容量大、盘片可更换、携带方便 (2)存储寿命长、功能多样化 (3)生产成本低廉、数据复制工艺简单、效率高。 3.1 信息存储3.1
6、.3 3.1.3 信息存储体系信息存储体系l计算机信息存储体系是利用计算机对一定范围内的信息集合进行选择、记录和存储,以便用户采用科学手段与技术获取必要和充分信息资源的信息系统。l从整体上看,计算机信息存储系统包括硬件、软件和数据库。 1. 1. 硬件设备硬件设备l这是计算机信息存储体系用于处理数据的各种硬设备的总称。包括:外部设备;中央处理机;主存储器;外部存储器等3.1 信息存储2. 2. 软件设备软件设备l软件设备是计算机信息存储体系中各类程序和各种文件数据的总称,分为系统软件和应用软件。 系统软件系统软件是关于组织控制计算机硬件资源协调工作的操作程序。应用软件应用软件通常包括自动标引软
7、件、词表管理软件、各种匹配程序及数据库管理程序等。 数据库管理程序数据库管理程序是计算机信息存储体系最基本、最重要的组成部分。3.1 信息存储3. 3. 数据库数据库l数据库是计算机信息存储体系的基础,也是用户进行计算机信息存储与检索的对象。l数据库的类型数据库的类型:从数据的存储方式划分,可以分为层次数据库、网状数据库和关系数据库。从数据存储的介质划分,可以分为磁带数据库、磁盘数据库和光盘数据库。 从数据类型划分,有文献数据库、数据型数据库、事实型数据库、多媒体数据库和超媒体数据库。3.1 信息存储4. 4. 数据仓库数据仓库l数据仓库数据仓库(DW)是一个面向主题的、集成的、相对稳定的、反
8、映历史变化的数据集合,用于支持管理决策,容量一般大于100GB。l数据仓库的特征:数据仓库的特征: (1) 面向主题 (2)集成的 (3)相对稳定 (4)反映历史变化 l数据仓库系统体系结构数据仓库系统体系结构( (四个层次四个层次) ) : (1)数据源(基础和源泉) (2)数据的存储与管理(核心) (3)OLAP(在线分析技术)服务器(分析) (4)前端工具(应用开发)3.1 信息存储数据库与数据仓库的比较数据库与数据仓库的比较表表比较特征比较特征数据库数据库数据仓库数据仓库设计目标设计目标面向事务设计,为捕获面向事务设计,为捕获数据而设计数据而设计面向主题设计,为分析数面向主题设计,为分
9、析数据而设计据而设计存储对象存储对象在线交易数据在线交易数据历史数据历史数据数据处理类型数据处理类型事务型数据事务型数据决策支持型数据决策支持型数据数据操作特点数据操作特点经常进行记录修改和删经常进行记录修改和删除等操作除等操作记录的修改和删除操作很记录的修改和删除操作很少少,通常,通常只需要定期的加只需要定期的加载和刷新载和刷新冗余设计特点冗余设计特点尽量避免冗余尽量避免冗余有意引入冗余有意引入冗余3.2.1 信息检索的作用和原则l信息检索信息检索是指从以任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的过程。l信息检索的作用:信息检索的作用: (1)有利于充分利用信息资源,
10、避免重复劳动。 (2)有利于缩短获取信息的时间,提高工作效率。 (3)有利于决策者进行决策。 l信息检索的基本原则:信息检索的基本原则: (1)目的性。信息检索一定要以所要达到的目的为原则,不能盲目行事。 (2)时间性。信息检索要有一个时间概念。 (3)全面性。信息检索应尽量全面系统地提供用户所需要的一切信息。 (4)准确性。信息检索的结果应该尽可能做到准确无误。 (5)规范性。信息检索应该遵循信息检索规律,按检索规则办事。 3.2 信息检索3.2.2 信息检索的过程(1 1)信息标引和存储过程)信息标引和存储过程 信息标引和存储是对大量无序的信息资源进行标引处理,使之有 序化,并按科学的方法
11、存储,形成检索工具或检索文档,即组织检索 系统的过程。(2 2)信息的需求分析和检索过程)信息的需求分析和检索过程 信息的需求分析和检索是分析用户的信息需求,利用已组织好的 检索系统,按照系统提供的方法与途径检索有关信息,即检索系统的 应用过程。3.2 信息检索l信息检索信息检索与与信息存储信息存储的关系的关系:信息检索是通过信息存取系统(即检索工具)来实现的。3.2 信息检索信息信息用户用户信息检索信息检索信息存储信息存储转换成转换成系统标识系统标识转换成转换成检索标识检索标识主题主题分析分析信信息息资资源源形形式式概概念念系系统统标标识识语语言言形形式式概概念念课题课题分析分析检检索索提提
12、问问答答复复信息集合信息集合检索检索系统系统图图3.3 信息存储与信息检索关系图信息存储与信息检索关系图3.2.3 3.2.3 信息检索的类型信息检索的类型(1 1)书目信息检索)书目信息检索 从存储有标题项、作者项、出版项或文摘项的检索系统中获取有关信从存储有标题项、作者项、出版项或文摘项的检索系统中获取有关信 息线索。息线索。 (2 2)全文信息检索)全文信息检索 从存储整篇论文、专利说明书或整本著作的检索系统中获取全文信息。从存储整篇论文、专利说明书或整本著作的检索系统中获取全文信息。(3 3)数据信息检索)数据信息检索 从存储有大量数据、图表的检索系统中获取数值性信息从存储有大量数据、
13、图表的检索系统中获取数值性信息 。(4 4)事实信息检索)事实信息检索 从存储有大量事实信息和数据信息的检索系统中获取某一事项的具体从存储有大量事实信息和数据信息的检索系统中获取某一事项的具体 答案答案 。3.2 信息检索3.2.4 3.2.4 信息检索的效率信息检索的效率l信息检索效率是研究信息检索原理的核心,是评价一个检索系统性能优劣的标准,它始终贯穿于信息存储和检索的全过程。主要有以下衡量指标: 1. 查全率(R)= 2. 查准率(P)= 3. 漏检率(O)= 4. 误检率(N)=3.2 信息检索mw1%100 xw%100mwxw1w: : 检索出的相关信息量检索出的相关信息量x: :
14、 信息库信息库中存储的相关信息量中存储的相关信息量m: : 检出检出信息总量信息总量3.2.5 3.2.5 信息检索系统信息检索系统l信息检索系统信息检索系统是拥有一定的存储、检索技术装备,存储经过加工的各类信息,并能为信息用户检索所需信息的服务系统。 l检索系统的构成检索系统的构成:信息数据库存储、检索信息的装备存储、检索信息的方法系统工作人员信息用户3.2 信息检索l信息检索系统按使用的技术手段可分为:手工检索系统u又称传统检索系统,是用人工查找信息的检索系统。其主要类型有各种书本式或卡片式的目录、题录、文摘和各种参考工具书等。 计算机检索系统计算机检索系统u又称现代化检索系统,是用计算机
15、及其网络技术、远程通讯技术、光盘技术等构成的存储和检索信息的检索系统。u计算机检索系统,按使用的设备和采用的通讯手段,可分为:联机检索系统联机检索系统光盘检索系统光盘检索系统网络检索系统网络检索系统3.2 信息检索3.2.6 3.2.6 网络网络信息检索信息检索1. 1. 网络信息检索的特点网络信息检索的特点 (1 1)网络信息检索的范围不断拓宽。)网络信息检索的范围不断拓宽。 (2 2)信息检索手段更加容易。)信息检索手段更加容易。 (3 3) 信息检索的途径更加灵活。信息检索的途径更加灵活。2. 2. 网络信息检索的原理网络信息检索的原理 网络信息的检索主要是通过网络信息的检索主要是通过搜
16、索引擎搜索引擎在在Internet上查找信息,检索上查找信息,检索原理是使用原理是使用Robot(一种搜索程序,名字叫网络蜘蛛,类似的软件还有(一种搜索程序,名字叫网络蜘蛛,类似的软件还有Spider,Crawler,Wander 等)来遍历因特网,将等)来遍历因特网,将WWW上分布的信息上分布的信息下载到本地文档库,然后对文档内容进行分析并建立索引,对于用户提下载到本地文档库,然后对文档内容进行分析并建立索引,对于用户提出的查询提问,搜索引擎通过查找索引找出匹配的文档或链接,再返回出的查询提问,搜索引擎通过查找索引找出匹配的文档或链接,再返回给用户。给用户。3.2 信息检索l目前搜索引擎搜索
17、引擎主要通过两种技术实现信息检索: (1 1)使用网站分类技术)使用网站分类技术把网站进行树状归类,对每个网站都有简略的描述。 (2 2)使用全文检索技术)使用全文检索技术全文处理的对象是文本,通过网页抓取程序对大量网页数据建立由字(词)组成的倒排索引,以便用户用关键词对文档进行查询,系统则返回含该关键词的网页。 3.2 信息检索3. 3. 网络信息检索的方法网络信息检索的方法 (1 1)直接访问信息源)直接访问信息源直接通过直接通过IP IP 地址、域名打开网站或网页。地址、域名打开网站或网页。 (2 2)借助网络检索工具查找信息)借助网络检索工具查找信息网络检索工具网络检索工具是经专业人员
18、对网络信息资源的采集、组织、评价、过滤、控是经专业人员对网络信息资源的采集、组织、评价、过滤、控制、检索等手段的全面把握而开发出的可供浏览和检索的网站资源主题指南。制、检索等手段的全面把握而开发出的可供浏览和检索的网站资源主题指南。 (3 3)利用搜索引擎进行信息检索)利用搜索引擎进行信息检索搜索引擎搜索引擎是能进行关键词、词组或自然语言检索的工具。用户提出检索要求,是能进行关键词、词组或自然语言检索的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户。搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户。 (4 4)利用大型专业数据库搜索)利用大型专业数据库搜索 (5 5)通过新闻组搜索)通过新闻组搜索新闻组新闻组(英文名(英文名Usenet 或或News Group),简单地说就是一个基于网络的计),简单地说就是一个基于网络的计算机组合,这些计算机被称为新闻服务器,不同的用户通过一些软件可连接算机组合,这些计算机被称为新闻服务器,不同的用户通过一些软件可连接到新闻服务器上,阅读其他人的消息并可以参与讨论。到新闻服务器上,阅读其他人的消息并可以参与讨论。3.2 信息检索4. 4. 网络信息检索
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《幼儿教师语言领域教学知识(PCK)来源研究》
- 2024年甲乙双方二手房交易税费分摊合同
- 2024年标准食堂服务人员劳务合同版B版
- 2024年物业租赁合同中的维修责任与违约赔偿条款
- 2025测量仪器租赁合同书
- 2024年私募基金委托理财合同协议书3篇
- 2024医疗设备采购与物流配送合同书3篇
- 2025的职工持股资金信托合同范本
- 2024年快递配送与客户满意度提升合同模板3篇
- 2025私宅房屋买卖合同样本
- 9 古代科技 耀我中华(教学设计)部编版道德与法治五年级上册
- 期末 (试题) -2024-2025学年外研版(三起)英语四年级上册
- 2025届江西省景德镇市八年级数学第一学期期末质量跟踪监视试题含解析
- 小学美术桂美版三年级上册《第8课画身边的小物件》省级名师授课教案课教案获奖教案公开课教案A001
- 钢筋工程专项施工方案
- 光电子技术(第二版)全套课件电子教案板
- 统编版(2024新版)七年级上册历史期末复习全册知识点考点提纲
- Tobii-Studio-眼动仪中文使用手册
- 公司场地授权使用合同协议书
- 龙湖云河玉陛暖通系统报价(氟机)-20231107
- 相关分析spss课件
评论
0/150
提交评论