网络信息资源管理_第1页
网络信息资源管理_第2页
网络信息资源管理_第3页
网络信息资源管理_第4页
网络信息资源管理_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络信息资源管理1第1页,课件共56页,创作于2023年2月网络信息资源有哪些?网站,社区,微博网络信息资源的获取网络信息资源的传输网络信息资源的存储网络信息资源的分析网络信息资源的使用网络信息资源的维护2第2页,课件共56页,创作于2023年2月9.1网络信息资源概述目前关于信息资源的含义有很多不同的解释,但归纳起来主要有两种:一是侠义的理解,认为信息资源就是指文献资源或者数据资源,或者各种媒介和形式的信息的集合,包括文字,声像,印刷品,电子信息,数据库等,这都是限于信息本身。二是广义的理解,认为信息资源是信息活动中各种要素的总称,包含了信息相关的人员,设备,技术和资金等各种资源。3第3页,课件共56页,创作于2023年2月网络信息资源可以理解为“通过计算机网络可以利用的各种信息资源的总和”。作为知识经济时代的产物,网络信息资源也称虚拟信息资源,它是以数字化形式记录的、以多媒体形式表达的、存储在网络计算机的磁介质,光介质以及各类通讯介质上,并通过计算机网络进行传递信息内容的集合。简言之,网络信息资源就是通过计算机网络可以利用的各种信息资源的总和。4第4页,课件共56页,创作于2023年2月9.1网络信息资源概述网络信息资源有狭义与广义之分。狭义的网络信息资源通常指在各种网络(包括互联网、局域网)上可以利用的、能满足广大用户科研与工作需求的各种信息资源的总和。广义的网络信息资源指所有互联网上的信息资源,包括技术,各种设备、标准规范等,5第5页,课件共56页,创作于2023年2月9.1.1网络信息资源的分类与组织网络信息资源的特点网络信息资源作为一种新型的信息源,有不同于传统信息资源的特点,主要表现在数量、结构、分布、类型、传播范围、载体形态、控制方式等方面。6第6页,课件共56页,创作于2023年2月以网络为传播媒体传播迅速,数量大,增长快内容丰富、形式多样信息组织的局部有序性与整体无序性并存信息质量良莠不齐结构复杂、分布广泛信息资源组织方式非线性化分布式存储、但关联程度强9.1.1网络信息资源的分类与组织7第7页,课件共56页,创作于2023年2月9.1.1网络信息资源的分类与组织网络信息资源的分类网上信息资源浩如烟海,可以从不同的角度进行划分和归类。依据不同的标准,网络信息资源可分成不同的类型,较典型的有如下几种。按信息资源的媒体形式,分为:文本信息图片信息。音频信息视频信息三维虚拟影像8第8页,课件共56页,创作于2023年2月9.1.1网络信息资源的分类与组织按照人类信息交流方式,可将网络信息资源分为:非正式出版信息半正式出版信息正式出版信息。按信息内容的表现形式和用途,可分为:全文型的事实型的数值型实时活动型其他类型:如图形、音乐、影视、广告等各种媒体

9第9页,课件共56页,创作于2023年2月9.1.1网络信息资源的分类与组织按信息来源划分,可分为政府信息资源公众信息资源商用信息资源按信息时效划分,可分为电子邮件型信息资源图书馆目录资源书目与索引资源全文资料及电子出版物资源数据库信息资源10第10页,课件共56页,创作于2023年2月9.1.1网络信息资源的分类与组织按网络传输协议划分,可分为www信息资源Telnet信息资源FTP信息资源用户服务组信息资源Gopher信息资源其他分类方法IDGBookWorldWide1996年出版的《WWW指南》就将网络信息资源进行混合分类,它以学科领域为依据将网络信息资源分为57类日本的户田慎一把网络信息资源分成7类网络信息资源按信息源提供信息的加工深度分,可分为一次信息源、二次信息源、三次信息源等

11第11页,课件共56页,创作于2023年2月网络信息资源的组织是指人们根据网络信息本身的特征,运用各种工具和方法,对网络信息资源进行加工、整理、排列、组合,使之有序化、系统化、规律化,从而利于网络信息的存储、传播、检索、利用,以满足人们的网络信息需求的活动过程。网络是网络信息资源的载体,由于载体的特殊性而呈现出独特的组织形式。有学者结合网络信息资源组织开发形式的现状,将网络信息资源组织与开发形式归纳为超文本方式、搜索引擎方式、指引库方式、元数据方式、图书馆编目方式等。9.1.2网络信息资源的组织方式

12第12页,课件共56页,创作于2023年2月9.1.2网络信息资源的组织方式文件方式文件方式是网上数字化信息资源的一种主要存储形式。以文件方式组织网络信息资源有如下优势简单易操作文件是存储非结构化信息的单位13第13页,课件共56页,创作于2023年2月9.1.2网络信息资源的组织方式文件方式是网络信息资源组织的简单方式。随着网络信息、资源利用的不断普及和信息量的不断增多,以文件为单位共享和传输信息的不足逐步显现。随着网络信息资源利用的普及和信息量的增加,以文件来传递信息会使得网络的负载量越来越大。对结构化信息组织与管理显得不足。随着以文件形式保存和管理的信息资源的增多,文件本身也需要作为对象来管理。14第14页,课件共56页,创作于2023年2月9.1.2网络信息资源的组织方式超文本方式超文本是一种将网上相关文本的信息有机地组织在一起,以节点为基本单位,节点间以链路相连,将信息组织为网状结构的组织方式。人们可以通过高度链接的网络在各种信息库中自由航行,找到所需要的各种媒体形式的信息。超媒体的优势在于:非线性编排,符合人们思维联想和跳跃的习惯;节点中的内容可多可少,结构可以任意伸缩,具有良好的包容性和扩充性;可组织各类媒体的信息,方便地描述和建立各媒体信息之间的语义联系,超越了媒体类型对信息组织的限制;通过链路浏览的方式搜索信息,将信息控制机制融合进系统数据中,避免了检索语言的复杂性。

15第15页,课件共56页,创作于2023年2月9.1.2网络信息资源的组织方式超文本方式同样有它的局限性:它在文本之间的来回跳跃链接,很容易打断读者的思路,分散读者的注意力,甚至可能使读者被五花八门的链接牵着鼻子走而偏离了信息浏览查询的初衷。由于超文本方式本身的特点,一组逻辑与联系较强的信息往往由各个节点,多个web页组成,从而导致用户在浏览和查询时,难以从整体上把握节点和页面的完整的逻辑关系,检索结果往往失去整体性和全局性。很难保存遍历过程中所有的历史记录,故无法在需要时立即返回到曾经浏览过的某一节点,即出现“迷航”现象。16第16页,课件共56页,创作于2023年2月9.1.2网络信息资源的组织方式数据库方式所谓数据库方式,就是将网络信息资源以固定的记录格式存储,并提供一些检索入口,用户通过检索入口,就可以找到所需要的信息线索,并利用超级链接功能直接链接到相关站点或一次信息本身的方式。利用数据库技术组织网络信息资源具有如下优势对大量的结构化数据的处理效率有了很大的提高数据的最小存取单位是信息项(字段),可以根据用户需求灵活地改变查询结果集合的大小,从而大大降低了网络数据传输的负载以数据库技术为基础已建立了大量的信息系统,形成了一整套系统分析、设计与实施的方法,为人们建立网络信息系统提供了现成的经验和模式

17第17页,课件共56页,创作于2023年2月9.1.2网络信息资源的组织方式以数据库方式组织网络信息资源,其不足之处在于:对非结构化信息的处理困难较大,对网络环境中日益增加的多媒体信息及表格程序、大文本等非结构化信息的组织处理能力较差无法有效处理结构日益复杂的信息单元缺乏直观性和人机交互性

为了满足利用数据库技术处理非结构化文本信息的需要,人们试图对全文文本进行结构化处理,并用数据库技术对经过处理的文本信息进行管理,称之为“全文数据库”。

18第18页,课件共56页,创作于2023年2月9.1.2网络信息资源的组织方式搜索引擎方式

自动搜寻工具主要有自动搜寻网络资源、自动索引、自动摘要、提供检索方法和用户界面等功能。由于是自动搜寻,故这种方式的不足之处是收录的信息良莠不齐耗费大量的计算机资源查全率高但查准率低搜索引擎“命中”的网上一次信息动辄上百成千,因此越来越多的搜索引擎提供二次检索功能,以及对检索结构进行再处理的功能。

19第19页,课件共56页,创作于2023年2月9.1.2网络信息资源的组织方式目录指南方式

目录指南方式,又可称为主题树方式,组织信息资源的方法是将信息资源按照某种事先确定的主题分门别类地加以组织,用户通过浏览的方式层层遍历,直到找到所需的信息的线索,再链接到相应的网页。目录指南方式的优点是信息的专题性较强,信息质量高,且能较好地满足族性检索的要求用户按照规定的范围和分类体系,逐级查看,按图索骥,目的性强,查准率高屏蔽了网络资源系统相对于用户的复杂性,提供了一个基于树浏览的简单易用的网络信息检索与利用界面,并且具有严密的系统性和良好的可扩充性

20第20页,课件共56页,创作于2023年2月9.1.2网络信息资源的组织方式目录指南方式的不足主要体现在:很难确定一个全面的范畴体系作为目录指南结构的基础来涵盖所有的网络信息资源。用户为了迅速地找到所需信息还须对相应的体系有较全面的了解,这就增加了用户的智力负担。要保证目录结构的清晰性,每一类目下的条目也不宜过多,这就大大限制了所能容纳网络信息资源的数量。因此,目录指南结构不适合建立大型的综合性的网络资源系统。但在建立专业性或示范性的网络信息资源体系时,就显示出其结构清晰、使用方便的优点。21第21页,课件共56页,创作于2023年2月9.1.2网络信息资源的组织方式图书馆编目方式目前,图书馆编目已成为一种组织网络信息资源的重要方式,它用传统的机读目录格式来组织整理网络信息资源。网上资源编目需要精干的咨询机构、自动化系统的专门知识、馆藏发展与参考部门的共同合作,才能为用户提供最为有效的目录产品。采用馆内合作的方式对网上资源进行编目,分为三个步骤:①由负责馆藏建设的馆员选择网上资源,填写“网络资源著录申请表”;②由编目人员根据MARC/AACRII对网上资源进行编目;③由自动化系统工作人员将确切的网址和检索方式添加到856字段中。由于网上信息常常修改、变动,故人们要时刻关注856字段相关内容的变化,这并不是一件容易的事。22第22页,课件共56页,创作于2023年2月9.1.2网络信息资源的组织方式数据库与超媒体结合方式数据库技术与超媒体技术的结合,是网络信息资源组织与开发技术的发展趋势两者的结合途径从当前来看,通常是将数据库作为超媒体系统的一个节点来进行处理。在这种方式中,数据库看成超媒体系统中一个独立的特殊节点,由特殊的链接将数据库节点和其他的超媒体节点相连。其具体实现方法有:CGI(CommonGatewayInter-face)方法WebAPI(ApplicationProgramInterface)方式ActiveX技术

JDBC(JavaDatabaseConnectivity)技术23第23页,课件共56页,创作于2023年2月9.1.2网络信息资源的组织方式从网络信息组织对象的范围看,网络信息组织的模式可以划分为4个层次:

第一个层次为微观的组织模式第二个层次为中观的组织模式,第三个层次为宏观的组织模式,第四个层次为对网络信息进行分布式组织的数字图书馆,其组织的资源己经远远超出网上信息的范围。24第24页,课件共56页,创作于2023年2月9.1.3网络信息资源组织的三个层次语法信息、语义信息和语用信息分别对应着信息的形式、内容和效用三个层次,与此相关,语法信息组织、语义信息组织和语用信息组织也就形成了网络信息组织方法的三个层次。语法信息组织是以信息的形式特征为依据序化信息的方法。语义信息组织是以信息的内容或本质特征为依据序化信息的方法。语用信息的组织是以信息的效用特征为依据序化信息的方法。25第25页,课件共56页,创作于2023年2月9.1.4信息系统资源组织的发展趋势理想的网络信息组织模式应是以用户为中心,遵循系统性、实用性、易用性原则,综合运用自然语言和人工语言,充分利用新兴技术和人们经验的积累,朝着更符合用户需要的方向发展。网络信息资源组织模式的发展呈现在以下几个方面。信息描述标准化组织技术智能化用户界面可视化组织方法多样化面向内容的信息组织面向对象的信息组织

组织活动合作化26第26页,课件共56页,创作于2023年2月9.2网络信息资源管理的相关技术超文本标记语言(HTML)HTML是一个简单的标记语言,它主要用来描述Web文档的结构,HTML文档由两部分组成:一种是HTML标记(tag);另一种是普通文本。27第27页,课件共56页,创作于2023年2月9.2网络信息资源管理的相关技术HTML的弊端主要表现在:难以扩展交互性差语义性差是一种表示技术,它包含了关于如何显示信息的标签,但是标签和数据是结合在一起的,很难进行分割不允许用户对数据进行变换以便进一步进行处理对数据只提供了一个“视图’,如果你想要得到不同的视图的话,你必须重新生成一个HTML网页;格式既不适合机器分析也不适合人阅读它的源码,而且它的格式要求比较松散,HTML解释器采用的是尽量解释的机制。

28第28页,课件共56页,创作于2023年2月9.2网络信息资源管理的相关技术可扩展标记语言(XML)XML的组成元素

模式(Schema)可扩展样式语言(XSL,ExtensiblestylesheetLanguage)可扩展链接语言(XLL,ExtensibleLinkLanguage)

XML是建立在数据由它的创建者和维护者管理这一信念的基础上的,对于那些准备提供内容的个人或团体将可以从中得到最好的数据格式服务。因此,它被认为是“21世纪Web领域的世界语”。29第29页,课件共56页,创作于2023年2月9.2网络信息资源管理的相关技术XML的出现大大弥补了HTML和SGML的局限性,主要表现在:

XML可以用于本地计算的数据XML可以为用户提供正确的结构化数据视图XML允许集成不同来源的结构化数据XML描述来自多种应用程序的数据XML通过粒度更新来提高性能

XML的特点

跨平台性自描述性灵活性

30第30页,课件共56页,创作于2023年2月9.2网络信息资源管理的相关技术XML的优势

设计与特定领域有关的标记语言异质系统间的通信开发灵活的Web应用软件在Web上发布数据更有意义和更准确的搜索提供多语种支持31第31页,课件共56页,创作于2023年2月9.2网络信息资源管理的相关技术元数据(Metadata)

元数据的概念:元数据即英文的Metadata。是关于数据的数据(dataaboutdata)。IFLA将Metadata定义为:“描述数据的数据,可用来协助对网络电子资源的辨识、描述、指示其位置的任何数据”。目前出现了很多种元数据规范,还有许许多多应用于各个专业领域的Metadata标准。在众多的元数据标准中,都柏林核心元数据已成为国际上最通用的元数据,也是万维网联盟(W3C)推荐的元数据标准口。32第32页,课件共56页,创作于2023年2月9.2网络信息资源管理的相关技术元数据在网络信息资源整合方面的作用有:描述(Description)定位(Location)发现(Discovery)评估(Evaluation)选择(Selection)从系统的角度审视元数据,元数据的功能还包括提供浏览及检索的功能、管理功能以及组合各个对象以及藏品的再呈现等。33第33页,课件共56页,创作于2023年2月9.2网络信息资源管理的相关技术资源描述框架(RDF)

资源描述框架ResourceDescriptionFramework,简称RDF应运而生,为多种元数据的交互操作性提供平台。资源描述框架使用XML作为交换和加工元数据的通用语法。RDF是由W3C组织开发的一种元数据格式,它的模型结构包括资源(Resources)、属性(Properties)和声明(statement)三种对象,采用“资源一属性一属性值”的“主谓宾”结构(或称三元组),提供一种框架容器,并通过XML定义了一套形式化的方法,为机器语义理解的结构基础。34第34页,课件共56页,创作于2023年2月9.2网络信息资源管理的相关技术目前RDF应用于:资源发现,以使搜索引擎功能更强定位(Location)智能软件,实现知识的共享与互换描述站点及其相关的内容,即站点编目等RDF有两个重要特点:独立性,它可以嵌入DC元数据,也可以嵌入别的类型的元数据。使用XML作为其描述语法,xML摒弃了SGML过于复杂及不利于在Web上传送的选项功能,又弥补了HTML过于简单的不足,是目前最具发展前景的标记语言。35第35页,课件共56页,创作于2023年2月9.2网络信息资源管理的相关技术本体(Ontology)Studer等认为ontology是共享概念模型的明确的形式化规范说明。这包含4层含义:概念模型(conceptualization)明确(explicit)形式化(formal)共享(share)Ontology的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。36第36页,课件共56页,创作于2023年2月9.3.1网络信息资源的检索网络信息检索自身的特点主要表现在:必须借助网络检索工具。基于超文本结构。检索方法的多样性。多媒体检索。37第37页,课件共56页,创作于2023年2月9.3.1网络信息资源的检索网络信息检索的一般步骤有七个主要过程:明确检索需求。确定检索范围。确定有效的检索词。构造合适的检索表达式。选择合适的检索工具。正式检索。评价检索结果。38第38页,课件共56页,创作于2023年2月9.3.1网络信息资源的检索网络信息资源的一般查询方法有:基于超文本的信息检索基于目录的信息检索基于搜索引擎的信息检索39第39页,课件共56页,创作于2023年2月9.3.1网络信息资源的检索影响网络信息检索的因素:信息资源质量检索软件用户水平等40第40页,课件共56页,创作于2023年2月9.3.1网络信息资源的检索信息资源质量对信息检索的影响:信息资源收集不完整、不系统、不科学,导致信息检索必须多次进行,造成人力、物力和时间上的浪费。信息资源加工处理不规范、不标准、使信息检索的查全率、查准率下降。信息资源分散、无序、更换、消亡无法预测,因此用户无法判断网上有多少信息同自己需求有关,检索评价标准无法确定。41第41页,课件共56页,创作于2023年2月9.3.1网络信息资源的检索信息资源由于版权和知识产权问题,也给信息检索带来麻烦。信息的语言障碍问题。42第42页,课件共56页,创作于2023年2月9.3.1网络信息资源的检索检索软件对信息检索的影响:互联网上的信息存放地址转换和更名频繁,根据检索工具检索的结果并不一定就能获得相应的内容。基于一个较广定义的检索项,往往会获得数以千万计的检索结果,而使用户难于选择真正所需的信息。每种检索工具虽然仅收集各自范围内的信息资源,但也难免使各种检索工具的信息资源出现交叉重复现象。43第43页,课件共56页,创作于2023年2月9.3.1网络信息资源的检索用户水平对信息检索的影响:用户对信息检索需求的理解和检索策略的制定关系到信息检索的质量。用户的计算机操作能力及网络相关知识的掌握程度影响着信息检索的效率。用户对网络信息检索工具的应用熟练程度影响着信息检索的效果。用户的外语水平影响着信息检索的广度与深度。44第44页,课件共56页,创作于2023年2月9.3.2网络检索工具搜索引擎是一种信息搜索的软件。狭义理解,它是利用网络自动搜索技术(Robot)对网络资源进行搜集、标引、储存和检索的一种技术和系统。广义上,搜索引擎可以看作是提供搜索和分类导航信息查询服务的一系列网站。45第45页,课件共56页,创作于2023年2月9.3.2网络检索工具搜索引擎的类型(按检索机制划分):检索型搜索引擎:以信息查询、检索为主目录型搜索引擎:以分类目录导航为主混合型搜索引擎:分类目录和关键词检索并重评价搜索引擎的优劣查询时间短、命中率高、重复率低46第46页,课件共56页,创作于2023年2月9.3.2网络检索工具网络信息检索工具的核心是其检索功能。从现有的检索工具来看,它们都已具备诸如布尔检索、截词检索和邻近检索这些基本检索功能。47第47页,课件共56页,创作于2023年2月9.3.2网络检索工具布尔检索指通过标准的布尔逻辑关系词来表达检索词与检索词间逻辑关系的检索方法。截词检索指在检索式中用专门符号(截词符号)表示检索词的某一部分允许有一定的词形变化,因此检索词的不变部分加上由截词符号所代表的任何变化形式所构成的词汇都是合法检索词,结果中只要包含其中任意一个就满足检索要求。

48第48页,课件共56页,创作于2023年2月9.3.2网络检索工具邻近检索(proximitysearch):通过检索式中的专门符号来规定检索词在结果中的相对位置。准字段检索:虽然网络信息实际上不分字段,但是以万维网为用户界面的网络信息检索工具设计了类似于字段检索的功能。许多网络

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论