版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、(售后服务)信息整流与知识增值服务20XX年XX月多年的企业咨询豉问经验.经过实战验证可以落地机行的卓越管理方案,值得您下载拥有信息整流和知识增值服务【内容提要】本文提出数字图书馆的主要功能目标是信息整流和知识增值服务;信息和知识转换是数字图书馆的关键理论和技术问题。图书馆受到Internet的巨大冲击、不再是文献信息服务的唯壹提供者,数字图书馆如何才能挽回失去的老用户,吸引新用户?知识管理工程将使数字图书馆成为21世纪学习的大平台、文化知识的大平台和知识资源中心。【摘要题】信息服务1 数字图书馆的信息整流数字图书馆把传统图书馆的功能由信息的查询和图书资料的借阅扩展到知识服务的新阶段。实现这壹
2、宏伟目标需要解决许多技术和社会问题,其中有俩个最关键的技术是信息的整流和知识的创新。前者涉及数字图书馆的知识链建立问题,后者涉及数字图书馆的信息变换成知识的知识增值服务问题。1.1 数字图书馆的知识链数字图书馆是壹个庞大的数字资料库,包括所有资料的数字化存储,于线网上资料、多媒体资料、电子出版物等。数字图书馆根据用户对信息的不同需求,将文本、图片等原件制作成不同数字形式。壹般有纯图像形式,目录文本形式,正文图像形式,全文本形式和全文索引形式。但关键仍是知识链的建立。为实现知识链信息,数字图书馆将资源分成为元数据和对象数据。对象数据指数字化的文本、图像、声言、影像等,元数据则指那些描述和管理对象
3、的数据。对象数据分布式地存放于各地的资源站点内,元数据则集中存放于数字图书馆中心的超大规模服务器上。用户查询时,中心调度系统通过元数据来调度各对象数据库以提供服务。知识的控制单位长期停留于文献这壹级上,而人对知识的需求壹般不是以文献为单位的。早于20世纪70年代后期就有专家指出,知识的控制单位将从文献深化到文献中的数据、公式、事实、结论等最小的独立的“知识元”。壹旦实现知识的控制单位由文献深化到“知识元”,大量文献中所包含的“知识元”及关联信息间的链接将产生极大的知识增值,从而大大推进人类对知识的利用,促进新知识的创造,从而也将推动知识资源业的重大发展1。壹篇文献反映作者的科学研究成果,包含着
4、作者的知识创新的过程。于是文本结构本身就隐含着对某学科问题的知识链。假如我们把每篇文献的知识见成是人类知识结构中的壹个知识单元,知识单元和知识结构就组成了个性知识和共性知识的知识系统。个性知识体当下知识的创新上,共性知识结构则表当下知识的完整性上。于是我们就建立了个性知识和共性知识的知识链。事实上,专利文献就明显地表现了个性知识单元和人类知识结构的知识创新链关系2。数字图书馆对文本的知识标引,既体现了标引者应用学科知识结构的背景知识的能力,同时又体现了标引者识别和提炼作者的知识创新点的判断和知识组织能力。因此,是壹个知识链建立的知识增值过程。1.2 数字图书馆的知识发现知识链的建立过程是知识发
5、现和知识再组织的过程。知识发现的主要目标是采用1)有效的算法,从大量现有或历史数据集合中发现且找出最初未知、但最终可理解的有用知识,且用简明的方式显示出来。知识发现壹股包含如下几个步骤:理解相应的问题领域;(2)准备关联数据子集;(3)发现模式(数据挖掘);(4)所发现模式的后处理;(5)应用发现结果。(1)文本知识结构分析技术尽管和多媒体信息相比,文本信息显得比较普通,但文本仍然是记载和传播信息的最主要媒体,因此对文本信息知识发现技术的研究具有十分重要的意义和广泛的应用前景。文本结构分析的目的于于发现文本表达主题概念的物理组织结构,由物理结构自动重组主题概念的逻辑结构,实现对文本知识的抽象化
6、和具体化推理检索。文献3把文本结构分成物理结构和逻辑结构。物理结构=标题,段落,句子,词汇,它表示了文本的组成情况。可采用向量空间模型表示文本及文本各个部分,进行文本结构分析,其中主要是文本的层次分析,从而得到文本的逻辑结构。逻辑结构=主题,层次,段落,句子,主题词,它更着重于表示文本所包含的思想内容和表达的逻辑方式。(2)知识链结构文本的物理结构是文本的外表形式,逻辑结构体现了作者表达目的的逻辑顺序,而文本的知识链结构则是作者的目的和灵魂,知识链结构=问题,已有解的优缺点,新解的方案,性能评价,今后方向。研究文本的目的是为了获得文本的知识链,以创建新的知识链。链,表现了引用文献和被引用文献之
7、间的多种关系。但它且不完全直接表现知识链关系。文献链是壹种庞大的文献引用系统。知识链则是壹种巨大的知识引用系统。若能完成这壹巨大的系统,人类将可能进行更有效的知识学习。1.3 信息整流的实现知识链是文本知识结构的普遍特性,是人类学习、创新的纽带。信息整流和信息滤波不同。信息滤波的目的主要有俩点,即过滤掉不关联的文档以及将关联文档列表分为新的文档和已经查阅过的文档,且按相似度大小排序,对已检索的关联文档,通知信息Agent不必返回全文文档,以减少通信费用。信息整流的目的于于建立数字图书馆的知识链库,提供知识链服务。信息整流是建立知识链的过程。从全文提取出知识单元,形成独立的知识基础,构成知识单元
8、库,把各种知识单元库进行链接,构成数字图书馆广泛的知识网络库。知识网络库形成了学科横向交叉和学科纵向延伸的科学知识体系。描述了人类知识学习和知识创新的知识网络结点。把人类知识学习和创新活动之间的距离大大的缩短。于知识网络库中,用户能够跨知识单元库学习所感兴趣的知识,更能够通过知识单元库直接学习到解决问题的知识和办法。知识单元库的实现是知识网络库建立的基础和关键。已有的信息置标语言HTML(HyperTextMarkupLanguage)的超级链接功能使Web技术从计算机世界走向社会、走向千家万户,实现Web和数据库的超级链接。HTML表现出Web显示数据的通用方法,而XML提供了壹个直接处理W
9、eb数据的通用方法。HTML着重描述Web页面的显示格式,而XML着重描述Web页面的内容。XML是文档的各种数字表示方式,用XML表示的数字文档能够由计算机处理,也能够供人阅读。XML文档是壹种纯文本文档,能够包含图片、视频或其他多媒体信息,能够是百科全书,也能够是壹封电子邮件,或壹则天气预报、壹张电子商务交易单等。如对商品的描述中,若于应用中的名称、质量、价格仍不足以描述壹个商品的特征时,仍可通过其他模式增加新特征,只要加入的元素于它们各自名域的前后关系中是有效的。这就为知识单元的描述提供了工具,通过XML标记将文本标记成知识单元,继而将知识单元链接成知识结构,实现知识链。和引文索引不同,
10、于用XML实现知识单元的描述中,能够将被引文献中的知识单元采用指针的方式加以直接标记,于是实现了知识链接的作用。链接(Linking)是Web实现关键。HTML的链接是单向的有俩个端点源端和目标端,源端通常是Web页的壹个片段,如壹个词语、壹段文本或壹幅图像,目标端是壹个“资源”。由统壹资源标记(URI)地址指定。XML是描述结构化数据的底层文法,用这种简单文法能够支持种类繁多的应用。预计XML将成为数字图书馆信息整流的基础性语言。2 数字图书馆的知识增值服务数字图书馆不仅是传统图书馆的数字化,而且是来源极其丰富的网上资源库。通过对信息资源的深加工和合理、有效的组织,使之成为永久、有序的知识源
11、泉。数字图书馆不仅要进行信息整流,而且仍要进行知识增值服务。数字图书馆将构筑起信息和知识转换的社会大平台,为实现全民终身学习、自主学习、随时随地学习创造条件。2.1 图书馆受到Internet巨大冲击Internet正于成为世界上最大的“图书馆”。网络信息资源的迅猛扩大,越来越加深了人们对网络的依赖程度,影响和改变着人们选择信息、使用信息的行为和方式。目前,Internet上已拥有各种日报、杂志及时事快报、新书报道,世界上大多数主要的检索系统、数据库均已上网,且且向用户提供信息服务。Internet信息服务商以其雄厚的资金投入和先进的技术设备优势,面向企业、面向市场开发信息产品,图书馆不再是信
12、息服务的唯壹提供者,图书馆传统的信息产品受到巨大冲击。2.2 数字图书馆的知识增值服务数字图书馆如何才能挽回以前的老用户,且吸引更多的新用户?这是图书馆转型的根本所于,是数字图书馆建设的核心。为此,数字图书馆的服务内容和质量要比目前网上的信息服务更加独具壹格,数字图书馆要向信息实体虚拟化、信息资源数字化、信息传递网络化、信息利用共享化、信息提供的知识化方向转型发展。数字图书馆发展的优势将于什么地方?知识增值服务是数字图书馆占领知识服务市场的优势所于。数字图书馆应用系统应是可扩展的知识服务网络系统。数字图书馆对于有高价值的图像、文本、语言、音响、影像、影视、软件和科学数据等多媒体信息进行高质量的
13、加工,实现知识增值,且提供于广域网上高速横向跨库的便捷的数字知识存取服务。由此,我们能够说,数字图书馆的兴起是Internet网络技术的巨大冲击;数字图书馆的发展的强大推动力是人类知识需求速度的猛增。人类不仅需求更多的信息,而且需要更高质量的知识。数字图书馆将面向知识增值服务系统的转型发展。2.3 数字图书馆的知识创新国家创新体系的主要功能,是知识创新、知识传播、知识交换和知识利用。大力促进和提高知识的生产、传播、交换和利用的水平、规模和效率,是国家创新体系的基本任务。(1)知识创新过程知识创新是数字图书馆发展的最主要的动力源泉。信息经过加工和改造形成知识。知识是人脑创新的成果,是人类智慧的结
14、晶。智慧是人类文明的源泉,是推动历史发展的永恒动力,是生产力诸要素中的核心。知识壹般可分为陈述性知识、过程性知识和控制性知识。陈述性知识提供概念和事实,描述系统状态、环境和条件,使人们知道是什么。过程性知识提供有关状态的变化、问题求解过程的操作、演算和动作的知识。个性知识单元由最小的知识元素“知识元”组成,知识元的不同排列构成了不同知识单元之间的差异,知识元也是知识结构的最小元素,于知识结构中能够由知识元直接组成新的知识单元,这就是知识学习和知识创新的过程。(2)知识创新的度量方法于考虑知识创新度量问题时,我们应尽可能从知识单元和知识结构之间所表现的特征寻找描述度量的方法。就某壹篇文献而言,它
15、的知识包含有俩个层次。壹个是局部的,即是围绕该文本主题有关方面的判断、推理、结论等。另壹个是全局的、总体的,即是相对该学科主题现状的知识增量。比如,壹篇综述性文献,由于采用知识的提炼和合成技术,它本身的(局部的)知识容量增加了,建立了新的知识链关系,就有知识创新产生。从知识度量角度讲,我们所研究的知识是事实性的、静态的知识,是关于事物的分类、属性、事物间关系等的科学事实或客观事实。具体到某壹篇文献而言,知识是指关于其所研究对象(主题)的结构、关系、属性和取值等方面所做的概念、判断、推理,即有关该主题对象新有的结论。相对学科主题而言,它的知识则指的是新增加的那壹部分,即知识创新的增量。知识是可学
16、习的、可复制的,而智慧是不可复制的。目前对知识创新度量最简单的方法是对产生新的知识增量及其效应的判别和估价。这种估价的结果表现为壹种数量现象,实质上估价知识的增量隐含着对智慧的测度,因为实现知识创新的根源是智慧,但对智慧的度量目前则是太困难了。(3)信息和知识的变换科技发展史上的壹条规律说明:当把俩门表面见来毫不相干的学科结合起来的时候,就可能形成壹门新的学科;当把俩种似乎没有任何联系的现象联系起来,就可能于科学技术上取得某些进展或突破。不同学科的文献常有内于的联系,包含隐含的知识或信息,能够从中重组出全新的知识或信息,得出全新的推理或结论。 隐含信息的关联隐含信息的重组是知识的外化和外延。壹
17、些信息本身没有什么价值,但于它身后却隐藏着另外壹种很有价值的信息,这种延伸或潜于的信息单元、知识单元,有壹定的隐蔽性,往往不易被人发现,壹旦被开发出来,且运用到实践当中去,却可产生不可估量的效益。美国芝加哥大学图书馆研究生院、信息中心的SwansanD.R.等壹直于从事认知科学和文献内容相互关系的研究,对信息重组和知识创新过程进行了不少研究。由于他们壹直对文献的隐含信息进行研究,且于研究过程中,利用现代的计算机技术,设计了壹种新颖的计算机辅助信息检索软件(ARROWSMITH算法),能辨别出生物医学文献中俩个词语间的联系,从而进壹步发现隐含信息的关联,促进新知识的产生。 知识的消息通信知识元、
18、知识单元、知识结构均以信息的方式于文献中表现,把隐含于文献中的大量复杂知识元以消息通信的方式连接起来,提高隐含知识的明晰化程度,将是未来数字图书馆向知识创新努力的关键4。知识检索是于知识结构中获取知识的过程,用户能够通过知识单元间接地获取知识,更能够通过知识元直接获取知识;信息检索只能通过间接的知识单元信息获取文献。知识链接是数字图书馆的核心,是实现数字图书馆从信息服务向知识服务转型的关键技术。因此,采用知识链研究知识标引和检索是合理的,研究知识元、知识单元、知识结构之间的信息和知识的变换是可实现的。从人工智能观点见,知识是对事实的合理推理的结果。知识的表达和处理能够有多种方法,且已有许多优秀成果,但最关键的是如何实现知识元和知识单元和知识结构之间的继承性,以及如何有效地实现它们之间的消息通信。 信息转换成知识从标引“知识元”层面研究,揭示单篇文献的个体“知识元”信息和某领域共性“知识结构”的链接关系,从而找出信息和知识的转换的普遍规律5,是提高用户通过检索系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《两只小象》教案设计
- 医疗健康产业园售楼部施工合同
- 林业项目招标投诉处理办法
- 工程施工农民工薪酬保障措施
- 制药业锅炉安全手册
- 商业广场供暖系统工程合同
- 社区服务公务车租赁协议
- 四人股东权益分配协议
- 美容养生招投标市场动态
- 篮球馆喜剧表演租赁协议
- 江苏省南京市六校联考2024-2025学年高一上学期期中考试语文试题(无答案)
- 预防校园欺凌主题班会课件(共36张课件)
- 公关服务合同
- 芯片基础知识单选题100道及答案解析
- 江苏省苏州市2024-2025学年七年级上学期期中数学摸底调研卷
- GB/T 44352-2024燃油蒸发排放系统用活性炭通用要求
- 2024山东济南轨道交通集团限公司招聘49人高频难、易错点500题模拟试题附带答案详解
- 市政道路交通疏导方案施工方案
- 2024年新人教版一年级上册数学课件 第四单元11~20的认识 第4课时简单加、减法
- “数字三品”应用场景典型案例申报书
- 《托育服务政策法规与职业伦理》全套教学课件
评论
0/150
提交评论