


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、信息整流与知识增值效劳 一【内容提要】本文提出数字图书馆的主要功能目标是信息整流与知识 增值效劳;信息与知识转换是数字图书馆的关键理论和技术问题。图 书馆受到 Internet 的巨大冲击、 不再是文献信息效劳的唯一提供者, 数 字图书馆如何才能挽回失去的老用户,吸引新用户?知识管理工程将 使数字图书馆成为 21 世纪学习的大平台、 文化知识的大平台和知识资 源中心。【摘要题】信息效劳1 数字图书馆的信息整流 数字图书馆把传统图书馆的功能由信息的查询和图书资料的借阅扩展 到知识效劳的新阶段。实现这一宏伟目标需要解决许多技术和社会问 题,其中有两个最关键的技术是信息的整流和知识的创新。前者涉及
2、数字图书馆的知识链建立问题,后者涉及数字图书馆的信息变换成知 识的知识增值效劳问题。1.1 数字图书馆的知识链 数字图书馆是一个庞大的数字资料库,包括所有资料的数字化存储, 在线网上资料、多媒体资料、电子出版物等。数字图书馆根据用户对 信息的不同需求,将文本、图片等原件制作成不同数字形式。一般有 纯图像形式,目录文本形式,正文图像形式,全文本形式和全文索引 形式。但关键还是知识链的建立。为实现知识链信息,数字图书馆将资源分成为元数据和对象数据。对 象数据指数字化的文本、图像、声言、影像等,元数据那么指那些描述 和管理对象的数据。对象数据分布式地存放在各地的资源站点内,元 数据那么集中存放在数字
3、图书馆中心的超大规模效劳器上。 用户查询时, 中心调度系统通过元数据来调度各对象数据库以提供效劳。知识的控制单位长期停留在文献这一级上,而人对知识的需求一般不 是以文献为单位的。早在 20 世纪 70 年代后期就有专家指出,知识的 控制单位将从文献深化到文献中的数据、公式、事实、结论等最小的 独立的“知识元 。一旦实现知识的控制单位由文献深化到 “知识元 ,大 量文献中所包含的 “知识元 及相关信息间的链接将产生极大的知识增 值,从而大大推进人类对知识的利用,促进新知识的创造,从而也将 推动知识资源业的重大开展 1。一篇文献反映作者的科学研究成果,包含著作者的知识创新的过程。 于是文本结构本身
4、就隐含着对某学科问题的知识链。假设我们把每篇文献的知识看成是人类知识结构中的一个知识单元, 知识单元与知识结构就组成了个性知识与共性知识的知识系统。个性 知识表达在知识的创新上,共性知识结构那么表现在知识的完整性上。 于是我们就建立了个性知识与共性知识的知识链。事实上,专利文献 就明显地表现了个性知识单元与人类知识结构的知识创新链关系2。数字图书馆对文本的知识标引,既表达了标引者应用学科知识结构的 背景知识的能力,同时又表达了标引者识别和提炼作者的知识创新点 的判断和知识组织能力。因此,是一个知识链建立的知识增值过程。1.2 数字图书馆的知识发现 知识链的建立过程是知识发现和知识再组织的过程。
5、知识发现的主要 目标是采用有效的算法,从大量现有或历史数据集合中发现并找出最 初未知、但最终可理解的有用知识,并用简明的方式显示出来。知识 发现一般包含如下几个步骤: 1理解相应的问题领域; 2准备相 关数据子集; 3发现模式数据挖掘 ; 4所发现模式的后处理; 5应用发现结果。1文本知识结构分析技术 尽管与多媒体信息相比,文本信息显得比拟普通,但文本仍然是记载 和传播信息的最主要媒体,因此对文本信息知识发现技术的研究具有 十分重要的意义和广泛的应用前景。文本结构分析的目的在于发现文本表达主题概念的物理组织结构,由 物理结构自动重组主题概念的逻辑结构,实现对文本知识的抽象化和 具体化推理检索。
6、文献3把文本结构分成物理结构和逻辑结构。物理结构=标题,段落, 句子,词汇,它表示了文本的组成情况。可采用向量空间模型表示文 本及文本各个局部, 进行文本结构分析, 其中主要是文本的层次分析, 从而得到文本的逻辑结构。逻辑结构 =主题,层次,段落,句子,主 题词,它更着重于表示文本所包含的思想内容和表达的逻辑方式。2知识链结构 文本的物理结构是文本的外表形式,逻辑结构表达了作者表达目的的逻辑顺序,而文本的知识链结构那么是作者的目的和灵魂,知识链结构 =问题,已有解的优缺点,新解的方案,性能评价,今前方向。研究 文本的目的是为了获得文本的知识链,以创立新的知识链。 引文方法是一种很好的文献链,表
7、现了引用文献与被引用文献之间的 多种关系。但它并不完全直接表现知识链关系。文献链是一种庞大的 文献引用系统。知识链那么是一种巨大的知识引用系统。假设能完成这一 巨大的系统,人类将可能进行更有效的知识学习。1.3 信息整流的实现 知识链是文本知识结构的普遍特性,是人类学习、创新的纽带。信息 整流与信息滤波不同。信息滤波的目的主要有两点,即过滤掉不相关 的文档以及将相关文档列表分为新的文档和已经查阅过的文档,并按 相似度大小排序,对已检索的相关文档,通知信息 Agent 不必返回全 文文档,以减少通信费用。信息整流的目的在于建立数字图书馆的知 识链库,提供知识链效劳。信息整流是建立知识链的过程。从
8、全文提取出知识单元,形成独立的 知识根底,构成知识单元库,把各种知识单元库进行链接,构成数字 图书馆广泛的知识网络库。知识网络库形成了学科横向交叉和学科纵向延伸的科学知识体系。描 述了人类知识学习和知识创新的知识网络结点。把人类知识学习和创 新活动之间的距离大大的缩短。在知识网络库中,用户可以跨知识单 元库学习所感兴趣的知识,更可以通过知识单元库直接学习到解决问题的知识和方法 知识单元库的实现是知识网络库建立的根底和关键。已有的信息置标语言HTML HyperTextMarkupLanguage的超级链接功能使Web技术 从计算机世界走向社会、走向千家万户,实现 Web 与数据库的超级链 接。
9、HTML表现出Web显示数据的通用方法,而 XML提供了一个直接 处理Web数据的通用方法。HTML着重描述 Web页面的显示格式,而 XML着重描述Web页面的内容。XML是文档的各种数字表示方式,用 XML表示的数字文档可以由计算机处理,也可以供人阅读。XML文档是一种纯文本文档,可以包含图片、视频或其他多媒体信息,可以是 百科全书,也可以是一封电子邮件,或一那么天气预报、一张电子商务 交易单等。如对商品的描述中,假设在应用中的名称、质量、价格 还缺乏以描述一个商品的特征时,还可通过其他模式增加新特征,只 要参加的元素在它们各自名域的前后关系中是有效的。这就为知识单 元的描述提供了工具,通过 XML标记将文本标记成知识单元,继而将 知识单元链接成知识结构,实现知识链。与引文索引不同,在用XML实现知识单元的描述中,可以将被引文献 中的知识单元采用指针的方式加以直接标记,于是实现了知识链接的 作用。链接Linking是Web实现关键。HTML的链接是单向的有两个端点 一一 源端和目标端,源端通常是 Web 页的一个片段,如一个词语、一段文 本或一幅图像,目标端是一个 资源由统一资源标记URI地址指 定。 XML 是描述结构化数据的底层文法,用这种简单文法可以支持种 类繁多的应用。预计 XML 将成为数字图书馆信息整流的根底性语言。 2 数字图书馆的知识
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 合同管理新规:劳动合同效力变化分析
- 购销合同担保书
- 苏教版三年级语文教学计划
- 2 不同材料的餐具 教学设计-2024-2025学年科学二年级上册教科版
- 2 折笔帽(教学设计)苏教版一年级下册综合实践活动
- 药店连锁品牌加盟合同转让协议
- 股东合作发展合同范本大全
- 10 我们当地的风俗 第一课时 教学设计-2023-2024学年道德与法治四年级下册统编版
- 4 少让父母为我操心 教学设计-2023-2024学年道德与法治四年级上册统编版
- 2023-2024学年人教版(2015)小学信息技术四年级下册个性表格巧制作(教学设计)
- 2025年中考语文模拟试卷(含答案解析)
- 2025版校园乐器销售代理与服务协议3篇
- DB11-T 1004-2023 房屋建筑使用安全检查评定技术规程
- 2024-2025年天津河西区七年级上学期期末道德与法治试题(含答案)
- 预制板粘贴碳纤维加固计算表格
- 2025年海南农垦自然资源开发集团有限公司笔试题
- 2023CSCO儿童及青少年白血病诊疗指南
- 医疗垃圾转运流程
- 矿棉板模板施工合同
- DB31∕T 1148-2019 水量计量差错的退补水量核算方法
- 2025蛇年元旦晚会
评论
0/150
提交评论