




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
论知识仓库的建设
1知识仓库的出现随着计算机、数字和网络化技术的发展,传播信息的速度越来越快,读者对信息服务的质量和数量有更高的要求。但是,面对纷繁、复杂的知识源,很多读者,由于一些客观原因,如时间紧迫或自身对知识和信息的驾驭程度偏低,往往手足无措,不能很好的使用这些信息。甚至,读者在使用一些图书馆所建的一些书目数据库时,仍然发现许多不便,因为通常的数据库只是将信息简单的数字化和有序化,无法根据各类读者需要组合成特定的知识体系。怎样让读者在众多信息源中迅速、直接选中自己所要检索的相关信息,能不能将信息整理、筛选,划分成许多类别分明、有特色的“块”,以利于读者使用呢?知识仓库的出现,就很好的解决了这个问题。目前,由于图书馆与网络技术、计算机技术结合的日益紧密,建设专业的知识仓库已逐渐提到各个图书馆的议事日程上来。2知识仓库的概念和特点2.1数据仓库与知识仓库90年代中期,西方管理学家提出了知识管理的概念,认为采用现代信息技术和手段将信息加工整理成为知识,并对这些知识按照某种知识的结构进行有效的管理,形成具有规定使用功能的数据仓库,也就是知识仓库。严格地说,所谓知识,就是根据工作需要,按照某种特定的要求进行分析整合形成的,能够说明某种问题的信息体系。而知识仓库就是按照特定的知识结构将无序信息组合而成、并具有规定使用功能的数据库。在知识经济时代,为了适应读者的需要,对各种外部和内部的知识与信息进行数字化改造和有效的管理,并建设有利与知识传播、共享和交流的知识网站,是图书馆信息化、知识化建设的当务之急。2.2知识仓库的功能(1)不同于一般的数据仓库,不是信息的简单数字化和有序化,而是根据一个机构各个部门各类工作人员的知识需要,按照使用的目的创建的新的知识体系,可以按照特定的检索词实现计算机自动分类,使信息根据使用者的目的高度知识化。(2)知识仓库对信息有组织功能,一个单位知识结构的决定和知识仓库建设的有关制度,形成了对本单位涉及的信息的组织制度,因此知识仓库的建设为单位的知识管理创造了条件。(3)在特定的知识结构组织下,各种无序的信息将在新的概念体系下形成系统知识,本身就是新知识的创造过程。(4)知识仓库的知识体系建设本身是对本单位领导和群众的针对性的知识服务。(5)知识仓库管理系统操作应该简单、规范,权限管理严密,数据安全性强,能全文显示,能随时更新。3建设内部知识仓库的步骤3.1做好知识仓库的建立准备工作。根据学校知识仓库是一种需要持续投资的知识基础设施建设。无论是硬件资源的配置、信息技术的应用,还是知识的获得、知识的编码化、知识分类方法的开发、相应的员工培训等,都需要投入一定的资金和人力、物力,做大量的组织协调工作。因此,在决定建立知识仓库之前,一定要做好周密的筹划和准备,以避免不必要的浪费或半途而废。同时,由于知识仓库的建立,它所涉及的资料和数据的面比较广,以建设学校内部研究生学位论文知识仓库为例,它就牵涉到学校的很多部门,需要得到各个部门的支持,提供相应的资料和数据,以便论文的组织和整理。基于如上所说的一些因素,我们在建设知识仓库的前期准备工作中,除了在资金、设备和人员上做一定准备之外,尤其重要的是,还应该组建一个专门的项目小组,组织、协调全面的工作,确定建库的主题和标准,小组成员对通过各种渠道所获得的知识进行鉴定、编选和组合增添价值,并使知识变得容易获得和使用,从而最终达到目的。3.2网络环境(1)数据传输设备①服务器(内存128M以上,双PⅢCPU)②数据存储设备(如磁盘阵列、光盘阵列、备份磁带、加载设备)③一个完整的局域网设备,如PC机,HUB,双绞线等(2)知识仓库的建设知识仓库的建立必须依靠强有力的技术支持。传统意义上的“仓库”一般指放置货物的地点,是有形的。我们这里所讨论的“知识仓库”是指保存信息的地点,是无形的。除了需要投入大量的人力和财力以外,还要依托很多先进的信息技术。知识仓库一般建立在的内部网络上,系统由安装在服务器上的一组软件构成,它能提供所需要的服务以及基本的安全措施和网络权限控制功能。读者可以利用该系统阅读新闻或查找所需资料,并可与Internet连接,在网上发布。知识仓库的建设,技术核心是建库软件包的选择。建库软件的选择要看它是否具有可扩展性、界面是否友好,自动化程度、数据格式的是否标准和规范、检索操作是否方便。一个好的建库软件可以帮助图书馆建设者方便、快捷地掌握整套建库、管理和网上发布技术。目前,运用得比较成熟的知识仓库建库管理系统是CNKI机构知识仓库建库管理系统(KD3.0)和知识网站支撑软件(KW3.0),它是一套适用各单位各机构知识仓库建库、生产、管理和网上发布的工具性系统软件。这套系统具有知识生产速度快、纸质资料数字化、数据达到出版标准、提供标准模板、人机结合标引、计算机自动分类等特点。该系统核心技术达到国际先进水平。4具体的加载步骤描述kd3.0标准4.1系统的实现程序(1)运行KD3.0SETUP目录下的SETUP.EXE文件,程序自动进行安装和配置。(2)根据提示输入姓名、公司及序列号KD3.0。(3)点击“下一步”,完成安装。(4)配置运行“知识仓库建库管理系统”,出现主界面,在主界面上点击鼠标右键,选择“配置程序”,点击“…”路径按钮,配置各模块主程序路径,通常情况下,我们也可以不做这一步,因为,一般来说,KD3.0安装程序执行完成后,系统已自动配置。但是,如果用户修改了系统文件路径时,就必须重新配置各模块路径。4.2系统总体控制流程下面我们就以流程图的形式,具体讲述建库的步骤:知识仓库建库管理系统KD3.0流程图:从上图我们可以看出,建库的主要步骤如下:·文档资料数字化·各种电子文档格式统一化·格式转换(电子文档标准化)·标引·分类·建立知识仓库、入库·发布(1)纸质资料数字化一般情况下,文档资料的保存可分为纸质方式和电子方式。电子数据的二维资料本身已是数字化的数据,无须再进行此步骤,这里我们主要说的是纸质文档资料的数字化。纸质资料的数字化,我们首先通过扫描将文档以图像形式转化到计算机中,然后通过OCR识别系统,将图像变成文字,在原文的基础上进行编辑、排版、标引等深加工。OCR系统还可将识别出来的文字进行版面还原,保持原来文档资料的风格。(2)标准化的过程电子化的文档排版格式各种多样,版本型号也不一,所以,数字化之后还必须有一个标准化的过程。对以Word为代表的基于Windows平台的文档,必须打印成PDF文档,然后进行格式转换,而以老版本的方正为代表的基于DOS平台的文档,可以直接用格式转换。(3)编码软件的操作经过各种文档格式统一化,原始资料已经实现了数字化,但是,有的文件占用的空间很大,有的文件文字和图像分离(比如方正排版文件),所以,我们下一步的工作是对数字化资料进行格式转换,即打包。打包就是将各种数字化文档统一到一种标准的压缩格式,将一篇文献和资料(可能是一个或几个文件)打包成一个文件。这样,不仅使文件占用的空间最小,而且还能实现屏幕摘录,为以后的标引做准备。打包过程非常简单,只需点击KD3.0的主界面的“格式转换”,选择“打包”,下拉菜单中有三项:“单个打包”,“批量打包”,“图像页打包”,选择一项,点“打开”即可。需要说明的是,“单个打包”和“批量打包”时须选择文件类型,是“PDF”文件,还是“方正排版”文件。(4)计算机知识设计标引就是将一篇文章中混杂的信息变成可检索的知识点的过程。在标引之前,用户要设定知识结构,这包括两方面的内容,一是知识框架的建立,即分类树的设计,二是知识元素设计,也就是标引库结构的设计。标引分为计算机手工辅助标引和计算机自动标引。KD3.0首先让计算机帮助人们将文章切块,如切出标题、作者、作者单位、摘要、关键词、正文等字段。这就为下一步建立知识仓库提供了素材。(5)将其仅将其归类,其存放于人的状态以上的工作,我们对文献实现了数字化、有序化。为了使检索方便,则必须将其归类,使其存放有序。KD3.0的“分类”模块,就是帮助用户对众多的资料进行整理、归类,建立知识仓库的导航系统,使资料按用户的知识体系搭建成真正的知识仓库。(6)建立索引以固定存放位置数据入库的过程实际上是将文献组合在一起使之成为有机的整体,对字段建立索引以提高检索效率、固定其存放位置,以便于数据备份和用户访问的过程。知识仓的建库和管理功能是数据发布的基础。数据入库有四个步骤:建库、数据管理、显示字段设置、结构管理。(7)站发布时的操作用户建好数据库之后,要进行数据发布,KD3.0有两种发布类型,一是光盘发布,一是网站发布,网站发布需借助KW3.0机构知识网站发布软件,这里就不在详细叙述。在光盘发布时,点击“发布”按钮,在“发布管理”窗口,选择光盘发布,点击“开始发布”,出现“发布导航”窗口,在此
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 负载均衡设备配置试题及答案
- 2025年会考生物一轮复习:第18讲 人体内废物的排出课件(共21张)
- 2025年会考生物一轮复习:第4讲 细胞的结构及功能、细胞的生活课件(共38张)
- 202512 合同执行与管理
- 2025年北京市家庭装饰装修施工合同示范文本
- 2024秋新沪粤版物理八年级上册课件 3.4 探究光的折射规律
- 2025年上海个人租房合同标准版
- 2025汽车俱乐部加盟合同
- 酒店市场推广试题及答案要点
- 湖南省永州市双牌县二中2025届高三二诊模拟考试化学试卷含解析
- 电梯困人培训课件
- 熔化焊接与热切割作业题库题库(1455道)
- 金属冶炼中的铍冶炼与铍合金生产
- 2025年中国中煤华东分公司招聘笔试参考题库含答案解析
- 2025年河南郑州医药健康职业学院招考聘用高频重点提升(共500题)附带答案详解
- 铁路运输碳排放分析-洞察分析
- 第16课数据管理与编码(教案)四年级全一册信息技术人教版
- 《控制器接口》课件
- HPV分型检测介绍课件
- 外卖骑手交通安全课件
- 浙江省工贸企业电气隐患排查技术服务规范
评论
0/150
提交评论