机构知识库的发展趋势_第1页
机构知识库的发展趋势_第2页
机构知识库的发展趋势_第3页
机构知识库的发展趋势_第4页
机构知识库的发展趋势_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机构知识库的发展趋势

1机构知识早期发展自20世纪90年代提出以来,对机构知识的理论和实践研究一直没有停止。理论研究主要集中在机构知识库的基本概念、与开放获取(OpenAccess)的关系、对传统学术交流的影响等;而实践研究主要是集中在不同的学术研究机构和政府机构根据自身需求和目标构建本机构的知识库,并向本机构成员提供服务。在机构知识库早期发展阶段,实践研究更多的是注重于机构知识库“如何建”,这些早期构建的机构知识库的主要功能是收集、保存、管理和利用本机构成员的数字化学术资源。在机构知识库早期蓬勃发展过程中出现了多套用于构建机构知识库的免费开源软件,其中以DSpace和EPrints最为知名,在OpenDOAR站点的构建机构知识库软件统计排名中位居前列。然而,随着软件技术、网络技术、存储技术等信息技术的迅速发展以及用户信息需求的不断提高和改变,机构知识库的发展出现了新的变化、新的趋势。2该机构的储量发展趋势2.1机构知识资源库的开发与完善机构知识库最主要的功能是用来长期保存和展示本机构的数字化学术资源,因此,早期的机构知识库软件平台也是围绕这方面功能进行开发的。然而早期的机构知识库实践表明,由机构成员自愿主动提交其数字化学术资源到机构知识库的比例非常低,机构成员对机构知识库内容建设的参与度或者积极性没有预想中的高。其中一个重要原因是机构知识库系统平台功能相对单一,用户体验度不够好,为此,不同的机构已经开始对原有的知识库系统平台进行升级开发,更有甚者进行重新设计和开发。中国科学院机构知识库(ChineseAcademyofSciencesInstitutionalRepository,CAS-IR)是在对DSpace软件进行全面熟悉和梳理的基础上进行二次开发完成的。他们对DSpace软件进行的主要扩展和优化涉及到内容提交、编辑流程、知识组织、传播和服务、知识资产统计、用户管理、用户界面等,并且集成开放知识组织引擎OpenKOS的相关功能,对机构知识库中知识产出进行主题标引和提供基于规范主题词的分面浏览,实现对数字资源的自动标引与自动分类。二次开发增加的和优化的功能极大地提升了原有机构知识库平台的性能,更好地满足了不同用户的需求。香港大学机构知识库(TheHKUScholarsHub)对DSpace软件进行了二次开发和完善,其中增加了一个重要功能,即设计了研究人员网页(researcherpages)。香港大学校内教员可以通过机构知识库研究人员网页展示其个人基本情况和学术成果,包括姓名、联系方式、研究专长、所获荣誉、学术成果等。企业单位、政府部门或学术研究机构可以通过此网页找到课题协作或合作者、相关专业咨询专家、毕业论文指导教授、媒介发言人以及快速组建不同类型项目组团队等。新西兰奥克兰大学图书馆StuartLewis在Atom出版协议(AtomPublishingProtocol)的基础上新创建了SWORD(SimpleWeb-serviceOfferingRepositoryDeposit)协议,并根据SWORD协议开发了相关API软件。用户根据SWORD协议和API软件,可以不必登录机构知识库系统就可以在远程同时把学术资源提交到多个知识库系统中,极大地提高了用户提交资源的效率。J.S.Erickson等人在DSpace系统上添加了条目书签与个人标签的功能,并且与机构成员的研究兴趣相关联,在此基础上为用户推荐他可能感兴趣的条目和成员。系统还逐渐进行聚合机构成员的博客、维基、网络资源等,使机构知识库嵌入到用户的工作环境中。增加或完善机构知识库系统平台的功能,其中最为根本的目的是吸引尽量多的本机构用户使用知识库,提高和改善知识库系统的用户体验,增加用户粘性。基于这样的目的,不同的机构知识库构建者对本机构知识库进行完善并增加新的功能,如增加知识库中资源的被引用率、数字对象全文链接、资源下载排行榜以及添加标签、资源评价等Web2.0的元素,简化用户提交流程等。对现有机构知识库系统进行改造和升级,必须要坚持以用户为中心的原则,以用户实际需求和增加用户体验为出发点进行改造和升级。机构知识库构建者应当调研和持续跟踪用户需求,结合国内外最新信息软件技术,丰富现有知识库系统的功能,最大限度地满足用户的不同需求。另一方面,对机构知识库系统进行功能完善或增加,所在机构需要相对较高的软件开发能力或相应资金支持,不同机构可以根据自身软件开发能力,选择开源或闭源软件灵活地进行开发和完善。2.2成立机构资源库联盟,实现数字图书馆、研究类高校根据ROAR(RegistryofOpenAccessRepositories)站点的统计,截至2012年7月,在其站点上注册的机构知识库数量是2910家。2011年6月赵永超在中国大陆作了CALIS(ChinaAcademicLibrary&InformationSystem)现有高校成员馆有关机构知识库的调研,结果显示,已经建有、准备建设和拟建设机构库的图书馆分别是54、25和91家。从国内外的统计数据来看,目前机构知识库的发展正犹如雨后春笋般迅速发展,如果把如此众多的孤立的机构知识库进行整合,实现联盟化,势必会出现新的资源服务局面。目前国内外已经开始出现机构知识库联盟:●美国俄亥俄州数字资源共享联盟(OhiodigitalResourceCommons,DRC)是在俄亥俄州高校图书馆联盟(OhioLibraryandInformationNetwork,OhioLINK)的基础上于2008年建立的机构知识库联盟,免费为俄亥俄州的高校和文科学院提供保存、发现和共享教学、科研、历史性和创造性的数字化成果的服务,目前联盟成员共有24个。●欧洲科研数字仓储架构研究项目(DigitalRepositoryInfrastructureVisionforEuropeanResearch,DRIVER)是由欧洲38个国家的295个知识库组成的机构知识库联盟,目前系统中条目超过350万条。●日本的机构知识库在线(JapaneseInstitutionalRepositoryOnline,JAIRO)是由日本国家信息中心于2009年建立的一个机构知识库联盟,通过该联盟的统一检索入口,可以检索不同机构的期刊论文、学位论文、部门公告文件、研究文档等,目前联盟成员209个,数据总条目接近138万条。●中国台湾地区台湾机构典藏TAIR(TaiwanAcademicInstitutionalRepository)是由台湾大学于2007年牵头组建的区域性机构知识库联盟,目前包括台湾地区一般大学、技职院校、各类专科学校及其他机构共125个成员,联盟资源条目总数超过123万条。●中国科学院机构知识库服务网格(ChineseAcademyofSciencesInstitutionalRepositoriesGrid,CAS-IRGrid)是2007年开始由中国科学院国家科学图书馆在中国科学院所属的各个研究所推广机构知识库建设的基础上发展起来的机构知识库联盟。目前,该联盟拥有72个成员,另外还有一批成员正在加紧建设知识库,联盟资源条目总数超过33万条。●CALIS机构知识库是由中国高等教育文献保障系统资助,由北京大学于2011年牵头组建的中国大陆地区高校机构知识库联盟,目前有27个高校成员,联盟资源数据总条目约8万条。实现联盟化,无论对学术资源本身,还是构建知识库的图书馆以及用户,都是一种共赢的模式。对于学术资源而言,联盟打破了学术资源各自孤立的局面,使不同机构的知识库群形成了一个资源整体,为将来的数据挖掘、信息增值服务打下良好的“物质”基础。资源的集中呈现和统一服务,将增加学术资源被发现的机率,加速信息资源的传播,从而提升信息资源的影响力,体现资源服务整体效益。对于图书馆而言,由于联盟之间实现资源共享,联盟成员的资源可以被本机构使用,使图书馆的信息服务保障能力得到提升,同时也为本机构成员进行学术交流增加了渠道。另外,加入联盟的图书馆,可以大大节省机构知识库构建、维护等方面的资金、人员及其他成本,避免了大量不必要的重复建设。对于用户(学术资源消费用户和学术资源生产用户)而言,学术资源消费用户可以在联盟提供的统一服务平台上实现相关信息的跨库检索,而不必在各个成员机构知识库中反复检索,节省了学术资源消费用户检索利用知识库资源的时间;学术资源生产用户(机构科研人员)可以借助联盟提高自己学术资源被发现的机率,提升自己学术资源的被引用率和自身的学术影响力。基于上述的共赢模式,机构知识库联盟目前发展比较迅速,也比较顺利。2.3美国最大的云存储企业—存储云端化随着机构的教学、科研活动的持续推进和发展,学术论文、著作、科学数据等机构知识产品将不断丰富,这将对机构知识库的数据存储能力提出更高的要求。传统的数据存储技术,如单一磁盘存储、磁盘阵列(RedundantArraysofInexpensiveDisks,RAID)存储、直连式存储(DirectAttachedStorage,DAS)、网络接入存储(NetworkAttachedStorage,NAS)、存储区域网络(StorageAreaNetwork,SAN)等在应对大规模海量数据时,都将面对技术过于复杂或投入过高等问题。另一方面,随着网格计算、云计算等虚拟技术的发展,出现了新的数据存储技术,即云存储技术,它为用户提供了低成本、高效率和无限扩展能力的虚拟存储技术。随着云技术的成熟和客户的需求,越来越多的公司或企业推出云存储服务,并受到客户青睐。亚马逊(Amazon)是较早推出商业云存储的公司,正如刘佳所言,“当人们还在将云计算当作时髦的IT词汇讨论时,亚马逊早已从云计算中获益”。亚马逊的云计算系统被称为“弹性计算云”,可以提供“现购现付”的服务,包括计算能力和数据存储。美国麻省理工学院、哥伦比亚区公共图书馆、俄亥俄州高校图书馆联盟、西北大学、莱斯大学等都开始使用亚马逊公司的弹性计算云服务。Fedorazon是JISC资助的一个项目,目的在于为大规模仓储所面临的数据量不断增长和复杂度不断增加的问题找到一种合理的解决方法,从而提高英国高等教育与继续教育(UK’sHEandFE)内容仓储的性能。该项目的技术实现方法是在亚马逊的云平台上部署FedoraCommons机构知识库软件,然后开放给不同用户使用。与传统的本地方式相比,Fedorazon只需要在云平台上启动多个实例,就可以避免使用本地WebServer随着访问量的增加速度越来越慢的大规模数据访问的弊端;由于使用亚马逊的S3云存储,比本地磁盘阵列更容易扩展,用户不需要操心购买和部署硬件设施,不需要担心未来磁盘空间不足的问题,不需要配备专门的硬件管理人员,而可直接将注意力集中在如何开展数字资源长期保存研究上。DuraSpace是由机构知识库构建平台开放源码软件供应商DSpaceFoundation与FedoraCommons合并组建的机构,于2011年推出的该机构第一款开源软件产品DuraCloud,就与云存储相关。DuraCloud基于多个商业性或非商业性的云服务,为学术图书馆、学术研究中心和其他文化遗产机构提供和托管云存储服务,使机构的数字资源得以长期保存,并提供数据访问、转换和共享服务。目前,麻省理工学院、汉密尔顿学院、莱斯大学、罗德学院等多所美国高校都在使用DuraCloud来管理本机构资源的云存储,其中就包括机构知识库。学者钱宏蕊认为云存储技术具有如下特征:①高可扩展性:云存储系统可支持海量数据处理,资源可以实现按需扩展;②低成本:云存储系统具备高性价比的特点,低成本体现在两方面——更低的建设成本和更低的运维成本;③无接入限制:相比传统存储,云存储强调对用户存储的灵活支持,服务域内存储资源可以随处接入,随时访问;④易管理:少量管理员可以处理上千节点和PB级存储,更高效地支撑大量上层应用对存储资源的快速部署需求。云存储技术能够很好地解决机构知识库数字资源的不断增长的现实存储需要以及长期保存的需要,降低了机构知识库用户的使用难度。我国幅员辽阔,图书馆众多,因地区发展不均衡,不同馆的馆情不一。具体来说,中小型馆对存储和技术力量投入比例小,在构建机构知识库时,经常面临存储和技术方面的困难。对于这种情况,建议国家层面(如教育部、CALIS管理中心等)或大型的实力强的馆能够对外提供云服务,帮助解决中小型馆面临的存储技术问题。2.4基于平台的语义信息显示技术在提高cas-ir传统的信息服务是指以用户的信息需求为依据,提供有用的显性知识(以文字、图像、符号表述和以印刷或电子方式记载的)内容的信息服务活动。知识服务是指从各种显性和隐性知识资源中,通过对用户的知识需求和问题环境的分析,将信息析取、重组、创新、集成的知识提炼过程,是有针对性地解决用户问题的高级阶段信息服务活动。很显然,机构知识库的服务方式属于传统信息服务范畴,而机构知识库联盟化本质是实现了信息资源组织方式的改变,没有改变其信息服务方式,即仍属于传统信息服务范畴。如何进行知识组织,如何提供知识服务,目前学界还没有统一清晰的认识,但是,国外的一些机构在知识服务方面已经开始作一些尝试和探索。由哈佛大学开发的免费开源机构知识库软件DataverseNetwork一方面与传统的机构知识库系统功能一样,收集、保存、发布和共享机构学者不同类型的科研数据;另一方面,它可以对专门的数据进行抽取、分析和统计,生成不同格式的数据子集和分析报表,供用户参考和使用。用户不但可以从Dataverse获取普通的一般的学术信息,而且还可以获取经过加工的更深层次的学术信息。Dataverse在下一步的开发中,还将引入可视化的操作和结果展示,为用户提供更直观的学术信息。美国康奈尔大学图书馆专家认为,传统的机构知识库系统只能单纯地保存和揭示本机构成员的学术资源,用户也只能从其上面浏览或下载相关的学术资源,而对这些学术资源后面的作者了解甚少,不能进行更进一步的交流或合作。为此,康奈尔大学图书馆在传统机构知识库的基础上增加开发了开源的VIVO软件,该软件类似于Facebook的虚拟社区网络,采用实体-关系(entity-relationship)的语义网模型来组织和展现科研人员、研究成果和教学活动的相关信息。传统机构知识库与VIVO软件结合后,作为虚拟社区成员的科研人员可以在社区共享学术成果、寻找同行、跨学科合作、改进研究等。澳大利亚格里菲斯大学的MalcolmWolski等学者引用资源描述框架(ResourceDescriptionFramework,RDF)、关联数据(linkdata)、相关语义网标准、VIVO软件等理念与技术在知识库的层面上建立了元数据交换中心(MetadataExcha

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论