大数据背景下数字图书馆面临的机遇与挑战分析_第1页
大数据背景下数字图书馆面临的机遇与挑战分析_第2页
大数据背景下数字图书馆面临的机遇与挑战分析_第3页
大数据背景下数字图书馆面临的机遇与挑战分析_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、    大数据背景下数字图书馆面临的机遇与挑战分析    摘 要:现下图书馆表现出大数据的特性。大数据于图书管相关服务方面发挥着协助功能,但同时也暴露出一定的不足。图书馆需要聚焦知识服务的发展形势,通过全新技术的应用完成大数据解读,避免以往知识服务的不足,相对可观地获得深层次的大数据内容,使得图书馆服务实现进一步开拓。关键词:大数据;图书馆;知识服务1 引言最近几年由于互联网蓬勃成长而出现了各式的数据形态,既存在以往类型的结构化数据,还包括众多半结构化以及非结构化数据。种种迹象显示出了大数据的来临,其代表的是海量数据涌入人们的生活,而从内容方面来看更是异

2、常丰富,属于海量数据的拓展。处于这一背景之下,图书馆资源表现出了大数据的特性,基于数据的相关知识服务既获得了机会,同时也迎来了挑战。图书馆需要尽可能明确大数据的长处以及特征,解读目前知识服务暴露出的问题,研究制定全新的服务措施,帮助读者获得更贴合需求的服务。2 大数据为图书馆知识服务再拓展提供可能知识服务的概念为:依照用户的要求,有目的的由多类或是显性或是隐含的资源内获取整合知识,同时基于此处理用户提出的深层次问题的整个环节。 1 根据统计学来看,追求精准的成果就要获取更多的数据,利用优化运算的方式可以探索到全新的内容。图书馆经过多年的沉积,现已展示出大数据特征。大数据让图书馆涉及内容更加多彩

3、,同时在运算方面速度更快,而投入量相对降低,这些均导致数据量的大幅增加。除此以外,大数据使得数据的处理相对合理精准。移动服务大面积推广使得图书馆数据丰富,特别是非结构化数据。尽管伴随数据呈现出愈加复杂的势头,但是涉及数据类别的丰富,数据处理成果的交叉验证随之提升,因此有助于数据处理合理程度以及精准水平的提升。23 大数据时代图书馆知识服务面临的挑战3.1 数据平台与安全技术图书馆大多涉及的是关系数据库平台,而在常用的rdbms之中,由新技术拓展的非结构化数据处于弱势地位,倘若继续使用rdbms的手法控制非结构化数据,将导致存储模块的流失,过量的数据内容汇聚于同一数据库同样使得数据库读写不顺畅。

4、现下大部分图书馆为追求便利的数据储存,因而使用了集中存储的手段,这将便于图书馆方面明确每一块工作的落实状况,还有读者使用服务项目的效果。然而由安全方面入手,此类手法暴露出不足之處。目前图书馆数据与个体的隐私以及知识产权息息相关,同时集中存储时常发生系统漏洞或者不安全因素的产生。同时,大数据涉及到的非关系数据的提升表现出非线性特点,但是现下图书馆采取的措施大多面向的是线性扩增的数据。3.2 分析引擎与知识发现大数据分析对实时性提出了严苛的态度,读者使用的顺畅程度会作用于图书馆服务的水平,而图书馆以往数据分析水平不足。伴随图书馆网络系统的大规模推广以及和读者越来越多的互动,动态交互数据激增。由于同

5、时登录的读者数目增加让数据仓库处理状况不良,改善服务器缓存效果同样无法有效地舒缓此方面压力。图书馆各代知识服务在更新换代之后均将造成知识库数据源涉及单位的扩增,使得其结构愈加复杂。所以以往的查询功能朝着多表查询以及数据处理结合的方面过渡,进而数据结构于横向伸缩特性方面达到需要。而现下的图书馆信息服务网络不具备这一效果。4 大数据时代图书馆知识服务解决方案4.1 大数据物理存储平台它属于图书馆大数据知识服务构造的前提,依照不同的要求解读数据储存措施还有划分数据节点。由于图书馆涉及的数据量以及类别范围的广阔使得不能通过一致的标准来实现物理存储。除去增量方面投入非关系构造hdfs以外,其他部分继续保

6、持以往关系型构造,这属于一类相对优越的手段。关系型架构通过以往的服务器还有磁盘阵列模式组建而成,再利用raid加以数据重建,把数据各自存储于磁盘阵列内部,同时通过san协议实现计算机以及存储装备二者的信息交互。此类手法已经充当图书馆以往信息服务手法实施已久,表现出相对优秀的稳定程度自己安全水平。非关系型架构hdfs对照raid表现出一些差距,其属于一类分布型文件系统,它的中心环节nanenode 用于控制文件系统涉及的元数据,以及控制不同数据节点datanode ,每一datanode就属于一个 机架,不同的datanode利用交换机加以连通,namenode把数据文件划分放入许多不同的dat

7、anode内, 同时于用户涉及此方面时把datanode下的信息汇合在一起呈递于用户。hdfs通过tcp/ip协议实现具体的连通,此类构造手段能够可观地通过集群的效果实现便捷的存储以及迅速的计算,可以面向超大数据集加以科学、可行的分布型处理。4.2 大数据采集平台采集平台依照图书馆使用人员反馈的需要,明确涉及的大数据源构造同时进行探究,遵循数据挑取的规则,通过专门的语言由数据库内获得目标数据,同时面向搜集的数据加以深入的处理,最终把获得的数据实现转换,依照读者提出的条件进行相关搜索以显现相关数据。4.3 大数据组织平台大数据组织平台囊括了关系型数据库以及非关系型数据库二者。rdbms具有保障数

8、据稳定、投入量有限的特点,而且其应用的比重相对较高。另一方面,当处于非结构化类型时,nosql数据库表现出绝佳的存储以及管理能力。由于刨除了关系型数据库涉及的关系性,因此这类数据库构造便捷,能够任意时间设置数据结构。5 结语由于信息技术于全球范围没推广,多种数据形态如同雨后春笋一般涌现出来。图书馆作为知识以及信息的保存以及传输的机构,处于这一时代背景之下,同样显示出了大数据的迹象。大数据时代的来临推动了图书馆持续地实现自我发展,但同时也带来了相应的问题。以往的图书馆服务手段无法与日益增长的读者需求相对等,本文由此切入,解读了将大数据投入于图书馆服务的可行性还有问题,并由此着手构筑相应平台,为图书馆的持续进步做好铺垫。参考文献1肖强,朱庆华.hadoop环境下的分布式协同过滤算法设计与实现j现代图书情报技术,2013

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论