大数据文献综述_第1页
大数据文献综述_第2页
大数据文献综述_第3页
大数据文献综述_第4页
大数据文献综述_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息资源管理文献综述题目:大数据背景下的信息资源管理系别:信息与工程学院班级:2015级信本1班姓名:学号:学06101015任课教师:2017年6月大数据背景下的信息资源管理摘要:随着网络信息化时代的日益普遍,我们正处在一个数据爆炸性增长的“大 数据”时代,在我们的各个方面都产生了深远的影响。大数据是数据分析的前沿 技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力就是大数 据技术,这也是一个企业所需要必备的技术。“大数据” 一词越来越地别提及与使用,我们用它来描述和定义信息爆炸时代产生的海量数据。就拿百度地图来说, 我们在享受它带来的便利的同时,无偿的贡献了我们的“行踪”,比如

2、说我们的上 班地点,我们的家庭住址,甚至是我们的出行方式他们也可以知道, 但我们不得 不接受这个现实,我们每个人在互联网进入大数据时代,都将是透明性的存在。各种数据都在迅速膨胀并变大,所以我们需要对这些数据进行有效的管理并加以 合理的运用。关键词:大数据信息资源管理与利用目录 TOC o 1-5 h z HYPERLINK l bookmark6 o Current Document 大数据概念 3 HYPERLINK l bookmark8 o Current Document 大数据定义 3 HYPERLINK l bookmark10 o Current Document 大数据来源 3

3、 HYPERLINK l bookmark12 o Current Document 传统数据库和大数据的比较 4 HYPERLINK l bookmark14 o Current Document 大数据技术 4 HYPERLINK l bookmark16 o Current Document 大数据的存储与管理 4 HYPERLINK l bookmark18 o Current Document 大数据隐私与安全 5 HYPERLINK l bookmark20 o Current Document 大数据在信息管理层面的应用 6 HYPERLINK l bookmark22 o Cu

4、rrent Document 大数据在宏观信息管理层面的应用 6 HYPERLINK l bookmark24 o Current Document 大数据在中观信息管理层面的应用 7 HYPERLINK l bookmark26 o Current Document 大数据在微观信息管理层面的应用 8 HYPERLINK l bookmark28 o Current Document 大数据背景下我国信息资源管理现状分析 9前言:大数据泛指大规模、超大规模的数据集,因可从中挖掘出有价值 的信息而倍受关注,但传统方法无法进行有效分析和处理.华尔街日报将大数据时代、智能化生产和无线网络革命称为引

5、领未来繁荣的 大技术变革.“世界经济论坛”报告指出大数据为新财富,价值堪比 石油.因此,目前世界各国纷纷将开发利用大数据作为夺取新一轮竞 争制高点的重要举措.当前大数据分析者面临的主要问题有:数据日趋庞大,无论是入2库和查询,都出现性能瓶颈;用户的应用和分析结果呈整合趋势,对实时性和响应时间要求越来越高;使用的模型越来越复杂,计算量指数级上升;传统技能和处理方法无法应对大数据挑战.正文:大数据概念大数据定义维基百科对大数据的定义则简单明了 :大数据是指利用常用软件工具捕获、管 理和处理数据所耗时间超过可容忍时间的数据集。 也就是说大数据是一个体量特 别大,数据类别特别大的数据集,并且这样的数据

6、集无法用传统数据库工具对其 内容进行抓取、管理大数据来源1)来自人类活动:人们通过社会网络、互联网、健康、金融、经济、交通等活动 过程所产生的各类数据,包括微博、病人医疗记录、文字、图形、视频等 信息.2)来自计算机:各类计算机信息系统产生的数据,以文件、数据库、多媒体等形式存在,也包括审计、日志等自动生成的信息.3)来自物理世界:各类数字设备、科学实验与观察所采集的数据 .如摄像头所不断 产生的数字信号,医疗物联网不断产生的人的各项特征值,气象业务系统采集设备所收集的海量数据等传统数据库和大数据的比较现有数据处理技术大多采用数据库管理技术,从数据库到大数据,看似一个 简单的技术升级,但仔细考

7、察不难发现两者存在一些本质上区别。传统数据库时 代的数据管理可以看作“池塘捕鱼”,而大数据时代数据管理类似“大海捕鱼”,“鱼 表示待处理的数据。“捕鱼”环境条件的变化导致“捕鱼”方式的根本性差异大数据技术大数据处理技术正在改变当前计算机的运行模式,正在改变着这个世界。它 能处理几乎各种类型的海量数据,无论是微博、文章、电子邮件、文档、音频、 视频,还是其他形态的数据。它实时、高效、可视化呈现结果。它依托云计算将 计算任务分布在大量计算机构成的廉价的资源池上,使用户能够按需获取计算资源、存储资源、网络资源和信息服务。云计算技术的应用使得大数据处理和利用 成为可能。大数据作为信息金矿,对其采集、传

8、输、处理和应用的相关技术就是 大数据处理技术,是一系列使用非传统的工具来对大量的结构化、半结构化和非 结构化数据进行处理,从而获得分析和预测结果的一系列数据处理技术,或简称大数据技术大数据的存储与管理数据存储与大数据应用密切相关。大数据给存储系统带来3个方面挑战:1)存储规模大,通常达到PB甚至EB量级;2)存储管理复杂,需要兼顾结构化、非结构化和半结构化的数据3)数据服务的种类和水平要求高大数据存储与管理,需要对上层应用提供高 效的数据访问接口,存取 PB甚至EB量级的数据,并且对数据处理的实时性、 有效性提出更高要求,传统常规技术手段根本无法应付。 某些实时性要求较高的 应用,如状态监控,

9、更适合采用流处理模式,直接在清洗和集成后的数据源上进 行分析。而大多数其他应用需要存储,以支持后续更深度数据分析流程。根据为 上层应用访问接口和功能侧重不同,存储和管理软件主要包括文件系统和数据库。 大数据环境下,目前最适用的技术是分布式文件系统、分布式数大数据隐私与安全当前大数据的发展仍然面临着许多问题,安全和隐私问题是人们公认的关键问题 之一。其中,隐私问题由来已久,计算机的出现使得越来越多的数据以数字化的 形式存储在电脑中,互联网的发展则使数据更加容易产生和传播, 数据隐私问题 越来越严重。大数据在存储、处理、传输等过程中面临安全风险,具有数据安全 和隐私保护需求。而实现大数据安全与隐私

10、保护,较其他安全问题(如云安全中数据安全等)更为棘手。呈现出的安全隐私问题主要有:1)大数据时代的安全与传统安全相比,变得更加复杂;2)使用过程中的安全问题;3)对大数据分析较高的企业和团体,面临更多的安全挑战;4)基于位置的隐私数据暴露严重;5)缺乏相关的法律法规保证;6)大数据的共享问题;7)数据动态性;8)多元数据的融合挑战;目前针对上述问题,主要研究解决方法有:文件访问控制技术、基础设备加密、 匿名化保护技术、加密保护技术、数据水印技术、数据溯源技术、基于数据失真 的技术、基于可逆的置换算法据库以及访问接口和查询语言大数据在信息管理层面的应用大数据在宏观信息管理层面的应用关于大数据的科

11、学价值与社会价值正如牛津大学的维克托迈尔舍恩伯格教 授所言主要表现为两大方面,“一方面,对大数据的掌握程度可以转化为经济价值 的来源。另一方面,大数据已经撼动了世界的方方面面,从商业科技到医疗、政 府、教育、经济、人文以及社会的其他各个领域。”大数据的潜在经济价值很快 在现实中表现出来,伦敦智库政策交易所宣布大数据每年能为英国政府节省330亿英镑。因此无论出于利益还是效率方面的考虑, 各国政府对于大数据在宏观信 息层面的管理都已提到议事日程上来。美国奥巴马政府2亿美元的“大数据研究和发展计划”,中国工信部在物联网“十二五”规划中提出了与大数据密切相关的四 项关键技术创新工程:信息感知技术、信息

12、传输技术、信息安全技术、信息处理 技术。由此可见,各国政府充分意识到了大数据的潜在价值, 试图从宏观上对信 息结构进行合理的开发与应用。而在政府宏观信息管理范畴内较为重要的一个问 题是“数据开放;只有在保证数据透明开放的前提下,大数据的潜在价值才有被 开发的可能。以大数据在政务管理方面的应用为例。 今天政府工作在电子政务方 面的发展已经相对普及,但始终停留于低层次的初级水平, 这不仅涉及到政府工6作效率,更是对政府职能的一次叩问。蒂姆奥莱利在 Web2.0概念基础上提出 了政府2.0。所谓政府2.0是指政府利用互联网上的多元信息平台,打造形成一 个国民互动、共同创新的整合开放平台。以此保证与民

13、众直接互动和沟通, 从条 块分割、封闭的架构迈向一个开放、协同、合作、互动的架构,使政府真正成为 服务型政府。其基本特征是公开透明、互动沟通、开放创新、平台服务。大数据 对于政府2.0以及政府工作的推动无疑是革命性的,它最终推动了政府信息资源 的公开化和有效利用,打破了政府与社会民众间的无形藩篱大数据在中观信息管理层面的应用大数据在信息管理中观层面的影响主要通过对于信息系统的管理完成的,主要应用于某一部门或某一区域的信息管理。比如大数据在公共事务管理方面的应 用,在电子政务、医疗卫生、新闻通信、教育管理、公共交通等部门领域内的事 务管理,极大提高了公共事务的处理效率,并为公共事务的管理建立起新

14、方法与 新秩序。在中观层面信息管理的应用过程中,大数据能够在具体领域起到关键作 用。比如大数据对图书馆在信息数据获取与服务等方面提供的机遇与挑战;大数据在当前企业竞争情报系统管理方面的强大优势;大数据在城市交通管理体系建 构中的积极作用;在医疗方面能够有效预测流感的发生, 并及时采取合理的治疗 手段,保证社会医疗卫生安全;甚至对于电力通信、地理测绘等也能产生效能。大数据的积极影响已经深入社会生活各个层面,并且已经开始干预生活,影响人们的生活模式大数据在微观信息管理层面的应用大数据在信息管理微观层面的应用,主要表现为对于信息以及信息资源的处 理等方面,具体针对某类客户、某一问题的信息收集、整理、

15、分析工作。例如汽 车导航、航海路线、设备维修、人员管理等微观事务的信息管理,能够切实解决 现实生活中的具体问题。大数据的这种微观信息管理在商业、 经济领域的应用效 果表现得最为突出,甚至很多企业正是以大数据的开发而闻名。正如著名的 OReilly公司预言的那样,“数据是下一个Intellnsid未来属于将数据转换成产 品的公司和人们。”其中世界最早的大数据公司之一 Farecast公司,他们创建了 一个相对稳定的预测系统,在对某一行业的数据进行合理分析的基础上,用以预测某类产业价格的升降趋势。比如在机票价格、宾馆预订、二手车购买等方面, 通过Farecast公司的预测系统可以发现它们价格的走势

16、与增降幅度,且具有较 高的命中率,从而帮助很多消费者节省大量开支。其后微软公司( Microsoft ) 国际商业机器公司(旧M)、甲骨文公司(Oracle)、谷歌公司(Google)、亚马 逊公司(Amazon)、Facebook等等各大跨国巨头也都先后进入大数据领域,一 方面推动着大数据处理技术快速发展,另一方面从大数据中获取巨额利润。比如以图书销售为主要业务的亚马逊公司,他们采用了机器生成的个性化图书推荐系 统,以此代替之前的书评家的个人评论与推荐,从而极大降低了投入成本、增长了销售量,并最终彻底改变了电子商务,使电子商务在今天得以全面普及。 同时 亚马逊公司与各大出版公司协商将图书数据

17、化的工程也取得了巨大成功,将大数据的应用推向新的方向、走向新的高峰。今天大数据在经济领域的应用可谓深入 而广泛,已经成为了不可逆转的一种趋势大数据背景下我国信息资源管理现状分析我国的网络信息资源管理跟一些发达国家相比,还存在很大的差距,即我国的网络信息资源管理所研究的内容还不是很系统和完善, 一般对网络信息资源管理的 研究也主要是从理论的层面进行研究的, 主要研究的内容有信息资源的特征、 信 息资源管理的体系结构以及信息资源的利用中所存在的问题和相应的对策等。在当前信息技术飞速发展的时代,信息资源的重要性不言而喻,全球特别是发达国 家对大数据的研究非常重视。特别是近些年,美国政府相关部门以及军

18、方斥巨资研究大数据以及大数据的 发展规划,以便更好地提升美国的教育事业、科研事业以及整个国家的信息安全 能力,这表明美国非常重视大数据的研究, 并将大数据作为国家发展的一个促进 策略。从目前的形式来看,我国对大数据的研究也紧跟时代的发展潮流,信息资源 管理发展由最初的传统型管理步入网络信息资源管理时代,其发展势头迅猛。绑贺锭院士曾经说过:“我国将产生全球最大量的数据,要重视大数据的开发利用和 管理。”而工信部提出我国必须要利用信息资源促进并发展传统产业, 有效提升传 统产业的质量和经济效益,进而促进我国经济社会的快速、 稳定发展。信息处理 技术所包括的数据存储技术、图像视频智能分析技术以及数据

19、挖掘信息技术等也 都属于大数据处理技术。而大数据背景下,我国在信息资源管理和利用方面存在 的问题很多,如当前我国依然沿用其他先进国家的网络信息资源管理和利用技术, 没有自主性和创新性;大数据安全管理能力不强、大数据存储及处理能力不高、 大数据应用能力较差等。在技术的角度来讲,当前我国主要研究的是数据库以及数据挖掘等方面,包括一些搜索引擎技术、元数据以及专业指引库技术等。 而现 在,我国无法提出适合我国信息技术快速发展的信息资源管理手段,虽然也有很多研究性的理论知识,但是将其付诸实践的难度却很大。结论:通过研究发现,关于大数据的开发虽然已经取得巨大进步,但仍处于初级阶段,在信息技术与信息管理方面

20、尚有较大提升空间,应用范围也有待进一步扩展,同时它的反本质主义倾向也易于导致边际的泛化扩展,这都需要进一步研究解决。最后我们应该看到,大数据作为信息管理领域内出现的一种新理念、新技术,它为我们带来了新的契机,面对这一历史的端点,我们有责任与义务投入全部的科 研热情与力量,将我国大数据研究推至世界领先地位,以保证我们在新世纪激烈的竞争环境中占据有利地位参考文献:1梁吉业,冯晨娇,宋鹏.大数据相关分析综述J.计算机学报,2016,(01):1-18.2黄欣荣.大数据技术的伦理反思J.新疆师范大学学报(哲学社会科学 版),2015,(03):46-53+2.3黄刘生,田苗苗,黄河.大数据隐私保护密码

21、技术研究综述J.软件学 报,2015,(04):945-959.4李学龙,龚海刚.大数据系统综述J.中国科学:信息科学,2015,(01):1-44.5孙杰,贺晨.大数据时代的互联网金融创新及传统银行转型J.财经科 学,2015,(01):11-16.6刘雅辉,张铁赢,靳小龙,程学旗.大数据时代的个人隐私保护J.计算机研究与发 展,2015,(01):229-247.107方巍,郑玉,徐江.大数据:概念、技术及应用研究综述J.南京信息工程大学学报(自然科学版),2014,(05):405-419.8何克抗.大数据面面观J.电化教育研究,2014,(10):8-16+22.9任磊,杜一,马帅,张小龙,戴国忠.大数据可视分析综述J.软件学报,2014,(09):1909-1936.10

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论