大数据的特征_第1页
大数据的特征_第2页
大数据的特征_第3页
大数据的特征_第4页
大数据的特征_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

01数据的体量巨大(Volume)02数据的类型繁多(Variety)04数据的处理速度快(Velocity)03数据的价值密度低(Value)05数据的准确性(Veracity)06数据的动态性(Vitality)数据的体量巨大(Volume)

01数据的体量巨大(Volume)

这就是大数据本身的本质,有很多数据,很大数据量。而数据量本身并不使数据变得有用,所以我们需要对它进行再次的处理。计算机的运行速度决定了没法迅速处理如此大的数据规模,所以在大量数据领域,还有类似存储,访问和处理相关的成本,可扩展性和性能等等挑战。数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。截至目前,人类生产的所有印刷材料的数据量是200PB(1PB=210TB),而历史上全人类说过的所有的话的数据量大约是5EB(1EB=210PB)。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。数据的类型繁多(Variety)

02数据的类型繁多(Variety)

数据格式多样性:包含文字、影音、网页、串流等等结构性、非结构性的数据等等。来源多样性:从动车系统传来的实时数据,从沃尔玛系统每周统计的数据等。媒体多样性:随着多媒体的发展,用来传播的媒体也越来越多,如音频、视频、图片等等。语义多样性:分为两个方面。一方面,举个最简单的例子,我们可以用数字来表示年龄,我们也有用小孩,青年,老人来表示年龄。另一方面,在不同语义情况下,相同的词会蕴含不用的意思。种类和来源多样化。这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。数据的价值密度低(Value)03数据的价值密度低(Value)数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,存在大量不相关信息。价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。由此需要对未来趋势与模式作可预测分析,利用机器学习、人工智能等进行深度复杂分析。而如何通过强大的机器算法更迅速地完成数据的价值提炼,是大数据时代亟待解决的难题。虽然单位数据的价值密度在不断降低,但是数据的整体价值在提高。数据的处理速度快(Velocity)04数据的处理速度快(Velocity)这里解释为处理数据的速度,因此访问速度和得到所需结果的速度是至关重要的。举个例子,GoogleFluTrends(虽然已经证明是失败的了)能够预测流感,通过实时收集数据进行运算,如果你的运算速度比较慢,处理不了那么多数据,那么在流感爆发的时候,你还没有计算出这个区域有没有流感潜伏,这就失去了时效性。所以处理速度很重要。数据增长速度快,处理速度也快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。数据的准确性(Veracity)05数据的准确性(Veracity)当数据源变得多元时,数据的准确性和可信赖度,即数据的质量。数据的动态性(Vitality)06数据的动态性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论