版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据技术概述数据世界的本质是数据!
--维克托·迈尔-舍恩伯格维克托·迈尔-舍恩伯格维克托·迈尔-舍恩伯格是十余年潜心研究数据科学的技术权威,是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。文本图像声音视频动画……数据我们周围到底有多少数据?增长的速度有多快?我国网民数量居世界之首,每天产生的数据量也位于世界前列。单日数据产生量超过5万GB存储量4000万GB淘宝网站目前数据总量10亿GB存储网页1万亿页每天大约要处理60亿次搜索请求百度公司身边的数据我们周围到底有多少数据?增长的速度有多快?我国网民数量居世界之首,每天产生的数据量也位于世界前列。一个小时能产生3.6GB的数据一个城市每月产生的数据达上千万GB一个8Mbps的摄像头一个病人的CT影像数据量达几十GB全国每年需保存的数据达上百亿GB医院身边的数据身边的数据全球:35ZB(2020)百度:74PB、8PB阿里:60PB,7.2PB腾讯:100PB,4PB需永久存储的数据量每天高峰处理的数据量数据单位单位等价关系1Byte8bit1KB1024Byte1MB1024KB1GB1024MB1TB1024GB1PB1024TB单位等价关系1EB1024PB1ZB1024EB1YB1024ZB1BB1024YB1NB1024BB1DB1024NB目前的大数据应用,数据量主要集中在PB/EB/ZB级别大数据据IDC发布《数据时代2025》的报告显示,全球每年产生的数据将从2018年的33ZB增长到175ZB,相当于每天产生491EB的数据。175ZB的数据到底有多大呢?1ZB相当于1.1万亿GB。如果把175ZB全部存在DVD光盘中,那么DVD叠加起来的高度将是地球和月球距离的23倍(月地最近距离约39.3万公里),或者绕地球222圈(一圈约为四万公里)。如果平均网速为25Mb/秒,一个人要下载完这175ZB的数据,需要18亿年。大数据大数据或称海量数据,是指涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理并处理成为帮助用户经营决策更积极目的的信息。大数据是一个体量和数据类别特别大的数据集,无法用传统数据库工具对其内容进行抓取、管理和处理。大数据本质上和传统的数据本无差异,他们大多是结构化、半结构化或者非结构化的数据。只是因为他们的数量级增长太快,我们需要用全新的方式来计算这些数据。大数据大数据(bigdata),是指无法在一定时间内用常规软件工具进行捕捉、管理和处理的数据集合,因此需要新的处理模式,该处理模式就是大数据.单机计算模式和传统的数据分析算法①采用集群的方法来获取强大的数据分析能力;②研究面向大数据的新的数据分析算法大数据的特点大数据1.Volume2.
Variety3.Varacity4.Velocity结构化数据、半结构化数据和非结构化数据如今的数据类型早已不是单一的文本形式,订单、日志、音频,能力提出了更高的要求沙里淘金,价值密度低以视频为例,一部一小时的视频,在连续不间断监控过程中,可能有用的数据仅仅只有一两秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”是目前大数据汹涌背景下亟待解决的难题实时获取需要的信息大数据区分于传统数据最显著的特征。如今已是ZB时代,在如此海量的数据面前,处理数据的效率就是企业的生命数据量巨大全球在2010年正式进入ZB时代,IDC预计到2020年,全球将总共拥有35ZB的数据量大数据解决什么问题?大数据云计算是硬件资源的虚拟化,而大数据是海量数据的高效处理。大数据着眼于数据,云计算着眼于计算,数据是计算的对象。大数据的总体架构包括三层:数据存储,数据处理和数据分析。分布式数据挖掘分布式处理分布式数据库云存储虚拟化如:Mahout如:MapReduc
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 制作儿童课件教学课件
- 目送课件底板教学课件
- 蘑菇屋课件教学课件
- 卡通游戏课件教学课件
- 2024年度云计算平台广告业务合同
- 2024年度八宝山殡仪馆鲜花制品物流配送服务合同
- 2024年度委托加工协议(定制产品)
- 2024年塑料模具生产与交付合同
- 2024年度健康医疗服务合同服务细节
- 2024供水供电合同
- 人力资源管理师(三级)课件合集
- 2024贵州省榕江县事业单位招聘100人历年高频难、易错点500题模拟试题附带答案详解
- 绵阳市高中2022级(2025届)高三第一次诊断性考试(一诊)物理试卷
- 标志设计 课件 2024-2025学年人教版(2024)初中美术七年级上册
- 校园班级大队委竞选内容课件演示
- 2024版合同范本之711便利店加盟合同
- 医疗机构工作人员廉洁从业九项准则
- 1《观潮》(课件)语文四年级上册统编版
- 部编版小学二年级道德与法治上册 第四单元 我们生活的地方 学历案设计
- 人教版九年级化学电子版教材(全册)-课件资料
- 2024年秋国开形策大作业【附3份答案】:中华民族现代文明有哪些鲜明特质?建设中华民族现代文明的路径是什么
评论
0/150
提交评论