HC1209201第一章大数据概述2026.ppt_第1页
HC1209201第一章大数据概述2026.ppt_第2页
HC1209201第一章大数据概述2026.ppt_第3页
HC1209201第一章大数据概述2026.ppt_第4页
HC1209201第一章大数据概述2026.ppt_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、修订记录,本页不打印,HC1209201 第一章 大数据概述,目标,学完本课程后,您将能够: 描述大数据产生、概念和特征; 理解大数据对IT的需求和促进因素 了解大数据方案。,目录,大数据产生与特点 大数据对IT的需求与促进 大数据解决方案,IT发展时代的数据变迁,海量数据产生,DATA,海量数据的管理难题,数据类型,移动商务,CRM 数据,计划,机会,事务,客户,销售订单,事物,即时消息,需求,库存,大数据,销售订单,事物,移动商务,需求,大数据,CRM 数据,客户,计划,事务,结构化数据与非结构化数据,解构大数据,大数据特征,目录,大数据产生与特点 大数据对IT的需求和促进 大数据解决方案

2、,数据应用中的性能与容量,大数据对技术要求,对应挑战,数据挖掘、商业智能、数据搜索,关键技术,Volume海量,Velocity快速,Value价值,Variety多样性,并行计算(批量计算、流计算),非结构化:分布式文件/对象系统 半结构化:NoSQL数据库 结构化:分布式数据库,异构数据融合 ETL过程优化,大数据分析技术,大数据存储技术,数据可视化,大数据对IT系统要求,单机,集群,NAS,单机,GE FC,FC,关系型数据库,10GE FC IB,分布式数据库 非关系型数据库,双控阵列,10GE SAS IB,横向扩展 块级虚拟化,横向扩展 分布式文件系统,计算瓶颈,存储瓶颈,网络瓶颈

3、,数据库瓶颈,应用独占主机多应用共享大规模资源池,大数据推动IT架构演进(一),IT基础设施架构从以计算为中心以数据为中心,大数据推动IT架构演进(二),大规模并行处理 持久化内存,大数据对存储技术促进(一),数据保护,数据管理,数据流动,Rest,快照 远程复制 EC,动态分层 策略驱动,归档/节能/Worm 重删、压缩 快速搜索和分类检索,特性,接口,存储池1(租户A),存储池2(租户B),A,B,B2,B1,A2,C,R,全局命名空间,基础架构,A1,大数据对存储技术促进(二),大数据应对技术发展趋势,2011,201x,2013,2015,生活助理,机器人,报表仪表盘,广告,推荐,精准营销,RDBMS,NOSQL DB,MPP DB,以客户画像为基础的业务,分布式内存计算技术,HP小型机,IBM小型机,X86机架服务器,刀片服务器,统计分析,OLAP分析,预测分析,数据应用发展趋势,数据智能发展趋势,存储计算发展趋势,硬件发展趋势,目录,大数据产生与特点 大数据对IT的需求和促进 大数据解决方案,大数据存储解决方案,互联网大数据解决方案- HADOOP,Hadoop大数据分析,总结,大数据产生与特点 大数据对IT的需求和促进 大数据解决方案,思考题,大数据的特点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论