企业大数据解决方案_第1页
企业大数据解决方案_第2页
企业大数据解决方案_第3页
企业大数据解决方案_第4页
企业大数据解决方案_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大数据时代,泽佳助力企业发展大数据时代,泽佳助力企业发展2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 2 页什么是大数据什么是大数据2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 3 页数据无处不在数据无处不在任何时间,任何地点,任何事情,任何人任何时间,任何地点,任何事情,任何人? ?Anytime,anywhere,anything, anyone?休息中,随意刷微博爬山时,记录每一瞬间旅途中,处理公司事件工作时,实时掌握市场动态2013 北京泽佳公

2、司版权所有Copyright2013 Zejia Consulting Corporation第 4 页大数据时代已经来到大数据时代已经来到每分钟都有大量数据产生1min486笔订单(2012年11月)7.3万笔交易数(2012年双11)1.1GB文件下载9.5万条微博发送14万张照片上传70TB处理数据2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 5 页互联网中的大数据互联网中的大数据n Web 3.0时代,社交媒体网站数据出现井喷式激增,截至2013年3月底,新浪微博注册用户数增长到5.36亿,日均活跃用户数达到498

3、0万,每日新增微博约2亿。n 企业在大数据时代,面临文化、战略、组织、流程、信息化、公共公关系、人才培养方方面面的挑战,同时也迎来重大的转型机遇和飞跃契机。2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 6 页互联网中的大数据互联网中的大数据 大数据在消费IT领域的作用更加明显。只要你用PC上网或手机浏览信息,你便在网络上处处留照了,性别、年龄、爱好、踪迹、信用等等便被大数据刻画的一览无余,恭喜你已经成为数字透明人了!可能你都不知道自己下一步要干什么,产品经销商借助搜索引擎、电子商务平台、旅游网站的数据根据你的浏览行为已经在

4、为你张罗生日、餐饮、旅游、结婚、生子、购房、购车了,特价机票、婚纱、尿不湿、奶粉、海景房等广告已经为你编排好了。大数据在消费IT领域的作用更加明显。只要你用PC上网或手机浏览信息,你便在网络上处处留照了,性别、年龄、爱好、踪迹、信用等等便被大数据刻画的一览无余,恭喜你已经成为数字透明人了!可能你都不知道自己下一步要干什么,产品经销商借助搜索引擎、电子商务平台、旅游网站的数据根据你的浏览行为已经在为你张罗生日、餐饮、旅游、结婚、生子、购房、购车了,特价机票、婚纱、尿不湿、奶粉、海景房等广告已经为你编排好了。2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting

5、 Corporation第 7 页企业企业ITIT进入进入2.02.0时代时代 随着公司业务的增长,大量和流程、规则相关的非结构化数据也爆发式增长。比如:1、业务系统现在平均每天存储20万张图片,磁盘空间每天消耗100G;2、平均每天产生签约视频文件6000个,每个平均250M,磁盘空间每天消耗1T;2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 8 页大大数据的特性数据的特性价值Veracity体量Volume多样性Variety速度Velocity68%31%来源多;格式多:大数据包括结构化数据和非结构化数据,邮件,Wo

6、rd,图片,音频信息,视频信息。最新研究报告,到2020年,全球数据使用量预计暴增44倍,达到35.2ZB。价值密度低,犹如沙里淘金,海量业务中寻找价值。1秒定律,实时获取所需要的数据,为决策提供依据。2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 9 页企业企业大数据的挑战大数据的挑战业务数据的映射提取大数据价值大数据隐私大数据分析2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 10 页泽佳建议企业大数据解决方案泽佳建议企业大数据解决方案2013 北京泽

7、佳公司版权所有Copyright2013 Zejia Consulting Corporation第 11 页大数据基础架构要求大数据基础架构要求n 可预测的低延迟n 高事务参数n 灵活的数据结构获取获取组织组织分析分析决策决策n 高吞吐量n 就地准备n 所有数据源和结构n 深度分析n 敏捷开发n 高度可伸缩性n 实时n 流数据n 运营影响2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 12 页泽泽佳大数据解决方案,以数据融合、综合处理为方向佳大数据解决方案,以数据融合、综合处理为方向大交易数据大交互数据大交易融合大数据处理

8、企业供应链消费者SNS互联网物联网移动终端OLTP实时 交易处理OLAP实时分析处理SOCIAL MEDIA DATAOTHERINTERACTION DATAMachine/DeviceSensors/meters/RFID tags CDR/mobileSD,MM,PP,SD,FICO。2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 13 页泽佳大泽佳大数据数据解决方案解决方案整体架构整体架构企业内外部协同(供应商+企业内部+客户+银行+税务+政府+社区+)外部信息(社交+电商+移动+视音频+)开放式API和协议通用的设

9、计和模型环境通用数据管理环境交易数据管理社交数据管理移动数据管理主数据管理内存数据管理企业数据仓库管理数据存储数据获取数据组织数据分析数据展现无线数据管理信息管理和实时数据迁移联合访问实时大数据平台门户数据分析 电子邮件 办公软件大屏幕电脑桌面 移动终端企业级报告工具Ad hoc 即时查询 例外分析非结构化数据探索预测与挖掘2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 14 页泽泽佳大数据佳大数据解决解决方案体系方案体系数据多样性模式动态模式HDFS分布式文件系统Hbase分布式列存储系统Sybase ESP事件流处理器H

10、doop MapReduceBig Data ConnectorsYoung hong BI获取组织分析决策复杂场景处理实 时决 策ETLEDW2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 15 页一般企业数据处理一般企业数据处理平台的基础架构平台的基础架构2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 16 页泽泽佳大数据解决方案基础架构佳大数据解决方案基础架构门户泽佳大数据平台快速、可靠大屏幕电脑桌面电子邮件SCMSCMCRMCRMERPERP数据分

11、析人员办公软件移动终端安全,部署,管理灵活体系MESMESPDMPDM2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 17 页泽泽佳建议企业大数据佳建议企业大数据解决解决方案基础架构方案基础架构图图2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 18 页应用层数据分析应用层数据分析2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 19 页视频存储视频存储2013 北京泽佳公司版权所有Cop

12、yright2013 Zejia Consulting Corporation第 20 页离线离线日志分析日志分析2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 21 页在线数据分析在线数据分析2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 22 页大大数据解决方案特点数据解决方案特点泽佳大数据解决方案提供高速、低速两种互联解决方案,在节点间能够建立起40Gb的互联通路,彻底消除系统节点间通信的瓶颈。高性能高可扩展性高可靠相比较传统的数据库集群,泽佳大数据

13、解决方案具有良好的可扩展性,随着数据节点的增加,系统整体性能接近线性增加。同时数据节点可以在系统运行中动态添加,对系统不会造成任何影响。因此企业可以根据自身业务需要,动态添加数据节点,当业务量较小时,配置较少的数据节点,随着业务量的逐渐增多,添加相应的数据节点,从而满足自身业务量增长的需求。泽佳大数据解决方案能自动地维护数据的多份复制,并且在任务失败后能自动地重新部署(redeploy)计算任务。同时消除系统单点故障,系统中任意一个部分出现故障,系统将自动进行切换,保证用户应用的无缝连接,具有较高的稳定性和可靠性。2013 北京泽佳公司版权所有Copyright2013 Zejia Consu

14、lting Corporation第 23 页大大数据应用技术数据应用技术2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 24 页大大数据的技术领域占位图数据的技术领域占位图2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 25 页泽泽佳大数据应用主要技术佳大数据应用主要技术 Hadoop Hadoop 据IDC的预测,全球大数据市场2015年 将达170亿美元规模,市场发展前景很大。而HadoopHadoop作为作为新一代的架构和技术,因为有利于并行分布处

15、理 “大数据”而备受重视。 Apache Hadoop 是一个用java语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,它可以让应用程序支持上千个节点和PB级别的数据。 Hadoop是项目的总称,主要是由分布式存储(HDFS)、分布式计算(MapReduce)等组成 。 2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 26 页HadoopHadoop体系架构体系架构MapReduceHDFSHBasePigChuKwaHiveZooKeeperlPig是一个基于Hadoop的大规模数据分析平台,Pig

16、为复杂的海量数据并行计算提供了一个简易的操作和编程接口。lChukwa是基于Hadoop的集群监控系统,由yahoo贡献。lHive是基于Hadoop的一个工具,提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。lZooKeeper:高效的,可扩展的协调系统,存储和协调关键共享状态。lHBase是一个开源的,基于列存储模型的分布式数据库。lHDFS是一个分布式文件系统。有着高容错性的特点,并且设计用来部署在低廉的硬件上,适合那些有着超大数据集的应用程序。lMapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算2013 北京泽佳公司版权所有Cop

17、yright2013 Zejia Consulting Corporation第 27 页HadoopHadoop核心设计核心设计2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 28 页HDFSHDFS文件读流程文件读流程HDFS是一个分布式文件系统。有着高容错性的特点,并且设计用来部署在低廉的硬件上,适合那些有着超大数据集的应用程序。lClient向NameNode发起文件读取的请求。lNameNode返回文件存储的DataNode的信息。lClient读取文件信息。2013 北京泽佳公司版权所有Copyright2013

18、 Zejia Consulting Corporation第 29 页HDFSHDFS文件写流程文件写流程lClient向NameNode发起文件写入的请求。lNameNode根据文件大小和文件块配置情况,返回给Client它所管理部分DataNode的信息。lClient将文件划分为多个Block,根据DataNode的地址信息,按顺序写入到每一个DataNode块中。2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 30 页MapReduceMapReduce映射、化简编程模型映射、化简编程模型输入数据-Map分解任务-执

19、行并返回结果-Reduce汇总结果-输出结果2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 31 页HbaseHbase分布式数据存储系统分布式数据存储系统lClient:使用HBase RPC机制与HMaster和HRegionServer进行通信lZookeeper:协同服务管理,HMaster通过Zookeepe可以随时感知各个HRegionServer的健康状况lHMaster: 管理用户对表的增删改查操作lHRegionServer:HBase中最核心的模块,主要负责响应用户I/O请求,向HDFS文件系统中读写数据

20、lHRegion:Hbase中分布式存储的最小单元,可以理解成一个TablelHStore:HBase存储的核心。由MemStore和StoreFile组成。lHLog:每次用户操作写入Memstore的同时,也会写一份数据到HLog文件2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 32 页大大数据未来发展瓶颈数据未来发展瓶颈 通过对大数据产业链的分析,我们可以看到,在大数据产业链的各个生产环节中,各大公司都已开占位,随着高性能计算机、海量数据的存储和管理的流程的不断优化,技术能够解决的问题终将不会成为问题。我们认为,真正

21、会制约或者成为大数据发展和应用瓶颈的有三个环节:n 数据收集和提取的合法性,数据隐私的保护和数据隐私应用之间的权衡。n 大数据发挥协同效应需要产业链各个环节的企业达成竞争与合作的平衡。n 大数据结论的解读和应用。2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 33 页NoSQLNoSQL产品产品2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 34 页大大数据应用案例数据应用案例2013 北京泽佳公司版权所有Copyright2013 Zejia Consu

22、lting Corporation第 35 页大数据行业应用分析大数据行业应用分析应用可能性应用可能性电信政府(公共事业)交通金融医疗教育能源(电力/石油)n纵轴契合度:纵轴契合度:表示该用户的IT应用特点与大数据特性的契合程度;n横轴应用可能性横轴应用可能性:表示该用户出于主客观因素在短期内投资大数据的可能性;u 注:注:该位置为分析师访谈的综合印象,为定性分析,图中位置不代表具体数值HighHighMidMidLowLowLowLowMidMidHighHigh优先关注行业用户应用特点与大数据技术有较高的契合度,在主客观条件上也有较高的应用可能性。值得关注行业用户应有特点与大数据的契合度及

23、应用可能性综合较高适当关注行业用户两个维度暂时都不具备优势,可适当给予关注互联网(电子商务)契合度契合度流通零售制造2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 36 页互联网行业大数据需求分析互联网行业大数据需求分析网络终端设备网络终端设备 网络技术的升级和终端设备的爆发,使今天的用户能够使用多种设备、从不同位置、通过多种手段来接入互联网,并在这一过程中不断创造新内容在线应用和服务在线应用和服务 越来越丰富的在线应用和服务,不断激励用户创造和分享信息,尤其是社会化媒体业务,带动图片、视频等非结构化数据飞速增长与各垂直行业

24、的融合与各垂直行业的融合 互联网作为一个高渗透力的行业,正在与各垂直行业发生深度的融合,原本隐藏于先下的孤岛信息,源源不断的输入到线上。互联网行业拥抱大数据的关键因素互联网行业拥抱大数据的关键因素互联网大数据技术的应用,会首先带动社会化媒体、互联网大数据技术的应用,会首先带动社会化媒体、电子商务的快速发展,其他的互联网分支也会紧追电子商务的快速发展,其他的互联网分支也会紧追其后,整个行业在大数据的推动下将会蓬勃发展。其后,整个行业在大数据的推动下将会蓬勃发展。l互联网行业对数据实时分析要求较高,例如广告监测、B2C业务,往往要求在数秒内返回上亿行数据的分析,从而达到不影响用户体验和快速准确营销的目的。l目前互联网企业面对大数据,会普遍感觉到实时分析能力差、海量数据处理效率低、缺少分析方法、分析软件能力差等问题。互联网行业大数据分析面互联网行业大数据分析面临的主要问题临的主要问题2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation第 37 页腾腾讯基于讯基于HadoopHadoop的大数据架构图的大数据架构图2013 北京泽佳公司版权所有Copyright2013 Zejia Consulting Corporation

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论