大数据发展概况及行业解决方案_第1页
大数据发展概况及行业解决方案_第2页
大数据发展概况及行业解决方案_第3页
大数据发展概况及行业解决方案_第4页
大数据发展概况及行业解决方案_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大数据发展概况及行业处理方案第1页目录1 了解大数据2 大数据业界处理方案及经典应用概览第2页移动互联时代,数据暴发性增加在60秒内,YouTube会上传48小时视频;Google会收到2000000次搜索请求;Facebook用户会分享684478条信息;当前世界上90%以上数据是最近3年才产生;年0.8Z,每年将增加50%,每两年便将翻一番,而预测全球数据使用量到20会增加44倍,到达35.2ZB (1ZB = 10亿TB);数字宇宙第3页大数据主要起源较少:传统IT,企业业务系统,门户网站;15%;较多:社交网络兴起,大量UGC(用户自生成内容)内容、音频、文本信息、视频、图片,非结构化

2、数据出现了;最多:物联网数据量更大,加上移动互联网能更准确、更加快地搜集用户信息,比如环境、位置、生活信息等数据;并处于急剧加速趋势;231第4页什么是大数据Wiki百科:大数据(Big Data)是指那些超出传统技术处理能力数据。它数据规模和转输速度要求很高,或者其结构不适合原本技术存取、处理。IDC:大数据,通常是指处理问题一个方法,即经过搜集、整理生活中方方面面数据,并对其进行分析挖掘,进而从中取得有价值信息,最终衍化出一个新商业模式。实体角度广泛意义第5页大数据主要特征:4V多样化高速化准确化海量化第6页Volume:大数据体量巨大天天25TB日志数据天天上传168TB视频天天9500

3、万条8全球数据存放量(ZB)2.71.81086420数量可能是与大数据最相关特征;从TB级别,跃升到PB、ZB级别;前所未有规模和加速趋势;第7页Variety:大数据多样性 数据形式多样结构化数据,数据间有很强因果关系;半结构化数据,数据间因果关系较弱;非结构化数据, 数据间无因果关系;数据起源多样性不一样应用系统各种设备互联网其它第8页Velocity:大数据处理速度要求越来越高大数据与海量数据一个主要区分,在于不但数据尺寸大,而且对数据处理响应速度有着更高要求;处理速度快,1秒定律;传统以周,天,小时为单位运算处理周期,下降到以分钟,秒为单位;大数据高价值主要表达-处理速度;信用卡欺诈

4、检测:经过分析每个客户历史用卡行为, 使用欺诈检测模型实时来检测每一笔交易是否异常。案例第9页Veracity:准确化,大数据低价值密度高准确要求数据不确定性。比如人感情,天气形势,经济原因,环境信息等。价值密度低。以视频为例,连续不间断监控过程中,可能有用数据仅仅有一两秒。准确性是大数据最主要特征,表达价值;客观数据体毫无意义;准确是对大数据方法要求和挑战,第10页第5V,大数据价值大数据关键,第5V:Value;eBay精准在线营销Ebay 有 1.8 亿个活跃用户,有 3.5 亿左右商品被销售,天天会产生 2.5 亿次搜索,拥有原始数据是 10 PB;用户行为模式+用户基本信息,更精准定

5、位客户,感知客户购物需求,促成在线交易率;新浪微博+淘宝;QQ;美国海啸预警日本大地震发生后仅9分钟,美国国家海洋和大气管理局(NOAA)就公布了详细海啸预警,制作海啸影响模型出现在YouTube等网站;NOAA快速反应基于其全球范围内庞大海洋传感器网络,获取全球范围海洋信息,并对取得实时数据进行计算机模拟。NOAA数据中心存放着超出20Pb数据,是美国政府最大数据库之一。数据进行专业化处理,并与已知现实相融合,洞察运行,促进和创新;数字石油;数据回报率=数据价值/数据成本;全球大数据市场规模从今年148.7亿美元增加到年463.4亿美元。我们在信息海洋里淹死了,却在知识海洋里渴死了。第11页

6、大数据带来主要挑战和机遇数据存放;处理能力;实时响应;业务价值;传统IT架构和技术已经不能适应大数据处理需求;第12页大数据发展历程早在1980年,著名未来学家阿尔文托夫勒便在第三次浪潮一书中,将大数据赞颂为“第三次浪潮”;全球著名咨询企业麦肯锡最早提出“大数据”时代到来; 从年开始,“大数据”才成为互联网信息技术行业流行词汇;20出版大数据时代,对大数据进行系统、明确阐述;203月,美国政府投资2亿美元开启“大数据研究和发展计划”,美国政府认为大数据是“未来新石油”,将“大数据研究”上升为国家意志。我国还未提出国家层面大数据战略,在十二五规划中把大数据作为物联网相关关键技术提及;EMC、惠普

7、、IBM、微软在内全球IT巨头纷纷布局大数据;今年最大收购案都与大数据相关:Oracle对Sun、惠普对Autonomy;状态:大数据相当于年左右云计算:概念炽热,探索实践,落地较少;第13页大数据市场前景1-年中国大数据市场规模2各行业大数据市场规模计世资讯预测,政府、互联网、电信、金融大数据市场规模较大,四个行业将占据二分之一市场份额。公共服务(环境保护、交通);移动互联电子商务;因为各个行业都存在大数据应用需求,潜在市场空间非常可观。计世资讯认为,是中国大数据市场元年,一些大数据产品已经推出,部分行业也有大数据应用案例产生。年-20,将迎来大数据市场飞速发展。计世资讯预测,年中国大数据市

8、场规模将到达4.7亿元,20大数据市场将迎来增速为138.3%飞跃,到20,整个市场规模迫近百亿。十二五规划落地,4G;第14页大数据与传统经分(BI)结构化数据数据规模普通为TB规模集中式为了分析进行大量数据移动,数据向计算靠近样例抽样,批处理为主结构化/非结构化混合分析能力数据规模从数十TB到PB级别分布式,计算向数据靠近全量,支持流式分析实时性要求高,1秒定律;含有最深血缘关系第15页大数据与云计算当今最火两个概念,相互融合;云计算使大数据成为可能,大数据靠云计算技术实施和落地;大数据在于对海量数据挖掘和处理,传统技术无法支撑,它必须依靠云计算分布式处理、分布式数据库、云存放和/或虚拟化

9、技术;大数据比云计算更宜落地;商业模式驱动 vs 应用需求驱动大数据与云计算是天作之合第16页目录1 了解大数据2 大数据业界处理方案及经典应用概览大数据企业实践方法大数据行业趋势热点大数据业界处理方案大数据经典应用案例第17页企业大数据应用四重奏第18页企业大数据实践演进路线认识和学习探索和规划落地和实践执行和推广内容建立知识库;意识和知识培养和积累;从技术和业务价值等角度;个人、单元进行知识搜集,而非正式组织重视知识积累与市场观察;相关技术试验性应用;企业大数据战略蓝图:数据角色,技术方向,投资回报;企业大数据演进路线:基于业务需求,分步骤优先级处理数据,部门,业务域;在有限范围内,落地大

10、数据项目;验证技术、战略和业务方向;人力、技能、经验积累;形成企业级标准规范;扩大范围,大规模使用大数据应用;大数据长期化,重点聚焦业务运行和创新;提升、优化数据分析能力;第19页企业大数据实践演进路线认识和学习探索和规划落地和实践执行和推广高管对大数据支持无高管首席信息官业务高管(相关)首席执行官负责业务线高管早期技术推进,伴随范围扩大和效果显现,业务高管逐步重视,并最终发挥更关键业务关键作用,实现业务主导价值最大化。第20页企业大数据实践演进路线认识和学习探索和规划落地和实践执行和推广所需数据时效性一星期内二十四小时内同一个工作日内实时传送伴随大数据应用深入,缩短数据时延,提升数据时效性。

11、数据不再仅仅是辅助支持决议东西;而是在制订该决议时一个业务关键要素。第21页企业大数据实践演进路线认识和学习探索和规划落地和实践执行和推广主要障碍制订有吸引力业务投资回报分析汇报了解怎样使用大数据管理与资源支持技术能力资源支持到能力提升;制订有吸引力业务投资回报分析汇报能力,贯通一直;数据质量分析能力第22页企业大数据分析能力组成传统经分 + 数据拥有 + 处理分析能力 + 业务融合第23页目录1 了解大数据2 大数据业界处理方案及经典应用概览大数据企业实践方法大数据行业趋势热点大数据业界处理方案大数据经典应用案例第24页大数据关键技术第25页大数据重点行业及应用21互联网行业大数据主要应用在

12、社交和网购方面结合位置数据、消费数据进行实时营销信息推送是电信行业大数据应用主要场景3金融行业大数据应用场景主要集中在投资方面4制造行业含有多步骤、多地域特色,各个步骤优化是制造行业最关注大数据应用场景永无止境第26页大数据价值热点趋势依据IDC和麦肯锡大数据研究结果总结,大数据主要能在以下4个方面挖掘出巨大商业价值:对整个用户群体细分,然后对每个群体量体裁衣般采取独特行动;利用大数据模拟实境,发掘新需求和提升投入回报率;提升大数据结果在各相关部门分享程度,提升整个管理链条和产业链条投入回报率;进行商业模式、产品和服务创新。综合来看,未来几年大数据在商业智能、公共服务和市场营销三个领域应用非常

13、值得看好,大多数大数据案例和预算将发生在这三个领域。从单纯关注技术“T”转为愈加关注信息“I”,让数据产生价值第27页目录1 了解大数据2 大数据业界处理方案及经典应用概览大数据企业实践方法大数据行业趋势热点大数据业界处理方案大数据经典应用案例第28页四类大数据处理平台;数据分析平台:提供高效存放和快速列存放式数据库,能为客户分析处理PB级数据,比如HP Vertica。数据操作平台:企业级NOSQL数据库,Couchbase和MarkLogic等。IaaS:分布式云计算平台,主要产品有Amazon, Infochimps等;结构化数据库:结构化数据库产品,Oracle, Microsoft

14、SQL Server, MySQL, PostgreSQL, memsql, Sybase, IBM DB2等;围绕大数据生态产业链数据应用层数据处理层基础支撑层基础支撑技术,包含Hadoop, MapReduce, Hbase, Cassandra, Mahout等分布式大数据支撑平台;分析和可视化应用;商业智能;DaaS;国内、国外分布;广告/媒体应用;日志数据应用;垂直应用;第29页大数据方案供给商角色综合方案供给商专业厂商互联网厂商电信运行商综合处理方案供给商:IBM、 HP、 EMC、Microsoft等IT巨头,提供端到端产品和处理方案;面向应用分析专业厂商:vertica、 sp

15、lunk 、cloudera,引跑科技,华夏威科,以提供软件和服务为主;国内厂商大多据此;互联网厂商:大数据拥有者,服务者,收益者,领跑者;阿里、腾讯、baidu等;电信运行商:互联网化转型;第30页阿里大数据战略架构马云对阿里集团未来“平台、金融、数据”三大构想战略;阿里集团当前拥有大数据到达30P,其中1P等于100万GB;阿里是大数据拥有者,数据服务提供者、收益者;自用 + 他用;现在数据开放应该是以TOP平台为主面向电商平台客户开放,比如数据魔方开放。打造开放生态系统:近期慎重开放;互联网厂商是大数据战略实践领跑者第31页引跑科技 EngineOne大数据处理平台云数据库云搜索引擎云内

16、容管理结构化数据海量数据搜索非结构化数据.云操作系统EngineOne: 一站式、弹性、高性价比大数据处理平台第32页引跑科技 EngineOne大数据处理平台云计算关键:云数据库、云内容管理、云搜索引擎第33页目录1 了解大数据2 大数据业界处理方案及经典应用概览大数据企业实践方法大数据行业趋势热点大数据业界处理方案大数据经典应用案例第34页案例:阿里 数据魔方第35页阿里 数据魔方数据魔方淘宝官方数据产品分享海量行业数据致力帮助商家实现数据化运行用数据做行业定位、点亮品牌路。订购条件:集市五钻以上或者天猫用户适用人群:中大卖家,品牌商专业版 3600元/年;标准版 90元/季; 第36页第一时间实时监测店铺成交,店铺在行业内经营改变,帮助您实时掌握店铺动向。第37页行业分析俯瞰行业市场大盘,分析行业内热销宝贝,热卖店铺买家信息等。帮助您做品类管理、定价、定向营销。第38页市场细分从品牌、产品、属性角度分析热销宝贝,热卖店铺

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论