版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据时代,泽佳助力企业发展第1页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第2页数据无处不在任何时间,任何地点,任何事情,任何人?Anytime,anywhere,anything,anyone?休息中,随意刷微博爬山时,统计每一瞬间旅途中,处理企业事件工作时,实时掌握市场动态第2页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第3页大数据时代已经来到每分钟都有大量数据产生1min486笔订单(11月)7.3万笔交易数(双11)1.1GB文件下载9.5万条微博发送14万张照片上传70TB处理数据第3页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第4页企业大数据势不可挡Web3.0时代,社交媒体网站数据出现井喷式激增,截至3月底,新浪微博注册用户数增加到5.36亿,日均活跃用户数到达4980万,每日新增微博约2亿。企业在大数据时代,面临文化、战略、组织、流程、信息化、公共公关系、人才培养方方面面挑战,同时也迎来重大转型机遇和飞跃契机。第4页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第5页大数据特征
V
V
V
V价值Veracity体量Volume多样性Variety速度Velocity68%31%大数据包含结构化数据和非结构化数据,邮件,Word,图片,音频信息,视频信息。最新研究汇报,到,全球数据使用量预计暴增44倍,到达35.2ZB。沙里淘金,海量业务中寻找价值。1秒定律,实时获取所需要数据,为决议提供依据。第5页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第6页企业大数据挑战业务数据映射提取大数据价值大数据隐私大数据分析第6页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第7页大数据和云计算关系商业模式驱动应用需求驱动云计算改变了IT,而大数据则改变了业务云计算是大数据IT基础,大数据须有云计算作为基础架构,才能高效运行经过大数据业务需求,为云计算落地找到了实际应用第7页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第8页大数据市场分析1-年中国大数据市场规模2各行业大数据市场规模政府、互联网、电信、金融大数据市场规模较大,四个行业将占据二分之一市场份额。因为各个行业都存在大数据应用需求,潜在市场空间非常可观。是中国大数据市场元年,一些大数据产品已经推出,部分行业也有大数据应用案例产生。年-20,将迎来大数据市场飞速发展。年中国大数据市场规模到达4.7亿元,20大数据市场将迎来增速为138.3%飞跃,到20,整个市场规模迫近百亿。/12/12第8页泽佳提议企业级大数据战略第9页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第10页大数据基础架构要求可预测低延迟高事务参数灵活数据结构高吞吐量就地准备全部数据源和结构深度分析灵敏开发高度可伸缩性实时流数据运行影响第10页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第11页大数据处理方案体系第11页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第12页Oracle处理方案体系
第12页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第13页IBM大数据处理方案体系第13页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第14页SAP大数据处理方案体系第14页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第15页泽佳大数据处理方案,以数据融合、综合处理为方向大交易数据大交互数据大交易融合大数据处理企业供给链消费者SNS互联网物联网移动终端OLTP实时交易处理OLAP实时分析处理SOCIALMEDIADATAOTHERINTERACTIONDATAMachine/DeviceSensors/meters/RFIDtagsCDR/mobileSD,MM,PP,SD,FICO。。。第15页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第16页泽佳大数据处理方案基础架构泽佳大数据平台快速、可靠SCMCRMERP安全,布署,管理灵活体系MESPDM第16页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第17页泽佳大数据处理方案整体架构企业内外部协同(供给商+企业内部+客户+银行+税务+政府+小区+…)外部信息(社交+电商+移动+视音频+…)开放式API和协议通用设计和模型环境通用数据管理环境交易数据管理社交数据管理移动数据管理主数据管理内存数据管理企业数据仓库管理数据存放数据获取数据组织数据分析数据展现无线数据管理信息管理和实时数据迁移联合访问实时大数据平台门户数据分析电子邮件办公软件大屏幕电脑桌面移动终端企业级汇报工具Adhoc即时查询例外分析非结构化数据探索预测与挖掘第17页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第18页泽佳大数据处理方案体系数据多样性模式动态模式HDFS分布式文件系统Hbase分布式列存放系统SybaseESP事件流处理器HdoopMapReduceBigDataConnectorsYounghongBI获取组织分析决议复杂场景处理实时决策ETLEDW第18页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第19页泽佳大数据应用主要技术—Hadoop据IDC预测,全球大数据市场将达170亿美元规模,市场发展前景很大。而Hadoop作为新一代架构和技术,因为有利于并行分布处理“大数据”而备受重视。ApacheHadoop是一个用java语言实现软件框架,在由大量计算机组成集群中运行海量数据分布式计算,它能够让应用程序支持上千个节点和PB级别数据。Hadoop是项目标总称,主要是由分布式存放(HDFS)、分布式计算(MapReduce)等组成。
第19页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第20页Hadoop体系架构MapReduceHDFSHBasePigChuKwaHiveZooKeeperPig是一个基于Hadoop大规模数据分析平台,Pig为复杂海量数据并行计算提供了一个简易操作和编程接口。Chukwa是基于Hadoop集群监控系统,由yahoo贡献。Hive是基于Hadoop一个工具,提供完整sql查询功效,能够将sql语句转换为MapReduce任务进行运行。ZooKeeper:高效,可扩展协调系统,存放和协调关键共享状态。HBase是一个开源,基于列存放模型分布式数据库。HDFS是一个分布式文件系统。有着高容错性特点,而且设计用来布署在低廉硬件上,适合那些有着超大数据集应用程序。MapReduce是一个编程模型,用于大规模数据集(大于1TB)并行运算第20页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第21页大数据处理方案特点泽佳大数据处理方案提供高速、低速两种互联处理方案,在节点间能够建立起40Gb互联通路,彻底消除系统节点间通信瓶颈。高性能高可扩展性高可靠相比较传统数据库集群,泽佳大数据处理方案含有良好可扩展性,伴随数据节点增加,系统整体性能靠近线性增加。同时数据节点能够在系统运行中动态添加,对系统不会造成任何影响。所以企业能够依据本身业务需要,动态添加数据节点,当业务量较小时,配置较少数据节点,伴随业务量逐步增多,添加对应数据节点,从而满足本身业务量增加需求。泽佳大数据处理方案能自动地维护数据多份复制,而且在任务失败后能自动地重新布署(redeploy)计算任务。同时消除系统单点故障,系统中任意一个部分出现故障,系统将自动进行切换,确保用户应用无缝连接,含有较高稳定性和可靠性。第21页大数据行业应用分析第22页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第23页大数据行业应用分析应用可能性电信政府(公共事业)交通金融医疗教育能源(电力/石油)纵轴契合度:
表示该用户IT应用特点与大数据特征契合程度;横轴应用可能性:表示该用户出于主客观原因在短期内投资大数据可能性;注:
该位置为分析师访谈综合印象,为定性分析,图中位置不代表详细数值HighMidLowLowMidHigh优先关注行业用户应用特点与大数据技术有较高契合度,在主客观条件上也有较高应用可能性。值得关注行业用户应有特点与大数据契合度及应用可能性综合较高适当关注行业用户两个维度暂时都不具备优势,可适当给予关注互联网(电子商务)契合度流通零售制造第23页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第24页互联网行业大数据需求分析互联网行业拥抱大数据关键原因互联网大数据技术应用,会首先带动社会化媒体、电子商务快速发展,其它互联网分支也会紧追其后,整个行业在大数据推进下将会蓬勃发展。互联网行业对数据实时分析要求较高,比如广告监测、B2C业务,往往要求在数秒内返回上亿行数据分析,从而到达不影响用户体验和快速准确营销目标。当前互联网企业面对大数据,会普遍感觉到实时分析能力差、海量数据处理效率低、缺乏分析方法、分析软件能力差等问题。互联网行业大数据分析面临主要问题第24页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第25页互联网行业Hadoop应用企业详细应用HADOOP在阿里巴巴用于处理商业数据排序,并将其应用于阿里巴巴ISEARCH搜索引擎,垂直商业搜索引擎。节点数:15台机器组成服务器集群服务器配置:8核CPU,16G内存,1.4T硬盘容量HADOOP在baiduHADOOP主要应用日志分析,同时使用它做一些网页数据库数据挖掘工作。节点数:10-500个节点。周数据量:3000TBHADOOP在Facebook主要用于存放内部日志拷贝,作为一个源用于处理数据挖掘和日志统计。主要使用了2个集群:一个由1100台节点组成集群,包含8800核CPU(即每台机器8核),和1TB原始存放(即每台机器12T硬盘),一个有300台节点组成集群,包含2400核CPU(即每台机器8核),和3000TB原始存放(即每台机器12T硬盘),由此基础上开发了基于SQL语法项目:HIVEHADOOP在TWITTER使用HADOOP用于存放微博数据,日志文件和许多中间数据使用基于HADOOP构件Cloudera'sCDH2系统,存放压缩后数据文件(LZO格式)HADOOP在雅虎主要用于支持广告系统及网页搜索机器数:25000,CPU:8核集群机器数:
4000
个节点
(2*4cpuboxesw4*1TBdisk&16GBRAM)第25页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第26页金融行业大数据需求分析金融行业大数据发展分析IDC研究显示,数据是主要资产理念已经在中国金融行业形成共识,数据真正价值在于能够洞察企业内部规律,数据洞察力成为金融企业关键竞争力。在中国金融行业信息化建设中,与信息加工亲密相关大数据管理正逐步成为与关键业务系统建设、渠道建设和前置建设同等主要领域。经过多年发展与积累,当前中国大型商业银行和保险企业数据量已经到达100TB以上级别,而且非结构化数据量在快速增加。金融行业大数据需求背景从未来几年看,金融行业在“十二五”时期面临发展方式转型挑战,转型主要集中在三大方面:一,建立全方面风险管理体制,向严监管转型;二,从粗放式管理向精细化管理转型;三,从“利润为中心”向“客户为中心”转型。大数据在加强风险管控、精细化管理、服务创新等转型中别具现实意义,是实现向信息化银行转型主要推进力。金融行业应首先在战略层面对大数据进行规划,主动应对大数据时代挑战,推进并建立数据驱动型发展方式。第26页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第27页摩根大通基于Hadoop大数据应用
已经开始使用Hadoop技术以满足日益增多用途,包含诈骗检验、IT风险管理和自助服务。150PB在线存放数据、30,000个数据库和35亿个用户登录账号。Hadoop能够存放大量非结构化数据,允许企业搜集和存放Web日志、交易数据和社交媒体数据。数据被聚集至一个通用平台,以方便以客户为中心数据挖掘与数据分析工具使用。第27页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第28页中信银行信用卡中心基于Hadoop大数据应用大数据挑战发卡量增加快速:发卡约500万张,年增加了一倍。业务数据增加快速:伴随业务迅猛增加,业务数据规模也线性膨胀。数据存放、系统维护、数据有效利用都面临巨大压力。需求可扩展、高性能数据仓库处理方案能够实现业务数据集中和整合;能够支持多样化和复杂化数据分析提升信用卡中心业务效率;经过从数据仓库提取数据,改进和推进有针对性营销活动。采取大数据方案后价值表达实时商业智能能够结合实时、历史数据进行全局分析,风险管理部门现在能够天天评定客户行为,并决定对客户信用额度在同一天进行调整;原有内部系统、模型整体性能显著提升秒级营销Greenplum数据仓库处理方案提供了统一客户视图,更有针正确进行营销。,中信银行信用卡中心经过其数据库营销平台进行了1286个宣传活动,每个营销活动配置平均时间从2周缩短到2-3天。EMCGreen-plum未来和基于HadoopPivotalHD相融合第28页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第29页电信行业大数据需求分析
伴随互联网和移动互联网发展,运行商网络将会愈加繁忙,用于监测网络状态信令数据也会快速增加。经过大数据海量分布式存放技术,能够愈加好地满足存放需求;经过智能分析技术,能够提升网络维护实时性,预测网络流量峰值,预警异常流量,有效预防网络堵塞和宕机,为网络改造、优化提供参考,从而提升网络服务质量,提升用户体验。提升网络服务质量,增强管道智能化客户洞察是指在企业或部门层面对客户数据全方面掌握并在市场营销、客户联络等步骤有效应用。经过使用大数据分析、数据挖掘等工具和方法,电信运行商能够整合来自市场部门、销售部门、服务部门数据,从各种不一样角度全方面了解自己客户,对客户形象进行精准刻画,以寻找目标客户,制订有针对性营销计划、产品组合或商业决议,提升客户价值。判断客户对企业产品、服务感知,有针对性地进行改进和完善。经过情感分析、语义分析等技术,能够针对客户喜好、情绪,进行个性化业务推荐愈加精准地洞察客户需求,增强市场竞争力智慧城市发展以及教育、医疗、交通、环境保护等关系到国计民生行业,都含有极大信息化需求。当前,电信运行商针对智慧城市及行业信息化服务即使能够提供一揽子处理方案,但主要还是提供终端和通信管道,行业应用软件和系统集成尚需要整合外部应用软件提供商,对于客户价值主要表达在网络化、自动化等较低水平。而伴随社会、经济发展,客户及客户客户对于智能化要求将逐步强烈,所以运行商如能把大数据技术整合到行业信息化方案中,帮助客户经过数据采集、存放和分析更加好地进行决议,将能极大提升信息化服务价值升级行业信息化处理方案,提升客户价值大数据也有大风险,其中之一就是客户隐私泄露及数据安全风险。因为大量数据产生、存放和分析,数据保密和隐私问题将在未来几年内成为一个更大问题,企业必须提供数据安全服务,在大数据市场建立差异化竞争优势第29页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第30页中国移动基于Hadoop大数据应用在中国移动“大云”产品总体架构中,分析型PaaS产品底层基于Hadoop数据存放和分析平台,在技术路线方面,选择数据仓库与Hadoop混搭方式,借鉴关系型数据仓库在传统应用支持方面以及在复杂查询和分析方面快速响应能力,同时也借鉴了Hadoop非结构化数据处理能力以及存放低成本。屏蔽Hadoop与数据仓库使用细节,让用户在使用这些数据时尽可能无感知;在数据ETL采集预处理步骤,尽可能采取Hadoop与分布式ETL方式,提升数据转换效率,同时降低成本。
第30页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第31页中国联通基于Hadoop大数据应用中国联通已经构建了一个全国集中一级架构海量数据存放和查询系统:通信用户上网统计集中查询与分析支撑系统,在集团企业进行统一布署,各个省分仅仅是做数据采集,按照业务实时性将数据传送到集团企业,由集团企业统一处理,全国全部用户全部上网统计数据都放北京数据中心里,在国内电信行业当中也是首创方式。中国联通成功将大数据和Hadoop技术引入到‘移动通信用户上网统计集中查询与分析支撑系统’。截止到当前已经布署了4.5PB存放空间。其中,4.5PB存放分布在300个数据节点上,即每个节点配置15TB存放空间。系统天天有能力处理700亿条上网统计。第31页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第32页政府行业大数据需求分析1、加强统筹规划,优化大数据形成机制。强化对大数据建设工作组织协调,打破地域和部门数据壁垒,实现数据资源联合共建、广泛共享。建立政府和社会联动大数据形成机制,以政府数据公开共享,推进公共数据资源开发利用。
2、加强数据搜集和信息感知,提升智慧城市感知水平。加强政府部门在管理和服务过程中对数据主动采集,建立政府大数据库。勉励制造业企业和商业机构加强对生产经营活动中数据采集,形成覆盖生产过程和商业各步骤各流程数据库。推进无线识别技术、传感器、无线网络、传感网络等新技术广泛应用,提升数据采集智能化水平。3、推进大数据应用,提升经济社会智慧化水平。推进政务信息公开。推行政府网上办事,搜集分析挖掘社会政务服务需求,推进公共服务个性化和政府决议智能化。支持公共服务机构和商业机构开放与社会民生亲密相关公共数据。推进国民经济各行业和企业数据开发,发展商业智能。勉励开展服务大众大数据应用,提升智慧生活品质。第32页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第33页政府行业大数据应用——智慧城市1月29日,住房和城镇建设部公布了首批90个国家智慧城市试点名单,试点城市公布标志着我国智慧城市发展进入规模推广阶段。在当前智慧城市发展阶段,主要应用还处于对感知设备传递信息进行简单处理水平,充分认识大数据对于智慧城市建设关键作用,对于防止智慧城市建设中出现“重感知,轻智慧”通病含有主要意义。从智慧城市体系结构来看,因为智慧城市基础在于物联网技术,所以智慧城市体系架构和物联网体系结构相类似,也可分为四层,分别为感知层、传输层、平台层、应用层。智慧城市相对于之前数字城市概念,最大区分在于对感知层获取信息进行了智慧处理,所以也能够认为智慧城市是数字城市升级版。由城市数字化到城市智慧化,关键是要实现对数字信息智慧处理,其关键是大数据处理技术。智慧城市第33页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第34页医疗行业大数据需求分析医疗行业产生数据量主要来自于PACS影像、B超、病理分析等业务所产生非结构化数据。人体不一样部位、不一样专科影像数据文件大小不一,PACS网络存放和传输要采取不一样策略。面对大数据,医疗行业碰到前所未有挑战和机遇。医疗行业大数据应用场景非常多,右图仅以临床操作和研发为例,展示医疗行业大数据应用场景。对于公共卫生部门,能够经过过覆盖全国患者电子病历数据库,快速检测传染病,进行全方面疫情监测,并经过集成疾病监测和响应程序,快速进行响应。比较效果研究临床操作临床决议支持系统医疗数据透明度远程病人监控研发预测建模提升临床试验设计统计工具和算法疾病模式分析第34页@北京泽佳企业版权全部Copyright©ZejiaConsultingCorporation第35页医疗行业基于Hadoop大数据应用Cloudera正在与西奈山医学院合作开发新生物数据分析方法和系统。Cloudera还与FDA合作侦测各种药品组合副作用,与埃默里大学合作帮助病历学家更准确地分析医疗影像。Cloudera客户之一——Explorys业务主要是聚合并分析医疗统计,而英特尔和Ne
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025新人教版英语七年级下单词默写表(小学部分)
- 莫言《儿子的敌人》阅读答案及解析
- 商务英语笔译之宣传资料
- 住宅室内装修工序间歇及工艺间歇标准
- 二零二五年度医疗设备维护与保养合同4篇
- 苏科版七年级(上)期末复习模拟卷
- 八年级数学期末模拟卷(全解全析)(苏州专用)
- 2024年浙江经贸职业技术学院高职单招数学历年参考题库含答案解析
- 2024年浙江电力职业技术学院高职单招职业适应性测试历年参考题库含答案解析
- 21世纪中国电子商务网校讲义资料
- 《内部培训师培训》课件
- 《雷达原理》课件-3.3.3教学课件:相控阵雷达
- 红色中国风蛇年年会邀请函
- 2024年车辆修理合同范本
- 高速公路机电系统培训
- 220kV耐张线夹检测报告
- 化工厂拆除施工方案
- 新能源汽车课件
- 人教版2024-2025学年七年级数学上册3.2代数式(压轴题综合测试卷)专题特训(学生版+解析)
- 骨科特殊检查-肩部特殊检查(康复评定技术)
- 医疗器械设备采购项目实施方案
评论
0/150
提交评论