版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据时代----生活、工作与思维的大变革大数据时代1一、认识大数据二、大数据时代的变革三、大数据时代的挑战四、大数据的应用一、认识大数据2何为大?—数据度量1Byte=8Bit1KB=1,024Bytes1MB=1,024KB=1,048,576Bytes1GB=1,024MB=1,048,576KB=1,073,741,824Bytes1TB=1,024GB=1,048,576MB=1,099,511,627,776Bytes1PB=1,024TB=1,048,576GB=1,125,899,906,842,624Bytes1EB=1,024PB=1,152,921,504,606,846,976Bytes1ZB=1,024EB=1,180,591,620,717,411,303,424Bytes1YB=1,024ZB=1,208,925,819,614,629,174,706,176Bytes何为大?—数据度量3《红楼梦》含标点87万字(不含标点853509字)每个汉字占两个字节:1汉字=16bit=2*8位=2bytes1GB约等于671部红楼梦1TB约等于631,903部1PB约等于647,068,911部美国国会图书馆藏书(151,785,778册)(2011年4月:收录数据235TB)1EB=4000倍美国国会图书馆存储的信息量《红楼梦》含标点87万字(不含标点853509字)4每天有2940亿封电子邮件发出,如果这些是纸质信件,在美国需要花费两年时间处理;每天有200万篇博客在网上发布,这些文章相当于《时代》杂志刊发770年的总量;每天有2.5亿张照片上传至社交网站Facebook,如果都打印出来,摞在一起能有80个埃菲尔铁塔那么高;每天有86.4万小时视频被上传至视频网站Youtube,相当于不间断播放视频98年;每天有1.87亿个小时的音乐会在流媒体音乐网站Pandora上播放,如果一台电脑从公元元年就开始播放这些音乐会,到现在还没完没了地接着放;谷歌翻译每天处理的文字数量,每天翻译次数达十亿次,相当于一百万册图书,超过了全世界的专业翻译人员一年能够翻译的文字规模;百度每天的关键词搜索量50亿,谷歌33.3亿;淘宝天猫双11那一天营业额达191亿人民币。中国小商品城全年成交额才580.03亿元人民币;累积起来,互联网一天之内产生的信息总量,可以装满1.68亿张DVD光盘。……未来:物联网每天产生的数据将会是海量的。一、认识大数据(续)每天有2940亿封电子邮件发出,如果这些是纸质信件,在美国需5什么是大数据?
什么是大数据(big-data)?人们并未形成统一的认识,一般而言,它是指规模远远超过传统数据库软件处理能力的海量数据集合。这一概念首要是针对信息化社会数据“爆炸式”增长,体量巨大而提出的。对于数据多大能称之为“大数据”,业界并没有统一的认识,通常认为100TB(太字节)是大数据的门槛。
简而言之,传统方法无法处理的数据即为大数据。
据美国政府估计,全球每年由各类设备产生的数据达到约1.2ZB(1ZB=12亿TB)。若用1粒沙代表1B数据,1PB(相当于1000T)相当于1英里长、100码宽的沙滩,而1.2ZB的数据就如同一片浩瀚的沙漠。一、认识大数据(续)什么是大数据?一、认识大数据(续)621世纪是数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓展了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。互联网(社交、搜索、电商)、移动互联网(微博)、物联网(传感器,智慧地球)、车联网、GPS、医学影像、安全监控、金融(银行、股市、保险)、电信(通话、短信)都在疯狂产生着数据。“大数据”的诞生:半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。信息爆炸的学科如天文学和基因学,创造出了“大数据”这个概念*。如今,这个概念几乎应用到了所有人类智力与发展的领域中。21世纪是数据信息大发展的时代,移动互联、社交网络、72007年,图灵奖获得者JimGray,提出“数据密集型科学发现(Data-IntensiveScientificDiscovery)”将成为科学研究的第四范式,“数据科学”拉开了帷幕。2008年,《Nature》杂志出版专刊,讨论大数据处理相关的一系列技术问题和挑战。2012年3月底,美国政府发布了大数据研发专项研究计划(BigDataInitiative),拟投入2亿美元用于研究开发科学探索、环境和生物医学、教育和国家安全等重大领域和行业所急需的大数据处理技术和工具,把大数据研究上升到为国家战略。2012年10月,中国计算机学会于成立大数据专家委员会,并在2012年12月发布调研报告,说明数据科学的热点问题和发展趋势。2007年,图灵奖获得者JimGray,提出“数据密集型科82012年3月29日,白宫发布美国政府的大数据计划。通过提高从大型复杂的数字数据集中提取知识和观点的能力,承诺帮助加快在科学与工程中的步伐,加强国家安全,并改变教学研究。2012年3月29日,白宫发布美国政府的大数据计划。910/5/2023
我国的应对
最早提出“大数据”时代已经到来的机构是全球知名咨询公司麦肯锡。麦肯锡在研究报告中指出,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。“麦肯锡的报告发布后,大数据迅速成为了计算机行业争相传诵的热门概念,也引起了金融界的高度关注。”随着互联网技术的不断发展,数据本身是资产,这一点在业界已经形成共识。“如果说云计算为数据资产提供了保管、访问的场所和渠道,那么如何盘活数据资产,使其为国家治理、企业决策乃至个人生活服务,
事实上,全球互联网巨头都已意识到了“大数据”时代,数据的重要意义。包括EMC、惠普(微博)、IBM、微软(微博)在内的全球IT巨头纷纷通过收购“大数据”相关厂商来实现技术整合,亦可见其对“大数据”的重视。“大数据”作为一个较新的概念,目前尚未直接以专有名词被我国政府提出来给予政策支持。不过,在工信部发布的物联网“十二五”规划上,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这都是大数据的重要组成部分。而另外3项关键技术创新工程,包括信息感知技术、信息传输技术、信息安全技术,也都与“大数据”密切相关。7/27/2023我国的应对最早101.Volume2.Variety3.value4.Velocity结构化数据、半结构化数据和非结构化数据如今的数据类型早已不是单一的文本形式,订单、日志、音频,对处理能力提出了更高的要求沙里淘金,价值密度低以视频为例,一部一小时的视频,在连续不间断监控过程中,可能有用的数据仅仅只有一两秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”是目前大数据汹涌背景下亟待解决的难题实时获取需要的信息大数据区分于传统数据最显著的特征。如今已是ZB时代,在如此海量的数据面前,处理数据的效率就是企业的生命“大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值密度低(Value)”就是“大数据”的显著特征,或者说,只有具备这些特点的数据,才是大数据。大数据的4V特征数据量巨大全球在2010年正式进入ZB时代,IDC预计到2020年,全球将总共拥有35ZB的数据量1.Volume2.Variety3.value4.11大数据=海量数据+复杂类型的数据大数据包括:交易数据和交互数据集在内的所有数据集海量交易数据:企业内部的经营交易信息主要包括联机交易数据和联机分析数据,是结构化的、通过关系数据库进行管理和访问的静态、历史数据。通过这些数据,我们能了解过去发生了什么。海量交互数据:源于Facebook、Twitter、LinkedIn及其他来源的社交媒体数据构成。它包括了呼叫详细记录CDR、设备和传感器信息、GPS和地理定位映射数据、通过管理文件传输Manage协议传送的海量图像文件、Web文本和点击流数据、科学信息、电子邮件等等。可以告诉我们未来会发生什么。海量数据处理:大数据的涌现已经催生出了设计用于数据密集型处理的架构。例如具有开放源码、在商品硬件群中运行的ApacheHadoop。大数据=海量数据+复杂类型的数据大数据包括:海量交易12第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。第二层面是技术,技术是大数据价值体现的手段和前进的基石。第三层面是实践,实践是大数据的最终价值体现。第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的13大数据处理技术让大数据能够为我所用,大数据时代终于开启了。大数据处理技术让大数据能够为我所用,大数据时代终于开启了。14大数据与云计算大数据与云计算15
大数据与云计算
云计算的模式是业务模式,本质是数据处理技术。
(肉体+灵魂)数据是资产,云为数据资产提供存储、访问和计算。盘活资产,使其为国家治理、企业决策、个人生活服务,是大数据核心议题,也是云计算的最终方向。
大数据与云计算
云计算的模式是业务模式,本质是数据处理技术16如果将云计算与大数据进行一些比较,最明显的区分在两个方面:第一,在概念上两者有所不同,云计算改变了IT,而大数据则改变了业务。然而大数据必须有云作为基础架构,才能得以顺畅运营。第二,大数据和云计算的目标受众不同,云计算是CIO等关心的技术层,是一个进阶的IT解决方案。而大数据是CEO关注的、是业务层的产品,而大数据的决策者是业务层。如果将云计算与大数据进行一些比较,最明显的区分在两个方面:17大数据比云计算更为落地大数据不仅仅是“大”软件是大数据的引擎大数据的应用不仅仅是商业化服务管理大数据“易”,理解大数据“难”大数据比云计算更为落地18和数据中心(DataCenter)
一样,软件是大数据的驱动力,软件改变世界和数据中心(DataCenter)一样,软件是大数据的驱19大数据时代生活工作与思维的大变革课件20通过用户行为分析实现精准管理、科学决策和人性化服务是大数据的典型应用,大数据在各行各业特别是公共服务领域具有广阔的应用前景消费行业金融服务食品安全医疗卫生军事交通环保电子商务气象通过用户行为分析实现精准管理、科学决策和人性化服务是大数据的21虽然大数据是一个重大问题,真正的问题是让大数据更有意义目前大数据管理多从架构和并行等方面考虑,解决高并发数据存取的性能要求及数据存储的横向扩展,但对非结构化数据的内容理解仍缺乏实质性的突破和进展,这是实现大数据资源化、知识化、普适化的核心非结构化海量信息的智能化处理:自然语言理解、多媒体内容理解、机器学习等虽然大数据是一个重大问题,真正的问题是让大数据更有意22大数据时代没有隐私爱德华·斯诺登大数据时代没有隐私爱德华·斯诺登2370万人,无人告知的在线实验,全球第一大社交网络脸书(Facebook)隐秘进行的情感测试近日曝光天下,业界一片哗然。2012年,脸书(Facebook)的幕后试验旨在公测70万用户在面对相应的NewsFeed中的情感反应和行为引导。具体说来,脸书(Facebook)在页面上人为的设置一些正面或是负面的情感性关键词,同时控制用户在自己的NewsFeed中得阅读内容,从而观察用户在自身Post中得行为表达。经过大约一周的数据收集,脸书的数据分析员可以观察到用户对于社交网络上的情绪反应。对于70万用户情绪被消无声息的如此操控,脸书(Facebook)的行为无疑遭到了强烈的指控。脸书此次幕后试验的曝光,是一个警醒的明示。用户、互联网企业以及政府之间的权衡,是一个当即也是长期去努力协作的过程。在个人隐私和道德制约的前提下,“大数据“时代,不是一个滥用数据的时代,而是一个需要善用数据的时代。70万人,无人告知的在线实验,全球第一大社交网络脸书(Fac24大数据属于谁?大数据属于谁?25数据独裁卓越的才华并不依赖大数据,大数据扼杀创新。如果对不可量化的事物进行量化,我们将失去全面了解该事物的机会。数据独裁卓越的才华并不依赖大数据,如果对不可量化的事物进行量26??27大数据时代生活工作与思维的大变革课件28大数据时代生活工作与思维的大变革课件29大数据时代生活工作与思维的大变革课件30中国工程院院士邬贺铨说道,“智慧城市是使用智能计算技术使得城市的关键基础设施的组成和服务更智能、互联和有效,随着智慧城市的建设,社会将步入“大数据”时代。”智慧政务智慧交通智慧电网智慧教育智慧医疗……根据国家信息中心信息化研究部统计,目前我国提出智慧城市建设的城市总数已达到154个,预计投资规模超过1.5万亿元。智慧城市必将产生大数据,利用大数据的思维来改变公共管理部门的形象。中国工程院院士邬贺铨说道,“智慧城市是使用智能计算技术使得城31医疗可利用多种大数据手段临床操作——1、疗效比较研究
2、临床决策支持系统
3、医疗数据透明度
4、远程医疗监护
5、针对患者情况的先进分析付款/定价——1、自动化系统
2、医保系统研发——1、预测模型
2、改进临床试验设计的统计工具和算法
3、临床实验数据分析
4、个体化医疗
5、疾病模式分析新业务模型——1、患者临床记录和需求数据的聚合
2、在线平台和社区公共卫生医疗行业受益于大数据电子病历医疗行业产生大数据(电子病历),利用大数据的思维将会给医疗行业带来变革。医疗可利用多种大数据手段医疗行业受益于大数据电子病历医疗行业32旅游业发展趋势是:网络化、散客化、大众化。在大数据时代,必须运用大数据思维,推行旅游的数字化管理,开展数字化营销,为旅客提供精准的个性化服务。旅游业发展趋势是:网络化、散客化、大众化。33购物:不受时空限制,随时随地购物。在看不到商品的情况下,口碑就是质量。购物:不受时空限制,随时随地购物。在看不到商品的情况下,口碑34旅行:足不出户,安排好一切。旅行:足不出户,安排好一切。35信息:人人都是传媒。信息:人人都是传媒。36社交:你所有的朋友都能在网络上找到。社交:你所有的朋友都能在网络上找到。37分析事物时,依赖该事物的所有数据,不再是进行样本分析。在大数据时代,允许不精确。更注重相关关系,而不是因果关系。分析事物时,依赖该事物的所有数据,不再是进行样本分析。38一场生活、工作与思维的大变革大数据开启了一次重大的时代转型。就想望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发……大数据,变革公共卫生大数据,变革商业大数据,变革思维大数据,开启重大的时代转型预测,大数据的核心大数据,大挑战引言一场生活、工作与思维的大变革大数据开启了一次重大39大变革思维商业管理1、大数据时代的思维变革2、大数据时代的商业变革3、大数据时代的管理变革大变革思维商业管理1、大数据时代的思维变革401、大数据时代的思维变革1、大数据时代的思维变革411、大数据时代的思维变革—更多“更多”——不是随机样本,而是全体数据当数据处理技术已经发生翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马一样。一切都改变了,我们需要的是所有的数据,“样本=总体”。让数据“发声”小数据时代的随机采样,最少的数据获得最多的信息全数据模式,样本=总体1、大数据时代的思维变革—更多“更多”——不是随机样本,而是421、大数据时代的思维变革—更杂“更杂”——不是精确性,而是混杂性执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是有框架且能适用于传统数据库的。如果不能接受混乱,剩下95%的非框架数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。允许不精确大数据的简单算法比小数据的复杂算法更有效纷繁的数据越多越好混杂性,不是竭力避免,而是标准途径新的数据库设计的诞生1、大数据时代的思维变革—更杂“更杂”——不是精确性,而是混431、大数据时代的思维变革—更好“更好”——不是因果关系,而是相关关系知道“是什么”就够了,没必要知道“为什么”。在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”。关联物,预测的关键“是什么”,而不是“为什么”改变,从操作方式开始大数据,改变人类探索世界的方法1、大数据时代的思维变革—更好“更好”——不是因果关系,而是442、大数据时代的商业变革2、大数据时代的商业变革452、大数据时代的商业变革—数据化“数据化”——一切皆可“量化”大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。信息技术变革随处可见,但是如今信息技术变革的重点在“T”(技术)上,而不是在“I”(信息)上。现在,我们是时候把聚光灯打向“I”,开始关注信息本身了。数据,从最不可能的地方提取出来数据化,不是数字化量化一切,数据化的核心当文字变成数据当方位变成数据当沟通成为数据一切事物的数据化2、大数据时代的商业变革—数据化“数据化”——一切皆可“量化462、大数据时代的商业变革—价值“价值”——“取之不尽,用之不竭”的数据创新数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。数据创新1:数据的再利用数据创新2:重组数据数据创新3:可扩展数据数据创新4:数据的折旧值数据创新5:数据废气数据创新6:开放数据给数据估值2、大数据时代的商业变革—价值“价值”——“取之不尽,用之不472、大数据时代的商业变革—角色定位“角色定位”——数据、技术与思维的三足鼎立微软以1.1亿美元的价格购买了大数据公司Farecast,而两年后谷歌则以7亿美元的价格购买了给Farecast提供数据的ITASoftware公司。如今,我们正处在大数据时代的早期,思维和技术是最有价值的,但是最终大部分价值还是必须从数据本身来挖掘。大数据价值的3大构成大数据掌控公司大数据技术公司大数据思维公司和个人全新的数据中间商专家的消亡与数据科学家的崛起大数据,决定企业的竞争力2、大数据时代的商业变革—角色定位“角色定位”——数据、技术483、大数据时代的管理变革3、大数据时代的管理变革493、大数据时代的管理变革—风险“风险”——让数据主宰一切的隐忧我们时刻都暴露在“第三只眼”之下:亚马逊监视着我们的购物习惯,谷歌监视着我们的网页浏览习惯,而微博似乎什么都知道,不仅窃听到了我们心中的“TA”,还有我们的社交关系网。无处不在的“第三只眼”我们的隐私被二次利用了预测与惩罚,不是因为“所做”,而是因为“将做”数据独裁挣脱大数据的困境3、大数据时代的管理变革—风险“风险”——让数据主宰一切的隐503、大数据时代的管理变革—掌控“掌控”——责任与自由并举的信息管理当世界开始迈向大数据时代时,社会也将经历类似的地壳运动。在改变人类基本的生活与思考方式的同时,大数据早已在推动人类信息管理准则上重新定位。然而,不同于印刷革命,我们没有几个世纪的时间去适应,我们也许只有几年时间。管理变革1:个人隐私保护,从个人许可到让数据使用者承担责任管理变革2:个人动因VS预测分析管理变革3:击碎黑盒子,大数据程序员的崛起管理变革4:反数据垄断大亨3、大数据时代的管理变革—掌控“掌控”——责任与自由并举的信51结语正在发生的未来大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。结语正在发生的未来大数据并不是一个充斥着算52三、大数据时代的挑战三、大数据时代的挑战53国外什么情况?万马奔腾,抢数据高地国外什么情况?万马奔腾,抢数据高地54衍生于亚马逊、Google等互联网公司前瞻来看,随着互联网对网民的理解,网民对网络的反作用,互联网将变得越来越智能。它在满足你需求的同时,也在创造新的需求。前者的代表是Google,后者的典型则是Facebook。谷歌的盈利在于所有的软件应用都是在线的。用户在免费使用这些产品的同时,把个人的行为、喜好等信息也免费的送给了Google。因此Google的产品线越丰富,他对用户的理解就越深入,他的广告就越精准。广告的价值就越高。这是正向的循环,谷歌好用的、免费得软件产品,换取对用户的理解;通过精准的广告,找到生财之道。颠覆了微软卖软件拷贝赚钱的模式。成为互联网的巨擘。互联网越来越智能Google精确掌握用户行为、获取需求衍生于亚马逊、Google等互联网公司前瞻来看,随着互联网对55IBM\Oracle\EMC\Microsoft角力大数据
EMCEMC的大数据解决方案专注于使组织更有效地使用他们从不同来源产生的数据,包括网络上,网页上,消费者,监控系统和传感器。EMC的数据计算产品事业部正在开发分析工具以解决大数据现象。EMC的大数据解决方案包括40多个产品。2010年7月收购数据库软件供应商Greenplum,花费3亿美元2009年七月收购数据复制解决方案提供商DataDomain,花费24亿美元不一定和大数据完全相关,EMC从2009年起收购了ArcherTechnologies,SourceLabs,FastScaleTechnology,Configuresoft,andVaronisSystems。IBMIBM的策略是提供一个全面的方法来解决前所未有的信息爆炸提出的挑战,因为信息量无论在流量、种类、速度还是活力上都是爆炸式增长IBM一直致力于扩大对包括数据仓库中的大数据、信息流和结构化数据的分析在过去四年中,IBM已经投入超过120亿美元进行了23项相关并购,其中包括:2010年9月收购数据库分析供应商Netezza公司,花费17亿美元2010年10月收购网络分析软件供应商Coremetrics2009年10月收购数据分析和统计软件提供商SPSS,花费12亿美元2009年1月收购业务规则管理软件供应商ILOG,花费3亿4千万美元2007年花费20亿美元收购商务智能软件供应商Cognos微软微软提供了高性能计算能力,并在2005年靠WindowsComputeCluster服务器进入相关市场最近,微软的HPC部门开发了该公司的Dryad
并行处理技术社区技术预览(CTP),第一步是向WindowsHPCServer的用户提供处理大数据工具甲骨文甲骨文大数据提供的数据库和数据库软件主要用于配合Sun的硬件,特别是它的最高端服务2009年7月收购专注于数据复制和实时数据集成解决方案的私人企业GoldenGateSoftwareIBM\Oracle\EMC\Microsoft角力大数据56国外已经开始投资应用美国国务院采用大数据技术开发新的美国护照系统。IBM宣布投资1亿美元用于大数据研究;美国IT公司开始意识到大数据技术能够为公司创造价值;大数据公司引入汽车行业高管人员扩展营销业务;国外已经开始投资应用美国国务院采用大数据技术开发新的美国护照57成功企业具备时代特征大数据云计算物联网平台移动互联语义网智能化大数据时代能产生大数据,如电信运营商,互联网门户具备大数据挖掘能力,如google,百度能应用大数据进行垂直整合,如苹果,淘宝工业时代信息时代手工时代大数据时代典型特征在大数据时代,让数据成为资产,三类企业将获得成功时代变迁掌握”入口”是共性58成功企业具备时代特征大数据移动互联大数据时代能产生大数据,如58SONY没落原因总结:“新一代基于互联网DNA企业的核心能力在于利用新模式和新技术更加贴近消费者、深刻理解需求、高效分析信息并作出预判,所有传统的产品公司都只能沦为这种新型用户平台级公司的附庸,其衰落不是管理能扭转的。互联网的魅力就是thepoweroflowend。”————出井伸之(SONY前董事长兼首席执行官)他们曾经伟大,但在没落Nextwho?59SONY没落原因总结:“新一代基于互联网DNA企业的核心能力59平台化满足用户个性化需求,企业才能持续领先自动交互个性化需求满足平台自愿进入自我增值产品销售规模化产品供应流程批量生产服务响应颠覆性创新传统的以产品营销和服务为核心的商业模式,构建以用户需求为核心的平台生态圈,形成用户:自愿进入(搭建以用户为核心的开放交互平台);自动交互(过程中应用大数据分析挖掘形成用户知识);自我增值(整合网络资源为用户提供个性化解决方案服务)的商业模式60平台化满足用户个性化需求,企业才能持续领先自动个性化自愿自我60向平台生态圈企业转型,企业需经历三个阶段平台化转型期采集大数据,形成“入口”能力(~1年时间)平台化发展期应用“入口”大数据,服务产品化(2~3年时间)平台生态圈发展期垂直整合,“入口”能力释放(持续发展)开发能采集用户大数据的智能产品、完善运营大数据的采集能力形成大数据采集、存储和管理的技术平台内外部数据梳理和整合,形成统一的用户大数据和运营大数据整合数据挖掘资源和能力,应用内外大数据支撑产品领先和消费体验领先战略发展大数据技术平台成熟基于用户的大数据内生和应用平台形成形成1~2个领先型大数据产品拥有强大的数据挖掘资源和能力,对大数据进行价值挖掘和应用,数据价值开始显著发挥形成网络化的大数据采集体系整合相关资源形成开放生态圈平台,成为平台生态圈发展的主导者基于生态圈平台,能为用户提供多元化的精确性服务,抢占用户的心理份额、生活份额、钱包份额61向平台生态圈企业转型,企业需经历三个阶段平台化转型期平台化发61数据源内部结构化数据外部其他渠道网络/应用日志EDW(内外部结构化数据)用户基本信息数据库Hadoop(内外部非结构化数据)Hadoop/GPFSClusterMapReduce&Analytics网络日志分析内容分析交互数据分析个体分析用户购买记录数据库用户维修记录数据库内部非结构化数据社会化媒体数据生产、销售、服务、售后数据数据应用仓库用户在线浏览据库用户安装配送数据库。。。。。其他数据集清洗整合用户数据清洗整合规则确定ETLDQ数据清洗、整合、转换开发清洗整合规则自动调度规则与标准制定用户信息归属规则确定用户数据使用权限与流程确定用户数据质量标准确定数据应用/服务营销/关怀活动自动化管理商业智能管理驾驶舱业务报表专题分析嵌入运营系统的大数据应用信息可视化工具CRMSCMMESPLM平台化企业,需要大数据架构的支撑数据源内部结构化数据外部其他渠道网络/应用日志EDW(内外62【案例】阿里大数据平台生态圈发展史内部建设天梯1技术平台业务需求驱动,分析PV,UV等行业基础指标,优化用户消费体验在小网站联盟投放广告,并进行精准
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园主题工作计划
- 建筑工程公司文员岗位职责(3篇)
- 福建省百校联考2024-2025学年高三年级上册10月测评英语试卷(含答案)
- 消防安全常记心间的广播稿(34篇)
- 新教材高考地理二轮复习综合题专项训练二原因分析类含答案
- 测量初步与简单机械运动(原卷版)-2023年中考物理二轮复习专练
- 山东省德州禹城市2024-2025学年五年级上学期期中考试科学试题
- 河北省保定市阜平县2024-2025学年八年级上学期期中生物学试题(含答案)
- 2024-2025学年福建省漳州市十校联盟高二上学期期中质量检测联考数学试卷(含答案)
- 物质的共存检验鉴别和除杂(专项训练)-2022年中考化学二轮复习
- 《史记》上册注音版
- 园林制图课件透视
- 汉语拼音发音口型及配图[新版]
- 注塑IPQC培训教材
- 现场技术服务确认单
- 恶性心律失常及常见心律失常识别与急诊处理
- 砂石项目盈利能力分析报告(范文)
- 第13课 规划每一天
- 羧甲基纤维素钠的制备及表征
- 【人教版】八年级英语上册 Unit 7 全单元英文教案
- (完整版)汽油发电机操作规程
评论
0/150
提交评论