




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
EvaluationWarning:ThedocumentwascreatedwithSpire.Docfor.NET.大数据公司挖掘数据价值的49个典型案例来源:大数据实验室
时间:2015-01-0610:15:51
作者:对于企业来说,100条理论确实不如一个成功的标杆有实践意义,本文的主旨就是寻找“正在做”大数据的49个样本。本文力力图从企企业运营营和管理理的角度度,梳理理出发掘掘大数据据价值的的一般规规律:一一是以数数据驱动动的决策策,主要要通过提提高预测测概率,来来提高决决策成功功率;二二是以数数据驱动动的流程程,主要要是形成成营销闭闭环战略略,提高高销售漏漏斗的转转化率;;三是以以数据驱驱动的产产品,在在产品设设计阶段段,强调调个性化化;在产产品运营营阶段,则则强调迭迭代式创创新。上篇天然大大数据公公司的各各种套餐餐从谷歌歌、亚马马逊、FFaceeboook、LinnkeddIn,到到阿里、百百度、腾腾讯,都都因其拥拥有大量量的用户户注册和和运营信信息,成成为天然然的大数数据公司司。而像像IBMM、Oraaclee、EMCC、惠普普这类大大型技术术公司纷纷纷投身身大数据据,通过过整合大大数据的的信息和和应用,给给其他公公司提供供“硬件软软件数据”的整体体解决方方案。我我们关注注的重点点是大数数据的价价值,第第一类公公司首当当其冲。下面就就是这些些天然大大数据公公司的挖挖掘价值值的典型型案例。01亚马逊逊的“信息公公司”如果全全球哪家家公司从从大数据据发掘出出了最大大价值,截截至目前前,答案案可能非非亚马逊逊莫属。亚亚马逊也也要处理理海量数数据,这这些交易易数据的的直接价价值更大大。作为为一家“信息公公司”,亚马马逊不仅仅从每个个用户的的购买行行为中获获得信息息,还将将每个用用户在其其网站上上的所有有行为都都记录下下来:页页面停留留时间、用用户是否否查看评评论、每每个搜索索的关键键词、浏浏览的商商品等等等。这种种对数据据价值的的高度敏敏感和重重视,以以及强大大的挖掘掘能力,使使得亚马马逊早已已远远超超出了它它的传统统运营方方式。亚马逊逊CTOOWeerneerVVogeels在在CeBBIT上上关于大大数据的的演讲,向向与会者者描述了了亚马逊逊在大数数据时代代的商业业蓝图。长长期以来来,亚马马逊一直直通过大大数据分分析,尝尝试定位位客户和和和获取取客户反反馈。“在此过过程中,你你会发现现数据越越大,结结果越好好。为什什么有的的企业在在商业上上不断犯犯错?那那是因为为他们没没有足够够的数据据对运营营和决策策提供支支持,”VVogeels说说,“一旦进进入大数数据的世世界,企企业的手手中将握握有无限限可能。”从支撑新兴技术企业的基础设施到消费内容的移动设备,亚马逊的触角已触及到更为广阔的领域。亚马逊逊推荐::亚马逊逊的各个个业务环环节都离离不开“数据驱驱动”的身影影。在亚亚马逊上上买过东东西的朋朋友可能能对它的的推荐功功能都很很熟悉,“买过X商品的人,也同时买过Y商品”的推荐功能看上去很简单,却非常有效,同时这些精准推荐结果的得出过程也非常复杂。亚马逊逊预测::用户需需求预测测是通过过历史数数据来预预测用户户未来的的需求。对对于书、手手机、家家电这些些东西———亚马马逊内部部叫硬需需求的产产品,你你可以认认为是“标品”———预测测是比较较准的,甚甚至可以以预测到到相关产产品属性性的需求求。但是是对于服服装这样样软需求求产品,亚亚马逊干干了十多多年都没没有办法法预测得得很好,因因为这类类东西受受到的干干扰因素素太多了了,比如如:用户户的对颜颜色款式式的喜好好,穿上上去合不不合身,爱爱人朋友友喜不喜喜欢………这类类东西太太易变,买买得人多多反而会会卖不好好,所以以需要更更为复杂杂的预测测模型。亚马逊逊测试::你会认认为亚马马逊网站站上的某某段页面面文字只只是碰巧巧出现的的吗?其其实,亚亚马逊会会在网站站上持续续不断地地测试新新的设计计方案,从从而找出出转化率率最高的的方案。整整个网站站的布局局、字体体大小、颜颜色、按按钮以及及其他所所有的设设计,其其实都是是在多次次审慎测测试后的的最优结结果。亚马逊逊记录::亚马逊逊的移动动应用让让用户有有一个流流畅的无无处不在在的体验验的同时时,也通通过收集集手机上上的数据据深入地地了解了了每个用用户的喜喜好信息息;更值值得一提提的是KKinddleFirre,内内嵌的SSilkk浏览器器可以将将用户的的行为数数据一一一记录下下来。以数据据为导向向的方法法并不仅仅限于以以上领域域,亚马马逊的企企业文化化就是冷冷冰冰的的数据导导向型文文化。对对于亚马马逊来说说,大数数据意味味着大销销售量。数数据显示示出什么么是有效效的、什什么是无无效的,新新的商业业投资项项目必须须要有数数据的支支撑。对对数据的的长期专专注让亚亚马逊能能够以更更低的售售价提供供更好的的服务。02谷歌的的意图如果说说有一家家科技公公司准确确定义了了“大数据据”概念的的话,那那一定是是谷歌。根根据搜索索研究公公司coomSccoree的数据据,仅220122年3月一个个月的时时间,谷谷歌处理理的搜索索词条数数量就高高达1222亿条条。谷歌歌的体量量和规模模,使它它拥有比比其他大大多数企企业更多多的应用用大数据据的途径径。谷歌搜搜索引擎擎本身的的设计,就就旨在让让它能够够无缝链链接成千千上万的的服务器器。如果果出现更更多的处处理或存存储需要要,抑或或某台服服务器崩崩溃,谷谷歌的工工程师们们只要再再添加更更多的服服务器就就能轻松松搞定。将将所有这这些数据据集合在在一起所所带来的的结果是是:企业业不仅从从最好的的技术中中获益,同同样还可可以从最最好的信信息中获获益。下下面选择择谷歌公公司的其其中三个个亮点。谷歌意意图:谷谷歌不仅仅存储了了搜索结结果中出出现的网网络连接接,还会会储存用用户搜索索关键词词的行为为,它能能够精准准地记录录下人们们进行搜搜索行为为的时间间、内容容和方式式,坐拥拥人们在在谷歌网网站进行行搜索及及经过其其网络时时所产生生的大量量机器数数据。这这些数据据能够让让谷歌优优化广告告排序,并并将搜索索流量转转化为盈盈利模式式。谷歌歌不仅能能追踪人人们的搜搜索行为为,而且且还能够够预测出出搜索者者下一步步将要做做什么。用用户所输输入的每每一个搜搜索请求求,都会会让谷歌歌知道他他在寻找找什么,所所有人类类行为都都会在互互联网上上留下痕痕迹路径径,谷歌歌占领了了一个绝绝佳的点点位来捕捕捉和分分析该路路径。换换言之,谷谷歌能在在你意识识到自己己要找什什么之前前预测出出你的意意图。这这种抓取取、存储储并对海海量人机机数据进进行分析析,然后后据此进进行预测测的能力力,就是是数据驱驱动的产产品。谷歌分分析:谷谷歌在搜搜索之外外还有更更多获取取数据的的途径。企企业安装装“谷歌分分析”之类的的产品来来追踪访访问者在在其站点点的足迹迹,而谷谷歌也可可获得这这些数据据。网站站还使用用“谷歌广广告联盟盟”,将来来自谷歌歌广告客客户网的的广告展展示在其其站点,因因此,谷谷歌不仅仅可以洞洞察自己己网站上上广告的的展示效效果,同同样还可可以对其其他广告告发布站站点的展展示效果果一览无无余。谷歌趋趋势:既既然搜索索本身是是网民的的“意图数数据库”,当然然可以根根据某一一专题搜搜索量的的涨跌,预预测下一一步的走走势。谷谷歌趋势势可以预预测旅游游、地产产、汽车车的销售售。此类类预测最最著名的的就是谷谷歌流感感趋势,跟跟踪全球球范围的的流感等等病疫传传播,依依据网民民搜索,分分析全球球范围内内流感等等病疫的的传播状状况。03eBaay的分分析平台台早在220066年,eBBay就就成立了了大数据据分析平平台。为为了准确确分析用用户的购购物行为为,eBBay定定义了超超过5000种类类型的数数据,对对顾客的的行为进进行跟踪踪分析。eBay分析平台高级总监OliverRatzesberger说:“在这个平台上,可以将结构化数据和非结构化数据结合在一起,通过分析促进eBay的业务创新和利润增长。”eBaay行为为分析::在早期期,eBBay网网页上的的每一个个功能的的更改,通通常由对对该功能能非常了了解的产产品经理理决定,判判断的依依据主要要是产品品经理的的个人经经验。而而通过对对用户行行为数据据的分析析,网页页上任何何功能的的修改都都交由用用户去决决定。“每当有有一个不不错的创创意或者者点子,我我们都会会在网站站上选定定一定范范围的用用户进行行测试。通通过对这这些用户户的行为为分析,来来看这个个创意是是否带来来了预期期的效果果。”eBaay广告告分析::更显著著的变化化反映在在广告费费上。eeBayy对互联联网广告告的投入入一直很很大,通通过购买买一些网网页搜索索的关键键字,将将潜在客客户引入入eBaay网站站。为了了对这些些关键字字广告的的投入产产出进行行衡量,eBay建立了一个完全封闭式的优04塔吉特特的“数据关关联挖掘掘”利用先先进的统统计方法法,商家家可以通通过用户户的购买买历史记记录分析析来建立立模型,预预测未来来的购买买行为,进进而设计计促销活活动和个个性服务务避免用用户流失失到其他他竞争对对手那边边。美国国第三大大零售商商塔吉特特,通过过分析所所有女性性客户购购买记录录,可以以“猜出”哪些是是孕妇。其其发现女女性客户户会在怀怀孕四个个月左右右,大量量购买无无香味乳乳液。由由此挖掘掘出255项与怀怀孕高度度相关的的商品,制制作“怀孕预预测”指数。推推算出预预产期后后,就能能抢先一一步,将将孕妇装装、婴儿儿床等折折扣券寄寄给客户户。塔吉吉特还创创建了一一套购买买女性行行为在怀怀孕期间间产生变变化的模模型,不不仅如此此,如果果用户从从它们的的店铺中中购买了了婴儿用用品,它它们在接接下来的的几年中中会根据据婴儿的的生长周周期定期期给这些些顾客推推送相关关产品,使使这些客客户形成成长期的的忠诚度度。05中国移移动的数数据化运运营通过大大数据分分析,中中国移动动能够对对企业运运营的全全业务进进行针对对性的监监控、预预警、跟跟踪。大大数据系系统可以以在第一一时间自自动捕捉捉市场变变化,再再以最快快捷的方方式推送送给指定定负责人人,使他他在最短短时间内内获知市市场行情情。客户流流失预警警:一个个客户使使用最新新款的诺诺基亚手手机,每每月准时时缴费、平平均一年年致电客客服3次,使使用WEEP和彩彩信业务务。如果果按照传传统的数数据分析析,可能能这是一一位客户户满意度度非常高高、流失失概率非非常低的的客户。事事实上,当当搜集了了包括微微博、社社交网络络等新型型来源的的客户数数据之后后,这位位客户的的真实情情况可能能是这样样的:客客户在国国外购买买的这款款手机,手手机中的的部分功功能在国国内无法法使用,在在某个固固定地点点手机经经常断线线,彩信信无法使使用———他的使使用体验验极差,正正在面临临流失风风险。这这就是中中国移动动一个大大数据分分析的应应用场景景。通过过全面获获取业务务信息,可可能颠覆覆常规分分析思路路下做出出的结论论,打破破传统数数据源的的边界,注注重社交交媒体等等新型数数据来源源,通过过各种渠渠道获取取尽可能能多的客客户反馈馈信息,并并从这些些数据中中挖掘更更多的价价值。数据增增值应用用:对运运营商来来说,数数据分析析在政府府服务市市场上前前景巨大大。运营营商也可可以在交交通、应应对突发发灾害、维维稳等工工作中使使大数据据技术发发挥更大大的作用用。运营营商处在在一个数数据交换换中心的的地位,在在掌握用用户行为为方面具具有先天天的优势势。作为为信息技技术的又又一次变变革,大大数据的的出现正正在给技技术进步步和社会会发展带带来全新新的方向向,而谁谁掌握了了这一方方向,谁谁就可能能成功。对对于运营营商来说说,在数数据处理理分析上上,需要要转型的的不仅是是技巧和和法律问问题,更更需要转转变思维维方式,以以商业化化角度思思考大数数据营销销。06Twiitteer中的的兴趣和和情绪Twiitteer兴趣趣聚类::通过过过滤用户户归属地地、发推推位置和和相关关关键词,Twitter建立了一系列定制化的客户数据流。比如,通过过滤电影片名、位置和情绪标签,你可以知道洛杉矶、纽约和伦敦等城市最受欢迎的电影是哪些。而根据用户发布的个人行为描述,你甚至能搜索到那些在加拿大滑雪的日本游客。从这个视角看,Twitter的兴趣图谱的效率优于Facebook的社交图谱。Twitter的用户数据所能产生的潜在价值同样令人惊叹。在社交媒体网站正在收集越来越多的数据的形势下,它们或许能找到更好的方式来利用这些数据盈利,并使其取代广告成为自身提高收入的主要方式。这些社交网站真正的价值可能在于数据本身。相信在不久的将来,如果寻找到既能充分利用用户数据,又可合理规避对用户隐私的威胁,社交数据所蕴藏的巨大能量将会彻底被开启。Twiitteer情绪绪分析::Twiitteer自己己并不经经营每一一款数据据产品,但但它把数数据授权权给了像像DattaSiift这这样的数数据服务务公司,很很多公司司利用TTwittterr社交数数据,做做出了各各种让人人吃惊的的应用,从从社交监监测到医医疗应用用,甚至至可以去去追踪流流感疫情情爆发,社社交媒体体监测平平台DaataSSiftt还创造造了一款款金融数数据产品品。华尔尔街“德温特特资本市市场”公司首首席执行行官保罗罗·霍廷每每天的工工作之一一,就是是利用电电脑程序序分析全全球3..4亿微微博账户户的留言言,进而而判断民民众情绪绪,再以以“1”到到“500”进行行打分。根根据打分分结果,霍霍廷再决决定如何何处理手手中数以以百万美美元计的的股票。霍霍廷的判判断原则则很简单单:如果果所有人人似乎都都高兴,那那就买入入;如果果大家的的焦虑情情绪上升升,那就就抛售。一一些媒体体公司会会把观众众收视率率数据打打包到产产品里,再再转卖给给频道制制作人和和内容创创造者。精确的的数据一一旦与社社交媒体体数据相相结合,对对未来的的预测会会非常准准。07特易购购的精准准定向聪明的的商家通通过用户户的购买买历史记记录分析析来建立立模型,为为他们量量身预测测未来的的购物清清单,进进而设计计促销活活动和个个性服务务,让他他们源源源不断地地为之买买单。特特易购是是全球利利润第二二大的零零售商,这这家英国国超级市市场巨人人从用户户行为分分析中获获得了巨巨大的利利益。从从其会员员卡的用用户购买买记录中中,特易易购可以以了解一一个用户户是什么么“类别”的客人人,如速速食者、单单身、有有上学孩孩子的家家庭等等等。这样样的分类类可以为为提供很很大的市市场回报报,比如如,通过过邮件或或信件寄寄给用户户的促销销可以变变得十分分个性化化,店内内的促销销也可以以根据周周围人群群的喜好好、消费费的时段段来更加加有针对对性,从从而提高高货品的的流通。这这样的做做法为特特易购获获得了丰丰厚的回回报,仅仅在市场场宣传一一项,就就能帮助助特易购购每年节节省3..5亿英英镑的费费用。Tessco的的优惠券券:特易易购每季季会为顾顾客量身身定做66张优惠惠券。其其中4张是客客户经常常购买的的货品,而而另外22张则是是根据该该客户以以往的消消费行为为数据分分析,极极有可能能在未来来会购买买的产品品。仅在在19999年,特特易购就就送出了了14..5万份份面向不不同的细细分客户户群的购购物指南南杂志和和优惠券券组合。更更妙的是是,这样样的低价价无损公公司整体体的盈利利水平。通通过追踪踪这些短短期优惠惠券的回回笼率,了了解到客客户在所所有门店店的消费费情况,特特易购还还可以精精确地计计算出投投资回报报。发放放优惠券券吸引顾顾客其实实已经是是很老套套的做法法了,而而且许多多的促销销活动实实际只是是来掠夺夺公司未未来的销销售额。然然而,依依赖于扎扎实的数数据分析析来定向向发放优优惠券的的特易购购,却可可以维持持每年超超过1亿英镑镑的销售售额增长长。特易购购同样有有会员数数据库,通通过已有有的数据据,就能能找到那那些对价价格敏感感的客户户,然后后在公司司可以接接受的最最低成本本水平上上,为这这类顾客客倾向购购买的商商品确定定一个最最低价。这这样的好好处一是是吸引了了这部分分顾客,二二是不必必在其他他商品上上浪费钱钱降价促促销。特易购购的精准准运营::这家连连锁超市市在其数数据仓库库中收集集了7000万部部冰箱的的数据。通通过对这这些数据据的分析析,进行行更全面面的监控控并进行行主动的的维修以以降低整整体能耗耗。08Facceboook的的好友推推荐Facceboook是是社交网网络巨擎擎,但是是在挖掘掘大数据据价值方方面,好好像办法法不多,值值得一提提的就是是好友推推荐。FFaceeboook使用用大数据据来追踪踪用户在在其网络络的行为为,通过过识别你你在它的的网络中中的好友友,从而而给出新新的好友友推荐建建议,用用户拥有有越多的的好友,他他们与FFaceeboook之间间的黏度度就越高高。更多多的好友友意味着着用户会会分享更更多照片片、发布布更多状状态更新新、玩更更多的游游戏。09LinnkeddIn的的猎头价价值LinnkeddIn网网站使用用大数据据在求职职者和招招聘职位位之间建建立关联联。有了了LinnkeddIn,猎猎头们再再也不用用向潜在在的受聘聘者打陌陌生电话话来碰运运气,而而可以通通过简单单的搜索索找出潜潜在受聘聘者并联联系他们们。与此此相似,求求职者也也可以通通过联系系网站上上其他人人,自然然而然地地将自己己推销给给潜在的的雇主。有有两个例例子能够够生动呈呈现LiinkeedInn的数据据价值::几年前前,LiinkeedInn忽然发发现近期期雷曼兄兄弟的来来访者多多了起来来,当时时并没引引起重视视,过了了不久,雷雷曼兄弟弟宣布倒倒闭;而而在谷歌歌宣布退退出中国国的前一一个月,在在LinnkeddIn发发现了一一些平时时很少见见的谷歌歌产品经经理在线线,这也也是相同同的道理理。如果果LinnkeddIn针针对性地地分析某某家上10沃尔玛玛的数据据基因早在119699年沃尔尔玛就开开始使用用计算机机来跟踪踪存货,1974年就将其分销中心与各家商场运用计算机进行库存控制。1983年,沃尔玛所有门店都开始采用条形码扫描系统。1987年,沃尔玛完成了公司内部的卫星系统的安装,该系统使得总部,分销中心和各个商场之间可以实现实时,双向的数据和声音传输。采用这些在当时还是小众和超前的信息技术来搜集运营数据为沃尔玛最近20年的崛起打下了坚实的地基,从而发现了“啤酒与尿布”关联。如今,沃沃尔玛拥拥有着全全世界最最大的数数据仓库库,在数数据仓库库中存储储着沃尔尔玛数千千家连锁锁店在665周内内每一笔笔销售的的详细记记录,这这使得业业务人员员可以通通过分析析购买行行为更加加了解他他们的客客户。通通过这些些数据,业业务员可可以分析析顾客的的购买行行为,从从而供应应最佳的的销售服服务。沃沃尔玛一一直致力力于改善善自身的的数据收收集技术术,从条条形码扫扫描,到到安装卫卫星系统统实现双双向数据据传输,整整个公司司都充满满了数据据基因。2012年4月,沃尔玛又收购了一家研究网络社交基因的公司Kosmix,在数据基因的基础上,又增加了社交基因。11阿里小小贷和聚聚石塔虽然阿阿里系的的余额宝宝如日中中天,但但其实阿阿里小贷贷才真正正体现出出了大数数据的价价值。早早在20010年年阿里就就已经建建立了“淘宝小小贷”,通过过对贷款款客户下下游订单单、上游游供应商商、经营营信用等等全方位位的评估估,就可可以在没没有见面面情况下下,给客客户放款款,这当当然是对对阿里平平台上大大数据的的挖掘。数数据来源源于“聚石塔塔”———一个大大型的数数据分享享平台,它它通过共共享阿里里巴巴旗旗下各个个子公司司的数据据资源来来创造商商业价值值。这款款产品就就是大数数据团队队把淘宝宝交易流流程各个个环节的的数据整整合互联联,然后后基于商商业理解解对信息息进行分分类储存存和分析析加工,并并与决策策行为连连接起来来所产生生的效果果。12西尔斯斯的数据据大集成成在过去去,美国国零售巨巨头西尔尔斯控股股公司,需需要八周周时间才才能制定定出个性性化的销销售方案案,但往往往做出出来的时时候,它它已不再再是最佳佳方案。痛痛定思痛痛,决定定整合其其专售的的三个品品牌———Seaars、Craaftssmann、Lannds''Endd的客户户、产品品以及销销售数据据,使用用群集收收集来自自不同品品牌的数数据,并并在群集集上直接接分析数数据,而而不是像像以前那那样先存存入数据据仓库,避避免了浪浪费时间间——先把把来自各各处的数数据合并并之后再再做分析析。这种种调整让让公司的的推销方方案更快快、更精精准,可可以从海海量信息息中挖掘掘价值,但但是价值值巨大,困困难也巨巨大:这这些数据据需要超超大规模模分析,且且分散在在不同品品牌的数数据库与与数据仓仓库中,不不仅数量量庞大而而且支离离破碎。西尔斯斯的困境境,在传传统企业业中非常常普遍,这这些企业业家一直直想不通通,既然然互联网网零售商商亚马逊逊可以推推荐阅读读书目、推推荐电影影、推荐荐可供购购买的产产品,为为什么他他们所在在的企业业却做不不到类似似的事情情。西尔尔斯公司司首席技技术官菲菲里·谢利(PPhillShhellley)说说:如果果要制定定一系列列复杂推推荐方案案质量更更高,需需要更及及时、更更细致、更更个性化化的数据据,传统统企业的的IT架构构根本不不能完成成这些任任务,需需要痛下下决心,才才能完成成转型。中篇轻公公司数据据创业狂狂欢在这次次“数据盛盛宴”中,是是否只有有大公司司的狂欢欢?并非非如此,从从事大数数据产业业的轻公公司将无无处不在在。新兴兴的创业业公司通通过出售售数据和和服务更更有针对对性地提提供单个个解决方方案,把把大数据据商业化化、商品品化,才才是更加加值得我我们关注注的模式式。这将将带来继继门户网网站、搜搜索引擎擎、社交交媒体之之后的新新一波创创业浪潮潮和产业业革命,并并会对传传统的咨咨询公司司产生强强烈冲击击。13PreedPool的犯犯罪预测测PreedPool公司司通过与与洛杉矶矶和圣克克鲁斯的的警方以以及一群群研究人人员合作作,基于于地震预预测算法法的变体体和犯罪罪数据来来预测犯犯罪发生生的几率率,可以以精确到到5000平方英英尺的范范围内。在在洛杉矶矶运用该该算法的的地区,盗盗窃罪和和暴力犯犯罪分布布下降了了33%%和21%%。14Tippp244AGG的赌徒徒行为预预测Tippp244AGG针对欧欧洲博彩彩业构建建的下注注和预测测平台。该该公司用用KXEEN软件件来分析析数十亿亿计的交交易以及及客户的的特性,然然后通过过预测模模型对特特定用户户进行动动态的营营销活动动。这项项举措减减少了990%的的预测模模型构建建时间。SAP公司正在试图收购KXEN,“SAP想通过这次收购来扭转其长久以来在预测分析方面的劣势”。15Inrrix的的堵车预预言交通的的参与者者多种多多样,是是大数据据最能发发挥价值值的领域域。交通通流量数数据公司司Inrrix依依靠分析析历史和和实时路路况数据据,能给给出及时时的路况况报告,以以帮助司司机避开开正在堵堵车的路路段,并并且帮他他们提前前规划好好行程。汽汽车制造造商、移移动应用用开发者者、运输输企业以以及各类类互联网网企业都都需要IInriix的路路况报告告。奥迪迪、福特特、日产产、微软软等巨头头都是IInriix的客客户。16潘吉瓦瓦的时尚尚预测消费者者追寻意意见领袖袖的生活活方式。潘潘吉瓦公公司就是是用数据据分析来来预测流流行趋势势,以此此为基础础甚至撬撬动全球球贸易。比比如,它它们通过过41次追追踪《暮暮光之城城》的徽徽章、袜袜子的运运输情况况,分析析在这部部电影中中主角的的服饰对对流行趋趋势有多多大影响响率,并并将分析析结果告告知用户户,建议议他们对对自己的的行动做做出恰当当的调整整。17潘多拉拉的音乐乐推荐美国在在线音乐乐网站潘潘多拉特特别聘请请一些音音乐专家家,让他他们每个个人平均均花上220分钟钟去分析析一首歌歌曲,并并赋予每每首歌4400种种不同的的属性。如如果你表表示喜欢欢一首歌歌,程序序会自动动寻找跟跟这首歌歌“基因”相同的的歌曲,猜猜测你也也会喜欢欢并采用用推荐引引擎技术术推荐给给你。借借助这种种人海战战术,潘潘多拉网网站已经经分析了了74万首首歌曲。18FuttrixxHeealtth的医医疗方案案FuttrixxHeealtth是一一家专注注于用通通过数据据为患者者制定医医疗解决决方案的的公司,从从安装在在智能手手机上的的个人健健康应用用,到诊诊所、医医院里医医生使用用的电子子健康记记录仪,甚甚至是革革命性的的数字化化基因组组数据,均均连接到到后端数数据仓库库上。从从而为患患者制定定最佳的的医院选选择、医医药选择择。该如如何将采采集到医医疗保健健机构的的大量操操作信息息,分析析患者情情况或治治疗效果果,实施施任何高高效率的的措施,使使之更具具有意义义——大数数据时代代提供的的机会,不不再是简简单地收收集这些些数据,而而是如何何运用数数据来更更好地认认知这个个世界。19RettenttionnScciennce的的用户粘粘性在零售售领域,创创业公司司RettenttionnScciennce发发布了一一个为电电子商务务企业提提供增强强用户粘粘性的数数据分析析及市场场策略设设计的平平台,它它的用户户建模引引擎具备备自学习习功能,通通过使用用算法和和统计模模型来设设计优化化用户粘粘性的策策略。平平台的用用户数据据分析都都是实时时进行,以以确保用用户行为为预测总总是符合合实际用用户行为为更新;;同时,动动态的根根据这些些行为预预测来设设计一些些促销策策略。RRS目前前已获得得BarrodaaVeentuuress,MMohrrDaaviddowVennturres,,DooublleMMPaartnnerss及一些些著名天天使投资资人1330万美美金的投投资。20众瀛的的婚嫁后后推荐江苏众众瀛联合合数据科科技有限限公司构构建了这这样一个个大数据据平台———将准准备结婚婚的新人人作为目目标消费费者,并并把与结结婚购物物相关的的商家加加入其中中。一对对新人到到薇薇新新娘婚纱纱影楼拍拍了婚纱纱照,在在实名登登记了自自己的信信息后会会被上传传到大数数据平台台上。大大数据平平台能根根据新人人在婚纱纱影楼的的消费情情况和偏偏好风格格,大致致分析判判断出新新人后续续消费需需求,即即时发送送奖励和和促销短短信。比比如邀请请他们到到红星美美凯龙购购买家具具、到红红豆家纺纺选购床床上用品品、到国国美电器器选购家家用电器器、到希希尔顿酒酒店摆酒酒席………如果新新人在红红星美凯凯龙购买买了中式式家具,说说明他们们偏好中中国传统统文化,就就推荐他他们购买买红豆家家纺的中中式家居居用品。21Takkaduu的数字字驯水水,向向来是个个不好管管理的东东西:自自来水公公司发现现某个水水压计出出现问题题,可能能需要花花上很长长的时间间排查共共用一个个水压计计的若干干水管。等等找到的的时侯,大大量的水水已经被被浪费了了。以色色列一家家名为TTakaadu的的水系统统预警服服务公司司解决了了这个问问题。TTakaadu把把埋在地地下的自自来水管管道水压压计、用用水量和和天气等等检测数数据搜集集起来,通通过亚马马逊的云云服务传传回Taakaddu公司司的电脑脑进行算算法分析析,如果果发现城城市某处处地下自自来水管管道出现现爆水管管、渗水水以及水水压不足足等异常常状况,就就会用大大约100分钟完完成分析析生成一一份报告告,发回回给这片片自来水水管道的的维修部部门。报报告中,除除了提供供异常状状况类型型以及水水管的损损坏状况况——每秒秒漏出多多少立方方米的水水,还能能相对精精确地标标出问题题水管具具体在哪哪里。检检测每千千米“水路”,Takkaduu的月收收费是11万美元元。22百合网网的婚恋恋匹配电商行行业的现现金收入入源自数数据,而而婚恋网网站的商商业模型型更是根根植于对对数据的的研究。比比如,作作为一家家婚恋网网站,百百合网不不仅需要要经常做做一些研研究报告告,分析析注册用用户的年年龄、地地域、学学历、经经济收入入等数据据,即便便是每名名注册用用户小小小的头像像照片,这这背后也也大有挖挖掘的价价值。百百合网研研究规划划部李琦琦曾经对对百合网网上海量量注册用用户的头头像信息息进行分分析,发发现那些些受欢迎迎头像照照片不仅仅与照片片主人的的长相有有关,同同时照片片上人物物的表情情、脸部部比例、清清晰度等等因素也也在很大大程度上上决定了了照片主主人受欢欢迎的程程度。例例如,对对于女性性会员,微微笑的表表情、直直视前方方的眼神神和淡淡淡的妆容容能增加加自己受受欢迎的的概率,而而那些脸脸部比例例占照片片1/22、穿着着正式、眼眼神直视视没有多多余poose的的男性则则更可能能成为婚婚恋网站站上的宠宠儿。23Priismaaticc的新闻闻外衣Priismaaticc是一款款个性化化新闻应应用,只只有4名创始始员工,凭凭借互联联网数据据爬虫和和社交网网络开发发平台的的数据,依依托亚马马逊的云云计算平平台,实实现了大大数据的的精益创创业。PPrissmattic不不提供统统一的设设计精良良的新闻闻订阅或或推荐界界面,而而是根据据分析用用户的FFaceeboook或或Twiitteer资料料,为用用户做一一对一的的数据分分析和推推荐。从从盈利模模式来看看,Prrismmatiic不是是依靠广广告费生生存下来来,也不不是传统统的新闻闻媒介,而而是一个个披着新新闻应用用外衣的的电子商商务公司司。名义义上为了了给用户户个性化化推荐新新闻而得得到用户户的个人人信息进进行数据据分析,针针对性的的推出推推荐商品品,从而而从电子子商务中中盈利。24Opoowerr的对比比激励人类都都有和同同类对比比的天性性,例如如,一家家政府机机构收集集不同地地点从事事同类工工作的多多组员工工的数据据,仅仅仅将这些些信息公公诸于众众就促使使落后员员工提高高了绩效效。在能能源行业业,Oppoweer使用用数据对对比来提提高消费费用电的的能效,并并取得了了显著的的成功。作作为一家家SaaaS的创创新公司司,Oppoweer与多多家电力力公司合合作,分分析美国国家庭用用电费用用并将之之与周围围的邻居居用电情情况进行行对比,被被服务的的家庭每每个月都都会受到到一份对对比的报报告,显显示自家家用电在在整个区区域或全全美类似似家庭所所处水平平,以鼓鼓励节约约用电。Opower的服务以覆盖了美国几百万户居民家庭,预计将为美国消费用电每年节省5亿美元。Opower报告信封,看上去像账单,它们使用行为技术轻轻地说服公用事业客户降低消耗。Opower已经推出了它的大数据平台Opower4,通过分析各种智能电表和用电行为,电力公司等公用事业单位成为Opower的盈利来源。而对一般用户而言,Opower完全是免费的。25Chaangoo和Uniiqliick的的点击消消费使用新新的数据据技术,诸诸如美国国的Chhanggo公司司和中国国的Unniqllickk公司正正在数字字广告行行业中探探索新的的商业模模式———实时竞竞拍数字字广告。通通过了解解互联网网用户在在网络的的搜索、浏浏览等行行为,这这些公司司可以为为广告主主提供最最有可能能对其商商品感兴兴趣的用用户群,从从而进行行精准营营销;更更长期的的趋势是是,将广广告投放放给最有有可能购购买的用用户群。这这样的做做法对于于广告主主来说,可可以获得得更高的的转换率率,而对对于发布布广告的的网站来来说,也也提高了了广告位位的价值值。26众趣的的行为辩辩析众趣是是国内第第一家社社交媒体体数据管管理平台台,目前前国内主主要的社社交开放放平台在在用户数数据的开开放性方方面仍比比较保守守,身为为第三方方数据分分析公司司,能够够获得的的用户数数据还十十分有限限,要使使用这些些用户数数据需获获得用户户许可。众众趣通过过运营统统计学等等相关数数据分析析原理对对用户数数据进行行过滤,最最终完成成的是对对一个用用户的行行为、动动作等个个体特征征的描述述。这些些描述可可以帮助助品牌营营销者了了解消费费者的消消费习惯惯及需求求;也可可以帮助助企业的的领导增增强对自自己员工工的了解解。除了了对个体体以及群群体行为为特征的的描述外外,这些些数据分分析结果果还可用用于对用用户群体体的行为为预测,从从而为营营销者提提供一些些前瞻性性的市场场分析。众众趣数据据分析的的结果只只能精准准到群组组而无法法达到个个人。此此类的用用户数据据研究除除在市场场营销领领域具有有一定的的参考价价之外,目目前大多多还主要要用于配配合一些些小调研研。此外外,这些些数据还还可以实实现对用用户甚至至企业机机构的信信用评级级,在金金融领域域也有一一定程度度的使用用。27拖拉网网的明天天猜想导购电电商的拖拖拉网制制作了“明天穿穿什么”这一应应用。在在这个应应用当中中,众多多时装圈圈权威人人士输送送时装搭搭配与风风格单品品,由用用户任意意打分,根根据用户户的打分分偏好,拖拖拉网便便能猜到到明天她她们想穿穿什么,然然后为她她在数十十万件网网购时装装中推荐荐单品,并并且实现现直通购购买下单单。在获获取客户户数据后后,后台台分析也也是各显显神通。拖拉网网加入了了更多变变量来考考核自己己的推荐荐模式。比比如有消消费者明明天要参参加一个个聚会,不不知道要要穿什么么风格,也也没有看看天气预预报,希希望导购购网站能能帮她把把这些场场景和自自己的信信息组合合起来,给给出一整整套的解解决方案案。于是是日期、地地域、场场合、风风格,这这些都成成为穿衣衣搭配解解决方案案的变量量,经过过不断的的组合呈呈现给用用户,据据拖拉网网数据,用用户在看看到一个个比较优优质的搭搭配,并并有场景景性引导导的时候候,点击击到最后后页面完完成购买买的转化化率会比比单品推推荐高440%。28SeeeChaangee的基因因健康现在人人们有了了把人类类基因档档案序列列化的能能力,这这允许医医生和科科学家去去预测病病人对于于某些疾疾病的易易感染性性和其他他不利的的条件,可可以减少少治疗过过程的时时间和花花费。位位于旧金金山的SSeeCChannge公公司创建建了一套套新的健健康保险险模式。该该公司通通过分析析客户的的个人健健康记录录、医疗疗报销记记录、以以及药店店的数据据,来判判断该客客户对于于慢性病病的易感感性,并并判断该该客户是是否有可可能从一一些定制制的康复复套餐中中获利。SeeChange同时设计健康计划,并设立奖励机制鼓励客户主动完成健康行动,全过程都通过其数据分析引擎来监控。29GivvenImaaginng的图图像诊断断以色列列的GiivennImmagiing公公司发明明了一种种胶囊,内内置摄像像头,患患者服用用后胶囊囊能以大大约每秒秒14张照照片的频频率拍摄摄消化道道内的情情况,并并同时传传回外置置的图像像接收器器,患者者病征通通过配套套的软件件被录入入数据库库,在44至6小时内内胶囊相相机将通通过人体体排泄离离开体外外。一般般来说,医医生都是是在靠自自己的个个人经验验进行病病征判断断,难免免会对一一些疑似似阴影拿拿捏不准准甚至延延误病人人治疗。现现在通过过GivvenImaaginng的数数据库,当当医生发发现一个个可疑的的肿瘤时时,双击击当前图图像后,过过去其他他医生拍拍摄过的的类似图图像和他他们的诊诊断结果果都会悉悉数被提提取出来来。可以以说,一一个病人人的问题题不再是是一个医医生在看看,而是是成千上上万个医医生在同同时给出出意见,并并由来自自大量其其他病人人的图像像给出佐佐证。这这样的数数据对比比,不但但提高了了医生诊诊断的效效率,还还提升了了准确度度。30Entteloo的“前猎头头”真正的的技术人人才永远远是各大大公司的的抢手货货,绝对对不要坐坐等他们们向你投投简历,因因为在他他们还没没有机会会写简历历之前很很可能已已经被其其他公司司抢走了了。Enntello公司司能替企企业家们们推荐那那些才刚刚刚萌发发跳槽动动机的高高级技术术人才,以以便先下下手为强强。Entteloo的数据据库里目目前有33亿份简简历。而而如何判判断高级级人才的的跳槽倾倾向,EEnteelo有有一套正正在申请请专利的的算法。这这套算法法有700多个指指标用于于判定跳跳槽倾向向。某公公司的股股价下跌跌、高层层大换血血、刚被被另一大大公司收收购,这这些都会会被Enntello看作作是导致致该公司司人才跳跳槽的可可能性因因素。于于是Enntello就会会立刻把把该公司司里的高高级人才才的信息息推送给给订阅了了自己服服务的企企业家们们。企业业家们收收到的简简历跟一一般的简简历还不不一样。Entelo抓取了这些人才在各大社交网络的信息。这样企业家们可以了解该人提交过哪些代码,在网上都回答了些什么样的问题,在Twitter上都发表的是些什么样的信息。总之,这些准备“挖角”的企业家能够看到一个活生生的目标人才站在面前。31FliighttCassterr和Passsurr的延误误预测航空业业分秒必必争,尤尤其是航航班抵达达的准确确时间。如如果一班班飞机提提前到达达,地勤勤人员还还没准备备好,乘乘客和乘乘务员就就会被困困在飞机机上白白白耽误时时间;如如果一班班飞机延延误,地地勤人员员就只能能坐着干干等,白白白消耗耗成本。美美国一家家大航空空公司从从其内部部报告中中发现,大大约100%的航航班的实实际到达达时间与与预计到到达时间间相差110分钟钟以上,30%的航班相差5分钟以上。FlightCaster是一家提供航班延误信息预测的公司,主要根据航空公司的航班运行情况进行预测。与航空公司所拥有的类似航班运行情况的专有信息一样,该公司拥有大量国内航班飞行和航班实时运行状况的历史数据。Flightcaster的秘诀就是其对大数据分析的有效利用和使用适当的软件工具对产出数据进行实时管理。PasssurrAeerosspacce是专专门为航航空业提提供决策策支持的的技术公公司。通通过搜集集天气、航航班日程程表等公公开数据据,结合合自己独独立收集集的其他他影响航航班因素素的非公公开数据据,综合合预测航航班到港港时间。时时至20012年年,Paassuur公司司已经拥拥有超过过1555处雷达达接收站站,每44.6秒秒就收集集一次雷雷达上每每架飞机机的一系系列信息息,这会会持续地地带来海海量数据据。不仅仅如此,经经过长期期的数据据收集,Passur拥有了一个超过十年的巨大的多维信息载体,为透彻的分析和恰当的数据模型提供了可能。Passur公司相信,航空公司依据它们提供的航班到达时间做计划,能为每个机场每年节省数百万美元。32Cliimatte的农农业保险险一家名名为气候候公司的的创业企企业每天天都会对对美国境境内超过过1000万个地地点、未未来两年年的天气气情况进进行超过过1万次模模拟,其其数据量量庞大、动动态、实实时。随随后,该该公司将将根系结结构和土土壤孔隙隙度的相相关数据据,与模模拟结果果相结合合,为成成千上万万的农民民提供农农作物保保险。通通过遥感感获取土土壤数据据,这和和我们过过去所熟熟悉的通通过网络络服务获获取用户户网络行行为数据据不是一一回事,数数据的概概念得以以极大的的扩充。要要想对每每块田地地提供精精准的保保险服务务,肯定定还需要要与土地地数据相相配套的的农产品品期货、气气候预测测、国际际贸易、国国际政治治和军事事安全、国国民经济济,产业业竞争等等等各方方面的数数。在如如此庞杂杂的大数数据基础础上推出出的商业业模式是是创新的的,同现现有农作作物保险险方式相相比具备备极大竞竞争力,并并且是可可持续和和规模化化的。更更妙的是是,这家家公司基基于大数数据的运运营,完完全没有有进行高高额的网网络设施施投资,只只是租用用了亚马马逊的公公共云服服务,一一个月几几万美元元而已。33Hipptyppe的记记录阅读读几乎所所有的收收费电子子书都会会提供部部分章节节让读者者试读,其其实,出出版商需需要弄清清楚人们们读到了了哪里、读读完后有有没有购购买,以以及其他他各种体体验,才才能卖出出更多的的电子书书。美国国创业公公司Hiiptyype开开发了一一套电子子书阅读读分析工工具,其其商业模模式就在在试图解解决这一一难题。Hiptype自称为“面向电子书的GoogleAnalytics”,能够提供与电子书有关的丰富数据。它不仅能统计电子书的试读和购买次数,还能绘制出“读者图谱”,包括用户的年龄、收入和地理位置等。此外,它还能告诉出版商读者在看完免费章节后是否进行了购买,有多少读者看完了整本书,以及读者平均看了多少页,读者最喜欢从哪个章节开始看,又在哪个章节半途而废,等等。Hiptype能够与电子书整合在一起,出版商无论选择哪种渠道,总是能够获得用户数据。Hiptype收集的所有数据都是匿名的。用户在下载了内置Hiptype服务的电子书时,会得到一个提示,可以选择将其屏蔽。34安客诚诚的“人网合合一”网络营营销存在在一个巨巨大问题题,如何何获知在在网上使使用几个个不同名名称的人人是否是是同一个个人?安安诚客推推出了一一种名为为“观众操操作系统统”的技术术方案解解决了这这个问题题。它允允许市场场营销者者与你的的“数字字人物”绑定,即即使你由由于婚姻姻换了名名字,或或者使用用昵称,或或者偶尔尔使用中中名,它它也照样样能够解解答那个个已经换换了地址址或者电电话号码码的人是是否是同同一个人人的问题题。AOSS可以以汇集不不同数据据库中的的信息,这这些数据据或离线线或在线线,是公公司可能能在不同同场合针针对个人人而收集集的。通通过使用用AbiiliTTec———一种种Acxxiomm也拥有有的数字字化“身份识识别”技术———AOSS将客户户信息删删繁就简简,得到到简单单单一的结结果。AAOS帮帮助安诚诚客的广广告客户户使用他他们的数数据在FFaceeboook上找找到广告告投放目目标用户户。下篇数据据关联、数数据废气气和黑暗暗数据大数据据主要不不作因果果判断,主主要适用用于关联联分析。很很多关联联分析并并不需要要复杂的的模型,只只需要具具有大数数据的意意识。很多机机构都有有数据废废气,数数据不是是用完就就是被舍舍弃,它它的再利利用价值值也许你你现在不不清楚,但但在未来来的某一一刻,它它会迸发发出来,可可以化废废为宝。黑暗数数据就是是那些针针对单一一目标而而收集的的数据,通通常用过过之后就就被归档档闲置,其其真正价价值未能能被充分分挖掘。如如果黑暗暗数据用用在恰当当的地方方,也能能公司的的事业变变得光明明。35数据关关联分析析某公司司团队曾曾经使用用来自手手机的位位置数据据,来推推测美国国圣诞节节购物季季开始那那一天有有多少人人在梅西西百货公公司的停停车场停停车,进进而可以以预测其其当天的的销售额额,这远远早于梅梅西百货货自己统统计出的的销售记记录。无无论是华华尔街的的分析师师或者传传统产业业的高管管,都会会因这种种敏锐的的洞察力力获得极极大的竞竞争优势势。对于税税务部门门来说,税税务欺骗骗正在日日益的被被关注,这这时大数数据可以以用于增增加政府府识别诈诈骗的流流程。在在隐私允允许的地地方,政政府部门门可以综综合各个个方面的的数据比比如车辆辆的登记记,海外外旅游的的数据来来发现个个人的花花费模式式,使税税务贡献献不被叠叠加。同同时一个个可疑的的问题出出现了,这这并没有有直接的的证据指指向诈骗骗,这些些结论并并不能用用来去控控告个人人。但是是他可以以帮助政政府部门门去明确确他们的的审计和和其他的的审核以以及一些些流程。36数据废废气物流公公司的数数据原来来只服务务于运营营需要,但但一经再再利用,物物流公司司就华丽丽转身为为金融公公司,数数据用以以评估客客户的信信用,提提供无抵抵押贷款款,或者者拿运送送途中的的货品作作为抵押押提供贷贷款;物物流公司司甚至可可以转变变为金融融信息服服务公司司来判断断各个细细分经济济领域的的运行和和走势。有公司司已经在在大数据据中有接接近“上帝俯俯视”的感觉觉,美国国洛杉矶矶的一家家企业宣宣称,他他们将全全球夜景景的历史史数据建建立模型型,在过过滤掉波波动之后后,做出出了投资资房地产产和消费费的研究究报告。麦麦当劳则则通过外外送服务务,在售售卖汉堡堡的同时时获得了了用户的的精准地地址,这这些地址址数据汇汇集之后后,就变变成了一一份绝妙妙的房地地产业的的内部数数据。37黑暗数数据
在在特定情情况下,黑黑暗数据据可以用用作其他他用途。InfinityProperty&Casualty公司用累积的理赔师报告来分析欺诈案例,通过算法挽回了1200万美元的代位追偿金额。一家电气销售公司,通过积累10年ERP销售数据分析,按照电气设备的生命周期,给5年前的老客户逐一拜访,获得了1000万元以上电气设备维修订单,顺利地进入MRO市场。338客客户流失失分析美国运运通以前前只能实实现事后后诸葛亮亮式的报报告和滞滞后的预预测,传传统的BBI已经经无法满满足其业业务发展展的需要要。于是是,AmmEx开开始构建建真正能能够预测测客户忠忠诚度的的模型,基基于历史史交易数数据,用用1155个变量量来进行行分析预预测。该该公司表表示,对对于澳大大利亚将将于之后后4个月中中流失的的客户,已已经能够够识别出出其中的的24%%。这样样的客户户流失分分析,当当然可以以用于挽挽留客户户。酒店店业可以以为消费费者定制制相应的的独特的的个性房房间,甚甚至可以以在墙纸纸上放上上消费者者的微博博的旅游游心情等等等。旅旅游业可可以根据据大数据据为消费费者提供供其可能能会喜好好的本地地特色产产品、活活动、小小而美的的小众景景点等等等来挽回回游客的的心。39快餐业业的视频频分析快餐业业的公司司可以通通过视频频分析等等候队列列的长度度,然后后自动变变化电子子菜单显显示的内内容。如如果队列列较长,则则显示可可以快速速供给的的食物;;如果队队列较短短,则显显示那些些利润较较高但准准备时间间相对长长的食品品。40大数据据竞选20112年,参参与竞选选的奥巴巴马团队队确定了了三个最最根本的的目标::让更多多的人掏掏更多的的钱,让让更多的的选民投投票给奥奥巴马,让让更多的的人参与与进来!!这需要要“微观”层面的的认知::每个选选民最有有可能被被什么因因素说服服?每个选选民在什什么情况况下最有有可能掏掏腰包??什么样样的广告告投放渠渠道能够够最高效效获取目目标选民民?如竞选选总指挥挥吉姆··梅西纳纳所说,在在整个竞竞选活中中,没有有数据做做支撑的的假设不不能存在在。为了筹筹到100亿美元元的竞选选款,奥奥巴马的的数据挖挖掘团队队在过去去两年搜搜集、存存储和分分析了大大量数据据。他们们注意到到,影星星乔治··克鲁尼尼对美国国西海岸岸40岁至至49岁的的女性具具有非常常大的吸吸引力::她们无无疑是最最有可能能为了在在好莱坞坞与克鲁鲁尼和奥奥巴马共共进晚餐餐而不惜惜自掏腰腰包的一一个群体体。克鲁鲁尼在自自家豪宅宅举办的的筹款宴宴会上,为为奥巴马马筹集到到数百万万美元的的竞选资资金。此此后,当当奥巴马马团队决决定在东东海岸物物色一位位对于这这个女性性群体具具有相同同号召力力的影星星时,数数据团队队发现莎莎拉·杰西卡卡·帕克的的粉丝们们也同样样喜欢竞竞赛、小小型宴会会和名人人。“克鲁尼尼效应”被成功功地复制制到了东东海岸。在整个个的竞选选中,奥奥巴马团团队的广广告费用用花了不不到3亿美元元,而罗罗姆尼团团队则花花了近44亿美元元却落败败,其中中一个重重要的原原因在于于,奥巴巴马的数数据团队队对于广广告购买买的决策策,是经经过缜密密的数据据分析之之后才制制定的。一一项民调调显示,80%的美国选民认为奥巴马比罗姆尼让他们感觉更加重视自己。结果是,奥巴马团队筹得的第一个1亿美元中,98%来自于小于250美元的小额捐款,而罗姆尼团队在筹得相同数额捐款的情况下,这一比例仅为31%。41监控非非法改建建“私搭搭乱建”在哪个个国家都都是一件件闹心的的事,而而且容易易引起火火灾。非非法在屋屋内打隔隔断的建建筑物着着火的可可能性比比其他建建筑物高高很多。纽纽约市每每年接到到2.55万宗有有关房屋屋住得过过于拥挤挤的投诉诉,但市市里只有有2000名处理理投诉的的巡视员员。市长长办公室室一个分分析专家家小组觉觉得大数数据可以以帮助解解决这一一需求与与资源的的落差。该该小组建建立了一一个市内内全部990万座座建筑物物的数据据库,并并在其中中加入市市里199个部门门所收集集到的数数据:欠欠税扣押押记录、水水电使用用异常、缴缴费拖欠欠、服务务切断、救救护车使使用、当当地犯罪罪率、鼠鼠患投诉诉等等。接接下来,他他们将这这一数据据库与过过去5年中按按严重程程度排列列的建筑筑物着火火记录进进行比较较,希望望找出相相关性。果果然,建建筑物类类型和建建造年份份是与火火灾相关关的因素素。不过过,一个个没怎么么预料到到的结果果是,获获得外砖砖墙施工工许可的的建筑物物与较低低的严重重火灾发发生率之之间存在在相关性性。利用所所有这些些数据,该该小组建建立了一一个可以以帮助他他们确定定哪些住住房拥挤挤投诉需需要紧急急处理的的系统。他他们所记记录的建建筑物的的各种特特征数据据都不是是导致火火灾的原原因,但但这些数数据与火火灾隐患患的增加加或降低低存在相相关性。这这种知识识被证明明是极具具价值的的:过去去房屋巡巡视员出出现场时时签发房房屋腾空空令的比比例只有有13%%,在采采用新办办法之后后,这个个比例上上升到了了70%%。42榨菜指指数负责起起草《全全国促进进城镇化化健康发发展规划划(20011--20220年)》(以下简简称“城镇化化规划”))的国家家发改委委规划司司官员需需要精确确知道人人口的流流动,怎怎么统计计出这些些流动人人口成为为难题。榨菜,属属于低质质易耗品品,收入入增长对对于榨菜菜的消费费几乎没没有影响响。一般般情况下下,城市市常住人人口对于于方便面面和榨菜菜等方便便食品的的消费量量,基本本上是恒恒定的。销销量的变变化,主主要由流流动人口口造成。据国家家发改委委官员的的说法,涪涪陵榨菜菜这几年年在全国国各地区区销售份份额变化化,能够够反映人人口流动动趋势,一一个被称称为“榨菜指指数”的宏观观经济指指标就诞诞生了。国国家发改改委规划划司官员员发现,涪涪陵榨菜菜在华南南地区销销售份额额由20007年年的499%、20008年的的48%%、20009年的的47..58%%、20110年的的38..50%%下滑到到20111年的的29..99%%。这个个数据表表明,华华南地区区人口流流出速度度非常快快。他们们依据“榨菜指指标”,将全全国分为为人口流流入区和和人口流流出区两两部分,针针对两个个区的不不同人口口结构,在在政策制制定上将将会有所所不同。43天气账账单常言道道,“天有不不测之风风云”,遇到到过出门门旅游、重重要户外外路演、举举办婚礼礼等重要要时刻却却被糟糕糕的天气气弄坏心心情甚至至造成经经济损失失的情况况吗?全全球第一一家气象象保险公公司“天气账账单”能为用用户提供供各类气气候担保保。客户户登录“天气账账单”公司网网站,然然后给出出在某个个特定时时间段里里不希望望遇到的的温度或或雨量范范围。“天气账账单”网站会会在1000毫秒秒内查询询出客户户指定地地区的天天气预报报,以及及美国国国家气象象局记载载的该地地区以往往30年的的天气数数据。通通过计算算分析天天气数据据,网站站会以承承保人的的身份给给出保单单的价格格。这项项服务不不仅个人人用户需需要,一一些公司司,比如如旅行社社也很乐乐意参与与。一家全全球性饮饮料企业业将外部部合作伙伙伴的每每日天气气预报信信息集成成,录入入其需求求和存货货规划流流程。通通过分析析特定日日子的温温度、降降水和日日照时间间等3个数据据点,该该公司减减少了在在欧洲一一个关键键市场的的存货量量,同时时使预测测准确度度提高了了大约55%。44历史情情景再现现微软和和以色列列理工学学院的研研究人员员已开发发出一款款软件,能能根据过过去200年《纽纽约时报报》的文文章以及及其他在在线数据据预测传传染病或或者其他他社会问问题可能能会于何何时何地地爆发。在利用用历史数数据进行行测试时时,该系系统的表表现十分分惊人。例例如,根根据20006年年对安哥哥拉干旱旱的报道道,该系系统预测测安哥拉拉很可能能发生霍霍乱。这这是由于于,通过过此前发发生的多多起事件件,该系系统了解解到在干干旱出现现的几年年后霍乱乱爆发的的可能性性将上升升。此外外,该系系统根据据对20007年年初非洲洲大型飓飓风的报报道,再再次对安安哥拉发发生霍乱乱做出预预警。而而在不到到一周之之后,报报道显示示安哥拉拉确实发发生了霍霍乱。在在其他测测试,例例如对疾疾病、暴暴力事件件及伤亡亡人数的的预测中中,该系系统的准准确率达达到700%至90%%。该系统统的信息息来自过过去222年中《纽纽约时报报》的报报道存档档,具体体时间为为19886年至至20007年。不不过,该该系统也也利用了了网络上上的其他他一些数数据,了了解什么么样的事事件会带带来特定定的社会会问题。这这些信息息来源提提供了不不存在于于新闻文文章但却却有价值值的内容容,有助助于确定定不同事事件之间间的因果果关系或或前后关关系。例例如,该该系统能能够推断断卢旺达达和安哥哥拉城市市之间所所发生事事件的关关系,因因为这两两个国家家都位于于非洲,有有着类似似的GDDP,其其他一些些因素也也很相似似。根据据这种方方法,该该系统认认为,在在预测霍霍乱爆发发方面,应应当考虑虑国家或或城市的的位置,国国土面积积有多少少是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 维保报价合同范本
- 学生保险合同范本
- 公司合作办厂合同范本
- 邻村库房转租合同范本
- 宣传版制作合同范本
- 2025劳务合同模板(28篇)
- 重度肝病护理方案
- 2025年春一年级语文上册 17 小猴子下山(+公开课一等奖创新教案+素材)
- 防护安全培训
- 音乐专业工作总结
- 专升本计算机教学课件-第一章-计算机基础知识(2023新版大纲)
- GB/T 23587-2024淀粉制品质量通则
- DL∕T 1120-2018 水轮机调节系统测试与实时仿真装置技术规程
- 公积金归集委托协议
- JTG D30-2015 公路路基设计规范
- 一年级下册口算题卡大全(50套直接打印版)
- 慢性肾脏病英文
- 涉密文件失泄密应急预案
- 智联招聘测评题库2024答案
- 农业社会化服务体系课件
- WS 10013-2023 公共场所集中空调通风系统卫生规范
评论
0/150
提交评论