大数据的简介及案例_第1页
大数据的简介及案例_第2页
大数据的简介及案例_第3页
大数据的简介及案例_第4页
大数据的简介及案例_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据的及案例1目录大数据的概念大数据与传统数据的区别?大数据的典型特征(4V)广义的大数据大数据应用案例2大数据的概念大数据(BigData)是指无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合简单一点的说,就是用现有一般技术难以管理的数据。3大数据与传统数据的区别?小明去了一百次书店

传统数据:要回答的问题是他第一百零一次买不买书,即业绩和经营指标的问题;大数据:要回答的是他第一百零一次买什么书,需要将什么样的内容推荐给他。群体和个体的区别传统定义上,更多关注的是一类人群,用同一类规则制订套餐给他们;互联网时代,要把每个人都精准刻画出来,进行精准匹配。4大数据的典型特征(4V)Volume(容量)现在基本上是指从几十TB到几PB这样的数量级,未来,可能只有几EB数量级的数据量才能称得上是大数据了。Variety(多样性)结构化和非结构化数据Velocity(速度)数据产生和更新的频率Value

(价值)

数据的价值密度低5广义的大数据所谓大数据,是一个综合性概念,它包括:(1)因具备3V特征而难以进行管理的数据(2)对这些数据进行存储、处理、分析的技术(3)以及能够通过分析这些数据获得实用意义和观点的人才和组织6大数据的应用案例7穿孔卡片与美国人口普查美国在1880年进行的人口普查,耗时8年才完成数据汇总。因此,他们获得的很多数据都是过时的。1890年进行的人口普查,预计要花费13年的时间来汇总数据。后来,美国人口普查局通过用赫尔曼-霍尔瑞斯发明的穿孔卡片制表机来进行1890年的人口普查,耗时一年。8麻省理工与通货紧缩预测软件美国劳工统计局的人员每个月都要公布消费物价指数(CPI),这是用来测试通货膨胀率的。政府通过人工采集价格信息数据每年大概需要花费两亿五千万美元。这些数据是精确的也是有序的,但是数据往往会有几周的滞后。麻省理工学院(MIT)的两位经济学家,通过一个软件在互联网上每天可以收集到50万种商品的价格,他们能比官方数据提前发现通货紧缩趋势。9沃尔玛,请把蛋挞与飓风用品摆在一起通过对历史交易记录这个庞大数据库进行观察,沃尔玛注意到,每当季节性飓风来临之前,不仅手电筒销量增加,而且美式早餐含糖零食蛋挞销量也增加了。因此每当季节性飓风来临时,沃尔玛就会把蛋挞与飓风用品摆放在一起,从而增加销量。10沃尔玛:东东海岸——中海岸——西海岸在美国,东东海岸、中中海岸、西西海岸之间间有两小时时时差。东海岸的沃尔玛营营业两小时时后之后,,中海岸才才开始营业业,沃尔玛玛就会把东东海岸当天天这两小时时的营业情情况、相关关数据传给给中海岸。中海岸就会根根据这个数数据知道了了这天人们们的购物喜好好,决定货品品怎么摆放放,哪些货货物摆放在在一起会比比较好。这种方式给给沃尔玛带带来了很大大的利润。。11美国折扣零零售商塔吉吉特与怀孕孕预测塔吉特公司司能在不被清楚告告知的情况况下预测出出一个女性性的怀孕情况该公司找出出了大概20多种与怀孕孕的关联物,给顾客客进行“怀怀孕趋势””评分这些数据甚至使使得零售商商能够比较较准确地预预测预产期期,这样就就能够在孕孕期的每个个阶段给客客户寄送相相应的优惠惠券12Hitwise,通过流量量判断消费费者喜好数据创新再利用用的一个典典型例子是是搜索关键键词。消费者和搜索引擎擎之间的瞬瞬时交互形形成了一个个网站和广广告的列表表,实现了了那一刻的的特定功能能。这些信息息除了实现现基本用途之外,它还还可以变得非常有有价值。如数据代理益益百利旗下下的网页流流量测量公公司Hitwise,让客户采采集搜索流流量来揭示示消费者的的喜好。13物联网物联网(InternetofThings,缩写IOT)是一个基基于互联网网、传统电电信网等信信息承载体体,让所有有能够被独独立寻址的的普通物理理对象实现现互联互通通的网络。。在物联网上,,每个人都都可以应用用电子标签签将真实的的物体上网网联结,在在物联网上上都可以查查找出它们们的具体位位置。通过物联网可以以用中心计计算机对机机器、设备备、人员进进行集中管管理、控制制,也可以以对家庭设设备、汽车车进行遥控控,以及搜搜寻位置、、防止物品品被盗等各各种应用。。14RFID技术RFID是RadioFrequencyIdentification的缩写,即射射频识别,俗俗称电子标签签。RFID是一种简单的的无线系统,,由一个询问问器(或阅读器)和很多应答器器(或标签)组成。该系统用于控制制、检测和跟跟踪物体。RFID技术在超市和和图书馆中的的应用15车联网未来车联网技技术将重新定定义汽车DNA。借助无线通讯,城城市内车与车车之间,车与与建筑之间,,车与人之间间都将建立更更加智能紧密密的互联。通过装载在车车辆上的电子子标签利用无线线射频等识别技技术,实现在在信息网络平平台上对所有有车辆的属性性信息和静、、动态信息进进行提取和有有效利用,并并根据不同的的功能需求对对所有车辆的的运行状态进进行有效的监监管和提供综综合服务。16无人驾驶无人驾驶被人人认为是车联联网的终极目标无人驾驶车依赖的的技术很多,,比如导航、、雷达、庞大大数据计算等等,要实现这这些技术需要要和物联网紧紧密结合起来来。无人驾驶是通过车载传感系统统感知道路环环境,自动规规划行车路线线并控制车辆辆到达预定目目标的智能汽车。17自动泊车系统自动泊车系统统,顾名思义义驾驶者双手可可以离开方向向盘,在车辆辆停好之前要要做的只是等等待。自动泊车系统主要要由两部分组组成:控制单单元和位于前前后保险杠以以及两侧的超超声波雷达探探头。按动自动泊车辅辅助系统激活活按钮之后,,雷达探头可可在车辆行驶驶时对车辆两两侧进行扫描。控制单元对雷雷达反馈的信信息进行分析析,从而估算算出车位是否否足以容纳车车辆停放。自动泊车系统统随后将通过过助力转向系系统对车辆行行驶方向进行行干预,并以以控制单元规规划好的路径径将车辆停入入车位。18日本先进工业业技术研究院院的坐姿研究究与汽车防盗盗系统该研究所教授把把每个驾车者者的坐姿量化化为精确的数数据,使其对对司机识别的的正确率高达达98%。这项技术作为汽车车防盗系统,,一旦识别驾驾车者不是车车主,就会自自动熄火。这一技术还可汇集集事故发生前前驾车者的姿姿势变化数据据,分析坐姿姿与行驶安全全的关系,在在司机疲劳驾驾驶时发出警警示或自动刹刹车。19UPS快递——大数据技术下下的最佳行车车路径UPS快递多效地利利用了地理定定位数据。为为了使总部能能在车辆出现现晚点的时候候跟踪到车辆辆的位置和预预防引擎故障障,它的货车车上装有传感感器、无线适适配器和GPS。同时,这些些设备也方便便了公司监督督管理员工并并优化行车线线路。UPS为货车定制的的最佳行车路路径是根据过过去的行车经经验总结而来来的。2011年,UPS的驾驶员少跑跑了近4828万公里的路程程,节省了300万加仑的燃料料并且减少了了3万公吨的二氧氧化碳排放量。20UPS与汽车修理预预测UPS国际快递公司司从2000年就开始使用用预测性分析析来监测自己己全美60000辆车规模的车车队,这样就就能及时地进进行防御性的的修理。通过监测车辆辆的各个部位位,UPS只需要更换需要更更换的零件,,从而节省了了好几百万美美元。21谷歌与甲型H1N1流感2009年出现的甲型型H1N1流感,当时还没有有研发出对抗抗这种新型流流感病毒的疫疫苗,公共卫卫生专家能做做的只是减慢慢它传播的速速度。但要做做到这一点,,他们必须先先知道这种流流感出现在哪哪里。疾控中心得到到流感方面的的信息往往会有一两周的滞后,这种滞后导致致公共卫生机机构在疫情爆爆发的关键时时期反而无所适从。谷歌通过观察察人们在网上上的搜索记录录来预测流感的传播,得到的的信息是非常常准确和及时时的。22“量化自我””通过一种非干预的的手段,把一一些所谓的医医疗传感器放放到我们的身身边,比如我我们戴一个腕腕表、一枚戒戒指、一个耳耳塞、一副眼眼镜等,通过过这些设备我我们可以了解解自己的心跳跳、血压情况况,甚至包括括我们体表的的健康状况,,从而对一些些大病(如癫癫痫等)进行行早期预测。美国Fitbit公司近期就推推出了一款免免费的苹果手手机应用,用用户可用于记记录食物和液液体摄入量,,从而跟踪其其活动水平和和营养摄入情情况,通过分分析这些数据据可以很好的的控制体重。。23小儿床垫通过床垫上的压力与湿湿度传感器分分析,来判断小孩孩子有没有比较严严重的打鼾或或者睡姿不正正确等问题。。24在线教育如著名的在线教教育公司Coursera,已经和普林林斯顿、伯克克利、宾夕法法尼亚大学等等30多所大学合作作,在互联网网上免费开放放大学课程分布在世界各各地的学习者者不仅可以在在同一时间实实时听取同一一位老师的授授课,还和在在校生一样,,做同样的作作业、接受同同样的评分和和考试。在线教育是一一个“行为评价和诱诱导”的智能能平台25在线教育服务务Knewton在线教育服务务Knewton是大数据应用用于教育行业业的典型,通通过数据分析析区分出每个个学生的优缺缺点,从而给给学生有效的的指导。美国最大的公立大大学亚利桑那那州公立大学学曾运用这一一系统来提高高学生的数学学水平,全校校2000名学生使用该该系统两学期期之后,该大大学的辍学率率下降了56%,毕业率从64%升高到75%。26购买飞机票同一架飞机上上的座位,票票价却千差万万别,个中原原因,只有航航空公司知道道。奥伦-埃齐奥尼开发发了一个系统,用来推推测当前网页页上的机票价价格是否合理理,预测当前前的机票价格格在未来一段段时间内会上上涨还是下降,从而帮帮助乘客明智智购票。这个预测系统建立立在41天内价格波动动产生的12000个价格样本基基础之上。27航班延误之候候机经济学美国建立了一一个统一的数数据开放门户户网站——Data.Gov。Data.Gov上线以后,美美国交通部开开放了全美航航班起飞、到到达、延误的的数据。航班延误时间间的分析系统统(Flyontime.us):帮助消费者找到表表现最佳,最最符合自己需需要的航班。。该系统向全社社会免费开放放,任何人都都可以通过它它查询分析全全国各次航班班的延误率及及机场等候时时间。28The-N与电影票房预预测The-N在好莱坞电影影上映之前,,就能利用海海量数据和特特定算法预测测出一部电影影的票房。该公司拥有一个包括括了过去几十十年美国所有有商业电影大大约3000万条记录的数数据库;数据据库里有所有有关于预算、、电影流派、、拍摄、阵容容、获得奖项项和收入等数数据。29VISA&MasterCard与商户推荐像VISA和MasterCard这样的信用卡卡发行商,它们能够从自己的的服务网获取取更多的交易易信息和顾客客的消费信息它们的商业模模式从单纯的的处理支付行行为转变成了了收集数据一个称为MasterCardAdvisors的部门收集和和分析了来自自210个国家的15亿信用卡用户户的650亿条交易记录录,用来预测测商业发展和和客户的消费费趋势。然后后,它把这些些分析结果卖卖给其他公司司30FICO,“我们知道道你明天会做做什么”2011年,FICO提出了“遵从从医嘱评分””——它分析一系列列的变量来确确定这个人是是否会按时吃吃药,包括一一些看起来有有点怪异的变变量。比方说,一个人在某某地居住了多多久,这个人人结婚了没有有,他多久换换一个工作以以及他是否有有私家车。这个评分会帮助医医疗机构节省省开支,因为为它们会知道道哪些人需要要得到它们的的用药提醒。。有私家车和和使用抗生素素并没有因果果关系,这只只是一种相关关关系。31中英人寿保险险有限公司((Aviva)中英人寿保险险有限公司((Aviva)是一家大型型保险公司,,他们想利用用信用报告和和顾客市场分分析数据来作作为部分申请请人的血液和和尿液分析的的关联物。这些分析结果被用用来找出更有有可能患高血血压、糖尿病病和抑郁症的的人。其中用用来分析的数数据包括好几几百种生活方方式的数据,,比如爱好、、常浏览的网网站、常看的的节目、收入入估计等。通过利用相关关关系,保险险公司可以在在每人身上节节省125美元,然而这这个纯数据分分析法只需要要花费5美元。32Xoom与跨境汇款异异常交易报警警Xoom是一个专门从从事跨境汇款款业务的公司司,它会分析析一笔交易的的所有相关数数据,一旦发发现用“发现现卡”从新泽泽西州汇款的的交易比平常常多的话,系系统就会报警警。33无所不包的谷谷歌翻译系统统2006年,谷歌公司开始涉足机器翻译译。这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论