




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
BIGDATA--PreparedByxindong不知道BIGDATA?你out了!前瞻来看,随着互联网对网民的理解,网民对网络的反作用,互联网将变得越来越智能。它在满足你需求的同时,也在创造新的需求。前者的代表是Google,后者的典型则是Facebook。谷歌的盈利在于所有的软件应用都是在线的。用户在免费使用这些产品的同时,把个人的行为、喜好等信息也免费的送给了Google。因此Google的产品线越丰富,他对用户的理解就越深入,他的广告就越精准。广告的价值就越高。这是正向的循环,谷歌好用的、免费得软件产品,换取对用户的理解;通过精准的广告,找到生财之道。颠覆了微软卖软件拷贝赚钱的模式。成为互联网的巨擘。互联网越来越智能Google精确掌握用户行为、获取需求微博为新浪带来巨大价值马云的判断来自于数据分析“2008年初,阿里巴巴平台上整个买家询盘数急剧下滑,欧美对中国采购在下滑。海关是卖了货,出去以后再获得数据;而我们提前半年时间从询盘上推断出世界贸易发生变化了。”马云对未来的预测,是建立在对用户行文分析的基础上。通常而言,买家在采购商品前,会比较多家供应商的产品,反映到阿里巴巴网站统计数据中,就是查询点击的数量和购买点击的数量会保持一个相对的数值,综合各个维度的数据可建立用户行为模型。因为数据样本巨大,保证用户行为模型的准确性。因此在这个案例中,询盘数据的下降,自然导致买盘的下降。腾讯在天津投资建立亚洲最大的数据中心;百度也在投资建立大数据处理中心;新浪推出企业微博产品,提供精准的数据分析服务。Gartner2011年技術成熟度曲線,大數據處於高速發展期技術演進歷史揭示未來是大数据驅動的智慧型經濟模式什麼才是大數據?指数型增长的海量数据海量數據就是大數據嗎?
大數據就是雲計算嗎?
大数据的4V特性体量Volume多样性Variety价值密度Value速度Velocity非结构化数据的超大规模和增长总数据量的80~90%比结构化数据增长快10倍到50倍是传统数据仓库的10倍到50倍大数据的异构和多样性很多不同形式(文本、图像、视频、机器数据)无模式或者模式不明显不连贯的语法或句义大量的不相关信息对未来趋势与模式的可预测分析深度复杂分析(机器学习、人工智能Vs传统商务智能(咨询、报告等)实时分析而非批量式分析数据输入、处理与丢弃立竿见影而非事后见效Value價值挖掘大数据的的价值类似沙沙里淘金,从海量数据中中挖掘稀疏但但珍贵的信息息.价值密度低,是大数据的一一个典型特征征.Variety多樣性企业内部的经经营交易信息息;物联网世界中中商品,物流信息;互联网世界中中人与人交互互信息,位置信息等是是大数据的主主要来源.能够在不同的的数据类型中中,进行交叉分析析的技术,是大数据的核核心技术之一一.语义分析技术术,图文转换技术术,模式识别技术术,地理信息技术术等,都会在大数据据分析时获得得应用.Velocity速度1s是临界点.对于大数据应应用而言,必须要在1秒钟内形成答答案,否则处理结果果就是过时和和无效的.实时处理的要要求,是区别大数据据引用和传统统数据仓库技技术,BI技术的关键差差别之一.Volume数据量PB是大数据層次次的临界点.KB->MB->GB->TB->PB->EB->ZB->YB->NB->DB对大数据的進進一步理解大数据比云计计算更为落地地商业模式驱动动应用需求驱动动云计算本身也是大数据的一种业务模式大数据不仅仅仅是“大”多大?PB级比大更重要的是数据的复杂性性,有时甚至大大数据中的小小数据如一条条微博就具有有颠覆性的价价值软件是大数据据的引擎和数据中心((DataCenter)一样,软件是是大数据的驱驱动力.软件改变世界界!大数据生态:软件是引擎大数据的应用用不仅仅是精精准营销通过用户行为为分析实现精精准营销是大大数据的典型型应用,但是是大数据在各各行各业特别别是公共服务务领域具有广广阔的应用前前景消费行业金融服务食品安全医疗卫生军事交通环保电子商务气象管理大数据““易”,理解大数据““难”目前大数据管管理多从架构构和并行等方方面考虑,解解决高并发数数据存取的性性能要求及数数据存储的横横向扩展,但但对非结构化化数据的内容容理解仍缺乏乏实质性的突突破和进展,,这是实现大大数据资源化化、知识化、、普适化的核核心.非结构化海量量信息的智能能化处理:自自然语言理解解、多媒体内内容理解、机机器学习等.大数据为什么么重要?更高一层数据据层面整合企企业内外部更高数据层面面整合利用用户”行为指纹”创造新商机用户在线的每每一次点击,,每一次评论论,每一个视视频点播,就就是大数据的的典型来源。。互联网企业业之所以取得得令人瞩目的的成绩,其核核心的本质就就是包括用户户网络操作的的大数据,进进行记录和分分析,形成用用户“行为指指纹”,从而而洞悉用户的的潜在的、真真实的需求,,形成预判。。这是传统企业业花费重金都都难以企及的的梦想。所有有传统的产品品公司都只能能沦为这种新新型用户平台台级公司的附附庸。大数据组成和和展現方式??基于SQL语言:面对OLAP的传统行和列列不基于SQL或map-reduce的:由谷歌率先发发起数据流:基于运行商数数据直接生成成任意图形新平台技术数据入口/汇聚数据平台分析不同范围的服务传统交付模式式-单片或基于设设备的解决方方案云:能够充分利用用物理设施的的弹性,以实实现处理快速速增长数据的的能力“数据库将演变成一个虚拟的,基于云计算,超级可扩展的分布式平台。”-ForresteranalystJimKobielus新的传输方案新模式
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基础护理无菌操作
- 预防煤气中毒主题班会2
- 八年级上册《三角形的稳定性》课件与练习
- 打破瓶颈的2024年特许金融分析师试题及答案
- 【名师课件】1.4 课件:验证动量守恒定律-2025版高一物理必修二
- 第八章 作业30 动能和动能定理-2025版高一物理必修二
- 预防夏季中暑大班
- CFA备考阶段试题及答案指导
- 2024年CFA考试必会知识试题及答案
- 学习金融学的有效途径试题及答案
- 电力设计收费标准2018
- HY/T 240.3-2018海水循环冷却系统设计规范第3部分:海水预处理
- GB/T 4056-2019绝缘子串元件的球窝联接尺寸
- GB/T 3625-2007换热器及冷凝器用钛及钛合金管
- GB/T 19355.1-2016锌覆盖层钢铁结构防腐蚀的指南和建议第1部分:设计与防腐蚀的基本原则
- GB/T 17214.4-2005工业过程测量和控制装置的工作条件第4部分:腐蚀和侵蚀影响
- GB/T 17144-2021石油产品残炭的测定微量法
- 显微镜检验报告
- 信息安全概论-张雪锋-习习题答案
- 微创外科技术课件
- 学习2022年建团一百周年主题班会PPT
评论
0/150
提交评论