大数据时代的列式数据库介绍_第1页
大数据时代的列式数据库介绍_第2页
大数据时代的列式数据库介绍_第3页
大数据时代的列式数据库介绍_第4页
大数据时代的列式数据库介绍_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大数据时代的列式数据库介绍技术创新,变革未来Agenda大数据有多“大”大数据怎么“数”大数据何以“据”2 4什么是Big Data: 亚马逊新体验1,当日推荐2,其他搜索人后来买了那些东西3 5 5什么是Big Data: 亚马逊购物新体验3,希望购买列表4, 购买单5,其他类似购物者还买了什么6,对已购买产 品作评价社交媒体 大数据的下一波挑战Twitter 和 TweetsTwitter 有 2,000,000,000注册用户每天新注册用户 450,000用户每周更新 10 亿条 Tweets = 将近 1.8 亿条每天 = 138888 条 每分 = 1650 条每秒有将近 52% 的

2、用户每天更新消息5% 的用户制造了 75% 的内容24% 的用户每天会查看好几次Twitter下午 5 点时发推最容易被转发Twitter 上每天有 16 亿将搜索, 每秒 18000 次5 使用方式40% 的 Tweets 来自移动设备50% 的用户使用超过 1 个 平台接入 Twitter,比如通 过手机,iPad,家里电脑等81% 用户关注不到 100 人,150 万用户关注超过 500 人Twitter 上注册的第三方应 用有超过 100 万个,每 1.5 秒产生一个新应用61% 的 Tweets 是英语6 社交媒体 大数据的下一波挑战用户分布70% 的 Twitter 用户是非 美国

3、用户46% 的用户是男性,54% 的用户是女性53% Twitter 用户没有小孩,有小孩的用户比例是 47%英国网民 11% 使用 Twitter30% Twitter 用户的家庭收 入超过 10 万美元7 社交媒体 大数据的下一波挑战Twitter 和品牌43% 的 Twitter 用户关注一个 品牌(为了获取打折等信息)75% 的 Twitter 用户有可能从 自己关注的品牌那里购买商品67% 的用户愿意将自己关注的 品牌帐户推荐给其他人一条推广的 Tweet 一天大概要 花费 120000 美元财富 100 强公司里有 88 家每 天在 Twitter 上更新新闻Twitter 估值达

4、到了 80 亿美元8 社交媒体 大数据的下一波挑战数据库市场的细分格局OLTP 交易 业务OLAP 分析系统传统行式数据库内存数据库更多事务处理列式数据库9 大数据、 复杂分析 美国税务局(IRS): 全美国所有报税人7年报税记录(及原始文档) (15亿条记录):2006年审计数量为2000年的3倍2006年审计中收缴税款创下记录,达到 592 亿美元 ,上升75!190TB数据仓库(压缩后数据量)六到八周加载一年的数据 15 到 20TB - 四个小时 ! 花旗银行: Sybase IQ保存6年所有交易记录,HR数据及文档 美国证监会(SEC): 分析数据仓库以及非结构化数据(灾难备份点) 美国航空公司(American Airlines): 使用Sybase IQ节约了5百万 美金 ComScore: 全球第一大互

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论