




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Infinidb在大数据的实战应用目录•
背景•
InfiniDB的特点•
Infinidb的实战问题一个真实的血案:•
需求:我们在数据库mysql要做基于pv的分析。日均裸数据增量>10g•
初始方案:
使用innodb问题:数据量增加太快,磁盘空间增加太快(40g)数据加载太慢了最最重要统计类查询太慢了,需要建太多的索引/汇总表•
改进方案:换成tokudb解决问题:数据压缩4倍,空间增加勉强可以接受(10g)数据加载快些了4倍左右,勉强可以接受未解决:最最重要查询太慢了,一个查询5分钟甚至更长,优化太痛苦,需要建太多的索引/汇总表问题一个真实的血案:•
需求:我们在数据库mysql要做基于pv的分析。日均裸数据增量>10g•
初始方案:
使用innodb问题:数据量增加太快,磁盘空间增加太快(40g)数据加载太慢了最最重要统计类查询太慢了,需要建太多的索引/汇总表•
改进方案:换成tokudb解决问题:数据压缩4倍,空间增加勉强可以接受(10g)数据加载快些了4倍左右,勉强可以接受未解决:最最重要查询太慢了,一个查询5分钟甚至更长,优化太痛苦,需要建太多的索引/汇总表解决:--换成infinidb•
最终方案:
使用infinidb(和最初方案innodb比较)–
空间增量2g
(
原来增量40g)–
加载数据
20万/每秒
(原来
<1万/每秒)–
查询一般小于1分钟(原来5分钟,甚至20分钟)–
免优化(再也不要建index了哦)•
业务线的反馈目录•
背景•
InfiniDB的特点•
Infinidb的实战Infinidb的定位Hbase
等infinidbinfinidbinfinidb产品介绍产品特点:•
Mysql协议兼容•
全功能,支持dml•
统计类查询10倍•
Load数据快(每秒>10万)•
压缩率5倍(和裸数据比)•
免优化Infinidb的单机构架InfiniDB
分布式框架集群文件系统(hdfs/gfs)
2013.10.15
支持hdfs
–不太建议生产环境用真实业务性能测试—查询性能分析类存储引擎InfiniDB
–
查询性能对比测试TPCH测试(以下以1G数据量,150000行用户数据测试)InfiniDB存储
–
为啥查询这样快数据存储方面,“拆拆拆”:•
按列拆•
按行(范围)拆:核心算法:hash
joinInfiniDB存储
–
按列拆InfiniDB存储
–
按行(范围)拆每个范围(术语:Extent
Map)都有最大/最小值,方便过滤Extent
Map
的向上扩展更大的范围(术语:Partition)也有最大值/最小值每个Extent
Map
可以并行计算InfiniDB存储
–
hash
join核心算法:hash
join•
每行都有一个rowid•
查询2列以上:通过行rowid关联,使用hash
join•
不太怕表的关联•
很怕Select
*InfiniDB存储
–
为啥查询这样快(总结)数据存储方面,“拆拆拆”:•
按列拆•
按行(范围)拆:•
通过核心算法:hash
join实现关联装载和更新-真实业务性能测试InfiniDB存储
–
数据装载语法load
data
local
infile
…•
速度超快
(>10万/每秒)•
一个表只能对应一个load语句,不可并行内部过程:•
内部实现转换成cpimport的方式•
内部实现
并行加载(不可以调并行度,代码写死了)•
Cpimport的实现是append
文件的方式
InfiniDB存储
–-锁、事务和mvcc对于DML:页级别的锁
Version
Buffer
(SCN)
:
1.
保存被修改的数据块,用于管理回滚、MVCC支持和snapshot
2.
Initial
4M
内存hash表,默认文件1G,VersionBufferFileSize控制大小
3.
在HDFS上,MVCC是disabled的,回滚只支持在语句级对应load数据:append数据到文件末尾,需要回滚时直接抛弃数据InfiniDB
–
压缩每一列的重复值多,所以压缩率5倍set
infinidb_compression_type
=
n可以在实例级或session启用关闭压缩。0)
关闭压缩1
or
2)
启用压缩,默认为2(quicklz算法)InfiniDB
–
免优化•
无index•
自动分区•
dba唯一可以做的:sql优化只能调整表的连接次序InfiniDB
–
和其他产品的对比Inforbright社区版•功能:不支持DML•
限制功能的开源Hbase•
Hbase本质上是个key
–多value的构架•
复杂•
扩展性好•
和infinidb是互补的结构infinidb产品特点(总结)产品特点:•
Mysql协议兼容•
全功能,支持dml•
统计类查询10倍•
Load数据快(每秒>10万)•
压缩率5倍(和裸数据比)•
免优化目录•
背景•
InfiniDB的特点•
Infinidb的实战InfiniDB
–
社区支持问题现在支持比较差,未来前景比较好•
(现状)文档和问题资料比较少•
2000
年公司,发布产品•
2013.10月,支持hadoop文件系统•
2014.10月公司倒闭•
2014.10月
mariadb接手•
2015.Q1会发布新的版本InfiniDB
–
高可用问题集群版本没有高可用文档,但是也许不太稳定单机版本本身不提供高可用•••备份/恢复方案+手工补缺少数据
使用lvmDrbd的方案Mysql主从方案不适应(
因为有binlog问题)InfiniDB
–
高可用drbdInfiniDB
–
规范(合适的场景)InfiniDB
–规范(不合适的场景)InfiniDB-兼容
性不支持最新版本mysql
官方的java驱动支持marridb的mysql驱动InfiniDB
–应用类问题•Infinidb数据会混乱•使用最简单的语法•Infinidb的数据表损坏•重新建立表,然后把数据导回去•大量的delete/load并行容易死锁•比如一天
84次delete,每次600万•Infinidb数据量排序大报错•max_length_for_sort_data•infindb
server本地
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《劳动法律法规与政策》课件
- 工程项目劳务风险评估协议
- 铁路旅客运输服务普速列车设备设施规范课件
- 《建筑预算实务》课件
- 艏艉总段的装焊船体加工与装配课件
- 铁道机车专业教学张琼洁22课件
- 四空车检查南京铁道课件
- 铁路市场营销铁路运输市场分析教学案例课件
- 《GB 17930-2016车用汽油》(2025版)深度解析
- 中国五音课件下载
- 网格员宣传防诈骗知识讲座
- (完整文本版)新概念英语第一册单词表默写版1-144
- 《医院劳动合同书》电子版
- 机车直流电机的电力拖动-直流电机的基本方程
- 2022-2023学年四川省巴中市巴州区川教版(三起)四年级下学期4月期中英语试卷(解析版)
- 互联网信息审核员考试题库大全-上(单选题汇总)
- 湖南省长沙市实验小学小学语文五年级下册期末试卷(含答案)
- 硫酸生产技术 二氧化硫催化氧化的化学平衡及动力学
- 浙摄影版(2020)信息技术三年级上册第一课认识计算机(课件)
- 第七讲-信息技术与大数据伦理问题-副本
- 校园安全常识测试题卷
评论
0/150
提交评论