版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、使用TerarkDB提升MySQL的性能和压缩率技术创新 变革未来互联网和大数据带来的挑战海量用户带来的海量随机访问写入性能目前通过单节点的持续写入,多节点只读,一般能满足需求(如阿里云的 PolarDB )绝大多数互联网用户对在线服务的访问偏向于随机读比如新闻资讯、搜索引擎、舆情监控、电商类商品检索等对大量随机读的优化,目前没有很好的解决方案(目前只能增加内存或建立额外的索引缓解)非随机读的场景,往往允许离线进行处理,一般不要求事务,暂时还可以忍内存和SSD依然很贵公司每个月的数据增长没有几个T,都不好意思跟人打招呼SSD 的价格依然是机械硬盘的数倍,容量越大,价格差距越大SSD 的寿命非常
2、有限存储引擎数据库数据库领域的探索没有止境TiDBCockroachDBMySQLMongoDBCassandraInnoDBRocksDBLevelDBWiredTigerTerarkDBPostgreSQLMariaDBPolarDBHBase为什么从引擎层优化目前的存储引擎底层算法,针对随机读较多、内存受限的场景,还有很大的 改进空间块压缩对随机访问很不友好压缩率太低引擎层的修改不触及用户现有数据库的使用逻辑,更加透明引擎层更加通用,可以适应各类数据库产品,应用范围更广,也能和现有的 数据库产品充分整合,设计各类解决方案TerarkDB 对MySQL 的改进方式MySQLInnoDBMy
3、ISAMMyRocksTerarkDBMySQL 以 RocksDB 作为存储引擎是发 挥了 RocksDB 的 LSM 随机写速度快的 优势,也是 Facebook 目前使用的主要方 法(MySQL on RocksDB, 简称 MyRocks)TerarkDB 基于 RocksDB 的接口,将自己 的算法适配到了 MyRocks 中,进一步支 持了 MySQL 数据库“块压缩”的问题块数据块数据块数据块数据块数据块数据块数据块数据块数据块数据块数据块数据存在双缓存问题及无效解压问题块的尺寸决定压缩率和无效解压的损失解压前的块数据解压后的块数据Terark 可检索压缩算法全局压缩不需要解压即
4、可提取单条记录不需要常见的数据库使用的 DB Cache层来缓存解压后的块压缩率逼近理论上限(相当于块压缩中 的块就是整个库)单条目标记录Terark 可检索压缩算法Terark 的可检索压缩算法,由以下两部分组成:索引压缩算法:CO-Index(Compressed Ordered Index)树结构高度压缩具有通过 ID 反查 KEY 的功能(区别于传统B+树)数据压缩算法:PA-Zip(Point Accessible Zip)全局压缩提取单条数据时无需多余解压索引压缩算法:CO-IndexSuccinct Data StructureSuccinct数据结构历史悠久,但是并未引起大家的
5、重视,对于相同的树结构,对比基于指针技术,它仅仅需要 1/30 的内存使用位向量来表达树结构,开源实现有 Succinct Data Structure Library,缺点是性能较指针更 低,需要通过工程上大幅度优化来接近指针性能Nested Patricia Trie原生的 Patricia支持路径压缩,通过把一串仅包含一个孩子的节点,压缩成一个包含多个字符 的节点我们对其进行了更进一步的嵌套压缩:把压缩后的路径构建成一个全新的 Patricia Trie,进一步 提升数据的压缩率。数据压缩算法:PA-ZipLZ系列算法的变种基于 LZ 系列算法进行了大幅度的改进,使用“全局字典” + “
6、局部字典”的方式,将压缩率达到最 理想的程度采用滑动窗口的方式进行数据压缩根据实际测试,全局字典的尺寸限制为 12GB 以内,效果比较理想,更大的字典对压缩率的帮 助很有限数据压缩算法的缺点由于需要进行大量的计算,在数据写入过程中对 CPU 的消耗会比较高目前可以采用写入限流的方式减轻 CPU 负载(大多数情况下,并不需要全速写入)在大型系统架构下,可以采用计算和存储分离的逻辑,单独进行数据压缩集成进入MySQL 数据库MySQL ServerAbstract Storage Engine LayerAdapterMyRocks ( RocksDB Adapter )InnoDBRocksDBBlockBased TablePlain TableTerarkZip TableOperating SystemTerarkDB通过Facebook推出的MyRocks适配进入MySQL,整合了 RocksDB 本身的优秀调度层和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024适用复杂情况砖渣批发采购合同3篇
- 2025版企业年会宣传海报定制制作合同范本3篇
- 2025年度科技创新项目担保借款合同范本2篇
- 二零二五年度二手房出售广告推广与代理合同4篇
- 2025版信用卡担保协议书:信用卡担保合同条款解释与法律适用3篇
- 2025年度520万OracleERP项目知识产权保护与授权合同2篇
- 智慧办公环境下的技术创新与升级
- 二零二五年度高速公路隧道监控系统设备维保及照明升级合同3篇
- 二零二五年环境监测软件销售与数据分析合同模板3篇
- 2025版智能电网建设与运营合同模板4篇
- 2024年东南亚人用疫苗市场深度研究及预测报告
- 【采购管理优化探究文献综述3000字】
- 《大学生职业发展与就业指导》课程标准
- 第23课《出师表》课件(共56张)
- GB/T 3953-2024电工圆铜线
- 发电机停电故障应急预案
- 接电的施工方案
- 幼儿阿拉伯数字描红(0-100)打印版
- 社会组织等级评估报告模板
- GB/T 12173-2008矿用一般型电气设备
- 新媒体研究方法教学ppt课件(完整版)
评论
0/150
提交评论