腾讯数据库的AI技术架构_第1页
腾讯数据库的AI技术架构_第2页
腾讯数据库的AI技术架构_第3页
腾讯数据库的AI技术架构_第4页
腾讯数据库的AI技术架构_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、腾讯数据库的AI技术架构技术创新 变革未来AgendaBackgroundSearch-Based AlgorithmMachine LearningDeep LearningReinforcement LearningCDBTuneEvaluationBackground 如何解决数据库参数调优问题?配置项多(上百个)没有统一标准(名字/作用不同,相互之间的影响等)依靠经验调优,人力成本高现存工具存在普适性问题ExpensiveInefficientComplicatedSearch-Based Algorithm 启发式搜索方法基于超抽样缩小范围,递归搜索最优配置divide-and-di

2、verge sampling (DDS)the recursive bound-and-search (RBS)可能问题:耗时较长,可能局部最优Zhu, Y., Liu, J., Guo, M., Bao, Y., Ma, W., & Liu, Z., et al. (2017). BestConfig: tapping the performance potential of systems via automatic configuration tuning. Symposium (pp.338-350).Machine Learning - 传统机器学习方法识别Workload特征降维/

3、聚类: Factor Analysis, K-Means识别Knob与性能相关性线性/非线性回归:Lasso, Polynomial自动调优Workload匹配,找到最相似负载配置推荐: Gaussian Process可能问题:对训练数据要求较高,过程复杂Aken, D. V., Pavlo, A., Gordon, G. J., & Zhang, B. (2017). Automatic Database Management System Tuning Through Large-scale Machine Learning.ACM International Conference on

4、 Management of Data(pp.1009-1024). ACM.Deep Learning - 深度学习方法目标:降低延时/提高吞吐)采集内部性能指标推荐用户修改有限数目配置目标性能和用户反馈数据采集获得Workload内部metric学习调参过程中内部metric的变化规律学习最终需要调节的参数可能的问题:高度依赖训练数据的质量需要获得各种负载和配置的性能数据匹配不到类似场景的话,调优结果可能不理想模型迭代Reinforcement Learning - 强化学习方法AlphaGo/Boston Dynamics类似于人类与环境的交互/学习方式强调state/action/re

5、ward能不能用强化方法进行参数调优?CDBTune 腾讯云数据库智能调参工具CDBTune使用强化学习方法进行参数调优去繁为简摆脱以数据为中心,强调调参的“动作”将调参过程抽象成游戏规则间隔一定时间调参,获得性能数据奖励性能提高获得正奖励值,下降获得负奖励值目标调参时间(次数)尽可能短最终获得较高的期望奖励值CDBTune 基于强化学习方法State ActionRewardMetrics性能指标(内部)选择某一配置Knob(Action)进行执行执行Action后根据Metrics性能(外部) 计算得到应该获得的即时奖励CDBTune Q-Learning to DQNQ-learning

6、状态空间有限动作空间有限数据库的状态空间(性能指标)和动作空间(配置组合)特别大相应的 Q-learning 中 Q(s,a) 这个矩阵会非常大所以需要借助DQN方法进行参数调优DQNQ(s,a,w) Q(s,a)其中w是神经网络的权值CDBTune 架构与实现实现算法类似DeepMind发布的Nature DQN,采用两个Q-Network如上图所示S为当前数据库性能状态(内部指标),S为下一状态数据库性能状态r为即时奖励,w为神经网络参数,a为采取的动作(配置参数的执行)Q为状态行为价值函数每次获取一个Q值最大的动作a执行获取新的迭代数据并加入记忆池CDBTune 数据形式和相关策略Kno

7、b1 增加不变减少状态S:内部metric向量每个配置参数的调整,是一个三维向量,如上图所示奖励R是一个标量,根据外部指标(吞吐/延时)计算性能降低,R 0调参次数增加到一定程度,R相应减小CDBTune 数据形式和相关策略Replay每次得到后,改变Knobs配置,实时采集一次MetricsExploration & Exploitation设定一个参数例如等于0.1随机生成一个数小于0.1,就随机选择一个Action否则,选择当前Q值最大的Action进行执行。网络输出:3*N,N为参数个数;参数调整方式如上所示Game Over累积奖励减少到一定值。Current ValueMinMax

8、2Current Min2Max Current减小增加EvaluationConfigurationTPSLatency(ms)MySQL Default9024000DBA7802300CDBTune8151900测试工具sysbench,测试脚本oltp_read_write.lua16 个表 * 20000000 行,共64GB数据测试环境MySQL 4 core/8GB,网络延时 30ms收敛较慢,仍需进一步改进和测试Evaluation基于DQN智能调参的优势化繁为简,无需对负载进行精确分类调参动作更符合实际调参时的情况无需获取足够多的样本来,减少前期数据采集的工作量利用探索-开发(Exploration & Exploitation)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论