




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、技术创新,变革未来LSQL大规模集群技术架构LSQL介绍LSQL大规模集群优化 LSQL集群运维实例一LSQL集群运维实例二目录01LSQL介绍应用层 Application LayerSQL计算层SQL computing LayerLSQL存储引擎层Storage Engine Layer全文检索引擎 Full-Text EngineKV 引擎Key-Value EngineOLAP 引擎 OLAP Engine预计算 引擎Pre-Computing Engine行业定制引擎 Industry EngineHadoop 基础服务HDFSYARN基础设施层 Infrastructure La
2、yer私有云 Private / 公有云 Public / 混合云 Hybrid / 物理集群 ClusterJDBC / REST外部数据源 External Data SourceOracle /MySQLKafkaHiveJSON / TXT / CSVParquet / ORCCustomerETL ToolsLSQL介绍LSQL集群架构DN NM LSQLDN NM LSQLDN NM LSQLNNLSQLDriverRMDN NM LSQLZKZKZKKafkaKafkaKafkaJNJNJN02LSQL优化LSQL优化映射表/视图表不同表不同分片DN请求缓存过载保护LSQL优化1
3、映射表列1列2列3列4列5128甲215乙340丙丁Tom男戊Lucy女己Mary女分组姓名性别丁Tom男戊Lucy女己Mary女ID年龄分组128甲215乙340丙物理表Physical Table映射表1Mapping Table映射表2Mapping TableLSQL优化映射表/视图表不同表不同分片DN请求缓存过载保护LSQL优化2不同表不同分片大表小表1200分片LSQL优化映射表/视图表不同表不同分片DN请求缓存过载保护LSQL优化3DN请求缓存NameNodeDN无Cache层LSQLDNCache层LSQL未使用DN缓存使用DN缓存LSQL优化映射表/视图表不同表不同分片DN请
4、求缓存过载保护倒排表扫描长度限制。Shuffle 达到过载保护的阈值,则中断此操作。单次查询文件读写量的过载控制。SQL任务执行时间的控制,超时kill。LSQL优化4过载保护03LSQL运维实例一LSQL案例背景3000张表数据规模超万亿条(PB级)日增300500亿条(几十TB)数据存储三个月以上全文检索、多维查询、地理位置检索数据碰撞、多表关联、统计、数据导出等每日请求近百万次90%查询响应时间 3天) 全量心跳ervalMsec : (0 = 300)增量数据心跳erv
5、al :erval :(3秒 = 60秒)心跳间隔(3秒 = 60秒)减少心跳频率node.invalidate.work.pct.per.iteration :(0.32 = 0.15)减少扫 描节点数量卡顿依旧!IBR同步机制的问题删除块接收块DataNodeIBR上报NameNode同步处理IBR:增量块汇报(Incremental Block Report),发生时机:刚刚被删除的块正在被接收(写)的块接收完毕(已被写完)的块问题1:DN实时上报IBR问题2:NN同步处理IBRIBR延时异步处理删除块接收块DataNodeBP线程Nam
6、eNode异步处理线程1,DN延时发送IBR2,NN异步处理IBRPending IBR暂存 队列04LSQL运维实例二千台联邦模式LSQL服务异常中止日志分析:NN处于Standby模式?原因分析及对策原因调查:1,NN负载过高,出现主备切换 2,主备切换后,Failover失效参数不起作用:dfs.federation.router.client.retry.max.attemptsSubCluster0主备切换异常原因State StoreRRNNNNDNDNDNActiveStandby修改Router源码NN高负载原因之一ChooseRandom()随机选节点引发的问题随机算法修改遍
7、历所有节点判断是否属于排除节点加入候选列表判断节点存储类型从候选列表随机选择从所有节点随机选择判断是否属于排除节点判断节点存储类型返回所选节点去掉全局锁循环数次NN高负载原因之二异构存储引发的问题Excluded列表包含几百台DN,全部为SSD节点!NN高负载原因之二节点排除策略引发的问题maxLoad = 系数 * 集群平均Xceiver负载数节点的负载数 maxLoad,将其加入exclude列表修改节点排除策略# 禁用# 增加倍数默认值:node.redundancy.considerLoad = node.redundancy.considerLoad.factor = 2.0修改方法:node.redundancy.considerLoad = node.redundancy.considerLoad.factor = 5.0NN高负载原因之三机架策略引发的问题遍历大量SATA节点!SATA节点NN高负载原因之三每机架最大副本数 = (总副本数 1)/ 机架数 + 2Rack01Rack02Rack03Rack04Rack05Rac
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 抚顺职业技术学院《英语交际2》2023-2024学年第一学期期末试卷
- 上海工程技术大学《环境模型设计与制作》2023-2024学年第二学期期末试卷
- 云南农业职业技术学院《医学影像读片训练》2023-2024学年第二学期期末试卷
- 哈尔滨科学技术职业学院《路基路面工程》2023-2024学年第二学期期末试卷
- 大连艺术学院《综合大学英语》2023-2024学年第一学期期末试卷
- 台州职业技术学院《中西医结合急诊医学》2023-2024学年第二学期期末试卷
- 福建幼儿师范高等专科学校《中国现代文学流派与思潮》2023-2024学年第二学期期末试卷
- 中山红砖隔墙施工方案
- 高架柱子灌浆施工方案
- 玻镁风管施工方案
- 【课件】勃兰登堡协奏曲Ⅱ+课件高一上学期音乐人音版(2019)必修音乐鉴赏
- G -B- 5009.11-2024 食品安全国家标准 食品中总砷及无机砷的测定(正式版)
- 小学四年级小数单位换算练习题100道
- ISO9001:2015供应商审核检查表英文版
- 2024年湖南生物机电职业技术学院单招职业技能测试题库及答案解析
- 苗木供货服务计划方案
- GB/T 28210-2024热敏纸
- 《谏逐客书》课后练习 统编版高中语文必修下册
- (高清版)TDT 1075-2023 光伏发电站工程项目用地控制指标
- 煤矿机电设备培训课件
- 小儿围术期液体和输血管理指南
评论
0/150
提交评论