版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、爱奇艺实时数据传输服务DBIO架构设计与实践技术创新 变革未来DBIO是什么?基于otter开发的数据迁移、变更订阅与实时同步服务IO InsideOut / InputOutput源DBlogloglog目标 系统Select(插件)获取数据变更Extract(插件)数据过滤Transform(插件)数据转换Load(插件)结果输出“伪装” 成Slave, 提取数据变更日志(CanalEntry)Insert Update Delete 源端5 种数据库:MySQL、 TiDB、MongoDB、Redis、 Couchbase全量+增量适配源端Failover 同步服务服务Failover自
2、动部署自服务:监控、告警、运 维自动化 目标端11 种目标系统:ActiveMQ、RocketMQ、Kafka、MySQL、TiDB、MongoDB、Redis、Couchbase、ElasticSearch、Kudu、HBaseMySQL分库分表单向+双向同步适配目标端FailoverWorker节点Manager节点配置推送 控制命令状态、统计 数据更新ZookeeperHA/同步位点源端支持更多数据库:TiDBDBIO实时获取并解析TiDB binlog至中间格式从Kafka获取数据后,解析为DBIO格式, 接入DBIO的传输通道TiDB binlog解析( ProtocolBuffer
3、 )格式转换(CanalEntry)Zookeeper(记录消费Kafka offset)SETL格式匹配问题:一对多转换;header/key/column/row等的转换;I/U/D的不同处理 字段匹配问题:bit(byte转换整形)/整形(根据MySQL字段类型处理溢出等问题)延迟时间计算:TSOexecutetime的转换源端支持更多数据库:其他DBIO伪装为源DB的slave,获取并解析Redis、MongoDB、Couchbase的log至中间格式CouchbaseRedisMongoDBPSYNC runid offsetBGSAVE全同步Transmit RDB部分同步back
4、logReplicator 同步控制器ConnectionCnxnReaderRESP协议解码RdbSinkAofSinkdbname.collname hash_id hashns1ns2oplogs_id hashActive vBucketDisk Write QueueDISKDCP QueueDisk snapshotPoint-in-time snapshotDCP ClientStream RequestMutation解码器流控、断点重试、特定分片、 特定时间、全量、实时中间 数据 格式支持更多目标端系统修改Load模块,使之支持更多目标端支持的数据格式不统一同步结果的确认方案
5、不统一异常的处理方法不统一API使用方法不统一保证重复操作幂等内置向MySQL分库分表同步组件向分库分表同步外接分库分表 中间件内置分库分表 模块优点:代码改造小缺点:重复SQL解析,同步延迟和吞吐量受影响;更多依赖,带来稳定性问题从Binlog解析出来的字段信息+插件化的分库分表规则支持常见的分库分表规则:range/hash/list/crc文本形式的分库分表规则,代码侵入性低 插件化:界面中配置,操作灵活,便于运维性能影响小MySQL ProxyDBIO(load)ShardingSphere内置向MySQL分库分表同步组件连接池换为HikariCP, 吞吐量提升15%内置分库分表组件比
6、外接组件吞吐量提升60%分表数越多,性能越低MySQL全量数据同步资源限制流量限制逻辑复杂 内存资源有限计算资源有限写数据QPS过高会导致目标端集群故障读写数据QPS不一致会导致内存不足(OOM)/资源浪费并发:(1)多表同时同步数据; (2)单表数据并行写入目标端终态:(1)提取数据完成; (2) load数据完成健壮性:单条数据同步失败,(1)不影响整体同步进度; (2) 不 影响同批次其它数据同步难点流式提 取数据内存使用可控读取速度可控限流源端限流:令牌目标端负载能力负反馈,影响源端提取数据的流量流程控 制器同步流程控制: Extract+Load异常信息处理: 重试与记录MySQL全
7、量数据同步流量 控制流程控制DBIO HA方案Region-XAZ1MasterAgentMySQL(从库)AgentMySQL(主库)AZ2Agent MySQL(从库)多路故障检测自动选新DB Master保证数据一致性HA Master自身高可用保证CMDB数据准确Raft GroupMasterMaster捕获DB连接异常查询CMDB获取最新DB Master IP+Port根据timestamp/GTID定位新Master起 始位点源DBIO端目标端通过域名访问Failover策略:捕获异常+重试 (封装在SDK中)涉及到的高可用问题源DB HA目标DB HAIO自身的HAMySQL
8、间双向同步方案Binlog event增加特定操作BEGINTABLE_MAPWRITE_ROWSTABLE_MAPWRITE_ROWSCOMMITMySQL 1(全量数据)MySQL 2(全量数据)MySQL 3(全量数据)写:user_id % 3 = 0 的数据写:user_id % 3 = 1 的数据写:user_id % 3 = 2 的数据user_id % 3 =0user_id % 3 =2user_id % 3 = 0&1user_id % 3 = 1&2前提条件:业务数据单元化 + 冲突交由业务处理Entry1Entry2continuehas check info & ch
9、eck FAILED discardEntry3has check info & check OKcontinueno check infoSelectEntry1Entry3add check infoadd check infoLoad利用双向同步实现MySQL异地多活数据拆分:单元化数据(异地多活)、全局数据(同城HA)单元化数据:每个Region部署一套MySQL集群,Region间通过DBIO双向同步,保证每个Region都可读写全局数据:利用MySQL 同城HA保证高可用SDK:对业务屏蔽后端数据库访问细节,实现透明故障切换/运维R&WSDK透明分库分表/读写分离/DB Failo
10、verMySQL 2(全量)MySQL 3(全量)W:user_id % 3 = 1 R:ALLW:user_id % 3 = 2 R:ALLW:user_id % 3 =0 R:ALLMySQL 1(全量)双向DBIO双向DBIORedisRedisRedisDBIO实时缓存更新MySQLMasterSlave1Region_1Region_2Region_3 业务单元 化数据Slave2 全局数据M-SM-S 缓存数据Zookeeper自服务平台工作流引擎+脚本 运维自助/告警自愈集群:同地域跨IDC部署,避免单IDC故障调度:根据规则自动关联集群,选择内存/CPU利用率最小且跨IDC的双
11、节点进行部署,节点故障重新调度DBIO ClusterManagerWokerWoWkeorkerWokerZookeeperWorkerAZ1WokerWoWkeorkerWokerWorkerAZ2ManagerWokerWoWkeorkerWokerZookeeperWorkerAZ3Zookeeper ClusterRegion-X关联集群工作节点 推荐根据目标 端选择部 署方式账号密码 等敏感信 息存储构建配置 信息在ZK等写 入配置更新 CMDB信息服务部署工作流从CMDB获取配置 信息工作流引擎运维工单/ 告警配置与工作 流的映射提交工作流任务执行工作流自服务平台DBIO在爱奇艺
12、的应用DBIO已在爱奇艺稳定运行2年多,有千条实时同步流,吞吐量百万行/秒MySQL间同步需求最强烈主要应用场景为:DB功能拆分RMQ逐步取代ActiveMQ数据 变更 通知汇总 各端 数据实时归档DB功能 拆分应用 场景在线 统计实时 构建 索引实时 缓存 更新数据 迁移MySQLRocketMQKafkaActiveMQElasticSearchKudu MongoDBCouchbaseTiDBRedisHbase各目标端占比DBIO常见应用场景DBDBIOM Q模块间的消息通知实时数据分析DBDBIODBDBTable1 Table2 Table3DBTable1Table3Table2分库:拆分为多个小DB,对应不同应用场景写读读读DBDBTable1Table2DBIODBTablex多表合并为一个宽表将多个库中的表汇总到一个库DBIODB写Tbl_Uid_
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年中国煤灰砖产业未来发展趋势及投资策略分析报告
- 2024-2030年中国焦炭行业应用趋势预测及投资商业模式分析报告
- 2024-2030年中国演唱机产业未来发展趋势及投资策略分析报告
- 2024年炊具挂盘项目申请报告
- 2024-2030年中国混凝土机械市场需求分析及投资策略研究报告
- 2024-2030年中国汽车线束贸易行业市场前景预测及投资经营模式分析报告
- 2024年数字视频切换台项目提案报告
- 2024-2030年中国汽车刹车片行业供需预测及投资策略分析报告
- 2024-2030年中国水晶行业竞争力策略及发展规划研究报告
- 2024-2030年中国椴木灵芝行业供需分析及投资潜力研究报告
- 2024年江苏苏州市(12345)便民服务中心招聘座席代表人员高频难、易错点500题模拟试题附带答案详解
- 2024年湖南省长沙市中考历史试卷真题(含答案解析)
- 石料仓储合同范本
- 第1-4单元期中核心素质检测卷(试题)-2024-2025学年数学三年级上册北师大版
- 摩托车维修技术考核试卷
- 6 我的家庭贡献与责任(教学设计) 部编版道德与法治四年级上册
- 期中测试题-2024-2025学年道德与法治六年级上册统编版
- 《珍爱生命拒绝毒品》主题班会课件
- 2024年贵州毕节市委政法委所属事业单位考调6人历年高频500题难、易错点模拟试题附带答案详解
- GB/T 32399-2024信息技术云计算参考架构
- 2024粤东西粤北地区教师全员轮训培训心得总结
评论
0/150
提交评论