美团命名服务的演进与业务赋能_第1页
美团命名服务的演进与业务赋能_第2页
美团命名服务的演进与业务赋能_第3页
美团命名服务的演进与业务赋能_第4页
美团命名服务的演进与业务赋能_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、美团命名服务的演进与业务赋能目录CONTENTS二美团命名服务遇到的挑战三美团命名服务的演进四美团命名服务对业务的赋能一美团命名服务简介五美团服务治理未来展望服务治理的基石:命名服务基 于 客 户 端基 于 服 务 端Server Based优势侵入小集中管控Client Based劣势网关单点成本高例子NginxMaglev优势无单点自然伸缩劣势侵入大难集中管控例子Eureka架构特性:1.代理方式,降低侵入性2.策略下沉,提升框架稳定性3.多级缓存,提高可用性4.边缘计算,均摊算力MNS美团命名服务演进前的架构SGAgentSGAgentRPC-TransportRPC- Transpor

2、tProvider NodeServiceRPChttpOceanushttpScannerMCC数据中心MSGPheartbeatMNSCMNS-ZKServiceConsumer Node接入99%+的在线应用数十万服务节点 三年+无重大事故日均万亿级调用覆盖公司所有业务线 已开源美团命名服务演进前规模目录CONTENTS二美团命名服务遇到的挑战三美团命名服务的架构演进四美团命名服务对业务的赋能一美团命名服务简介五美团服务治理未来展望美团业务迅速增长652001003102016年2017年2018年2019年酒店单日间夜数单位:万单192227275一季度二季度三季度营业收入单位:亿元1

3、000500200030002016年2017年2018年2019年外卖单日成交量一季度二季度三季度交易用户数单位:亿人单位:万单可用性挑战强一致组件操作有单点问题,选举失败,整个集群中断服务跨地域部署网络分区,区域性节点不可用数据多、连接量大,RTO小时级别性能挑战性能瓶颈扩展性挑战C10KC10M快照持续增长,造成IO压力及延长恢复时间集群写入不可扩展,参与写入节点越多性能越差集群限制数量上限200+,内部同步开销增加CP系统平行扩展能力不足命名服务应该是CP系统还是AP系统Partition toleranceAvailabilityConsistencyCP系统网络分

4、区是一 种客观事实网络分区后保证强一致性AP系统网络分区后,继续提供服务不可同时兼顾CAP主要是为了说明A与C不可兼顾部分异常时 提供服务的 能力命名服务应该是AP系统网络分区优先保证数据 一致性,可能中断服务云原生底层设施融合进一步降低业务接入感知,语言亲和链路接管,sdk合并基于服务节点的流量接入Cloud Native目录CONTENTS二美团命名服务遇到的挑战三美团命名服务的架构演进四美团命名服务对业务的赋能一美团命名服务简介五美团服务治理未来展望演进目标整体架构高性能的控制服务数据拆分方案、实现存储迁移高可用产品控制服务自研订阅系统灰度迁移SOP数据仓库业务系统层PigeonWhal

5、eOceanusMtthrift代理接入层ServiceMeshSgAgentMNS-API控制服务层网关管控模块数据分发模块变更捕获模块健康检查系统数据迁移系统SLA监控系统营运展示系统数据存储层ZookeeperCellarMafkaMySQLPigeon-WebMSGPPass-Service外部营运设施主 要 工 作 内 容典型场景1-流量洪峰突 发 事 件流 量 倍 增连 锁 效 应服 务 雪 崩平行扩展控制层轻状态甚至无状态平行扩展,实现分钟级新IDC部 署,应对突发流量打破非循环依赖,自动均衡新节点的流量,保证负载可控多地域部署,命名服务整体分钟级RTO控制服务层+代理层,构成层

6、级“堤坝”保护存储1/5数据量直接读存储;VS稳定承载全量数据;迁移过程中一次异常直连存储的流量洪峰记录典型场景2-推送风暴短期大量服务发布专线网络抖动、断开设备故障, 宿主机宕机雪崩效应,无法自愈关注 放大消息 放大注册中心的通知存在级联效应,推送量会显著 放大,类比社交网络中扇出(fanout)操作推送规模=服务变化次放次放=网络带宽告急业务服务节点,状态频繁变更数据拆分推送MemTableMemTableMemTableDataDataData数据存储控制服务代理组件ProcessWatcherDataset回调更新整块数据InfoStatusDataDataData数据存储控制服务Pr

7、ocessWatcherDataset数据 变更数据 MemTable变更节省内存 减缓 GC提高分发效率 降低带宽占用避免重复计算 减少CPU开销2/8原则:状态调整占服务注册信息写操作的80%+,分离读、写、推送数据推送代理组件回调infoDataset回调statusinfo推送status推送融入Service MeshMNS2.0:美团新一代命名发现入口层灰度迁移迁移服务存储层New DB注册发现规则数据采样同步数据巡检报警客 户 端 系 统接入代理层agent-new-3agent-new-4agent-new-5agent-new-2服 务 端 系 统agent-new-1未迁移

8、标志新、旧双写标志仅新注册流程标志接入代理层agent-old-2agent-new-2agent-new-3agent-new-1agent-old-1迁移标志位服务注册服务发现数据迁移服务不中断快速回滚能力数据不丢失Old DB演进成果跨地域多团队协作,数个核心组 件改造研发核心控制服务单机日均亿级调用 量, TP99910ms服务发现时间平均2s, TP999=5s迁移过程0事故RTO分钟级,RPO为0就近读/写,网络分区可用,双向数 据同步目录CONTENTS二美团命名服务遇到的挑战三美团命名服务的架构演进美团命名服务对业务的赋能一美团命名服务简介五美团服务治理未来展望四业务赋能服务治

9、理DevOps容器化数据挖掘服务治理-单元化解决异地容灾、异地扩展的方案按核心数据维度,对业务系统的部署架构和流量进行隔离支持全链路单元化,也支持业务层面定制单元化覆盖的具体环节服务治理-单元化单 元 扩 展故 障 隔 离命 名 发 现流 量 软 隔 离DevOps-泳道自动化测试流 量 隔 离并 发 测 试应 用 编 排搭 建 环 境DevOps-泳道自动化测试自动编排调用关系存在泳道节点时,测试流量进入泳道不存在泳道节点时,根据设置测试流量能够回流DevOps-平滑发布命 名 服 务 控 制 发 布 节 点 的 流 量 自 动 摘 除 与 恢 复对标项平滑发布传统发布方式流量丢失率概率小概

10、率较大发布自动化发布流程全自动化非自动化,业务需要手动检查单台发布时间需要等待流量摘除时间,偏长暴力重启服务,发布时间约等于服务启动时间流量摘除方式自动摘抄业务手动操作美团服务覆盖率生产环境默认方式测试环境,对流量丢失不明感场景DevOps-平滑发布容器化-弹性伸缩控制服务层代理接入层数据存储层ZookeeperSgAgentOceanusMnsApigatewaydeliveryMonitoringSOAtrackingmeta-discover版本效验查询索引MSGPMySQLPass-Service健康 检查SLA计算数据缓存数据营运ServiceMeshcdc数据关系化变动感知Cellar数据 迁移cache missMNS-Control数据挖掘&业务营运OldNewOLAP数据挖掘&业务营运单进程多端口端口资源浪费下游感知部署细节大服务列表底

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论