云卓越架构:云上网络稳定性建设最佳实践_第1页
云卓越架构:云上网络稳定性建设最佳实践_第2页
云卓越架构:云上网络稳定性建设最佳实践_第3页
云卓越架构:云上网络稳定性建设最佳实践_第4页
云卓越架构:云上网络稳定性建设最佳实践_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

云上网络稳定性建设最佳实践张星阿里云智能集团云网络解决方案架构师2024/09/2002面向失败的架构设计03可观测、应急快恢和故障演练网络实例异常爬虫网络实例异常爬虫网络安全攻击网络连通性异常网络连通性异常稳定性治理的责任分工客户客户客户的责任故障演练(容灾切换、故障注入)应急快恢(故障发现、定位、恢复)变更管理可观测灰度与回滚故障演练(容灾切换、故障注入)应急快恢(故障发现、定位、恢复)变更管理可观测灰度与回滚高可用架构设计(容灾、容错、容量)物理硬件计算存储数据库网络阿里云全球基础设施Regions可用区云企业网面向失败的网络架构设计综合考虑容量、容灾和容错,实现健壮聚焦可持续的网络运营面向失败的网络架构设计综合考虑容量、容灾和容错,实现健壮聚焦可持续的网络运营观测并通过智能化手段实现网络的持续云厂商责任解决确定性的架构设计问题解决不确定性风险事件解决确定性的架构设计问题解决不确定性风险事件面向精细化的运维管控面向精细化的运维管控解决不确定性的运维管控问题架构设计原则变更执行原则应急处理原则容错(点)1分钟发现5容错(点)1分钟发现5分钟响应容量(线)可灰度可观测可观测10分钟恢复10分钟恢复容灾(面)可回滚业务场景业务场景稳定可靠的私有业务环境安全的业务环境VPC网络规划设计设计方案设计方案IPv4/IPv6GWIPv4/IPv6GWAvailablezone-1Availablezone-2PrivateSubnet:/24网络Availablezone-1Availablezone-2PrivateSubnet:/24网络ACLPrivateSubnet:/24性伸缩/24/24TRVPC-BVPC-B/16VPC-D/16/16设计关键点设计关键点容灾容灾同城多活:VPC内划分的子网均支持多个可用区,应用可以跨可用区部署,实现业务同城多容错阿里云机房按照GB50174-2008《电子信息系统机房设计规范》不低于B级或者《TIA942》的T3+标准建设容量地址规划:IP地址统一规划,与现有内网地址不能冲突且留有冗余,可以满足业务长期发展弹性架构:ALB/NLB加弹性伸缩实现弹性服务架构转发路由器TR协同云企业网CEN分钟级构建跨地域互联网络业务流量按需传输业务流量按需传输设计方案云网关网络设备1212网络设备31233123云网关业务场景设计关键点容灾VPC接入双AZ高可靠:VPC实例关联至TR时,请务必确保至少2个及以上可用区VSWENI连接,保障同城VPC多容错多条跨域专线配合主备环网,使2点间不少于3条路径保护设计方案云网关网络设备1212网络设备31233123云网关业务场景设计关键点容灾VPC接入双AZ高可靠:VPC实例关联至TR时,请务必确保至少2个及以上可用区VSWENI连接,保障同城VPC多容错多条跨域专线配合主备环网,使2点间不少于3条路径保护基于多平面网络异常检测,多因子分级最优路径决策以及秒级重路由路径调整的全新主动式重路由技术。容量TR集群的高性能和弹性:单个TR集群支持100Gbps转发性能,且单个VPC连接支持10Gbps,无需用户配置规格按跨域带宽支持按量弹性付费:开通云数据传输服务CDT杭州北京新加坡深圳TR-Zoorouting快速重路由技术专线构建混合云架构设计方案品、品C品CEN云企业网专线专线业务场景设计关键点容灾通过双专线双接入点,提供线路级/设备级/机房级的高可用能力,提供不同级别的SLA保障容错超大规模的城域专用光纤互联冗余连接,毫秒级故障倒换容量对于稳定性要求高的业务可以规划多组小带宽专线,提供独享链路对于资源灵活共享的业务可以在同一组大带宽专线中,通过设计方案品、品C品CEN云企业网专线专线业务场景设计关键点容灾通过双专线双接入点,提供线路级/设备级/机房级的高可用能力,提供不同级别的SLA保障容错超大规模的城域专用光纤互联冗余连接,毫秒级故障倒换容量对于稳定性要求高的业务可以规划多组小带宽专线,提供独享链路对于资源灵活共享的业务可以在同一组大带宽专线中,通过vbr/qos等能力实现容量规划BGP+BFD+快速倒换组,实现专线快速收敛和倒换,提升业务的连续性容灾BGP:在物理专线接入过程中,可以使用动态路由协议BGP实现本地数据中心IDC与边界路由器VBR之间的内网互连,从而搭建高效的混合云链路BFD:是一种双向转发检测机制,可以提供毫秒级的检测,可以实现链路的快速检测流量自动从故障链路的VBR快速切换到备份VBR,完成毫秒级切换,加快阿里云网络内部收敛,实现业务平滑过渡设计方案23CEN云企业网专线业务场景设计关键点1设计方案23CEN云企业网专线业务场景设计关键点1业务场景设计关键点容灾用户可以在多个VPN链路之间进行ECMP负载均衡接入,从而提高可用性;双隧道模式的IPsec-业务场景设计关键点容灾用户可以在多个VPN链路之间进行ECMP负载均衡接入,从而提高可用性;双隧道模式的IPsec-VPN连接拥有主备两条隧道,在主隧道故障后,流量可以通过备隧道进行传输,提高了IPsec-VPN连接的可用性容错VPN网元底层是NFV集群化设计,底层单机故障可以做到实时热迁移容量VPN之间可以通过多个实例横向扩容,单个VPN隧道支持1Gbps的带宽,并且可以通过多个VPN实例快速构建更大级别的链路设计方案设计方案繁荣的集成生态,助力企业国内外分支便捷上云设计方案路由表VPN路由表设计方案路由表VPN路由表海外分支分支设备海外分支分支设备业务场景业务价值容灾分支到阿里云的underlay线路选择不同的线路供应商实现物理通道的高可用到健康实例路由自动发布到TR路由表,并向全网自动发布容错云上部分依赖云原生产品的高可用设计SDWAN部分依赖厂商自身的容错设计容量该方案整体不具备弹性能力,端到端链路的弹性受限于本地网络公网出口带宽、专线带宽、3rdSDWAN转发性能的影响,如果需要扩容测试VPC新加坡TRVPCAttachment跨地域带宽Attachment开发VPC上海TRVPCAttachment业务场景应用多活设计关键点容灾多可用区部署:避免单可用区故障,单可用区业务场景应用多活设计关键点容灾多可用区部署:避免单可用区故障,单可用区健康检测:健康检查机制避免了后端ECS异常对总体服务的影响,提高了前端业务整体可用性容错多节点session同步,单机、单节点故障长连接不中断对ALBproxy的http类型健康检查,故障节点容量单实例100WQps:动态弹性伸缩,单实例支持高达100WQps。设计方案设计方案自动伸缩服务器类型函数计算类型服务器组3方案核心能力ALBHTTP/HTTPS/QUIC服务器组1自动伸缩服务器类型函数计算类型服务器组3方案核心能力ALBHTTP/HTTPS/QUIC服务器组1服务器组2与转发由ALB负责,实现转发与防护完全分离,避免了业务场景应用容灾调度提升服务连续性应用访问优化提升服务体验设计关键点容灾多中心部署:业务场景应用容灾调度提升服务连续性应用访问优化提升服务体验设计关键点容灾多中心部署:业务同城双可用区部署,跨地域多活灾备部署服务可用性实时探测:GTM健康检测探测服务可用性,服务一旦不可用快速切换至双活节点,实现两地三中心应用级容灾容错GTM采用全球多节点部署的架构设计,实现了各节点之间的互备,有效避免了单节点故障导致容量通过自研的高性能DNS解析软件,单机解析并发能力超过千万,支持动态水位扩容升级,确保解析服务的高可用性和弹性伸缩。设计方案设计方案北京用户云解析全局流量管理方案核心能力北京用户云解析全局流量管理方案核心能力上海用户健康检查上海上海用户健康检查北京境外用户美东版配置,多模版综合判断可用性,最快1分钟发现并完成故网络流量不可见网络流量不可见•访问源(国家/城市/ISP)TR同地域流量Step2:看流量Top排序,下钻流量分析Step3:查看趋势图,看流量波动明细n流量TopN分析:有效抓取流量刺客,解决网络拥塞问题Step1:选场景、选Region,看流量分布TR混合云流量TR跨地域流量公网流量n流量洞察分析:应用AIOps智能基线预警,及时感知公网质量劣化和对业务IP的影响Step1:创建洞察仪添加监测资源Step2:观测网络质量运行状况Step3:订阅网络质量事件,分析影响面Step4:订阅流量周期性波动事件服务不可用问题服务不可用问题nn实例诊断:选择网络实例一键触发,诊断全面,报告详实诊断覆盖产品负载均衡:CLB/ALB/NLB弹性公网EIPVBRVPN网关私网连接PVL全球加速GA应急快恢诊断分析类别健康检查诊断容量超限诊断证书诊断安全策略检测费用诊断监听诊断等待十几秒n路径分析:输入路径五元组,逐跳分析网络连通性,提供转发拓扑和网络断点根因分析输出转发拓扑和分析结果输出转发拓扑和分析结果路由、ACL、安全组和防火墙拦截日志等路由表无命中条目、ACL/安全组存在拦截规则、防火墙存在历史拦截等若访问不通,提供可选路径推荐和配置建议输入路径的“源”和“目的”输入路径的“源”和“目的”覆盖场景跨VPC访问:TR、VPC-peering混合云访问:VBR、ECR、VPNVSW、ECS、IP(公网、云下私网)逐跳分析网络配置VIP3容灾:VIP探测失败,主动从DNS摘除VIPVIP3容灾:VIP探测失败,主动从DNS摘除VIP的A记录演练:主动摘除VIP,存量连接不影响,DNS不再解析该VIPVPCVIP1VIP2VIP3VPC容灾演练,主动关闭VIP3VPC容灾演练,主动关闭VIP3 VIP1VIP2VIP3AZ-AAZ-BAZ-C解决方案级别的解决方案级别的AZ级别的容灾演练容灾演练:与云速搭(CADT)结合,支持整个组网AZ级别的容灾演练故障演练:高速通道高速通道产品已支持用户自主进行故障演练,高速通道产品已支持用户自主进行故障演练,验证组网的可靠性(可以验证流量是否正常切换、切换耗时)阿里云助力某头部出行服务商构建全球互联网络**是全球领先的出行服务商,用户可以通过该平台享受丰富的出行旅行服务。该客户业务包括酒**是全球领先的出行服务商,用户可以通过该平台享受丰富的出行旅行服务。该客户业务包括酒店、机票、火车票等核心板块。原先国内的主要资源在上海IDC,海外主要资源在海外某云服务厂商,如今与阿里云合作,在上海、新加坡等地覆盖其核心业务板块。方案价值•方案价值•稳定:专线、IPSec等场景均采用多链路冗余设计,提供稳定链接•安全:通过CEN多平面承载不同核心业务,不同域进过防火墙•弹性:跨境专线和多云互联链路可按需弹性扩容,快速响应业务发展阿里云新加坡交易VPCTR交易生产VPC工具VPCAWS新加坡交易VPC生产VPC安全VPC阿里云上海-上海

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论