![iMaster NCE-WAN可靠性技术白皮书_第1页](http://file4.renrendoc.com/view/10820ecd73e4dea13d060ca5b6385b0a/10820ecd73e4dea13d060ca5b6385b0a1.gif)
![iMaster NCE-WAN可靠性技术白皮书_第2页](http://file4.renrendoc.com/view/10820ecd73e4dea13d060ca5b6385b0a/10820ecd73e4dea13d060ca5b6385b0a2.gif)
![iMaster NCE-WAN可靠性技术白皮书_第3页](http://file4.renrendoc.com/view/10820ecd73e4dea13d060ca5b6385b0a/10820ecd73e4dea13d060ca5b6385b0a3.gif)
![iMaster NCE-WAN可靠性技术白皮书_第4页](http://file4.renrendoc.com/view/10820ecd73e4dea13d060ca5b6385b0a/10820ecd73e4dea13d060ca5b6385b0a4.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 DOCPROPERTY PartNumber DOCPROPERTY Product&Project Name iMaster NCE-WAN DOCPROPERTY DocumentName 可靠性技术白皮书目 录 TOC h z t 标题 1,1,标题 2,2,标题 3,3, 标题 4,4, 标题 5,5, 标题 7,1, 标题 8,2, 标题 9,3, Heading1 No Number,1,Appendix heading 1,1,Appendix heading 2,2,Appendix heading 3,3,Appendix heading 4,4,Appendix head
2、ing 5,5, Heading 1,1,Heading 2,2,Heading 3,3, Heading 4,4, Heading 5,5, Heading 7,1,Heading 8,2,Heading 9,3 HYPERLINK l _Toc18308712 1 简介 PAGEREF _Toc18308712 h 1 HYPERLINK l _Toc18308713 2 前言 PAGEREF _Toc18308713 h 2 HYPERLINK l _Toc18308714 2.1 大容量高可靠的诉求 PAGEREF _Toc18308714 h 2 HYPERLINK l _Toc18
3、308715 2.2 大容量高可靠的职责 PAGEREF _Toc18308715 h 2 HYPERLINK l _Toc18308716 3 软件可用性 PAGEREF _Toc18308716 h 3 HYPERLINK l _Toc18308717 4 NCE-WAN控制器整体架构与可靠性方案 PAGEREF _Toc18308717 h 4 HYPERLINK l _Toc18308718 4.1 NCE-WAN控制器分布式架构 PAGEREF _Toc18308718 h 5 HYPERLINK l _Toc18308719 4.1.1 ACM集群架构 PAGEREF _Toc18
4、308719 h 6 HYPERLINK l _Toc18308720 4.1.2 ACC集群架构 PAGEREF _Toc18308720 h 7 HYPERLINK l _Toc18308721 4.2 可靠性方案介绍 PAGEREF _Toc18308721 h 7 HYPERLINK l _Toc18308722 4.2.1 控制器集群与负载均衡机制 PAGEREF _Toc18308722 h 7 HYPERLINK l _Toc18308723 4.2.1.1 集群技术 PAGEREF _Toc18308723 h 7 HYPERLINK l _Toc18308724 4.2.1.
5、2 设备连接负载均衡 PAGEREF _Toc18308724 h 8 HYPERLINK l _Toc18308725 4.2.2 分布式数据库集群 PAGEREF _Toc18308725 h 8 HYPERLINK l _Toc18308726 4.2.3 服务节点可靠性部署 PAGEREF _Toc18308726 h 9 HYPERLINK l _Toc18308727 4.2.4 异地容灾 PAGEREF _Toc18308727 h 9 HYPERLINK l _Toc18308728 4.2.5 故障预防 PAGEREF _Toc18308728 h 10 HYPERLINK
6、l _Toc18308729 4.2.5.1 故障信息采集 PAGEREF _Toc18308729 h 10 HYPERLINK l _Toc18308730 4.2.5.2 健康度检查 PAGEREF _Toc18308730 h 10 HYPERLINK l _Toc18308731 5 缩略语表/Acronyms and Abbreviations PAGEREF _Toc18308731 h 10简介关键词:大容量、高可靠、分布式架构摘要:本文从NCE-WAN控制器的发展趋势为切入点,结合大容量高可靠的关键技术架构方案、典型应用场景,从整体架构来介绍华为公司iMaster NCE-W
7、AN控制器(后面统称为NCE-WAN控制器)产品大容量高可靠性的功能与特点,突出产品的独特亮点。最后结合主要应用场景的介绍,重点讲述为客户带来的价值。前言随着设备管理规模、租户管理规模增长,传统的单机网管架构已经不能支撑大容量的业务需求。为了解决这些问题,NCE-WAN控制器中引入分布式的架构,负责大规模设备、租户的管理,并提供高可靠性的机制来保证分布式系统的稳定运行。 HYPERLINK l _ZH-CN_TOPIC_0166652405 o 2.1 大容量高可靠的诉求 HYPERLINK l _ZH-CN_TOPIC_0166652411 o 2.2 大容量高可靠的职责大容量高可靠的诉求随
8、着网络技术的飞速发展,企业网络规模也在不断扩大,大中型企业客户需要管理和维护少则几百台多则上千台的设备,NCE-WAN需要管理很多租户的设备,设备的总规模可达一万台以上,设备上报的性能相关的数据量非常庞大,大容量管理的诉求非常迫切。另一方面,随着企业信息化水平的提升,为了满足用户接入企业网络,通常会把网络铺设到办公区的每个角落。公司内大量流动的办公人员和合作伙伴经常会带着笔记本电脑接入公司的局域网,这将给公司的信息安全带来很大的挑战。大容量高可靠的职责NCE-WAN通过分布式集群架构帮助企业完成大容量下设备、租户的管理,并提供高可靠性的方案机制来保证系统的稳定运行,主要解决如下大容量高可靠的问
9、题:可伸缩的集群以管理不同的在线设备规模,最小集群1万在线设备管理规模;可伸缩的集群以管理不同的在线租户规模,最小集群300个最大在线租户帐号管理规模;大规模设备上报性能数据的处理。软件可用性NCE-WAN平台的软件可用性可达到3个9,即99.9%。NCE-WAN平台支持冗余部署:云平台支持集群部署,支持异地容灾。NCE-WAN平台支持故障检测自愈机制。NCE-WAN平台支持故障预防。NCE-WAN控制器整体架构与可靠性方案NCE-WAN控制器采用分布式架构来解决大容量高可靠性的架构问题,主要包括设备配置管理节点集群、数据采集节点集群、数据分析存储节点集群、分布式数据库节点集群。下面分别从整体
10、架构以及各类集群的关键机制来介绍NCE-WAN控制器的分布式架构技术方案。NCE-WAN控制器分布式架构分布式架构整体部署视图管理的设备类型:路由器AR;ACM集群:NCE-WAN控制器租户面的管理节点集群,主要租户管理、设备管理、设备监控、设备配置管理、性能告警等;ACC集群:NCE-WAN控制器大数据采集节点集群,主要包括对设备上的性能、日志、应用分析数据等进行采集和处理;分布式数据库:NCE-WAN控制器分布式数据库集群,主要持久化租户面的业务数据;分布式缓存:NCE-WAN控制器分布式缓存集群,主要存储一些对性能要求非常高的业务数据,用于提升系统并发性能。ACM集群架构南向设备连接到N
11、CE-WAN控制器ACM集群时先经过软负载节点,由软负载节点进行负载分担后分配到ACM集群中的一个节点;ACM集群支持不同的在线设备管理规模,最小集群1万在线设备管理规模,集群规模可扩展;租户面的业务请求先经过软负载节点,再负载均衡到ACM集群节点上;ACC集群架构ACM节点通过Netconf下发性能相关数据的订阅配置;南向设备连接到NCE-WAN控制器ACC集群;ACC集群支持南向1万设备的性能数据的上报处理,最小集群1万设备长连接;ACC将南向设备上报的数据解析后发送给ACC集群管理进行分析出来。可靠性方案介绍控制器集群与负载均衡机制集群技术NCE-WAN控制器集群节点之间相互独立处理业务
12、,单节点故障后业务可以自动切换到其它节点,控制器集群可以持续正常提供服务。NCE-WAN控制器可靠性是通过集群技术来解决节点故障时业务不中断。主要包含ACM集群、ACC集群、分布式数据库集群、分布式缓存集群。以下介绍集群可靠性:ACM集群:当某个设备配置管理节点故障时,租户管理面的业务操作请求会通过前置的负载均衡器自动分发到集群中其他节点,同时设备也会自动检测到管理节点故障,能够自动将连接切换到集群中其他节点,从而集群中某些节点故障不影响NCE-WAN控制器的设备配置管理业务。ACC集群:当某个数据采集节点集群故障时,设备自动检测到数据采集节点故障,能够重新与新的ACC节点建立长连接,并将上报
13、数据切换到集群中其他节点,从而集群中某些节点故障不影响NCE-WAN控制器的性能数据采集的业务。分布式数据库集群:NCE-WAN控制器的分布式数据库支持数据进行分片存储,同时支持数据的一主多备的可靠性模式。当分布式数据库集群中某个节点故障时,备份的节点能够立刻接管其业务,从而确保其对外提供正常的功能。分布式缓存集群:NCE-WAN控制器的分布式缓存支持数据进行分片存储,同时支持数据的一主多备的可靠性模式。当分布式缓存集群中某个节点故障时,备份的节点能够立刻接管其业务,从而确保其对外提供正常的功能。设备连接负载均衡南向设备连接附着采用软负载集群实现,设备的TCP连接请求经由软负载节点按照负载策略
14、直接转发给后台控制器集群节点。南向软负载节点主要转发两类TCP请求:设备与ACM集群节点建立Netconf长连接,设备注册时连接请求会由软负载集群负载到ACM集群中的任一节点,由端口确定负载列表;设备与ACC集群建立长连接,设备触发建连时连接请求会由软负载集群负载到ACC集群中的任一节点,由端口确定负载列表。该方案特点如下:无状态化ACM集群、ACC集群所有节点无状态化,都具备设备分片处理能力,均能够承担设备分片任务的处理,不存在单点性能瓶颈及串行约束。高可靠性设备连接任务指派给某个控制器节点后,当该控制器节点故障时,软负载集群节点会感知集群节点故障,设备重新发起注册请求时会负载到新的集群节点
15、,相关任务会由其他控制器节点来承担,消除单点故障。负载均衡设备注册时,软负载节点会以在线控制器节点负载较低的优先分配,并且会动态刷新在线控制器节点负载信息,保证所有控制器节点的设备连接负载整体上均衡。分布式数据库集群分布式数据库集群采用一主多备形式部署,实时进行数据的冗余备份,正常情况下主数据库节点提供数据存储服务,当主节点异常后,主备倒换软件检测到该异常并执行数据库主备切换,将集群内数据库备节点升级为主节点,原主节点降级为备节点。服务节点可靠性部署服务集群可靠性部署,考虑节点的可靠性:服务主备或者集群部署,无单点服务故障问题;主备和集群服务分节点部署;单节点故障不影响整个集群服务功能;物理机
16、虚拟化部署场景,相同功能集群服务节点反亲和部署,即单物理机故障不影响整个集群服务功能。最小集群部署视图如下:异地容灾NCE-WAN控制器容灾方案在两个地域部署两套独立的NCE-WAN控制器系统,系统之间建立心跳、数据通信链路,依赖数据库的能力把主集群的数据实时备份到备集群。在主集群发生重大故障无法恢复的时候,用户可以把备集群恢复成新的主集群,从而继续提供业务服务。容灾指标容灾指标是指在当系统发生灾难(地震、洪水等)或长时间无法恢复的故障(如核心磁阵损坏等)时,NCE-WAN控制器在灾难过程中的最大数据丢失量及从灾难状态恢复到可运行状态所需的时间,用于衡量容灾系统的数据冗余备份能力和业务恢复能力
17、。指标项指标项描述限制条件配置类业务数据实时同步(同步机制)RPO=0minNA设备告警类业务数据实时同步(异步机制)RPO=1minNA异地容灾倒换切换时间(min)RTO=故障发现时间+15min(切换时间)+设备上线时间125Mbps主备通信带宽,时延20ms。首次容灾配置数据同步时间(min)RTO=130 min125Mbps主备通信带宽,1W设备的数据量(GaussDB (68GB)+HDFS(4GB)。故障预防故障信息采集支持在NCE-WAN控制器集群纳管的所有节点执行故障信息收集,可以收集集群节点的“常见信息”和“高级信息”。在运维人员没有要求的情况下默认收集对应时间段的“常见信息”,在运维人员明确要求下根据以下内容来区分需要收集的日志:常见信息:Karaf日志,集群系统信息包括当前告警、运行日志、操作日志、各进程状态、数据库状态等。建议所有故障场景都收集此类日志。高级信息:包括系统故障日志、南北向服务日志、异地容灾&集群管理日志等系统日志。当出现NCE-WAN控制器系统类故障(如NCE-WAN控制器无法访问、南北向服务异常、异地容灾异常等)时,建议收集此类日志。在运维面进行线上故障信息收集,不再依赖其他独立的工具,及时发现故障问题,提升了故
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年企业医疗救助协议标准
- 2025年停车场车位共有权协议范本
- 2025年节能型路灯购销合同
- 2025年设备选购与安装合同范文
- 2025年农业产业链结构优化合作协议
- 2025年企业与员工合同协议样本
- 2025年内蒙古货运从业资格证题库及答案
- 2025年债务清算保障协议书
- 【北京+九年级+答案】北京市门头沟区2024-2025学年九年级上学期期末语文试卷
- 2025年鄂州货运资格证安检考试题
- 学校课程整体框架图
- 环境卫生学第二章 环境与健康的关系
- 2024届高考语文复习:小说阅读之叙事顺序与叙事节奏
- 环卫市场化运营方案PPT
- 电流互感器和电压互感器选型指南
- 大学生心理健康教育PPT完整全套电子教学课件
- 会务服务投标技术方案
- 中国传统图案大全
- 人间草木读书报告
- 市政污水管网深基坑拉森钢板桩支护专项施工方案
- 员工离职登记表(范本模板)
评论
0/150
提交评论