王晓征 - 浙江移动云运维体系建设与实践_第1页
王晓征 - 浙江移动云运维体系建设与实践_第2页
王晓征 - 浙江移动云运维体系建设与实践_第3页
王晓征 - 浙江移动云运维体系建设与实践_第4页
王晓征 - 浙江移动云运维体系建设与实践_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

晓征部副总经理兼云计算中心主任现状与挑战维体系转型建设望未来一 烟囱式 IT架构烟囱式云数据中心集中资源池的共享如何进行资源池的云数据中心集中资源池的共享如何进行资源池的如何有效保障租如何提升人均维护网元,进行标准低成本、标准化硬件随着IT架构朝着虚拟化、云化演进,运维环境带来了新的变化,呈现出网元海量化、组件多样化、调度动态化等特点,也给我们传统运维人员带来新的挑战。如何提升开源且多样化组如何在单点稳定性下降情况下有效保障连如何在单点稳定性下降情况下有效保障连调配、弹性伸缩带来的管理虚虚拟化、分时共享动动态调配、弹性伸缩自动化自动化、自服务的特定挑战均元均元界和恢复作化素构急分析浙江移动云计算中心深入分析思考私有云运维下的新环境和新挑战,采取运维管理体系建设和运维平台能力建设的方式来应对,两手抓,两手都要硬。具体措施如下:念阵级报制二道道器“法器运维之法法以立策运维之器器以成事道法器之道道以明向之道道以明向法法以立策之器器以成事 •IT运维的宗旨是保持系统高效的业务价值输出。IT户的体验、业务效率、企业效益。,运维管理应该运维à运营技术运营运维障服务总线(OSB/ESB/VSB)流程引擎缓存服务消息服务动云计算中心引入动云计算中心引入SRE云运维的最佳实践,维的角度分解为三层台化的自动运维向平台、面向应业务的三层进行对内对外的运维标•自动调度统一监控面向平台•自动部署弹性伸缩资源管理情况下,超过99%的场景业务是连续的。云计算中心在连续 (全局)可视化,实现准实时性故障提高效率,通过智能化能力提供智能分析/决策。之道道以明向之道道以明向法法以立策之器器以成事 SRE理理制系施统构SRE理理制系施统构IT网络二线一线二线一线主机二线一线租户3租户8网络二线一线二线一线主机二线一线租户3租户8租户5租户1租户2租户4租户6租户7租户9租户经理应云平台总控/一线应急值班经理SRE调度二线技术支持团队资深专家团队”这种组织形式,已不再是新鲜事物,但仍不失为一种理想化的支撑模式。众多的互联网公司都在二二线一线主机存主机存储网络安全移动云计算中心总控是云计算中心运维的触点,技术运营的接口。依托于运维自动化平台在可视化告警和自动化处营用延伸职权:策管理用延伸职权:策管理理平台性能优化平台工具演进运维思路:以应用架构角度向业务延伸职权:用应急与决策用上线发布管理可用管理用容量管理用性能优化用工具演进SRE是指SiteReliabilityEngineer(网站可靠性工程师),起源于Google,具备较强的编程能力和系统全栈能力的维护工程师。云计算中心在总结出云运维的三层保障体系的基础上,并借鉴国内外优秀的互联网运维经验,我们对SRE进行了重新的解读和定位:SRE是以连续性保障为最终使命,对部署架构、容量管理、运维工具演进负责的全栈型运维人员,分为两种角色:平台SRE、应用SRE。户经理是云租户和云计算中心之间更为通畅的沟通渠道,可以更快调度更为充分的资源响应客户需求,建立良动云计算中心总控统一接口事件管理快速先恢复,后修复动云计算中心总控统一接口事件管理快速先恢复,后修复监控告警(无业务影响):云总控>专业组否是控会告、记录归档理理控解决行总结后归档;自下而上、逐层升级,并对租户负责的态度,云计算中心对四级以及以上事件会向租户提供故障分析报告。云计算中作告知案作告知案变更评审变更通告变更实施后续保障险把控之道道以明向之道道以明向法法以立策之器器以成事 p应用和平台秤动态调整pp应用和平台秤动态调整p平台组件之间的依赖云化部署之后,应用和平台的关系呈现动态调整的趋势,且在多网元、多组件的情况下,通过传统的竖井化工具点问题来故障定界捉襟见肘,通过优化管理体系,设立SRE来加强全局分析能力,但是人的因素也成了瓶颈,故是不知道问题在哪里?!是不知道问题在哪里?!看!题就在这里!这次我也没辙!?APP网络署图P理员、大一线?APP网络署图P理员、大一线l实时问题发现、快速介入避免问题扩大l可视化故障全景,快速修复故障根源源在基础采集能力、配置能力支撑下,布局云平台场景化运维建设,逐步实现可视化、自动化、智慧化的云平台场景化运维能力,大大降低了运维门槛,实现租户自助式、无障碍故障定位与根因排查、恢复,同时实现运维人员价值转型。定界恢复能力统一标准计量用部署图存储ll线、三线l数据开放,实时数据化展示平台运行全貌l秒级、自动故障根源定位能力l可视化评估故障影响面l统一标准计量算法,客观评判云平台状态业管理灾自动切换审计编排分发理列户权限进行自服务管理控制采集策平台估器自动处理业管理灾自动切换审计编排分发理列户权限进行自服务管理控制采集策平台估器自动处理平台分析分析分析监控统监控 存储监控用据库拟机康评估分析控他 应用监控据作权限管理管理用库储据理共享中心资源作伙伴联合研能运维平台实现了业界IT件健康度模型,直经实现了数据库、操作网络设备等多个组件的换三命令文档脚本用户lll维大量自决策少量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论