百度AIOps智能运维框架课件_第1页
百度AIOps智能运维框架课件_第2页
百度AIOps智能运维框架课件_第3页
百度AIOps智能运维框架课件_第4页
百度AIOps智能运维框架课件_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、百度AIOps智能运维框架技术创新,变革未来第1页,共19页。目录研发型运维团队下一幕AIOps1百度AIOps框架2百度AIOps实践3迎接AIOps运维新时代4 第2页,共19页。DevOps、SRE、ChatOps、AIOpsDevOpsSREAIOpsChatOpsEngineeringCulture, Automation, Measurement, SharingB快回滚回滚 完毕B数据算 法AI/IA 推荐:Melissa Binde GCP NEXT 2016推荐:AIOps Gartner 2016第3页,共19页。百度研发型运维团队的第一幕:基础运维平台基础运维平台的历史阶

2、段20072012,GUI 交互时代服务树、权限管理、初始化系统、机器管理监控1.0/2.0、部署系统、数据管理任务管理、名字服务基础运维平台的问题基础运维平台DevOP基础运维平台个性化通用基础运维平台PaaS 12ManagerQA DevOps实践第4页,共19页。百度研发型运维团队的第二幕:开放运维平台开放运维平台的历史阶段20122014,API 交互时代可配置的监控3.0升级的部署系统 Archer开放运维平台DevOPManagerQAPaaSChatOpsSRE优秀方法实践DevOps成型开放运维平台的问题垂直场景重复的轮子分散的数据和运维知识计算感知认知智能层次 第5页,共1

3、9页。DevOps实践下运维工作的变化趋势参考Source:/devops/ 第6页,共19页。百度研发型运维团队的下一幕:AIOps智能运维平台2014今,数据+算法AIOps智能 故障管理/变更管理/容量管理/服务咨询三个核心运维知识库开发框架算法平台Source:Gartner ReportIT Operations Analytics Must Be Placed Within an AIOps Context.Will Cappelli (Research VP) | 26 August 2016 第7页,共19页。目录研发型运维团队下一幕AIOps1百度AIOps框架2百度AIOp

4、s实践3迎接AIOps运维新时代4 第8页,共19页。百度AIOps书同文:一致运维“语言”车同轨:一致运维“方法”A-PaaSC-PaaSE-ToolsB-PaaSD-Tools.应用、服务、机房 集群、镜像、机器行同伦:一致运维“模式”SOP 感知,如异常检测和定位决策,如弹性扩缩容策略、流量调度策略执行,如扩缩容执行、流量切换执行推荐参考:WinstonNetflix ; FBARFacebook;AuxonGoogle第9页,共19页。百度AIOps要解决的问题场景和思路复杂简单高频低频部署变更:数据部署变更:程序故障管理:重大故障(outage)备份管理机器管理:维修网络管理容量管理

5、监控管理智能辅助决策增强(augment)人的能力智能决策和执行,经验可迁移替代(substitute )人的能力自动化(automation) 自助化(self-service)规范化 流程化资产和服务管理Google AuxonFacebook FBARNetflix WinstonGitHub ChatOps客服&咨询助力业务高速发展,持续提升高质、高效的运维能力 减少自身 dirty work,运营能力提升,为服务增值服务架构和 性能优化故障管理:一般故障(disruption) 第10页,共19页。百度AIOps框架基础架构&基础运维平台运维知识库运维操作库开发工具运维开发框架Age

6、nt调度运行时库ETLSchema 管理查询与 计算根因诊断运维策略库异常检测止损决策容量预测智能 运维 平台解决 方案故障处理场景 单机房止损 单机自愈 一致性维持 FAQ客服场景 Chatbot 持续部署容量管理场景自动压测 容量规划自动扩缩容SSGFSGAIGEBG外部客户IDG变更场景 分级发布 存储 第11页,共19页。运维知识库 | 建立对“运维世界”的统一、数字化描述状态数据事件数据数据 源数 据 生 产 过 程服务管理模型和规范关联挖掘查询和视图反馈干预throughputlatency统元数据一 数 据 模 型ProductPerson AppServiceInstanceH

7、ostIDCNetwork.anomalyroot causechangeremediation.raw 数据分类映射 清洗消歧存储:MetaDB,TSDB,EventDB权限和配额质量控制errordiskcpumemiobandwidthrtt.核心数据中间数据择优计算管理类平台 监控类平台操作类平台第12页,共19页。百度AIOps框架:运维开发框架 和 运维大脑调度器工具链运维知识库部署变更通用组件(通讯、存储、调度等)其他场景其他 运维 应用软件运维机器人开发框架和运行时AB业业业 务务务C故障处理配置参数模型数据运维策略(大脑)研发垂类运维应用研发运维平台研发 第13页,共19页。

8、目录研发型运维团队下一幕AIOps1百度AIOps框架2百度AIOps实践3迎接AIOps运维新时代4 第14页,共19页。百度AIOps实践 第15页,共19页。百度AIOps实践Anomaly Detection in Infrequently Occurred Patterns Dong Wang, Baidu Inc.5月22日24日 新加波 第16页,共19页。百度AIOps实践:无人值守上线Dev 自助 (self-service)AIOps 逐渐替 代人来决策DevOps 自动化流水线自助处理依赖解决 效果确认 暂停点决策 上线通告.风险控制时间依赖任务依赖可用性影响性能影响用户体验影响上下游影响失败定位处理.效率优化 并发度预分发 优先级 流程减免(esp. 回滚、紧急上线) 第17页,共19页。百度AIOps实践:服务咨询意图识别与服务调用意图上线查询槽位Time = “十点附近” Product = “xxx” Module = “xxx”积累人工标注的语料训练意图和槽位识别模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论