容器环境下智能运维架构课件_第1页
容器环境下智能运维架构课件_第2页
容器环境下智能运维架构课件_第3页
容器环境下智能运维架构课件_第4页
容器环境下智能运维架构课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

容器环境下智能运维架构技术创新,变革未来容器环境下智能运维架构技术创新,变革未来1容器SEL实验室容器环境下智能运维的挑战容器环境下智能运维研发实践智能运维发展展望容器SEL实验室容器环境下智能运维的挑战2容器SEL实验室2009年,性能建模与容量规2001年,

划研究浙大道富技术中心成立2011年,

成立SEL实验室2013年起,重心转到容器云及其运维2016年至今,公司化研发容器技术和容器平台智能运维SELZhejiang

University容器SEL实验室2009年,性能建模与容量规2011年,3实验室团队SEL实验室团队教授/副教授/讲师20人博士硕士100+人研究容器云技术企业级应用运维模型机器学习及其应用大规模信息系统件开发模型300余篇高水平论文工程完成超过100个海外合作工程项目,掌握世界一流的大型信息系统建设核心工程技术丰富的大型金融信息系统开发、云计算、大数据实践经验具备全球化金融领域业务知识拥有美国道富、DST、IFDS、路透社、中国外汇交易中心等合作伙伴强劲的科研团队丰富的工程经验丰硕的研究成果媒体声音:被美国CIO杂志誉

为“一朵在中国开放的金融IT奇葩

实验室团队SEL实验室团队研究工程强劲的科研团队丰富的工4Kubernetes

项目的代码贡献,

按照贡献行数统计,截止2017/8/30--by

/CNCF创始会员,在容器开源项目Kubernetes等贡献核心代码200多万行,贡献度国内第—,全球第五,并出版了国内第—本深度解析容器技术的专业书籍《Docker容器与容器云》

。实验室容器管理平台2016年7月推出以来,迅速在电信,银行,电商,智能制造,智慧城市等行业服务于20多个合作伙伴。开源项目国内排名全球排名Kubernetes15Docker524Cloud

Foundry3265实验室容器云贡献Kubernetes项目的代码贡献,按照贡献行数统计,截5我们为什么做容器平台的智能运维深耕容 致力智器云 能运维扎实研 业界广究基础 泛合作我们为什么做容器平台的智能运维深耕容 致力智器云 能运6容器SEL实验室容器环境下智能运维的挑战容器环境下智能运维研发实践智能运维发展展望容器SEL实验室容器环境下智能运维的挑战容器环境下智能运维研7传统运维挑战事故报警以投诉为主客服记录故障描述故障诊断定位现场跟踪处理传统运维挑战事故报警以投诉为主客服记录故障描述故障诊断定位现8容器环境特点容器化是IT架构*要发展趋势之一组件和服务数量众多部署模式多样化自带服务治理功能容器环境特点容器化是IT架构*要发展趋势之一9容器环境下智能运维挑战监控复杂调度滞后故障定位困难容器环境下智能运维挑战监控复杂调度滞后故障定位困难10容器SEL实验室容器环境下智能运维的挑战容器环境下智能运维研发实践智能运维发展展望容器SEL实验室容器环境下智能运维研发实践智能运维发展展望11智能运维技术研发与实践1. 容器统—监控容器监控链路数据跟踪曰志数据汇聚2. 故障根源定位动态拓扑分析因果关系提取变更影晌分析3.

智能调度性能瓶颈分析资源利用率估算资源调度智能运维技术研发与实践1. 容器统—监控容器监控曰志数据汇121.

容器统一监控案例场景为某政务数据中心,采用IaaS+容器技术方案*要业务:支撑各部门单位应用系统发布运维特点:系统托管在数据中心,发现问题后,应用方请求数据中心提供相关数据进行故障诊断目标:提供适合应用的监控数据,供运维运行分析1.容器统一监控案例场景为某政务数据中心,采用IaaS+容13设计思路应用集群数据预处理容器Agentflume容器Agentflume…ElasticSearch数据索引、酌合Spark

Streaming时间、曰志等级、错误信息等Kafaka运维数据可视化可视化组件Spark

SQL存储集群HBaseHDFS设计思路应用集群数据预处理容器flume容器flume…El14容器监控方案容器监控方案15如何监控容器镜像Option1:

镜像提前做好,tomcat,jetty等启动命令提前加好Option2:

脚本Batch

批量更新镜像但:

根据只跟踪service

ip,

没有pod

ip,如何对应到pod如何监控容器镜像Option1:镜像提前做好,tomcat16Agent与K8SAgent如何识别自己是哪个service?哪个POD?ETCD维护着service与pod关系Agent启动时查询自己所属的serviceAgent与K8SAgent如何识别自己是哪个service17如何获取链路对代码掌控能力较强采用OpenTracing对代码进行插裝实现Google

Dapper的原理origin.classClass

LoaderJavaagentnew

classTomcat监控数据RequestResponse用户JVM如何获取链路对代码掌控能力较强采用OpenTracingor18Google DapperGoogle Dapper19链路跟踪TraceID

:

识别用户一次请求,所有全链路上的节点共用一个TraceIDSpanID:正在处理用户请求的节点ParentSpanID:正在处理用户请求节点的上一个节点链路跟踪TraceID:识别用户一次请求,所有全链路上的202.

故障根源分析案例场景为某在线教育平台提供各类教育资源分享,用户广泛,IT技术能力差异显著客服经常接到比较奇葩的投诉,很难给出合理建议发生故障后,IT团队修复问题需要花费较长时间定位问题根源目标:减轻客服和运维工作量,快速定位故障或投诉根由2.故障根源分析案例场景为某在线教育平台21分析流程数据采集监控数据、曰志数据特征提取数据清洗、特征选取动态拓扑分析Trace技术、动态链路跟踪等根由分析因果关系分析、根由概率分析等反馈反馈故障村主人工村签、机器学习分析流程数据采集特征提取动态拓扑分析根由分析反馈反馈故障村主22动态拓扑结构动态拓扑结构23基于拓扑的异常检测WEBLogicLogicDB

1DB

2构建执行链正常模型资源访问性能基线异常行为检测行为异常性能异常访问量异常基于拓扑的异常检测WEBLogicLogicDB1DB224因果关系分析定义构建数据中心服务拓扑结构图,如右图A调用B触发B调用C,A->B称为B的因边,B->C称为B的果边如何判定因果关系果边应发生在因边之后的一个特定的时间段,即服务延时服务延时不能超过超时时间也不能低于服务处理时间通过关联分析,判断潜在因果关系因果关系分析因果关系分析定义因果关系分析25故障根由定位对故障相关容器节点的可能性进行量化分析形成故障因果关系链,执行链的历史执行频度将作为该链路上节点权重计算因果链上每个节点的影响以右图D为例,影响D的节点为E,F等,受D影响的节点为C,B,A量化单个节点对其他节点影响FP(D|F)=P(DF)*w

/P(F)P(C|F)=P(C|D)*P(D|F),其中权重由节点历史执行频率决定异常发生时,可快速计算出其他节点的嫌疑程度E0.5B0.90C0.88F0.4A0.850.90.80.9510.880.98G0.60.8D

0.84H0.78I0.8H0.860.90.80.6故障根由定位对故障相关容器节点的可能性进行量化分析形成故障263.

智能调度案例场景为智慧物流信息共享和监控管理平台支持—个地级市范围内,10+万物流车辆,数百家物流决递公司秒级实时信息更新和发布采用云平台增强其弹性伸缩能力3.智能调度案例场景为智慧物流信息共享和监控管理平台27设计思路设计思路28性能瓶颈定位工作负荷特性:到达率、到达间隔分布、分类系统特性:调度策略、负载均衡策略性能指村:晌应时间、吞吐量和资源的利用率性能瓶颈定位工作负荷特性:到达率、系统特性:调度策略、负载均29性能瓶颈定位资源利用率服务时间估算

多元线性回归)资源利用率预测响应时间预测MVA队列模型BP神经网络

+

遗传算法性能瓶颈定位资源利用率30应用容量估算相关方法负载模型基于资源需求的事务分类,CPU密集型、IO密集型等流量分析隐马尔科夫模型自适应平滑Holt-Winters资源利用率估算RegressionAnalysis晌应时间预测NeuralnetworkQueuenetwork容量估算基于性能和资源利用率的估算,资源满足应用需求的同时应性能不会明显下降应用容量估算相关方法基于资源需求的事务分类,CPU密集315

13

21

29

37

45

53

61

69

77

85

931 9

17

25

33

41

49

57

65

73

81

89

970.80.60.40.20utilbrowsingsearchshoppingorderingDBDiskDB

CPUWeb

CPU0 2 4 6 8 10

12demand(mills)Transaction2Access

logResource

logTransaction

profileETL1RegressionAnalysisTransactionresource

demand5132129374553616977832应用资源需求估算MySQL

节点CPU利用率 vs

负载应用资源需求估算MySQL节点CPU利用率 vs负载33容器动态资源调度Kubernetes容器资源调度:Predicates和Priority业务指标驱动资源调度容器业务访问量预测

à容器资源需求

/

应用性能分析

à如可能过载,容器弹性伸缩或迁移应用流量分析资源利用率估算性能模型构建动态资源调度负载模型容器动态资源调度Kubernete

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论