版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、技术创新,变革未来基于APM的智能运维体系的实践目录业界智能运维发展现状及趋势智能运维体系建设方法论大规模实时监控平台的实践方案智能故障定位与处理实践APM 在京东物流的落地实践智能运维(AIOps)落地规划业界智能运维发展趋势新的问题1234正在消失的运维运维从业者减少,运维专家匮乏运维平台日趋复杂,缺乏统一规划公司内部监控/运维系统繁多,形成数据孤岛网络拓扑日益复杂,资源云化,虚拟资 源频繁弹性伸缩。不可靠的CMDB运维人数不变,管理机器数翻倍过去1:n 现在1:10越来越复杂的应用拓扑消息服务器发消息应用E收消息应用D收消息收消息数据库分布式 缓存JDBCJDBC读缓存分布式 文件系统写
2、缓存存取应用A开放平台API 请求无线客户端请求前端网页 请求应用B应用C服务调用服务调用应用F应用G服务调用服务调用应用H服务调用服务调用服务调用数据库应用AJDBC前端网页 请求系统问题定位难快速发展的APMAPM (应用性能管理)市场规模逐年递增01020304050607020142015201620172018APM市场规模(亿美元)目前,全球APM市场规模大约在60亿美元左右,预 计在五年内达到90亿美元APM成为ITOM成长最快的领域APM能够对企业的关键业务应用进行监测、诊断分 析、优化,最终能够提高应用的可靠性和质量,保证 良好的用户体验,降低IT成本运维角色转变背锅侠救火员
3、被动响应主动求变需求提炼产品化开发产品化落地产品意识推广落地业务数据分析过程改进技术运营事件处理业务分析业务预测业务增值架构标准化架构实施架构优化架构运维运维价值凸显 新运维时代来临目录业界智能运维发展现状及趋势分 析智能运维体系建设方法论大规模实时监控平台的实践方案智能故障定位与处理实践APM 在京东物流的落地实践智能运维(AIOps)落地规划智能运维体系建设方法论统一规划、避免重复建设标准化是前提产品化设计、产品化开发服务驱动运维中台业务增值过程改进智能运维体系建设方法论闭环生命周期管理流程管理审计归档目录业界智能运维发展现状及趋势智能运维体系建设方法论大规模实时监控平台的实践方案智能故障
4、定位与处理实践APM 在京东物流的落地实践智能运维(AIOps)落地规划大规模实时监控平台V1.0大规模监控平台架构大规模实时监控平台V1.0多维度使用率分析助力企业降本增效多级部门、应用多维度统计日报、周报、同比、环比统计低资源使用率TOP统计低负载应用榜单低资源使用率应用优化建议使用率报表大规模实时监控平台V2.0整合多端数据,解决数据孤岛问题性能分析、告警分析更加准确更全面评估应用健康状况大规模实时监控平台V2.0整合各种应用维度的指标分析,提供更全面的应用数据分析和故障诊断系统指标调用链指标日志分析数据库指标JVM指标应用拓扑自动探测应用健康报告大规模实时监控平台V2.0日志处理架构大
5、规模实时监控平台V3.0产品规划大规模实时监控平台V3.0预测分类:故障预测、容量预测、性能预测预测算法:LSTM、多元线性回归、决策树、随机森林、神经网络、朴素贝叶斯分类、最小二乘 法、支持向量机 重点关注:算法匹配度评分Kpi自动分类并匹配预测算法日历适配、基于节假日的机器学习算法 基于业务关联关系的预测算法预测大规模实时监控平台V3.0红绿灯大屏可视化目录业界智能运维发展现状及趋势智能运维体系建设方法论大规模实时监控平台的实践方案智能故障定位与处理实践APM 在京东物流的落地实践智能运维(AIOps)落地规划智能故障处理传 统 故 障 处 理被动故障处理:事后处理:出先故障后开始处理,易
6、造成业务中断;人工处理:基于工作流的故障上报和处理,层层通知手工定位故障原因,故障修复时间长;无计划性:多为突发情况,进行临时处理,难免有疏漏之处;报警爆炸:随着业务增长,报警越来越多,运维人员不堪其扰主动故障处理:事前感知:通过故障预测算法,预测故障类型及发生时间,并提前通知项目负责人;自动处理:决策引擎根据预设的事件处理策略,自动执行处理指令以及基于机器学习的自动故障处理;定时巡检:平台化的定时巡检机制,给出应用健康报告,问题早发现早解决;报警收敛:对告警做告警筛选、过滤、合并操作,大大减少报警数量;故障快照出现告警自动抓取现场快照信息快照信息持久化保存根据自学习的知识库提供异常原因分析集
7、成Arthas诊断工具,快速诊断问题根因分析基于双向过滤的告警通知恢复轻度中度严重过滤通知处理引擎过滤高级通知策略方法告警日志告警资产资产资产邮件 短信咚咚 微信调用链告警业务告警业务告警每周自定义每天每月时间规则为保证告警信息能够及时准确的传达给系 统管理员,监控模块需要实现灵活的告警通 知策略双重过滤的通知方式:资源和通知联系人 分别应用通知策略,实现对通知的双重安全 过滤目录业界智能运维发展现状及趋势智能运维体系建设方法论大规模实时监控平台的实践方案智能故障定位与处理实践APM 在京东物流的落地实践智能运维(AIOps)落地规划业界分布式跟踪系统Google:Dapper Naver:P
8、inpoint Twitter:Zipkin 点评:Cat阿里:EagleEye京东:JTrace、JD-Hydra(已废弃)、Callgraph、SGM新浪:Watchman 美团:MTrace又拍云:Tail其他: OpenTracing、 SkyWalking服务厂商:Compuware、iMaster、博睿Bonree、听云、New Relic、云智慧、 OneAPM、AppDyn、Amics京东物流Jtrace分布式跟踪系统延展性应用级透明低消耗智能分析定义了四个具体的设计目标JTrace数据结构核心数据结构由Span, Trace, 和 TraceId组成:Trace: 多个Spa
9、n的集合;Span: RPC跟踪的基本单元;SpanEvent:内部方法调用基本单元TraceId:TransactionId (TxId) : 全局唯一消息的IDSpanIdParentSpanId (pSpanId)Jtrace应用示例架构设计七大能力 :分布式事务跟踪,跟踪分布式应用消息自动检测应用拓扑,帮你搞清楚应用的架构水平扩展支持大规模服务器集群提供代码级别的可见性以便轻松定位失败点和瓶颈使用字节码增强技术,添加新功能无需改动代码集成SQLAdvisor智能化采样率字节码增强技术JavaAgent:java -javaagent:myagent.jar=mode=test Test
10、功能:可以在加载class文件之前做拦截,对字节码做修改可以在运行期对已加载类的字节码做变更,但是这种情况下会有很多的限制。还有其他一些小众的功能获取所有已经加载过的类获取所有已经初始化过的类(执行过clinit方法,是上面的一个子集)获取某个对象的大小将某个jar加入到bootstrap classpath里作为高优先级被bootstrapClassloader加载将某个jar加入到classpath里供AppClassloard去加载设置某些native方法的前缀,主要在查找native方法的时候做规则匹配java字节码框架kernelpluginpluginpluginpluginAge
11、nt内部是采用微内核+插件的方式微内核:封装了通过ASM或Javassist字节码框架对类进行增强插件:插件中指定要增强的类和方法以及增强内容优点缺点手工埋点要求更少开发资源API可以更简单并最终减少bug的数量开发人员必须修改代码跟踪级别低自动埋点开发人员不需要修改代码可以收集到更多精确的数据因 为有字节码中的更多信息开发难开发人员要求高增加bug发生的可能性字节码增强的价值隐藏API一旦API被暴露给开发人员使用,我们作为API的提供者,就不能随意的修改API。这样的限制 会给我们增加压力。而使用字节码增强技术,我们就不必担心暴露跟踪API而可以持续改进设计,不用考虑依赖关 系。容易启用或者禁用使用字节码增强的缺点是当JTrace自身类库的采样代码出现问题时可能影响应用。不过,可以通过 启用或者禁用JTrace来解决问题,很简单,因为不需要修改代码。-javaagent:$AGENT_PATH/pinpoint-bootstrap-$VERSION.jar-Dpinpoint.applicationName=APM性能优化使用二进制格式(thrift协议)使用变长编码和格式优化数据记录(thriftCompactProtocol)用常量表替换重复的API信息,SQL语句和字符串处理大量请求的采样使用异步数据传输来
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度床上三件套儿童房配套合同4篇
- 2025年度二零二五年度美发店品牌形象改造与升级合同4篇
- 深圳2025年度房屋租赁合同签订与凭证办理指南2篇
- 三方个人融资借款合同范本(2024年版)版B版
- 2025年度个人户外装备分期购买合同4篇
- 二零二五年农业科技创新化肥农药种子采购合同3篇
- 2025年度纯净水瓶装水企业内部管理与人才培养合同3篇
- 桶装水生产成本控制合同(二零二五年版)2篇
- 二零二五年度货物运输合同风险管理细则2篇
- 2025年度出租车公司高级司机招聘专项合同4篇
- 《色彩基础》课程标准
- 人力资源 -人效评估指导手册
- 大疆80分钟在线测评题
- 2023年成都市青白江区村(社区)“两委”后备人才考试真题
- 2024中考复习必背初中英语单词词汇表(苏教译林版)
- 《现代根管治疗术》课件
- 肩袖损伤的护理查房课件
- 2023届北京市顺义区高三二模数学试卷
- 公司差旅费报销单
- 2021年上海市杨浦区初三一模语文试卷及参考答案(精校word打印版)
- 八年级上册英语完形填空、阅读理解100题含参考答案
评论
0/150
提交评论