博睿数据2024IT运维最佳实践白皮书_第1页
博睿数据2024IT运维最佳实践白皮书_第2页
博睿数据2024IT运维最佳实践白皮书_第3页
博睿数据2024IT运维最佳实践白皮书_第4页
博睿数据2024IT运维最佳实践白皮书_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

BACKGROUND改变传统的运维模式,化被动为主动业务日志分析能力欠缺,风险防范意识不足,且缺少治理动作监控覆盖度不全,出现故业务日志分析能力欠缺,风险防范意识不足,且缺少治理动作报警平台、信息过多,有价值的报警信息容易被淹没且分散机器资源一直在申请,从未被回收,浪费严重根因定位不准确,业务调用链不清晰,机器资源一直在申请,从未被回收,浪费严重SOLUTION系统运作过程中,风险虽然不影响用户体验,但多个风险累积容易发生平台打不开、数据丢失等故障问题。为了提前发现风险将故障扼杀在摇篮中,运维团队不断完善BonreeONE的指标体系建设,AI风险检测更加准确。在日常运行中,当系统检测到有一个多活程序挂了,运维人员便能立刻发现去解决;CPU过高时,系统发出告警,负责人员便能及时打堆栈,并联系研发部门分析原因,在风险累积衍生成故障之前解决问题,降低故障发生率。BonreePilot的自动巡检和即时巡检功能利用自动巡检与即时巡检功能,对BonreeONE全套组件以及核心指标实施全面健康监测,涵盖主机监控、服务监控、运营分析、告警管理、业务监控等多个关键模块。当巡检报告中出现了告警和问题,例如磁盘容量告急:过去的被动运维:磁盘容量告急,立马缩减/扩容现在的主动运维:磁盘容量告急,先看表详情,观察这些表的增长趋势是否合理,表结构设计是否合理,是否存在优化空间,将空间释放、不合理设计优化后再采取对应的解决措施进行缩减/扩容,对运维成本进行主动管控。集成能力将Zabbix、Prometheus等监控方式通过集成功能,实现一体化存储,用全栈根因分析,统一告警,运维人员无需监控每一运维团队抢先体验了BonreeONE3.0的新功能:可用性监测。可用性监测支持HTTP多地址访问,释放了运维人员写脚本的工作量。同时能够自定义内外网监测点,以前对公网域名监控时需要给Zabbix机器增加外网访问的能力,因Zabbix机器有访问所有机器的权限,具备外网能力后,这显然不符合安全规定。可用性监测功能够同时使用内网和外网的监测点,很好地解决了这个问题。新功能弥补了开源工具对HTTP监控的缺失,也降低运维人员对shell脚本开发能力的依赖。3.AI智能观测,快速定位根因问题与影响范围全域分析将数据统一集成到BonreeONE后,运维团队以实体关系为核心构建数据指标体系,平台统一对数据进行分析、关联、查看过去查看日志需要上机器,且日志需符合等保3级对日志审计系统的要求,系统日志、安全日志、关键配置等均要能够保存和分析,现在在平台上便能立即查看相关日志信息,打破运维传统的流程惯例。接入Zabbix、Prometheus等第三方数据后,运维人员能够通过查看依赖分析影响范围,很直观地看出当前程序访问了哪些服务,以及哪些服务访问了当前程序。调用链分析能够在问题出现时帮助运维团队定位到Server领域或者慢方法,定位更准确,节约时间。发现风险报警问题后,打开问题详情,通过详情清单查看本次故障所涉及到的实体信息。根据系统提供的初步判断查看具体的方法、SQL等通过使用BonreeONE,运维团队的工作模式实现了从被动应对问题向主动治理风险的根本性转变。主动运维策略将风险与问题前置,团队能够提前识别并解决风险,显著提升系统稳定性的同时极大地减轻了运维人员的工作负担。同时,风险与问题前置也为运维人员争取了充裕的时间,能够在问题出现前对系统进行深入的观察和分析,及时进行必要的调整优化,这不仅提升了运维效率,还实现

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论