典型智能运维场景说明、场景能力解析示例_第1页
典型智能运维场景说明、场景能力解析示例_第2页
典型智能运维场景说明、场景能力解析示例_第3页
典型智能运维场景说明、场景能力解析示例_第4页
典型智能运维场景说明、场景能力解析示例_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

在智能运维场景实现过程中,应从实际出发,立足当前运维痛点,从场景切入,由点到面进行智能运维体系建设,并通过设立评价指标对实施效果进行测量,确保已建场景满足既定运维目标并有效体现智能特征。智能运维场景按照复杂度及实施路径可分为单一场景具备个别智能特征的简单运维场景,混合场景是将多个单一场景融合形成的智能运维场景。本附录表A.1典型智能运维场景说明(第1页/共4页)目标在事前、事中、事后的各方面,有效提高运维服务对象的运行稳单一常拨测该场景通过HTTP请求、TCP/IP请求、应用系统API请求等不同形式,对应响应结果发现异常并告警应用系统异常拨测率=拨测发现异常对象数/总异常对象数该场景通过自动化方式对系统、中间行启停、切换等便捷操作自执行该场景通过设定正则表达式等规则,合并为一个告警告警聚合率=1-聚合后告警数/总告故障自愈该场景通过实时海量数据处理、非结式,对故障场景特征精准识别,并自动调用预设的应急动作,实现业务的故障自愈率=自愈能感知、可决策、会诊断、自交易量、成功率、耗时、系统性能、日志等数据,利用机器学习训练历史数据运行模型,实时检测运行数据,态有效告警数/总告(应告警数-有效告警数)/应告警自适应、自学习、能感知、会析间依赖关系和配置数据,实现快速准故障影响分析准确率=影响范围分析正确的故障数量/异常根因定位该场景通过排障决策树、对象关联图异常根因定位准确率=准确推荐根因因故障数;率=准确推荐根因能感知、可决学习、自适应、表A.1典型智能运维场景说明(第2页/共4页)目标在事前、事中、事后的各方面,有效提高运维服务对象的运行稳定性和可故障预测领域的故障模型,提取故障特征,归行趋势的动态预测=准确预测数/总预测数自学习、会诊断该场景通过自动收集运维对象信息,如性能数据、状态数据、技术数据和日志数据等,利用同类运维对象的横向比较、历史数据分布比较、最佳实运维对象数/总能感知、会描施、应用(资源)方面,有务对象的运行和管单一负载统一调度、集中管理、实时计算,实现网络数据的快速转发、高效传输,并根据网络质量智能选路、业务路径调优,充分利用网络资源,降低使用网络堵塞年度减度发生数流程自动化单流程,以更快的速度、更高的准确率实现运维工单自动化填写等操作,有效代替人工并降低成本自动化工单流程的数量/运维工自执行资源弹性控,根据资源使用情况进行动态伸资源,避免资源的浪费,如数据库扩容、私有云的动态伸缩、文件系统、内存、CPU等动态扩容或收缩等资源调整自动化资源次数/总调整资源次数能感知、自学习、可决策、自性能预测CPU、I/0、内存、日志信息等应用系行成本测准确率=准确预测数/总预测数能感知、自学习、可决策、自各运维行为的时效性和准确性单一日常巡检自动化备端口状态、流量等进行自动巡检,并形成符合要求的巡检报告日常巡检自动化务数/总巡检任务数自执行表A.1典型智能运维场景说明(第3页/共4页)目标效维行为的时效单一化信息、环境参数,备份业务数据,日志信息进行检查,以确认软件分软件分发配置自动化率=自动化数量/运维对象自执行检检结果,提升工作效率机器人巡检准确率=正确巡检隐患数量/实际隐患数量;化率=机器完成的巡检任务数/需完成的总任务数能感知、会诊断、可决策、自用该场景通过文本识别、图像识别、等条目数/知识总条目数能感知、会描决策该场景通过利用自动化脚本、自动量重复、复杂的作业进行智能化编排,实现作业时间短、质量高、资源利用均衡等目标,降低运维人员压力,提升运维服务效能确率=完成作业正确数/作业执能感知、可决策、会诊断、自执行、自适应、自学习安和运维对象的性单一测威胁IP检测准确率=识别出真实威胁IP数量/识量自执行漏洞检测该场景通过定期对运维对象进行漏=正确检测漏洞数量/实际漏洞自执行访问控制审核该场景是在开通网络访问策略时,自动校验高危端口,实现网络访问策略的严格管控确率=正确审核高危需求数量/能感知数据中心人员出入和行为活动的全过程跟踪、记录、数据中心人员出入管控准确率=准确发现异常行为数/总发现异能感知、自学决策、自执行、自适应目标服务和运维对象的安全性和网络安全态势感知该场景利用大数据分析、数据挖掘、特征提取和态势预测等技术,获取和素信息,评估网络安全的状况,预测其未来发展趋势网络安全态势感知覆盖率=已感知网络资产数/实际存在网络资产;网络安全态势感知安全攻击数/总感知安全攻击网络安全态势感知自动化率=自动总处置安全事件数能感知、会描诊断、可决策、自执行、自适应场景能力解析示例给出了一个智能日志异常诊断实践落地的场景,明确了该场景的建设目标,识别了该场景的活动及活动需要具备表B.1场景能力解析示例(第1页/共5页)目标活动征能力域能力项能力要素人员资源知识智能日志异常诊断:自型日志,自动提取各日志模板,建并进行告的同时,也效率提升成本降低能感知、自能力域发团队与日志产生方就日志异常诊断场景数据案和计划,动日志接收主要通过采集平台的日志实现,主动采集可使用Fluentd等主流技术,的实时性、有效性、可靠性和安全性等要求;c)针对日志数据采集节点,使用相关技术监控日志采集延误和丢失的情况求,明确采集方行、审建立日志标,如日志源端采集资源消障率、人工工作采集动作的相关配置策略,集配置模版,日志源端资源响正常的业务监控日志时间略,及时发现日志采集延误节点数量、日志类型、网络安全分区分布,配力和网络资型的日志数据采用不同的数据采集规范,包括(接收/主/定期)、采集级别(全量/采目标活动征能力域能力项能力要素人员资源知识智能日志异常诊断:自型日志,自动提取各日志模板,建并进行告的同时,也效率提升成本降低能感知、自能力域储设计能力的成员制定不仅限于副足日志数据存储的高性能、高吞吐率和大容量b)对日志数据进行分级分类处理,包括原始日志、解析后日志、日志模板等类型,并根据日志类型特征、访问性能进行分级存储;满足数据高可用要求,定义并实施日存储需求、制定存储规范、条件及标准、实施、检查、果取速率等,以根据不同日志类型的压写性能需同的算法,如PPMD、存储的规模、性能和高可用当的资源,包存储等a)日志保存策略。包括不同数据存储类冷热温数据存储方案、数据清理策略术方案、目标活动智能能力域能力项能力要素人员资源知识智能日志异常诊断:自型日志,自动提取各日志模板,建并进行告的同时,也效率提升成本降低自学习、会决策能力域研发团队特征工程等相关背景知识和研发能力的成员制板提取方案,至少应包含日志解析、特征颗粒度定义和特征抽取日志模板的日志数据,日志需先进行日志则可直接提取场景,利用NLP等技术将无结构化日志转化成结构的日志明细数不同的日志类型自动选择不同算法,产生多个日志模板;b)系统持续跟踪日志的变化情况,结果进行识别、命周期管理各种日志模版的原如日志类别、模板模板生成速度、模成的各明细日志模板,包括征,日志内参数的变量分布等a)针对日志类型的运维数据,使用日志模板提取FT-行结构化转换;的指标类型运维征提取、使用等算法进行趋势等根据日志的规模和分析日志的实时置适当的大数据计算集群频使用的日志建立日志要求等;识别、判断、优化和目标活动征能力域能力项能力要素人员资源知识智能日志异常诊断:自型日志,自动提取各日志模板,建并进行告的同时,也效率提升成本降低自学习、会诊断决策能力域决策团队安排具备能力的成员承常检测模型的设计与研发、用等工作模日志分类模型训练框架技b)考虑采用日志多维定位和关联分析技术板建立运行动围等),并持续在线训练;间段建立日志续在线训练;日志模板和单位时间段内日志模板占比是否偏离动态基线基线数漏报率、误报率、及时率等出现的频次变化并使用时序异常检测进行b)利用JS散度、对模板中关键变量的分布做检测:对模板出现的顺序规律进行的语义进行分根据日志的日志的实时群略:总结归纳不同日志告警策略,包括基线敏感度、异常频次告警规则、稀有日志告警策略b)算法应用指南:为不同日志类型和场景标识有效的日志异南:总结归纳不同日志能力边界场目标活动智能能力域能力项能力要素人员资源知识智能日志异常诊断:自型日志,自动提取各日志模板,建并进行告的同时,也自学习、可决策决策能力域景研发团队安排具备能力的警使用方就日志数据告警可视化制定方案达成一致图表、仪表盘、大屏等可视化组件的快速创建;b)建立日志数据访问权限框架,实现日志数据可视化视图的展示和访问控c)采用统计图形学、展示或交互处理;染技术,提高实时动态日志数据和告据告警可视化的目标与选择可视化技术,开发和调用可视化组件,并对可视化结果进行识别、分析、的组件将海量日志数据告警相关数据以图标形式呈现出维人员分析a)具备日志数据告警展示过程中的展示布局模板等状态数日志数据告警可视化有效性的指标整度、页面刷新率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论