




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
故障管理的学习课件第1页/共22页5.1什么是故障管理5.1.1基本概念概念:故障管理是指在系统出现异常情况下的管理操作,简单的说就是找出故障的位置并进行恢复。目标:自动监测、记录网络故障并通知用户,以便网络有效地运行。网络的故障管理包括故障检测、隔离和纠正三方面。故障
检测隔离纠正网络的故障管理
维护并检查错误日志;接受错误检测报告并作出响应;跟踪、辨认错误;执行诊断测试;纠正错误。第2页/共22页5.1什么是故障管理5.1.2故障管理与ITIL的关系故
障
管
理ITIL服务支持帮助台事故管理问题管理借鉴负责管理和协调客户和用户的服务请求负责协调各支持小组和第三方供应商来解决事故和问题故障管理与ITIL的关系第3页/共22页5.1什么是故障管理5.1.2故障管理与ITIL的关系问题管理的主要目标是查明事故发生的潜在原因并找到解决此事故的方法或防止其再次发生的措施,而事故管理的主要目标是在事故发生后尽可能快的恢复服务,即使采取的是一些应急措施不是永久性的解决方案。事故管理强调速度,而问题管理强调质量,为了发现事故原因和防止事故再次发生,问题管理可能需要花费更多时间解决事故且可能推迟恢复服务。第4页/共22页5.1什么是故障管理5.1.3服务台HelpDesk帮助台是负责管理、协调并尽快解决IT服务运营与管理发生的以外事故的部门或平台。ServiceDesk服务台拓展了帮助台或呼叫中心的范围,通过提供一个全球集中的服务联络点促进了组织业务流程和服务管理基础架构的集成。第5页/共22页已解决的5.1什么是故障管理5.1.4事故管理事故管理负责记录、归类和安排专家处理事故并监督整个处理过程直至事故得到解决和终止。
“事故”指任何不符合标准操作且已经引起或可能引起服务中断和服务质量下降的时间。新出现的已派专家的已安排的已接受的正在处理的暂停的已终止的第6页/共22页5.1什么是故障管理5.1.5问题管理问题是存在于某个未知的潜在原因的一种情形。是问题经过诊断分析后找到事故产生的根本原因并制定出可能的解决方案时所处的状态。指负责解决IT服务运营和管理过程中遇到所有问题的流程。包括问题处理和问题控制两部分。在于减少由于IT基础架构的错误而导致的问题和将事故对业务产生的负面影响减少到最低,以及防止这些错误有关的事故再次发生。知名错误问题管理目标第7页/共22页5.2故障管理的重要性故障管理的主要优点及时解决事件,从而最小化业务影响;改善对支持资源的利用;更好地理解事件对SLA指标的影响,从而允许改进优先顺序;关于正在发生的事件的准确信息;消除“遗漏”的事件和服务请求;提高管理信息的可用性。第8页/共22页5.3故障管理的内容故障检测故障报警故障信息管理排错支持工具检索/分析
故障信息故障管理的内容第9页/共22页影响度、紧迫性和优先级关系图5.4故障管理的流程5.4.1影响度/紧迫性/优先级影响度紧迫性优先级
受影响的用户数受影响的系统数用户需求服务级别协议错误的严重性
……估计:人力、
资源和时间第10页/共22页5.4故障管理的流程5.4.2故障升级一线故障支持二线故障支持三线故障支持四线故障支持指帮助台和服务台;指管理部门;指软件开发人员和架构设计师;指第三供应商。是指当一线支持在规定时间内不能解决或没有解决某个故障时,便将其交给更有经验或权限的支持人员。故障支持第11页/共22页服务
请求
处理
流程检查和记录服务请求初步支持是否解决恢复服务终止故障管理调查分析是否解决恢复服务调查分析是否解决恢复服务继续调查分析继续调查分析一线支持二线支持三线支持N线支持否否否一线支持、二线支持、三线支持是第12页/共22页5.4故障管理的流程5.4.3故障管理流程1、故障检测和记录2、初步归类和支持3、故障调查和分析4、解决故障和恢复服务5、故障终止6、故障处理过程的跟踪和监督
故障管理流程第13页/共22页故障检测和记录初步归类和支持故障调查和分析解决故障和恢复服务终止进程服务请求负责
解决
故障并
跟踪、
监督、
控制和
协调
解决
过程故障知识库处理服务请求故障管理流程第14页/共22页用户故障查明和记录系统服务台其他IT部门服务台故障管理故障管理知识库创建新记录更新相记录故障编号记录基本分析信息补充其他相关信息故障严重初步归类和支持向上报告/告知用户基本信息否是相同故障否是第15页/共22页5.5故障管理知识库5.5.1知识要素知识要素主要包括:记录IT应用或网络出现的故障;
记录故障状况、引起的原因、关联问题、提交人等;提供一系列行之有效的解决方案;拥有负责人,便于维护和跟踪;隶属于一个或几个类别。便于查找和统计;拥有生命周期,当它不再具备服务作用或被更加有效的方法代替,应该及时“退休”。第16页/共22页5.5故障管理知识库5.5.2知识发布流程用户管理员审批人管理员提交分派审批发布知识发布流程第17页/共22页5.5故障管理知识库5.5.3知识库作用实现知识共享实现知识转化避免知识流失提高运维响应速度和质量挖掘、分析
IT应用信息知识库的作用第18页/共22页本章小结1.网络故障管理包括故障检测、隔离和纠正三方面。2.在故障管理的过程中,帮助台负责管理和协调客户和用户的服务请求,而事故和问题管理则负责协调各支持小组和第三方供应商来解决事故和问题。3.问题管理的主要目标是查明事故发生的潜在原因并找到解决此事故的方法或防止其再次发生的措施,而事故管理的主要目标是在事故发生后尽可能快的恢复服务,即使采取的是一些应急措施不是永久性的解决方案。事故管理强调速度,而问题管理强调质量,为了发现事故原因和防止事故再次发生,问题管理可能需要花费更多时间解决事故且可能推迟恢复服务。第19页/共22页本章小结4.故障管理的内容包括故障监测、故障报警、故障信息管理、排错支持工具和检索/分析故障信息。5.影响度是衡量故障影响业务大小程度的指标,通常相当于故障影响服务质量的程度,一般是根据受影响的人或系统的数量来确定的。6.紧迫性是评价故障危机程度的指标,是根据客户的业务需求和故障影响度而制定的。7.优先级是根据影响程度和紧急程度而制定的处理故障的先后顺序。第20页/共22页本章小结8.一般来说,对于不同情况下的故障,可以提供的支持可分为:一线故障支持,指帮助台和服务台;二线故障支持,指管理部门;三线故障支持,指软件开发人员和架构设计师;四线故障支持,指第三方供应商。9.在实际运用中,网络故障管理流程一般包括故障检测、故障隔离、故障修复和记录结果等几部分。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年-河南建筑安全员《B证》考试题库及答案
- 县团委笔试题目及答案
- 虚拟化平台的网络规划试题及答案
- 理解专利制度对地方经济的促进作用试题及答案
- 激光技术工程师证书考试有效策略试题及答案解析
- 缺陷管理在系统架构设计中的重要性试题及答案
- 西医临床案例评价试题及答案
- 系统管理师考题过程规范与总结
- 激光设备现代化管理试题及答案
- 系统架构设计师研究前沿技术试题及答案
- 绿色金融产品创新与风险管理-全面剖析
- 肝门部胆管癌诊断和治疗指南(2025版)解读
- 2025年广东广州市高三一模英语试卷试题及答案
- 山西省朔州市怀仁县2025届小学六年级第二学期小升初数学试卷含解析
- 东北三省三校2025届高三下学期第二次联合模拟考试物理试题及答案
- 2025年山东省济南市莱芜区中考一模地理试卷(原卷版+解析版)
- 2025陕西金融资产管理股份有限公司员工招聘(26人)笔试参考题库附带答案详解
- 2025年中国经纬仪行业市场调查研究及投资前景展望报告
- 杭州2025年浙江杭州余杭区余杭街道招聘编外劳务派遣人员25人笔试历年参考题库附带答案详解
- 2024-2025学年度四川省达州市达川区铭仁园学校高一第二学期3月月考历史试题(含答案)
- 2025年全球美容与美容个护趋势报告:中国篇
评论
0/150
提交评论