IT事件管理流程v5.01-ch_第1页
IT事件管理流程v5.01-ch_第2页
IT事件管理流程v5.01-ch_第3页
IT事件管理流程v5.01-ch_第4页
IT事件管理流程v5.01-ch_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

文件名称文档密级:DATE\@"yyyy-MM-dd"2010-08-12华为机密,未经许可不得扩散第页流程名称IT运维事件管理流程V5.01版本V5.01生效日期即为批准日期文件编码BR&IT/OM/IT.IM/P01流程架构L1BR&IT拟制人陈冬香L2运作/维护审核人陈风L3事件管理批准人胡泽新L4适用范围全球标准角色IM概述本流程旨在规范管理IT事件处理,确保所有事件按照规范尽快解决,维持承诺的服务水平。本流程适用于IT生产环境发生的所有IT事件,包括试运行期间的IT事件。目的尽快恢复正常的IT服务,将对业务系统产生的负面影响减到最少。术语名称定义事件(Incident)在某一服务中不属于标准操作的、并能导致或可能导致这个服务的中断或下降的任何事件(Event)。事件不仅包括与软硬件有关的错误,还包括服务请求。服务请求用户想要获得支持、递送、信息、建议或文档的请求,它并不属于IT基础设施方面的故障。问题可能或已经导致一个或多个事件的潜在、未知的故障原因业务范围流程起点事件发生流程终点事件关闭并完成事件分析输入用户或监控发现服务中断或下降的任何事件(Event)和用户提交的服务请求输出事件管理月报流程绩效指标指标名称指标定义计算公式事件及时处理率接收事件后,根据提交事件的渠道在规定的时间内给予处理,并已向用户反馈了事件处理状态和计划的事件占总接收事件数的百分率及时处理事件数之和/接收事件总数×100%事件及时解决率在接收用户事件后,按事件的级别在规定的时间内给予解决的事件占总接收事件数的百分率。其中,1级和2级事件的及时解决率权重为0.4,3级事件及时解决率权重为0.6,4级事件不计入。(及时解决的1级、2级事件数之和)/(接收的1级、2级事件数之和)×40%+(及时解决的3级事件数之和)/(接收的3级事件数之和)×60%流程总体要求当发生IT运维事件时,除了按照本文要求的活动进行管理外,同时,还要按《IT运维事件升级通报管理规定》要求,进行升级通报。流程中的角色及其职责角色职责IM管理事件流程日常操作,按照《IT运维事件升级通报管理规定》负责IT运维升级通报事件提出人用户通过IT求助渠道解决工作中遇到的IT困难或疑问监控集中监控全球机房设施、网络、系统(软硬件)、应用,及时发现异常并登记、诊断、分类、传递事件;负责现场巡检、健康检查,发现异常并登记事件。SuperUser负责IT应用使用咨询和操作类事件的解答。及时将无法解决的事件传递给IT热线或现场支持。配合其他IT技术支持现场处理应用事件。编写典型IT应用操作类事件案例并组织培训、宣传。

一线支持工程师IT热线作为用户接口,受理用户通过热线电话、邮件、IT服务平台等方式提交的IT事件;负责解决客户端、应用类事件。根据案例或相关操作指导书,对用户事件进行初步诊断、分析,提供解决方案。对于不能解决的事件,传递给其他相关技术支持;承担IM(IncidentManager)职责,端到端跟踪所有事件的处理和解决。遵照《IT运维事件升级通报管理规定》进行1级/2级IT运维事件的升级通报工作,推动重大事件及时解决;负责IT系统故障公告的拟制和发布,组织与受事件影响相关用户的沟通;及时总结,形成案例;通过定期的用户宣传和IT基础技能培训,提升用户的IT自助能力;定期进行事件统计分析,推动将重复发生的事件纳入问题管理流程。例行支持根据操作指导或案例,对机房设施、网络、系统(软硬件)、应用的IT事件进行例行化处理,不能解决的事件及时传递给其他技术支持;对机房设施、网络设备、系统(软硬件)及线路故障按操作指导向供应商报障并跟踪;及时填写所解决的一二级事件故障报告;及时总结,形成案例;定期进行事件和监控告警信息统计分析,推动将重复发生的事件纳入问题管理流程。现场支持根据案例、操作指导或配合其他技术支持现场解决当地机房或用户的IT事件;现场协助供应商处理事件;当地机房及机房IT设施设备的现场管理;及时填写所解决的一二级事件故障报告;及时总结,形成案例。二线支持工程师负责接收一线支持工程师传递的事件或非例行化的事件,对事件做进一步诊断、分析及处理,并及时解决事件。对无法解决的事件及时传递给三线支持工程师进行处理;及时填写所解决的1、2级事件故障报告;负责将重复发生、根因不明或已知缺陷的事件,转入问题管理流程;协调、配合供应商对事件的处理,进行供应商绩效评价;通过案例和例行化、脚本化等手段,提升一线支持的事件解决能力。三线支持工程师对二线支持工程师所传递的IT事件进行定位、分析,提供解决方案并实施;IT生产环境BUG类事件的定位、分析、提供Workaround或彻底解决方案并实施;及时填写所解决的1、2级事件故障报告;将根因不明或已知缺陷的事件,转入问题管理流程;协调、配合供应商对事件的处理,进行供应商绩效评价;总结案例并向一、二线支持工程师进行技能转移。注:新系统试运行期间,项目组承担二线支持工程师、三线支持工程师职责;老系统优化项目试运行期间,二线支持工程师职责由SO和项目组共同承担,事件优先传递给SO的二线支持工程师。三线支持工程师职责由项目组承担。流程图流程说明活动编号活动名称活动内容角色输入输出001发现事件1、用户遇到IT困难或疑问时,可以选择以下方式解决:在W3IT服务频道查找解决方案自助解决,或向SuperUser求助。转002;或通过电话、E-MAIL、填写电子表单等方式与一线支持工程师联系,报告事件、描述错误信息或故障现象、时间/地点、受影响的应用程序或功能等。转004。2、监控人员根据监控系统的报警、机房巡检时发现的异常情况、健康检查时发现的异常情况、《IT运维事件举例》,确认是否为事件。若为事件,转004;如果不是则不做处理。事件提出人用户或监控发现服务中断或下降的任何事件(Event)和用户提交的服务请求事件记录002诊断事件了解事件状况,分析确定原因及影响、确定有无解决方案。对于能解决的事件,转003;对于不能解决的事件,指引用户向一线支持工程师求助。转001。SuperUser事件记录事件记录更新003提供/实施解决方案根据事件的原因及影响,向用户提供解决方案,或帮助用户在客户端实施解决方案,流程结束。SuperUser事件记录事件记录更新004记录事件打开事件管理平台填写记录单,内容包括:用户信息(如:姓名、工号、部门、办公地点等)和事件类别、事件描述等。一线支持工程师用户或监控发现服务中断或下降的任何事件(Event)和用户提交的服务请求事件记录005诊断事件1、按《IT运维事件升级通报管理规定》的事件级别定义、事件及时处理时间要求,参考《IT运维事件举例》确定事件级别;进行初步诊断、分析原因、设置事件类别、分析能否解决。能解决时,转006;不能解决时,根据CMDB库中的技术支持名单,传递给正确的二线支持工程师处理,转008。2、同时,IM应根据《IT运维事件升级通报管理规定》进行事件跟踪、升级通报。按《IT故障公告管理规定》发布公告信息。转019。注:传递事件时,传递人必须确认被传递人有效接收传递信息。确认方式包括但不限于:短信、邮件、电话等。一线支持工程师事件记录事件记录更新006提供解决方案根据事件的原因及其影响,根据案例或操作指导,确定解决方案。解决方案需要用户在客户端处理时,通过电话或者邮件为用户提供解决方案。需要用户提交电子流的事件,如IT账号申请,指导用户提交服务请求到IT服务申请平台。解决方案需要在系统上操作时,一线支持工程师实施解决方案。需要修改系统配置时,要提交变更申请,触发变更流程。一线支持工程师事件记录事件记录更新007实施解决方案实施已确定的解决方案,实施后转016一线支持工程师事件记录事件记录更新008接收事件接收一线支持工程师传递的事件,确定事件传递的有效性,按《IT运维事件升级通报管理规定》中的事件及时处理时间要求,尽快处理。注:如果事件传递不正确,要尽快转给正确的人处理。传递事件时,传递人必须确认被传递人有效接收传递信息。确认方式包括但不限于:短信、邮件、电话等。二线支持工程师事件记录事件记录更新009诊断事件按《IT运维事件升级通报管理规定》中的事件及时解决时间要求,了解事件记录中描述的事件状况和事件特征,核实事件的严重等级,了解事件目前状态,确定大概的原因、确定可能的解决方案。能解决时,转010;不能解决时,根据CMDB库中的技术支持名单,传递给正确的三线支持工程师处理,转012。注:传递事件时,传递人必须确认被传递人有效接收传递信息。确认方式包括但不限于:短信、邮件、电话等。二线支持工程师事件记录事件记录更新010提供解决方案根据事件的原因及其影响,确定对其他用户影响最小的恢复程序或解决方案。解决方案需要用户在客户端处理时,通过电话或者邮件为用户提供解决方案。解决方案需要在系统上操作时,二线支持工程师实施解决方案。需要修改系统配置时,要提交变更申请,触发变更流程。二线支持工程师事件记录事件记录更新011实施解决方案实施已确定的解决方案,实施后转016二线支持工程师事件记录事件记录更新012接收事件接收二线支持工程师传递的事件,确定事件传递的有效性,按《IT运维事件升级通报管理规定》中的事件及时处理时间要求,尽快处理。注:如果事件传递不正确,要尽快转给正确的人处理。传递事件时,传递人必须确认被传递人有效接收传递信息。确认方式包括但不限于:短信、邮件、电话等。三线支持工程师事件记录事件记录更新013诊断事件按《IT运维事件升级通报管理规定》中的事件及时解决时间要求,了解事件记录中描述的事件状况和事件特征,核实事件的严重等级;了解事件目前状态,确定大概的原因、确定可能的解决方案。三线支持工程师事件记录事件记录更新014提供解决方案根据事件的原因及其影响,确定对其他用户影响最小的恢复程序或解决方案。解决方案需要用户在客户端处理时,通过电话或者邮件为用户提供解决方案。解决方案需要在系统上操作时,三线支持工程师实施解决方案。需要修改系统配置时,要提交变更申请,触发变更流程。注:对于待计划解决的事件,解决方案为三线支持工程师需要提供解决计划。三线支持工程师事件记录事件记录更新015实施解决方案实施已确定的解决方案,实施后转016三线支持工程师事件记录事件记录更新016验证解决方案确认解决方案的有效性。如果事件得到解决,转017;如果事件不能解决,按提供解决方案的责任人,分别转回给相关的责任人,即:一线支持工程师提供解决方案时,转005二线支持工程师提供解决方案时,转009三线支持工程师提供解决方案时,转013事件提出人事件记录解决方案的验证结果017关闭事件把完整的调查结果和处理过程,包括联系用户及采取行动的时间和日期,解决方案更新到事件记录中去,关闭事件。对于1级/2级事件,转018。对于3级/4级事件,如果是原因不明且重复出现的事件时,需要提交问题申请,触发《IT问题管理流程》,流程结束。注:若连续三天仍联系不上用户时,默认为事件已解决,事件将自动关闭。一线支持工程师解决方案的验证结果事件记录更新018提交故障报告事件处理责任人到“事件跟踪管理平台”数据库提交故障报告或者故障原因,流程结束。一线二线三线支持工程师1级/2级事件事件记录事件故障报告019升级通报,发布故障公告根据《IT运维事件升级通报管理规定》和《IT故障公告管理规定》要求,跟踪事件处理进展,进行升级通报,发布故障公告。本活动为流程KCP1,控制要素如下,其遵从性测试计划见支持文件:1、根据事件描述检查一二级事件是否登记为三四级,对于登记的一二级事件降为三四级是否在ITSM中有产品经理和事件流程经理审核通过记录。2、在以下关键时间点是否按规范通报:二级事件10分钟内打电话联系事件处理人;一级事件20分钟内发布故障公告;一级事件持续1小时前后10分钟内向BP&IT总裁发送事件进展短信。IM1级/2级事件事件记录事件通报记录支持文件序号文件名称文件编码01事件管理流程业务场景操作指导BR&IT/OM/IT.IM/M01/P01/W0102IT运维事件升级通报管理规定BR&IT/OM/IT.IM/M01/P01/R0103IT故障报告管理规定BR&IT/OM/IT.IM/M01/P01/R0204IT故障公告管理规定BR&IT/OM/IT.IM/M01/P01/R0305事件管理流程KCP遵从性测试计划BR&IT/OM/IT.IM/P01/R05相关流程及接口上层文件IT全球技术支持体系框架前端流程转产管理流程(IN:转产项目后产生的事件)告警管理流程(IN:告警发现的事件)变更管理流程(IN:变更实施引发的事件)备份/恢复管理流程(IN:备份、恢复中出现的事件)配置管理流程(IN:配置不准确引发的事件)帐号权限管理(IN:帐号权限申请引发的事件)服务等级管理(IN:事件服务水平指标)后端流程问题管理流程(OUT:所有1、2级事件、重复发生的3、4级事件生成问题)变更管理流程(OUT:需要通过变更解决的事件)可用性管理流程(OUT:事件的故障时间)IT服务持续性管理流程(OUT:事件升级为灾难)帐号权限管理(OUT:因解决事件需要申请帐号权限)服务等级管理(OUT:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论