ITSM-事件管理流程设计说明书_第1页
ITSM-事件管理流程设计说明书_第2页
ITSM-事件管理流程设计说明书_第3页
ITSM-事件管理流程设计说明书_第4页
ITSM-事件管理流程设计说明书_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

事件管理流程设计说明书IT服务管理项目事件管理流程设计说明书

目录1 综述 61.1 文档简介 61.2 适用范围 61.3 相关术语 62 事件管理流程设计 82.1 流程目的 82.2 流程范围 82.3 流程主要内容 92.4 与其他流程的关系 92.5 流程指导方针 102.6 流程执行原则 112.6.1 常规原则 112.6.2 流程关联原则 112.6.3 所有权原则 122.6.4 再分派原则 122.6.5 重复事件原则 122.6.6 关闭原则 122.6.7 升级原则 132.7 流程相关定义 132.7.1 事件信息项 132.7.2 事件性质 152.7.3 事件来源 152.7.4 事件发生地点――需要进一步更新 152.7.5 事件优先级――需要进一步确认 152.7.6 事件所属系统类型――需要进一步确认 162.7.7 事件分类――需要进一步确认 182.7.8 事件响应时限和解决时限 212.7.9 事件状态 222.7.10 事件解决代码 232.7.11 事件关闭代码 232.7.12 满意度调查 232.8 流程概要设计 252.9 流程详细设计 272.9.1 (100.1)事件记录和分类 272.9.2 (100.2)初始支持 282.9.3 (100.3)二线尝试解决 292.9.4 (100.4)记录解决方案细节 302.9.5 (100.5)关闭事件 312.9.6 (100.6)事件处理的监控 322.9.7 (101)紧急事件处理子流程 332.10 事件状态迁移图 352.11 关键角色、职责定义 372.11.1 事件管理流程负责人 372.11.2 事件经理 382.11.3 帮助台 382.11.4 二线支持人员 392.11.5 流程角色和人员对应表――需要进一步确定 402.12 关键流程衡量指标 402.13 报表 412.13.1 事件综合统计报表 412.13.2 各组工程师工作量和工作效率统计报表 412.13.3 按业务系统和优先级分类统计报表 412.13.4 按业务系统统计处理效率指标报表 422.13.5 按事件分类的故障和优先级统计报表 432.13.6 业务中断时长的分类统计报表――优先级为“紧急”的 442.13.7 供应商工作量和工作效率统计报表 44综述文档简介本文档,事件管理流程设计说明书,是某某某(以下简称:某某某)ITSM项目小组和中国某某某有限公司(以下简称:中国某某某)共同制定的事件管理流程设计文档。通过制定该流程,可以帮助某某某更高效率地处理IT环境的突发事件,提高IT服务的质量,为企业业务的快速发展提供更优质的IT支持,并且可以为有效地实施其他相关ITSM管理流程,如问题管理奠定基础。适用范围本文档作为本次项目的事件管理流程详细设计的交付物,读者对象为与事件管理流程相关的所有技术与管理人员。相关术语ITIL(ITInfrastructureLibrary)是英国政府在1987年制定的有关IT服务管理的方法论,现已成为事实上的IT管理标准。帮助台(ServiceDesk)帮助台从根本上来说是提供了用户和IT部门的唯一接口。此项功能常通过集中方式提供服务。帮助台的根本目的是提供初始支持,并通过变通方法、解决方案或升级到一线、二线支持等手段帮助用户恢复到正常工作状态。事件管理(IncidentManagement)ITIL流程之一,事件管理负责解决所有的IT事件、问题和用户请求。它的目的是尽快恢复被中断或受到影响的IT服务,所以它的特点往往是以解决表征现象为目的,而不在于查找根本原因。问题管理(ProblemManagement)ITIL流程之一,问题管理负责解决重大紧急事件或具有相同症状的一组事件。它的目的是找出事件的根本原因,并通过解除该根本原因从而防止类似事件的再次发生。同时问题管理流程也负责预防事件的发生。配置管理(ConfigurationManagement)ITIL流程之一,配置管理负责描述,跟踪和汇报所有IT基础架构中的每一个设备或系统的管理流程。这些设备和系统被称为配置项(CI)。每一个CI必须有效管理,跟踪和控制以支持公司的IT服务和基础设施成功运行。配置管理数据库(CMDB-ConfigurationManagementDatabase)是在配置管理流程中用于记录企业所有IT相关配置项信息及其相互关系而建立的数据库。变更管理(ChangeManagement)ITIL流程之一,变更管理通过控制和管理IT相关的变更,使变更对生产环境可能的影响和风险降到最小,从而提高IT环境的整体稳定性。事件(Incident)是指会造成或可能造成服务中断或服务质量的下降,不属于IT服务标准操作的活动。问题(Problem)是导致一个或多个事件发生的未知根本原因。事件管理流程设计流程目的事件管理流程的主要功能是尽快解决出现的事件,保持关键业务系统的稳定性,其目的包括:在成本允许的范围内尽快恢复IT服务快速响应用户请求(通过电话)用户在线获得帮助沟通事件解决的状态和客户确认事件的解决进行事件控制按规范记录事件就事件的优先级,影响度进行分类分析,诊断,必要时进行升级监视并结束事件进行定期服务流程回顾提供IT管理信息人力资源利用情况故障处理情况支持效率流程范围某某某事件管理流程包括:某某某生产环境中产生的事件涉及的基础架构和业务系统包括:包括以下基础架构--主机、存储、网络、PC、终端、打印机。包括以下业务系统――核心系统、IPP系统、国业系统、信贷系统、渠道系统、数据中心、OA系统、财务系统、人力系统。某某某事件管理流程不包括:开发和测试环境中产生的事件流程主要内容事件管理流程始于事件的接收和报告,结束于事件的解决。该流程包含下述主要内容:事件接收和记录这个环节是事件管理流程的起点。所有用户或系统报告的IT事件必须由此步骤开始。此步骤的目的是在事件发生时快速准确地发现,以协助事件的诊断和解决并通知相关人员。在此步骤中将会收集创建事件记录所需的信息。该环节的关键是信息的准确性和完整性。分类和在线支持事件可以是一个故障/告警/咨询/服务请求,对于每个事件,需要确立优先级和分类。若没有现成的解决方案或临时解决措施,该事件将分配给合适的支持人员对此进行调查。该环节的关键是必要的问题库支持和正确的事件分派。调查和诊断若支持人员无法解决事件,可运用自身技能、问题库、诊断工具等进行更加深入的分析以找到恢复服务的临时措施,必要时可调用多名支持人员以寻求解决措施。解决和恢复支持人员实施事件的解决方案,书写解决方案,并将解决完毕的事件转回帮助台,由帮助台通知用户解决的结果,并得到用户的确认。结束事件当用户确认事件解决后,此时可结束该事件。优先级为紧急的事件(紧急事件)和事件升级对于紧急事件,帮助台应立即上报给事件经理,由事件经理决定紧急事件的处理方式,确保其得到最快速的解决。当事件处理超过预期时限,将自动通知处理人员和相应管理层,以引起相关人员和管理人员的重视和参与。与其他流程的关系和问题管理流程的关系事件管理流程将提供事件的详细、精确的记录信息给问题管理流程来定位问题及分析问题的趋势,以及在优先级为紧急的事件解决并恢复服务后做为问题进行进一步的分析和处理。和配置管理流程的关系需要从配置管理数据库中查询配置项的属性和配置项间的关联关系来定位故障和帮助快速的恢复。和变更管理流程的关系帮助台应了解变更管理流程中目前正在进行的变更信息,检测因变更而可能引发的事件。在事件的解决过程中,必要时需要发起变更请求来解决事件。和服务级别管理流程的关系事件管理流程中的优先级根据服务级别协议来确定,事件管理流程产生的故障中断时间等数据是服务级别管理的数据来源之一。流程指导方针事件管理流程遵循的指导方针是事件管理流程的基础和关键因素。下面是某某某的事件管理流程遵循的指导方针:指导方针1:事件管理流程中的帮助台是信息技术部向业务用户提供的单一联络点,包括接受查询。指导方针2:任何业务人员提交的事件不能绕过帮助台来解决,所有需解决的突发事件要通过帮助台向信息技术部提交。指导方针3:帮助台是事件的责任人,必须确保事件解决和质量管理得到有效跟踪与解决指导方针4:在优先级为紧急的事件的解决过程中,应及时通报事件的处理情况,使用户可以知道事件的解决状态。事件处理的进度和状况应由帮助台员工与用户进行沟通。指导方针5:对于优先级为紧急和高的事件,由事件经理负责和用户确认事件是否解决,并负责事件的关闭。对于其他优先级的事件,由帮助台设置专人负责和用户确认事件是否解决,并负责事件的关闭。指导方针6:定义和明确事件经理、事件管理流程负责人、帮助台、二线支持的角色和责任,使IT支持人员明确自己的角色和相关的责任,流程能够得到正确的执行,保证服务的质量,使IT人员变成服务人员流程执行原则常规原则所有某某某事件管理范围内发生的事件,都应该记录在服务管理平台中,记录的信息应足够详细,包括事件处理交互过程,详细的解决方案和相应的附件所有IT支持人员对优先级为紧急和高的事件所采取的服务恢复行动,在比对其它行动的时候,将拥有优先处理级别组长应该每周检查相关的事件记录,以确保事件记录的完整和合理。事件经理应该每月产生事件管理报表。对反复发生的事件和变通方法解决的事件,举行定期的事件管理会议对这些事件进行评估,决定是否发起问题单以从根本上解决某些事件事件流程负责人每半年对流程进行回顾,回顾内容包括流程关键衡量指标、流程执行效率和流程支持工具的有效性,以改进事件管理流程流程关联原则和问题管理的关联所有优先级为紧急的事件在恢复服务后,都应该创建问题单(问题单必须和事件单建立关联)对于根本原因未明、采用变通方法解决的事件,应该产生问题记录并建立关联,或者与现有的问题进行关联帮助台和二线支持在解决事件的过程中,可以通过问题记录查找相应的解决方案和变更管理的关联事件处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提交变更请求单(变更单必须和事件单建立关联――目前阶段需要手工填写OA变更单号),变更完成后,继续事件单的处理紧急事件(优先级为紧急的事件,下同)的处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提出紧急变更请求,变更完成后,补录紧急变更单,并和紧急事件单建立关联和配置管理的关联事件处理过程中,可以通过配置管理查询相关的配置项信息以及该配置项历史上发生的事件、问题或变更,来帮助故障的定位事件处理过程中,如果可以将故障定位到某个配置项,则必须将事件单与该配置项关联所有权原则所有权原则用来确保每个事件在任何时段都有适当的人员负责,帮助台和事件经理必须确保事件得到有效跟踪与解决,并负责事件单的关闭。再分派原则事件的再分派原则是确保事件在服务目标时段内处理和解决的重要因素。因此,应当尽量减少事件单再分派的几率。事件单可以分配到个人,或者分配到组(帮助台,二线支持),再由组内的支持人员处理。事件单的重分派次数不应该超过5次。二线支持可以将事件单重新分配给帮助台或其他二线支持人员。事件再分派时要求分派人员进行再分派原因的沟通。重复事件原则重复事件是指在一个较短时间段(通常30分钟内至1小时),由监控平台上报的同一个配置项上现象相同的事件;或者一人/多人报告的同一来源(系统、应用)现象相同的事件。当被报告的事件与某个已经创建且尚未解决的事件单相同,则该事件被认为是重复的。由于此时已创建的事件尚未解决,还没有采取修正措施来恢复服务,因此,新报告的事件被认为是原有事件单的重复事件单。在原有事件单获得解决时,所有的重复事件单获得解决。重复的事件信息必须被标识,并且不计入事件流程的关键衡量指标。由二线支持人员负责标识重复事件。关闭原则由最终用户申报的事件单,必须由事件经理或帮助台专人完成关闭。事件处理人员在解决完成事件时,根据实际解决情况填写事件解决代码。事件经理和帮助台专职人员负责和最终用户确认事件的关闭事件经理负责优先级为“紧急”或“高”事件向最终用户确认事件的关闭帮助台负责优先级为“中”或“低”故障类事件向最终用户确认事件的关闭由最终用户认可获得关闭的事件单的结束代码为“已完成”已解决的事件单如果没有得到最终用户的认可,则首先关闭该事件单,结束代码修改为“未完成”,同时创建一个新的事件单重新分配到原处理人员继续处理已关闭的事件单不允许重开。如果事件重复发生,则创建一个新的事件单对于已解决事件单,如果在在确认时如无法联系用户,由帮助台和事件经理判断并决定是否关闭该事件升级原则制定升级原则的目的是确保事件在规定的解决时限内能够及时通知相关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案。优先级为紧急的事件,帮助台应立即升级到事件经理,由事件经理再次确认,如果优先级的确为紧急,则通知相应的管理层,并由事件经理启动紧急事件处理流程。各支持人员应及时响应和处理分配到本组或自己的事件单,如果超出规定的响应时限和解决时限,帮助台系统应自动将事件信息通报相关人员,由相关人员负责协调资源,并督促事件能够及时被响应和处理(参见2.7.8)帮助台应及时将不能解决的事件升级到二线支持人员,若未及时升级,事件经理应及时介入,负责协调升级处理。帮助台和二线支持人员在必要时通知事件经理,将事件升级为紧急事件。只有事件经理才能变更事件的优先级。流程相关定义事件信息项事件单必须包含如下事件信息项:序号信息项说明1事件ID事件单流水号(系统自动产生)2请求人信息事件申报人的信息,包括:姓名、部门、办公电话、手机(手工填写)3登记时间在帮助台生成事件记录的时间(系统自动产生)4事件发生地点事件发生的地点,指具体的支行或部门名(手工选择)5业务中断标记由事件经理判断业务是否中断6业务中断发生时间针对故障类事件,指的是业务中断的实际时间(可能早于登记时间),在故障引起业务中断时需要填写(手工填写)【默认值:空】7业务恢复时间针对故障的业务恢复实际时间(手工填写)【非必填项】8事件性质参见“事件性质”定义9事件来源参见“事件来源”定义10事件优先级参见“事件优先级”定义11事件响应时限对应每一个事件优先级,系统根据流程相关定义中“事件响应时限”自动设定最终的响应时限(系统自动产生)12事件解决时限对应每一个事件优先级,系统根据流程相关定义中“事件解决时限”自动设定最终的完成时限(系统自动产生)13事件所属系统类型参见“事件所属系统类型”定义14事件分类参见“事件分类”定义15事件标题事件的简要描述(手工填写)16事件描述对于整个事件内容的详细描述(手工填写)17事件解决人事件的最终解决人(手工选择)【默认值:最后提交人】18事件状态参见“事件状态”定义19分配对象被分配的技术支持组和人员(手工选择)20事件日志反映事件信息项的变化历史,如一个事件在处理过程中事件状态变化的时间点等信息(系统自动产生)21解决方案事件解决方案的描述(手工填写)22事件解决代码参见“事件解决代码”定义23事件关闭代码参见“事件关闭代码”定义24满意度调查参见“满意度调查”定义【隐藏,暂不用】25供应商在提交给三线处理时,选择的供应商名称,参见配置管理流程设计26重复事件标记标记为重复事件(手工选择)【非必填项】27工作日志每次处理,都需要填写相关的工作日志,包括转派依据等(手工填写)28实际开始时间记录事件状态到帮助台处理或二线处理中的时间(系统自动产生)29实际完成时间记录事件已解决的时间(系统自动产生)30关联的事件单号记录关联的事件单号,例如重复事件31关联配置项记录出现故障的配置项代码(手工填写)32关联的问题单号记录由事件引发问题时,关联的问题单号(手工填写)【非必填项】33关联的变更单号记录由事件引发变更时,关联的OA系统变更单号(手工填写)【非必填项】注:以上信息项,标注“(系统自动产生)”的信息项,表示由OVSC自动产生,不可以手工填写或选择;标注“(手工选择)”的信息项,表示OVSC提供选择项,只能由使用者手工进行选择,不可填写;标注“(手工填写)”的信息项,需要使用者手工进行填写;标注“【非必填项】”的信息项为非必填项,其他的均为必填项;标注“【默认值:XX】”的项,表示OVSC提供默认值;标注“【隐藏,暂不用】”的信息项为在系统中有该功能,但是暂时隐藏起来,不提供使用。事件性质根据某某某关键业务系统的业务要求和管理要求,定义如下四类事件:编号代码描述1故障由用户上报或者运维人员自检发现的影响系统正常使用的事件2告警运维人员自检发现的未影响服务的事件,或监控系统产生的告警事件3咨询指对业务系统、硬件等方面的求助和询问4服务请求未影响服务正常使用的事件,如安装驱动、网络调试等事件来源事件来源代码用来标明事件的提出方式,事件来源可以包括以下几种:编号代码描述1用户报告用户通过电话报告的事件,帮助台人员手工创建事件单2内部开单信息技术部日常检查产生事件3监控告警监控工具发现的告警事件事件发生地点――需要进一步更新指事件发生的具体地点,指具体的支行名或部门:支行/部门。。。事件优先级――需要进一步确认优先级是事件管理的一个关键要素,优先级决定处理事件的顺序及所需的资源,事件优先级可分为五级(紧急、高、中、低、服务请求)。优先级定义:优先级代码描述紧急(1)重大的系统停机,影响很大数量的用户和业务单位;关键业务不能运行;影响公司级领导。高(2)系统或是应用的使用受到重大限制;系统性能严重下降。监控工具严重告警中(3)事件影响一小部分用户;属于一般性故障。低(4)事件影响范围很小。监控工具一般告警服务请求(5)事件不直接影响生产。咨询、大部分的服务请求属于该优先级。当故障发生时,为了在判断优先级时增强实际可操作性,可以根据故障的影响范围和业务系统的关键程度在优先级映射表中定位优先级。系统影响范围全部支行、关键人员关键支行(?)、多个支行、关键部门()一个非关键支行核心系统123IPP系统123国业系统123信贷系统234渠道系统123数据中心234OA系统、财务系统234人力系统344事件所属系统类型――需要进一步确认根据目前业务系统和子类的划分定义事件所属系统类型,当事件发生时,应该由帮助台初步定位是哪个系统及子类出现问题,由二线进行进一步的明确。类别子类核心系统核心基础系统现代化支付系统支票影像系统国库集中支付系统IPP系统IPP系统银联系统国业系统国业系统SWIFT信贷系统信贷系统征信系统渠道系统ATM金融通短信平台数据中心1104系统金融数据共享平台客户经理绩效考核报表系统反洗钱商行内外部监管报表客户风险预警系统其他OA系统财务系统人力系统事件分类――需要进一步确认事件分类代码用于标识故障或投诉的具体原因,由支持人员在处理过程中填写。在制作统计报表时,可以通过和事件所属系统类型代码的结合来统计分析故障或投诉。事件的分类层次设计不超过三层,第一级分类,称之为“类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目(供应商)”。类别子类条目(供应商)应用软件核心系统核心基础系统现代化支付系统支票影像系统国库集中支付系统IPP系统IPP系统银联系统国业系统国业系统SWIFT信贷系统信贷系统征信系统渠道系统ATM金融通短信平台数据中心1104系统金融数据共享平台客户经理绩效考核报表系统反洗钱商行内外部监管报表客户风险预警系统其他OA系统财务系统人力系统类别子类条目(供应商)硬件服务器HPIBMDELL路由器CISCOHUAWEI交换机CISCOHUAWEIDLINK存储设备HPNStor无线设备CISCOVPN设备启明星辰终端国光实达新大陆打印机HP南天其他UPS梅兰日兰科华三特托管空调Stuiz

类别子类条目系统软件操作系统WindowsNTWindows2000Windows2003WindowsXPHPUXSCOUNIXLINUX数据库OracleSQLServerSybase中间件WeblogicTuxedoWebsphere监控软件Ciscowhatsup启明SOC存储备份软件DP事件响应时限和解决时限在事件处理过程中,对于一个事件有解决时间的限制和响应时间的限制,一方面,需要各工程师协同合作,在解决事件的时候应该有时间的概念,同时,也要求事件经理必须实时地督促事件的解决,对于影响度为高或者紧急的事件,需要及时通告事件经理,同时,如果该事件的响应或解决超过了时限,需要通告事件经理,同时也要根据具体情况通告给其他相关管理人员。响应时限指的是事件状态从“已登记”到“帮助台处理中”/“二线处理中”经过的时间;解决时限指的是事件状态从“已登记”到“已解决”经过的时间;事件优先级对应的事件响应时限和解决时限参考下表(以下时间是24×7工作时间):编号优先级代码响应时限要求解决时限要求1紧急15分钟2小时2高30分钟4小时3中1小时8小时4低4小时48小时5服务请求8小时60日超出响应时间的通告定义通知人员列表的用途:当服务管理平台判断到响应时限已经超出,则自动按照表中的人员列表发出邮件或短信通知。优先级别通知人员列表事件响应时限紧急事件经理、组长、事件处理人15分钟高事件经理、组长、事件处理人30分钟中组长、事件处理人1小时低事件处理人4小时服务请求事件处理人8小时超出和即将超出解决时限的通告定义通知人员列表的用途:当服务管理平台判断到解决时限已经或即将超出,则自动按照表中的人员列表发出邮件或短信通知。优先级别通知时间通知人员列表事件解决时限紧急1.5小时事件经理、组长2小时2小时事件经理、组长高3小时组长、事件处理人4小时4小时事件经理、组长、事件处理人中7小时组长、事件处理人8小时8小时事件经理、组长、事件处理人低48小时组长、事件处理人48小时服务请求60日事件处理人60日事件状态事件状态代码表明事件所处的处理状态,事件状态如下:编号代码描述1已登记新开事件记录或事件已创建2分配到帮助台事件已分配给帮助台人员3分配到二线事件已分配到二线支持,二线还未响应4帮助台处理中帮助台人员已接手处理事件5二线处理中二线支持人员已接手处理事件6三线处理中事件由三线(供应商)协助处理7已解决事件已解决,支持人员联系用户验证事件是否获得解决8等待事件转问题管理流程、变更管理流程、等待用户相关信息9已关闭事件已关闭事件解决代码事件结束代码说明了事件是在何种情况下关闭的,结束代码如下:编号代码描述1成功解决事件获得成功解决2变通方法解决事件已通过变通方法或者临时措施获得解决,但是需要进行更进一步的根源分析3消失事件自行消失4误报不属于某某某事件管理流程管理范围的事件,如开发和测试环境产生的事件,支行用电故障;或经检查,属于误认为存在故障5误操作属于业务人员的误操作6可忽略通过监控系统提交的信息,经确认属于无效信息7重复重复事件事件关闭代码代码描述已完成设备、业务系统等故障已得到修复;对于服务请求,申请的服务已完成。未完成故障没有被修复,需要再次进行处理;对于服务请求,申请的服务未完成。对于该类事件,需要重新开单,并分配给原来处理该事件的人员进行处理。注:该项是在帮助台回访时,同用户确定的最终结果。满意度调查帮助台在对用户进行回访时,咨询用户的满意情况,满意度可以分为以下四个级别:代码描述满意完全满足用户的需求基本满意基本满足用户的需求不满意不能满足用户的需求注:隐藏该项,暂不使用

流程概要设计事件管理概要设计流程图如下:事件管理概要设计流程说明序号步骤名称责任人说明100.1事件记录和分类帮助台帮助台对来自用户电话、监控系统发现和日常运维发现的事件进行详细记录,其中包括故障/告警/咨询/服务请求帮助台负责对业务用户的联系信息进行确认;如有必要,对该信息进行修正帮助台在接收到事件后进行分类和优先级划分对于初步判断为紧急的事件马上升级到事件经理处理100.2初始支持帮助台属于帮助台技能范围内可以处理的事件,帮助台应尝试解决,如果无法解决需及时升级到二线支持不属于帮助台职责范围或无法及时处理的事件,立即分派到相应的二线支持100.3二线尝试解决二线支持二线支持人员接受事件,进行调查诊断,尝试解决方案,在必要时根据服务协议联系供应商帮助解决并负责核查对于需要通过变更解决的事件提出变更申请,通过变更流程实施解决方案指定时限内不能解决的事件,通告事件经理,由事件经理负责协调资源100.4记录解决方案细节帮助台二线支持在事件得到解决后,各线支持人员负责详细记录事件解决过程及方案事件解决后,在事件管理平台记录事件解决方案,更新事件状态,并设置“事件解决代码”100.5关闭事件帮助台/事件经理对于优先级为紧急和高的事件,由事件经理负责和用户确认事件是否解决。如果解决,事件以成功解决关闭;否则,事件为不成功关闭,重新开事件记录,并与原记录做关联,分派到原处理人员继续处理事件经理在关闭事件的同时必须确认是否需要设置业务中断标记和填写业务恢复时间。对于其他优先级的事件,由帮助台设置专人负责和用户确认事件是否解决。如果解决,事件以成功解决关闭;否则,事件为不成功关闭,重新开事件记录,并与原记录做关联,分派到原处理人员继续处理。100.6事件处理的监控事件经理负责监控所有未关闭的事件的处理状况,对接收到的超时告警应及时关注,并负责协调资源,保证事件的最终解决当事件优先级为紧急时,应按照紧急事件处理流程处理紧急事件101紧急事件处理流程事件经理事件经理负责协调紧急事件的处理,具体过程见紧急事件处理子流程流程详细设计(100.1)事件记录和分类流程描述如下:序号步骤名称责任人输入输出说明100.1.1新建事件帮助台电话新建的事件记录帮助台负责创建新的事件单,明确详细情况描述。详细内容包括:报告人姓名、部门、办公电话、手机事件发生地点事件来源和事件性质事件标题和描述必要的附件事件所属系统类型和事件分类100.1.2从任务队列中接受事件帮助台事件队列需要处理的事件事件任务队列来自监控工具和日常检查中发现和建立告警事件,帮助台负责检查事件任务队列中的新事件单,开始处理。100.1.3事件优先级设定帮助台事件记录确定了优先级的事件根据上报的事件描述,对照优先级代码表,确定事件的优先级。优先级为紧急吗?帮助台N/AN/A帮助台根据事件优先级判定的条件,初步判断优先级别:是,优先级为紧急,转101紧急事件处理子流程;否,为其它优先级,转100.2初始支持(100.2)初始支持流程描述如下:序号步骤名称责任人输入输出说明帮助台可以处理吗?帮助台N/AN/A帮助台根据事件分类和事件描述,判断处理职责是否在帮助台:是,转100.2.1尝试处理;否,转100.2.2分配到二线支持100.2.1尝试处理帮助台事件记录经过初始支持的事件帮助台运用知识库和自身技能在规定的时限内尝试解决,事件状态变为“分配到帮助台”,如果不能处理应及时将事件单分配到二线支持。发起变更吗?帮助台N/AN/A帮助台根据解决方案的内容和变更管理流程对变更范围的定义,判断是否需要发起变更:需要发起变更,创建变更请求,提交到变更管理流程,解决方案的实施由变更管理完成不需要发起变更,则确定是否已经解决100.2.2分配到二线支持帮助台事件记录分配到二线的事件单选择相关的二线处理组和处理人员分派,事件状态变为“分配到二线”。解决了吗?帮助台N/AN/A将解决方案和用户沟通,判断是否已解决:已解决,进入下一步,记录解决方案无法解决,转100.2.2分配到二线支持(100.3)二线尝试解决流程描述如下:序号步骤名称责任人输入输出说明100.3.1接受事件分配二线支持事件记录二线处理中的事件单如属于分派错误,则转派到负责该事件的岗位,在转派时,必须将报障的详细内容、转派原因等内容告知责任岗位;如接受,则事件状态变为“二线处理中”。是否为重复事件?二线支持N/AN/A二线支持人员根据重复事件原则,判断该事件单是否属于重复事件:是,转100.3.2重复事件处理;否,进入100.3.3尝试找出解决方案100.3.2重复事件处理二线支持重复事件关联的重复事件通过“关联的事件单号”关联正在处理的事件单的流水号,保存退出。100.3.3尝试找出解决方案二线支持事件记录对应事件的解决方案二线工程师借助工具或运用自己技能尝试找出解决方案,在解决事件的过程中根据需要联系供应商(三线)共同参与制定解决方案。100.3.4供应商提供解决方案二线支持事件记录供应商提供的解决方案二线支持把事件的状态置为“三线处理中”,选择具体负责的供应商。供应商和二线支持共同研究解决方案,提供解决方案。事件单仍然还在二线支持手中。发起变更吗?二线支持N/AN/A二线支持根据解决方案的内容和变更管理流程对变更范围的定义,判断是否需要发起变更:需要发起变更,创建变更请求,提交到变更管理流程,解决方案的实施由变更管理完成不需要发起变更,转100.3.5应用解决方案100.3.5应用解决方案二线支持事件记录应用了解决方案的事件二线支持实施解决方案,实施解决方案的过程,需要和相关报告方共同确认解决方案是否有效。解决了吗?二线支持N/AN/A判断事件是否得到解决:是,进入下一步,记录解决方案否,判断是否需要协调处理?需要协调处理吗?二线支持N/AN/A根据事件的处理状况判断是否需要其它资源介入:是,转到100.3.6事件经理协调解决否,转到100.3.3尝试找出解决方案100.3.6事件经理协调解决事件经理未解决的事件记录已解决的事件事件经理负责将事件通报到管理层,通过高层寻求更多的资源介入,共同商讨和制定解决方案。(100.4)记录解决方案细节流程描述如下:序号步骤名称责任人输入输出说明100.4.1记录详细的解决方案二线支持/帮助台已解决的事件记录了解决方案的事件根据事件的处理状况填写事件信息项:1.填写“解决方案”2.确定“事件分类”和“事件所属系统类型”是否正确3.填写“事件解决代码”4.对于故障和告警,应该明确是哪个配置项发生的,关联正确的配置项保存后,事件状态变为“已解决”。(100.5)关闭事件流程描述如下:序号步骤名称责任人输入输出说明100.5.1列出优先级为“紧急”或”高”的事件事件经理已解决的事件优先级为“紧急”或”高”的事件列表打开优先级为“紧急”或”高”的事件视图。是否为故障事件经理/帮助台N/AN/A判断是否是监控工具或日常检查发生的告警事件:是,转100.5.2检查和更新事件记录,选择关闭代码否,转100.5.3与用户处确认事件解决100.5.2检查和更新事件记录,选择关闭代码事件经理/帮助台已解决的事件关闭的事件检查事件分类、事件所属系统、关联配置项等的填写是否准确,需要时更新事件记录,根据实际处理结果或用户反馈填写关闭代码。100.5.3与用户处确认事件解决事件经理/帮助台已解决的事件用户反馈向事件请求人确认所提供的解决方案是否有效是否解决?事件经理/帮助台N/AN/A从用户反馈中判断是否解决?是,转100.5.2否,转100.5.4重开单处理100.5.4重开单处理事件经理/帮助台未解决的事件记录新的事件记录将该事件单的的关闭代码置为“未完成”,关闭保存;创建一个新的事件单,事件信息可以复制,分配到原处理人员处理注:事件经理/帮助台应该和原处理人员沟通事件的确认结果和后续的处理方式。100.5.5视需要设置业务中断标记事件经理未判断是否需要设置业务中断标记的事件已判断是否需要设置业务中断标记或已设置业务中断标记的事件事件经理判断事件对业务的中断情况,如果事件引起业务中断,则设置业务中断标记,记录业务中断的起始时间。100.5.6列出其他优先级的事件帮助台已解决的事件优先级其他的事件列表打开优先级为其他的事件视图。(100.6)事件处理的监控流程描述如下:序号步骤名称责任人输入输出说明100.6.1事件队列的监控事件经理事件队列服务管理平台的超时告警经监控的事件单事件经理可以从以下途径获取事件处理的信息:帮助台系统自动发送的告警通知查询事件管理平台中当前处理中的事件列表需要介入吗?事件经理N/AN/A事件经理根据处理时限和该事件对业务的影响程度,判断是否需要及时介入,帮助协调资源解决:需要介入,转100.6.2不需要,则继续监控100.6.2召集资源协商解决事件经理告警事件支持人员的电话通知经过处理的事件由于处理不及时而可能导致用户满意度下降的事件或疑难事件,事件经理负责召集相应二线专家,共同商讨并制定解决方案,并实施解决方案。可以解决吗?事件经理N/AN/A如果可以解决,分配给二线支持进行解决无法解决,转100.6.3升级到经理层解决100.6.3升级到管理层解决事件经理升级的事件记录已升级的事件事件经理负责将升级事件通报到管理层,通过高层寻求更多的资源介入,共同商讨和制定解决方案。(101)紧急事件处理子流程制定紧急事件处理子流程的目标:当紧急事件发生时,尽可能采取措施减少对于业务带来的影响确保对紧急情况的有效管理加快紧急事件的响应和处理速度对紧急情况中的人员及采取的行动加强管理加强处理人员与用户之间的沟通和反馈对紧急情况妥善处理流程原则制定各系统应急处理预案为了确保系统发生重大故障时,能够尽快恢复业务,并充分调动技术力量,在最短时间内排除故障,各系统应该建立相应的应急处理预案,建议预案中的内容至少应涵盖以下方面:应急预案启动条件应急处理小组负责人和成员联系名单和联系方式应急处理步骤应急信息通报应急善后处理应急保障措施(人员、培训、演习、场地等)紧急事件及时上报信息部紧急事件处理子流程概要说明紧急事件处理子流程说明如下:序号步骤名称说明101.1召集应急小组,协调应急会议事件经理主持应急会议,并组织讨论、协调各方资源,分析紧急事件处理方案,并将紧急事件情况通报信息部101.2判断是否属于应急预案中的事件?应急小组和相关供应商根据紧急事件现象和影响程度,判断是否需要启动相应系统的应急预案?如果没有应急预案,则进入101.4组织相关供应商共同分析紧急事件,制定处理方案并处理;如果有应急预案,则进入101.3按照应急预案处理101.3按照应急预案处理根据各系统制定的应急预案中的实施步骤,处理紧急事件101.4组织相关供应商共同分析,制定处理方案并处理应急小组负责组织相关供应商共同分析紧急事件,制定相应的处理方案,处理方案在实施前应得到应急小组和相关领导的认可;事件处理过程中如果需要中断业务或对系统的IT组件产生变更,则需要按照紧急变更管理流程的定义和要求,提出紧急变更请求101.5紧急事件解除确认?在紧急事件处理方案实施后,应急小组、相关供应商和相关部门对紧急事件是否解除进行确认紧急事件如果没有解除,则重新进入101.4组织相关供应商共同分析紧急事件,制定处理方案并处理;如果解除,则进入101.6紧急事件善后处理和总结分析101.6善后处理和通报紧急事件解除后,应急小组向用户、公司相关领导简要报告紧急事件处理过程,解决方法,事件解除时间,业务恢复情况。紧急事件处理人在流程平台确定事件解决时间,填写解决方案。紧急事件处理人需要创建一个新问题,将紧急事件处理过程的详细信息记录到问题单中,提交到问题经理,由问题经理组织相关专家进行问题根源的分析事件状态迁移图事件状态变迁图用来标明:当一个事件单处于某个状态时,它可以去到的下一个状态。当前状态为‘已登记’状态时,可迁移的状态状态合法描述已登记否已登记为事件单初始状态分配到帮助台是用户提交事件请求,首先分派到帮助台进行处理分配到二线是帮助台组人员将事件单分配给二线支持帮助台处理中否二线处理中否三线处理中否已解决否等待否已关闭否当前状态为‘分配到帮助台’状态时,可迁移的状态状态合法描述已登记否分配到帮助台是帮助台的人员将分配给本人的事件单分配给帮助台或者帮助台的其他人员分配到二线是帮助台组人员将事件单分配给二线支持帮助台处理中是帮助台人员,接受分配的事件单,并开始处理二线处理中否三线处理中否已解决否等待否已关闭否当前状态为‘分配到二线’状态时,可迁移的状态状态合法描述已登记否分配到帮助台是二线支持人员将分配给本人的事件单转派给帮助台或者帮助台组内的其他人分配到二线是二线支持人员将事件单分配给二线支持组或二线支持组内的其他人帮助台处理中否二线处理中是二线支持人员,接受分配的事件单,并开始处理三线处理中否已解决否等待否已关闭否当前状态为‘帮助台处理中’状态时,可迁移的状态状态合法描述已登记否分配到帮助台是帮助台人员将分配给本人的事件单转派给帮助台或者帮助台组内的其他人分配到二线是帮助台人员无法处理该事件单,将事件单转派给二线支持组或组内其他人员帮助台处理中否二线处理中否三线处理中否已解决是帮助台人员找到解决方案或者变通方法,解决了该事件等待是该事件需要走变更流程或等待用户信息,该事件转入等待状态已关闭否当前状态为‘二线处理中’状态时,可迁移的状态状态合法描述已登记否分配到帮助台否分配到二线是二线支持人员无法处理该事件单,将事件单重新分配给二线支持组或二线支持组内其他人员帮助台处理中否二线处理中否三线处理中是二线支持人员提交给供应商协助处理已解决是二线支持找到解决方案或者变通方法,解决了分配的事件单等待是该事件需要走变更流程或等待用户信息,该事件转入等待状态已关闭否当前状态为‘三线处理中’状态时,可迁移的状态状态合法描述已登记否分配到帮助台否分配到二线否帮助台处理中否二线处理中是供应商提交解决方案给二线支持三线处理中否已解决否等待否已关闭否当前状态为‘等待’状态时,可迁移的状态状态合法描述已登记否分配到帮助台否分配到二线否帮助台处理中是变更流程已走完或用户信息足够,可以继续处理原事件二线处理中是变更流程已走完或用户信息足够,可以继续处理原事件三线处理中否已解决是该事件已得到解决等待否已关闭否当前状态为‘已解决’状态时,可迁移的状态状态合法描述已登记否分配到帮助台否分配到二线否帮助台处理中否二线处理中否三线处理中否已解决否等待否已关闭是帮助台在关闭事件单的时候,需要填写客户反馈和结束代码当前状态为‘已关闭’状态时,可迁移的状态不迁移至任何状态。关键角色、职责定义流程的实现是通过不同的流程角色以及其被赋予的职责来实现的,因此流程的每一个角色可以被定义为一系列职责的集合,在实际的管理操作中,不同的人员将被赋予不同的职责,也可能一个人被赋予多个职责,同时也可以将其职责授权给其管理结构之下的人员。 事件管理流程主要分为事件管理流程负责人、事件经理、帮助台、二线支持人员等角色。分别简述如下:事件管理流程负责人事件管理流程负责人从宏观上监控流程,确保事件流程在业务支持中心范围内被正确的执行。当流程不能够适应业务支持中心的情况时,流程负责人必须及时的对此进行分析、找出缺陷、进行改进,从而实现可持续提高。职责:确定管理流程的衡量指标确保事件流程能够取得管理层的参与和支持确保事件流程符合公司实际状况和公司IT发展战略总体上管理和监控流程,建立事件流程实施、评估和持续优化机制确保事件流程实用、有效、正确地执行,当流程不能够适应公司的情况时,必须及时的对此进行分析、找出缺陷、进行改进(假如增加或合并流程的角色),从而实现可持续提高保持与其他流程负责人的定期沟通技能要求:深刻理解事件管理流程;充分理解业务支撑网运维管理流程梳理项目的其他流程,能够进行流程接口设计;能够很好地理解业务对于事件管理的需求;对质量控制与保障有很深入的了解;有决策权,能够确保事件管理流程设计要求在实施项目中得到贯彻和执行;具有很好的沟通技能,能够取得公司高层的支持,获得所需资源。事件经理事件经理负责事件解决过程中的协调和监控,以及事件升级的判断以及具体执行。职责:负责对事件的解决协调资源,保证故障的最终排除当事件优先级为紧急或者事件将超过规定的时限,负责按照升级方法对事件进行处理确保有效协调资源,促进支持工程师快速恢复正常服务确保和问题管理流程经理的有效合作确保正确和广泛地收集和分析事件数据,发现IT和业务相关的问题技能要求:了解技术架构和技术环境较强的口头表达能力和与用户沟通技巧处理纠纷的能力深刻了解事件管理流程较强的领导能力帮助台帮助台负责接收所有的事件,对事件进行初步处理,提出解决方案以尽快恢复服务,必要时提供现场支持,并根据实际情况将事件分派到合适的二线支持人员。职责:在指定的响应时间内响应所有帮助台热线电话的事件报告完整记录所有接收的事件信息,包括:记录事件报告人的详细联系方式、事件特征表现、描述、发生时间等为事件进行适当的分类、为事件分配优先级等属性尝试使用工具、初步诊断、分析相关信息等方式解决问题将帮助台不能解决的事件分配给相应的二线支持小组/人员来处理检查已记录事件的处理进度,保持与事件报告人的联系,适时通知事件处理进展与用户确认事件解决方案,关闭事件(由专职帮助台人员负责)负责24×7的值班和系统监控技能要求:熟悉技术平台和技术环境较强的沟通能力对简单的故障要有快速诊断和解决的能力熟悉事件处理流程注:某某某帮助台暂由值班人员和部分二线支持人员轮值组成。二线支持人员二线支持人员是相关问题领域的专家。负责提供对帮助台人员无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务。可以考虑按照所维护的应用、系统进行分组,如:网络组、主机组、应用组等。职责:进行事件的深入调查研究根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论