




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、PAGE 智慧IT运维服务管理系统方案设计目 录 TOC o 1-4 h z u HYPERLINK l _Toc528142076 1.目标及范围 PAGEREF _Toc528142076 h 3 HYPERLINK l _Toc528142077 1.1 项目目标 PAGEREF _Toc528142077 h 3 HYPERLINK l _Toc528142078 1.2 项目范围 PAGEREF _Toc528142078 h 4 HYPERLINK l _Toc528142079 2.技术方案 PAGEREF _Toc528142079 h 5 HYPERLINK l _Toc52
2、8142080 2.1 系统总体架构及部署 PAGEREF _Toc528142080 h 5 HYPERLINK l _Toc528142081 2.1.1 总体架构 PAGEREF _Toc528142081 h 5 HYPERLINK l _Toc528142082 2.1.2 系统组成及系统体系结构 PAGEREF _Toc528142082 h 5 HYPERLINK l _Toc528142083 2.1.3 业务功能 PAGEREF _Toc528142083 h 6 HYPERLINK l _Toc528142084 IT服务管理系统 PAGEREF _Toc528142084
3、 h 7目标及范围项目目标集团公司在总部和企业层面已经建立了以综合网管系统和SAP SLM系统为主的运维支持系统,运维支持系统概览如 REF _Ref328568448 h * MERGEFORMAT 图所示。图 运维支持系统概览集团公司总部建立呼叫中心系统实时响应了用户有关门户、OA、基础应用、安全、视频、MES等系统的服务请求;工单系统实现了总部运维人员处理系统故障的工单流转;SAP SLM实现了ERP系统服务请求受理、事件管理、应用监控及变更管理;网管监控系统实现了因特网、主干网、局域网、服务器、安全设备、企业防火墙、基础应用等基础设施的故障和性能监控;资金集中监控系统实现了资金集中系统
4、的网络设备、服务器、安全设备、存储、负载均衡、灾备和应用系统的一体化监控;MES应用监控评价系统对MES应用进行监控,为MES上线达标、验收达标及深化应用提供了报告和依据。在企业,已建成76家企业的综合网管系统,实现了对企业基础设施的监控;基本建成防病毒管理Bigfix系统,截至2012年1月,共安装18.3万台,授权数18万。同时,广州石化、茂名石化、燕山石化、北京石油等部分企业已建设了运维服务管理系统。本次项目的总体目标是整合运维支持系统,建设集中的一体化运维平台,支撑集团公司IT运维共享服务,提高运行效率,降低成本,实现总部和企业运维统一调度和集中管控,达到国内领先、国际一流的水平。(1
5、)建设集团公司IT运维平台,实现运行监控、配置管理数据库、IT服务管理、运维门户与大屏展示;实现与SAP SLM、SSOC、云资源管理平台、资金集中监控系统、加油卡监控等系统的集成。具体实现如下:统一调度运维资源:建成集中的服务管理系统,集成SAP SLM,实现运维支持工作的全过程管控和知识共享,通过在线流程有机协同总部、区域中心和企业之间,运维队伍与项目组之间的运维支持工作。集中监控应用系统:建成集中的运行监控系统,实现对50套应用系统的应用监控,从用户使用的角度进行可用性监控,及时发现和处理问题,缩短系统不可用时间。集中管理配置信息:建成集中的配置管理数据库系统,实现50套应用系统与总部管
6、理的基础设施的统一管理,为运维支持、变更风险分析、重大问题处理决策等及时地提供真实数据。大屏展示运维情况:提升运维门户和大屏展示,通过系统集成大屏展示应用监控指标、信息安全状况、服务受理情况、重大问题处理情况等运维服务信息。(2)制定集团公司IT运维标准与规范。包括运行监控规范、服务管理规范、 配置管理规范等。项目范围项目范围包含总部基础设施和总部统建的50套应用系统,以及与两家试点企业已有运维系统的集成。基础设施的范围主要包括总部4个数据中心,11个区域中心,涵盖服务器、存储、安全设备、网络设备、数据库、中间件等,当前共有各类设备7000台左右,具体数量以实际为准。应用系统的范围主要包括ER
7、P、MES、资金集中管理、总部生产营运指挥、电子商务、合同管理、综合办公、加油卡(区外)、APC等50套应用系统,主要涵盖了SAP、.NET、JAVA、Domino等技术平台。技术方案系统总体架构及部署总体架构集团公司IT运维平台项目(一期)的总体架构如下:集团公司IT运维平台项目(一期)包括呼叫中心、运行监控、服务管理、配置管理、安全管理、运维门户和大屏展示7个子系统,其中呼叫中心和安全管理在另外项目中建设。本期项目重点完成运行监控、服务管理、配置管理、运维门户和大屏展示系统的建设。系统组成及系统体系结构根据本次集团公司IT运维平台项目(一期)需求的认真分析,推出自有的“CUBA”(立方体架
8、构)的整体解决方案。系统体系结构如下:针对本次项目的产品整体解决方案包括:“三个支撑”:以运行监控系统、CMDB配置管理系统、SOC安全监控系统(本期项目通过集成方式接入)为整个平台系统的支撑功能,打造系统功能基础。“一个导向”:以IT服务管理系统为导向,强调为用户提供一站式服务和服务级别管理。“两个贯穿”:以统一数据采集和ESB数据总线技术方案贯穿整个平台的建设。“两个体现”:以运维门户和大屏综合展示系统作为整体IT运维平台的最终体现。整体解决方案中的产品选型全部为获得国家版权认证、具备自主产权的软件产品,在电信、能源、金融、政府中获得广泛运用,拥有众多的成功项目案例。业务功能IT服务管理系
9、统服务管理系统特点具备自主知识产权的IT服务管理系统(软件登记名称:BrightView服务管理系统软件V2.0)是基于ITIL的先进设计理念之下,结合多年IT服务管理项目经验,提炼中国本地化需求,面向企业级运维服务,界面友好、操作便捷,符合中国企业特色的运维服务管理平台,已成功运用于广石化、北京石油、徐州管道等多家石化企业,以及中国电信、中国人保、英大集团等众多用户。IT运维服务管理遵循ITIL/ITSM最佳实践进行建设,以SLA服务级别管理为中心,以服务目录面向用户,支持事件/问题/变更/配置/发布等ITIL标准流程,并根据实际运维需要支持值班/作业计划/进出机房管理等实用流程。IT服务管
10、理系统注重实用性和先进性的平衡,实现企业级应用流程开发、运行、管理、监控、维护的中间件平台。一方面承接底层的J2EE技术,一方面以更业务化的形式面向最终应用。充分考虑流程角色与实际组织的映射、流程环节与实际工作的对应,为用户提供统一、完整的服务管理平台,实现流程自动化和电子化,依靠流程实现运维工作由被动式支持向主动式服务演进。IT服务管理采用先进的SOA(Service-Oriented Architecture)架构和标准规范并通过构件化、图形化、一体化的平台产品为客户提供完整的覆盖SOA应用全生命周期的支撑,从设计、开放、调试、和部署,到运行、维护、管控和治理。可以真正意义上满足企业客户和
11、各类机构对其业务需求不断调整的客观需要,达到低成本、高质量、灵活、易管控地构造SOA应用和服务的目标。SOA是一种架构模型,它可以根据需求通过网络对松散耦合的粗粒度应用组件进行分布式部署、组合和使用。服务层是SOA的基础,可以直接被应用调用,从而有效控制系统中与软件代理交互的人为依赖性。SOA的关键是“服务”的概念。 IT服务管理系统将ITSM设计理念与SOA工作流相结合,用户界面清晰易懂,操作简单明了,解决问题高效快速,为用户带来更多的价值回报。此外,IT服务管理系统可以对已有系统中的功能进行提取和包装,形成标准的“服务” 概念,然后按照业务流程需求进行整合,满足复杂多变的中国特色业务需求,
12、适应在管理以及业务执行过程中的各种复杂规则。IT服务管理系统具备如下特点:图形可视化的流程定制工具IT服务管理系统流程定制工具是在系统流程引擎之上实现基于Web的流程业务化定制工具。如下图具体流程定制的参考模型。在系统定制开发期间,项目实施定制开发人员主要通过集成与系统的流程制定工具来定义流程。由于流程制定工具需要依赖组织模型和外部相关应用,所以在流程制定开发以前需要首先实现组织模型接口,构造被调用的应用(Java方法、构建库服务等)。如果定制开发人员暂时不确定组织模型,也可以先使用产品系统内置的简单组织模型。在系统运行期间,流程引擎是所有依赖的中心。系统流程引擎包含流程调度引擎和任务表管理器
13、两大部分。引擎在运行过程中通过从组织模型获取到适当的参与者来调度人为参与的人工活动;通过调用外部应用来实现运转的自动活动;通过访问工作流相关数据进行必要的路由判断;通过工作流控制数据来记录流程运行的轨迹;通过访问日历接口来进行恰当的时限设置。流程调度引擎和任务表管理器之间通过任务表作为联系纽带,通过任务表的状态变迁来进行相互的驱动。IT服务管理系统提供“顺序”、“并行”、“合并”、“选择”、“同步”、“回退”等多种工作流模式;流程设置支持预先默认审核人和手工选择审核人。IT服务管理系统流程定制工具界面操作简单、便捷,将流程活动图标及流程活动之间关系的连线通过拖、拉、拽等方式摆放到流程图画板上,
14、并定义相关属性信息,能够展现所见即所得的流程活动过程效果。下图是通过简单的拖、拉、拽方式形成的事件管理流程图。同时,清晰全面的流程展现能够帮助运维人员更好的掌握流程整体进度、过程及当前状态。IT服务管理系统针对各流程的每个工单,通过图形化的方式展现整体流程图,流程流转的轨迹,以及各环节的处理过程。同时,每个环节的处理过程可以深入挖掘,包括处理人、处理时间、处理意见等环节关键处理信息可以进行直观呈现。在IT服务管理系统中默认的有两种常用的可视化视图,包括系统定制开发可视化视图和系统调试可视化视图,每个可视化视图又包含很多共用的视图和编辑器。系统定制开发可视化视图启动IT服务管理系统定制界面后,即
15、展示定制开发可视化视图窗口。窗口包含一些视图和编辑器,可同时打开多个视图窗口,如下图所示。系统调试可视化视图当在系统定制开发程序中设置了断点,运行系统调试程序时即切换到系统调试可视化视图窗口,如下图所示。与运行监控系统的集成能力IT服务管理系统可通过接口的方式与监控系统进行信息传递与数据交换,监控系统可触发相关流程进行流转,比如可自动创建工单,提供手工确认功能,并派发至对应的工程师,实现监控系统告警状态和IT服务管理系统工单状态同步,事件自动确认与清除、事件自动升级、工单自动关闭等功能。接口方式:提供基于软件标准的Web Service接口,便于系统集成。比如,监控系统的告警可通过接口自动或手
16、动触发IT服务管理系统的事件工单,并进行派发流转;以实现对这些告警信息的闭环处理。集成联动过程监控系统可以手动或者自动将告警派发IT服务管理系统 ,IT服务管理系统根据关键信息,例如网元类型,自动将工单派发到相应的负责人,并有短信或Email提醒。监控系统取消告警,通知IT服务管理系统。IT服务管理系统关闭事件,监控系统自动取消告警。如下图所示:扩展性:IT服务管理系统提供Web Service、Http、Ftp、DataBase等多种接口和通讯方式,实现与其它各类系统的向上、向下无缝集成。运维流程的高效实用运维服务管理系统是运维人员日常最主要的工作平台,系统的灵活性、方便性、实用性将影响一线
17、人员的工作效率,服务管理系统对各行业客户的需求提炼总结,细节做到位,提高系统的任务处理能力:支持待办提醒、即将超时提醒支持任务工单合并支持任务工单拆单支持工单升级处理支持工单抄送支持工单处理的阶段回复支持简单、按路径、自定义等各种回退机制支持解决方案、工单信息、审批意见等各种模板的自定义支持主动接单、抢单等多种策略支持按事件分类等特定属性绑定默认处理人或处理岗的功能支持运维报表订阅与推送各种自定义工单模板提供直观、可视化的表单定制工具。表单定制工具主要功能如下:(1)采用拖拉和配置的方式在页面上摆放控件(输入框、数据框等),并通过设置控件的属性、触发动作,可以完成相对复杂的数据表单操作,所见即
18、所得。支持调整表单属性可以进行灵活部署。(2)同一个流程可以设置不同的表单内容。(3)表单设置完成后,不需要重启服务,可以直接在流程中使用新的表单。日常运维工作中,运维人员可能会遇见大量重复性的服务请求、故障或问题,需要创建工单进行处理,面对大量重复性工作,用户需要花费很多时间填写工单信息、选择工单内容,工作效率低下,工作热情不高。针对这些问题,IT服务管理系统可在用户常用的服务请求、事件、问题等服务流程中设置工单模板、解决方案模板、处理意见模板等。用户可以预先定义自己的工单模板信息,对于一些重复性工单信息,可以使用工单模板快速填写,减少重复性工作,提高工作效率。多种提醒机制为保障运维人员能够
19、及时响应、处理分配的工单,提高客户的满意度,IT服务管理系统提短信、邮件、腾讯BQQ等多种提醒机制。 短信、邮件提醒短信、邮件提醒是IT服务管理系统在各服务流程工单流转时提供的一种提醒功能。在用户提交工单前,可以根据应用情况选择是否给下一流程环节的用户发送提醒邮件或短信,如果发送则工单流转到下一个用户时,系统会自动触发一封工单响应、处理的提醒邮件,主动提醒用户。同时系统也支持强制短信邮件发送机制(如:紧急事件必须短信邮件通知事件经理)页面提醒根据运维人员已接收工单的优先级、响应超时、解决超时情况,IT服务管理系统提供页面提醒机制,在页面中通过不颜色的图标和背景颜色,表示工单的紧急程度及响应处理
20、情况。请求人信息快速搜索与自定填充支持请求人信息按员工编号、姓名、电话、邮箱进行快速的模糊匹配,自动填充相关信息和最近报障信息,提高服务台建单效率。同时请求人信息可与呼叫集成,电话响后自动匹配请求人信息,自动填写请求人信息到事件单。知识智能搜索知识库的建立为运维经验的积累和共享提供了一个有效的管理途径。在工作中,运维人员怎样能从知识库中高效、便捷、准确的查找到所需要的知识内容是知识库优劣的重要衡量依据,IT服务管理系统知识库模块内置强大的知识搜索引擎,可对知识标题、关键字、知识简介甚至知识全文进行智能检索,完全符合运维人员的使用习惯和应用特点,能够通过知识库、知识问答、积分管理统一使用,真正体
21、现一个易用、高效的知识管理架构。 KPI报表定制服务报告是针对运维部门领导对于运维管理的需求特点而制定的运维服务统计分析报告。服务报告以不同的视角和维度,对统计周期内运维人员的工作量、工作质量、客户满意度以及其他KPI指标进行统计分析并通过多样化的图形报表进行展现,最终形成PDF、EXCEL样式的服务报告。通过设置,服务报告可定期自动形成并通过邮件发送给运维部门领导,服务报告是体现运维人员工作量、衡量运维部门整体服务质量、明确运维服务改进方向的重要依据。本土业务流程需求实现IT服务管理系统不仅支持ITIL 基本框架。服务台系统的服务台、服务目录、服务请求管理、事件管理、问题管理、变更管理、配置
22、管理、发布管理、服务等级管理、知识库管理;以及远期的可用性管理、能力管理、连续性管理、财务管理等各方面均符合ITIL标准,与ITIL的结构、功能等各方面要求一致。同时针对中国本土化业务需求进行扩展,更加适应中国特色要求,例如根据日常运维工作特点开发的巡检计划管理、值班管理、公告管理。这些贴近日常运维具体需求的流程,适应业务系统的不断变化,切实帮助运维人员提高管理水平。个人工作台个人工作台是由公告信息、知识库、待办列表、KPI指标等内容组合而成的综合信息展示页面,用户登录系统后会首先显示个人工作台,作为用户日常工作的主要页面,个人工作台上显示的内容贴近用户实际需求,满足用户对于日常工作、管理等多
23、方面、不同层次的需要。针对不同角色的用户(如:客户、运维人员、IT主管、IT领导)对个人工作台关注内容存在差异性需求的特点,个人工作台提供定制功能,可以根据系统角色对公告信息、知识库、待办列表、KPI指标等内容进行个人工作台定制管理,不同角色的用户登录系统可以显示不同的个人工作台。个人工作台的显示内容包括:1.任务展现展现当前用户的所有相关任务,包括超期任务、未解决的任务、待办的任务等,并可查看任务明细。2. 对待办任务的提醒和处理能够对用户的待办任务浏览、提醒和展示,显示信息包括任务的所有必要属性,具体显示内容可定制;点击待办的任务可直接进入任务处理的工作界面,方便用户操作使用。3. 公告信
24、息能够对公告信息查询、显示、编辑、删除。4知识库查询通过快速选择知识分类、关键字等信息进行知识的搜索查询浏览。5报表查询能够方便的查询用户具备权限的报表。个人工作台作为用户的主要工作界面,展现的信息需要尽可能的丰富和关联。服务管理系统的个人工作台可以实现以下数据集成功能: 能够集成现有的运维系统(包括SAP SLM); 能够接收监控系统(综合监控、安全监控等)的故障处理请求和工作分派; 能够接收呼叫中心的服务请求、故障申告等; 能够查询CMDB的基础信息,并接收CMDB的配置变更请求。同时,为满足IT主管领导对于运维管理的需求,使IT主管领导通过运维门户即可对当前整体运维工作的运行状况进行监控
25、和管理,个人工作台可以把服务水平、故障分类、故障来源分类等用户关心的KPI指标以柱状图、饼状图、趋势图等多种图形化方式进行页面定制显示,并且KPI指标具备数据钻取功能,用户可以对KPI指标进行深入挖掘直至找到指标对应的具体工单信息。服务台服务台目标服务台的主要目标是为用户的IT服务请求和抱怨提供单一联系点,确保向用户提供正常的服务以避免业务操作中断,为所有用户提供所需的服务支持,分配特定的和相关的用户呼叫给相应的IT部门,减轻其他IT部门的工作量。服务台功能服务台是服务管理平台与外部用户的唯一接口,用户通过服务台提交事件单、问题单、变更单,服务台对事件进行记录和管理,在事件、问题、变更等管理流
26、程中进行处理。服务台满足ITIL定义的服务台管理功能。主要功能如下:支持邮件、短信、屏幕提示等通告方式,有群发功能;能提供运维支持人员、开发人员、用户进行相互沟通的工具;可以进行内部信息发布和交流,通过电子邮件具有根据事件单、问题单、变更单状态变动自动给相应角色人员发送电子邮件功能;能快速响应用户的服务请求,完成事件记录、分派、跟踪和回复功能,并启动后台的事件、问题、变更、配置处理流程。服务台特点服务台管理包括自助服务台、个人工作台和管理控制台。1、自助服务台用户可以根据服务目录在线提交服务请求;在线提交的服务请求,用户可以随时查看历史工单及状态;服务请求处理完成后用户可以在线反馈满意度情况;
27、用户可以在线查看个人基本信息、个人配置/资产信息及知识库。2、个人工作台个人工作台作为IT运维管理体系的职能模块,负责统一接收、支持和反馈各种事件、故障、投诉等,同时根据具体管理需求生成事件;个人工作台能够创建、处理和关闭个人及工作组工单,可以实时统计个人和工作组工单,同时可以进行客户满意度调查;个人工作台可以在线查看公告、值班信息和知识库等。3、管理控制台管理控制台负责宏观掌控IT运维管理整体运行情况,提供仪表盘功能,同时实时进行工作情况的统计分析;管理控制台可以在线查看公告、值班信息和知识库等。服务台考核指标(KPI)服务台考核指标(KPI)包括:呼叫的平均应答时间;呼叫的平均处理时间;事
28、件一线处理比率;每个服务台员工处理的事件数及总的事件数;可根据客户实际现状制定考核指标。服务目录管理服务目录管理目标服务目录管理的目标是对所有提供的服务保证期信息来源的一致性,并且确保那些已获准访问者能够最大程度的使用它。服务目录管理流程要确保服务目录的产生和维护,其中包括关于所有运维业务和业务准备的准确信息。服务目录管理功能服务目录管理是对服务提供商为客户和用户提供的所有服务及服务规格的有效组织形式。通过IT服务目录,客户和用户可以直观感受到服务提供商的服务内容。服务目录主要包括业务服务目录和技术服务目录两种类型。业务服务目录包含提交给客户的所有IT服务细节,并将关联到依靠IT服务的业务单元
29、和业务流程,这是以客户视角的服务目录。技术服务目录包含提交给客户的所有IT服务细节,并将其关联到提供给业务的必需的支持服务、共享服务、组建和配置项,它支撑业务服务目录,而不是客户视角。服务目录管理功能可以与服务计量、自助服务等功能关联,可以提供标准接口供其它功能模块使用。服务目录包含四大功能模块,如下图所示:服务菜单: 提供展现服务项的功能,服务菜单就像餐厅的菜单,用户通过此界面可快速选取需要的服务,提供快速建单模板,实现快速创建工单的功能。可实现服务目录模板的定制、更新及应用。可灵活地自定义服务目录,支持多级服务目录分类,并可灵活调整。模版更新后各类服务目录信息维护表单自动调整。服务目录模版
30、的维护可采用网页、客户端、附件等各种形式,并具有方便的模版增删改查功能。能够根据用户需求提供不同的服务目录组合,比如按业务、部门等不同维度进行组合。服务菜单分为二级目录:一级目录为服务分类,是从宏观上去定义,没有后台服务流程的支撑;二级目录为具体服务,用业务化的语言,根据具体运维服务项去定义,服务项与运维流程紧密相连,且至少会对应一个服务流程。同时,服务包含完成时间承诺的相关要求,如:服务响应时限、解决时限、支持时限等。服务配置:提供配置服务目录的接口,它是服务目录和服务流程结合的桥梁。一个服务项到底调用哪个服务流程,传递什么初始参数,都是通过服务配置模块进行配置。服务配置包含公共属性配置和个
31、性属性配置,公共属性配置是所有服务项通用的,个性属性是针对具体业务支撑流程(如事件流程)。提供增删改查功能和附件导入、导出功能,同时提供服务目录查询打印功能。具体如下图所示:服务调用:实现服务目录创建工单的功能。一个服务工单创建过程为:点击服务项系统自动获取服务配置参数并填充相关表单用户填写必要的表单信息提交工单,实现服务工单的创建。服务目录建单如下图所示:权限控制:实现对服务菜单的权限控制(调用权限管理的接口),能够根据不同的角色提供不同服务项。服务目录设计服务目录内容主要指总部职能部门、事业部及企业的提供事务性IT工作,主要包括各类应用系统服务、桌面级本地服务、通讯及沟通服务、网络及硬件服
32、务和VIP服务等。在承建的广石化运维管理中,通过对企业IT人员的调研、讨论,整理形成IT服务内容,对服务内容进行详细分析总结,形成IT服务类型,对服务类型进行梳理、逐步分解与设计,形成服务组建、业务子类和服务条目,对服务目录设计过程进行归纳、评估,形成了具有石化特色IT服务目录模型。在这一过程中,首创了石化行业的运维服务目录的设计先河,积累了较为丰富的经验。为广州石化梳理、设计的运维服务目录如下:在本次项目中,根据对石化运维业务现状的分析,设计服务目录如下:服务目录与其它流程的关系服务目录是为客户提供的服务的总目录,它不能独立存在,必须有其它模块的支撑。支撑模块包含相关服务流程和权限管理。其中
33、,服务目录是上层,相关服务流程是底层,服务流程接收服务目录传递过来的相关参数,创建工单,实现具体工单流转。权限管理:实现对服务目录的权限控制,不是所有角色都拥有所有服务项的服务,权限管理能够根据对不同的角色提供不同服务项。服务请求:用户想要获得支持、递送、信息、建议或文档的请求,并不属于IT基础设施方面的故障,服务目录需要与服务请求管理流程进行关联。例如用户在系统功能方面的问题或请求、状态查询、口令重置、数据库的提取、要求提供具有一定IT技能或服务的新雇员的请求等。事件管理:对IT生产环境中导致IT服务中断或服务质量下降的任何事件的这类服务,服务目录需要与事件管理流程进行关联。变更管理:对已批
34、准构建或实施的、正在维护的或作为基线的配置项所作的增加、修改或移除等这类服务,服务目录需要与变更管理流程进行关联。作业计划:对周期性的巡检或临时性作业的这类服务,服务目录需要与作业计划管理流程进行关联。业务流程:根据组织实际情况对用户提供个性化的相关服务,服务目录需要与个性化业务流程进行关联。服务水平管理服务水平管理目标服务水平管理为处理所有与服务相关问题提供统一的接口,对与用户商定的服务级别和服务目标进行管理,随后监视约定的服务级别执行情况,并生成报告。服务水平管理功能服务水平管理(SLM)这个流程是根据合理的成本范围和客户需求,确保所有运维管理流程、运维服务水平和用户满意度达到标准。并通过
35、定期监督和运维报告来确保服务质量得以维持并逐渐改善。服务水平管理功能模块通过建立与客户达成约定的服务级别协议,包括运维服务的范围、服务指标集等内容,并对相关联的服务流程的执行情况进行监控,最终统计出相应的服务指标,并形成改善计划和服务水平报告。具体功能主要包括:(1)实现服务水平指标信息维护功能。能按服务水平协议进行维护,能自定义服务项目、指标名称等,并能与客户、信息系统等进行关联。能对服务水平指标集进行标准化和维护。(2)服务水平能够管理不同的服务水平指标集,对指标的设置可进行灵活调整,同时能够设置服务水平计算公式,计算公式可通过系统进行修改。(3)能够对不同应用系统的服务水平进行差异化管理
36、,比如ERP、MES、网络维护的服务水平指标都可能不一样。(4)服务水平指标录入系统后,其KPI指标自动与实际达成情况进行关联,并能够对水平指标违约情况进行通知和预警。(5)服务水平在设置后,在服务提供期间,能够自动收集各服务水平指标完成情况,实时查看各个服务水平指标完成情况,同时收集的服务水平能够与已设置的服务水平指标进行比对,比较实际值与设置值的差异情况,对于将要违规的服务水平进行通知和提醒。服务水平管理功能模块的维护功能提供以下功能:录入服务水平协议提供储存已审批的服务水平协议、启用/停用、发布等功能。记录服务水平指标对服务水平协议中的服务水平指标进行录入管理。监控服务指标集对录入的的服
37、务水平指标集按照相应的计算方法进行监控并预警。服务水平统计报告对服务水平指标进行统计分析,并可按照不同样式出具报告。服务水平定级管理对应用系统定级评分,之后按评分标准提供I、II、III级三种不同的服务标准。服务水平设计服务水平设计需要遵循以下要点:基于影响要素,对应用系统进行分类,确定所需何种级别的服务将服务按水平相对高低程度分为I、II、III级或其他适合等级原则上不同类型的系统对应不同级别的服务水平根据石化系统的重要程度类别进行分类,设定服务水平定级I、II、III如下:(一)服务水平衡量指标设计服务水平衡量指标的设计需要考虑以下:用户可以根据需求选择I、II、III级服务或其他适合等级
38、对签订的服务水平指标进行设置、测量、监控、预警按照应用系统进行指标管理每个应用系统对可用性、故障恢复时间指标进行管理,同时设置测量、过滤条件统一显示所有应用系统的服务水平指完成情况在承建的广石化的运维管理项目中,根据广州石化IT服务目录模型(详见“.4.3服务目录设计”),为广石化设计了服务类型为业务保障的服务水平协议(SLA)如下:针对石化总部运维业务特点,设计服务水平衡量指标样例如下:(二)服务水平指标的衡量与计算服务水平指标的衡量和计算需要考虑如下因素:监控系统与IT服务管理系统通过应用系统进行关联,监控系统对可用性指标进行测量并返回IT服务管理系统IT服务管理系统存储可用性的计算公式,
39、定期获取监控的可用性指标,与约定的指标进行比较,对于将要违约的系统进行预警同时对系统SLA的其他指标进行测量和预警具体:说明: 可用性实际指标=(运营时间-中断时间)/运营时间,其中的中断时间由运行监控系统自动提供,运营时间不包括计划内停机检修时间。服务水平管理特点服务经理要清楚理解并文档化客户对IT服务的需求,通过协商的方式帮助IT组织在客户需求的质量和IT组织提供的质量之间达到平衡。服务级别协议内容中服务对象内容可从CMDB中选择相应配置项。服务水平协议内容中服务目录为功能点,选择后可转入服务目录功能模块,进行添加或编辑等。签订的服务水平协议要录入在IT服务管理系统,并可以对其中的服务承诺
40、的指标进行监控。监控的结果用来评估实际的服务表现和服务效能。服务水平协议内容中可用性指标的监控,需要相应监控平台提供监控数据根据设置指标对IT服务提供过程进行监控,对于将要违约的SLA进行告警提醒服务水平管理团队应当在约定的时间内对服务表现和服务效能进行评估,并与服务经理共同完成服务水平报告,服务水平报告要按照SLA中设定的报告机制,定期进行汇报。服务经理应监控和报告不符合服务水平目标的地方,并就不符合的地方进行审查。必要时需提交服务水平改善计划。对于变更的服务级别需求或超限的服务水平协议,服务经理与服务水平管理团队需按照服务水平管理流程进行更新,并在IT服务管理系统中录入新的服务级别协议。储
41、存的服务水平协议点击“启用”,其服务承诺指标方开始通过系统进行监控;点击“停用”,系统停止监控。业务系统定级模型:基于对业务系统有影响的运维中心内外部各类要素,对业务系统进行定级;表 业务系统定级模型影响要素分类影响要素名要素值分值权重得分监管要求故障实时通报16%故障备案无监管要求影响的程度重大12%严重普通细微影响的范围集团12%企业部门个人系统种类经营管理类12%生产营运类基础应用与安全服务类系统运行的要求运行时间7*249%5*115*8业务性能高9%中低特殊要求(重保期)是30%否总分在评分模型中针对上述的要素进行评分,最终的评分按照评分标准对系统进行定级为核心、重要、一般;服务水平
42、定级对服务质量要求进行分析,将各项服务水平指标按照不同级别要求进行打包,比如分为I级、II级、III级三个服务等级包,供用户选择;当对业务系统定级后,系统默认对核心系统系统I级服务,对重要系统提供II级服务,对一般系统提供III级服务;如:表 服务水平级别表服务水平等级包服务水平指标I级可用性故障恢复时间平均最大99.9%2小时4小时II级可用性故障恢复时间平均最大97.9%4小时8小时III级可用性故障恢复时间平均最大95.9%6小时12小时用户可根据实际情况对服务等级包进行选择;若业务系统所需的SLA指标与模板中的值不相配,可以为系统另定义“例外SLA”指标。服务计量管理服务计量管理目标服
43、务计量管理的目标是对IT服务进行计量,对IT服务的实际服务内容、服务成本和服务收费进行管理,以服务质量和服务标准为准则进行计费。服务计量管理功能提供按组织、应用系统的服务计量(月/年/季)。提供按服务目录的服务内容及工作量查询(月/年/级)。要求此功能必须具有可扩展性,考虑服务成本和服务收费。服务计量能够与服务目录进行关联。服务计量支持灵活定制服务计量的计算公式,可以根据实际情况进行灵活调整。服务计量设计不同的服务目录按不同的计量模型进行计费,如服务计量管理特点在设置IT服务计量标准时,最核心的是要设置IT服务计量模型。通过合理的模型覆盖集团公司所有的信息系统运维服务,并能够将每个信息系统的运
44、维服务合理的分摊给成本核算单位/事业部/专业公司。最终将信息系统的运维费用合理的归结到单位和专业公司。事件管理事件管理目标事件管理流程是为系统尽快恢复正常工作状态而设计,其关心的重点是快速响应、快速恢复,使故障对业务的影响最小化。事件管理流程受事件触发和驱动,所谓事件,是指发生了非常规的运作情况,包括系统崩溃、软件故障、任何影响用户业务操作和系统正常运作的故障、以及影响业务流程或违背服务水平协议的情况。事件也包括一个用户的请求,如重设用户密码。不是所有的事件都由用户产生,监控管理平台产生的告警也可引发事件。事件管理功能事件的接受与记录支持多种的事件录入方式,包括:支持人工在呼叫中心系统中手工派
45、单,以及呼叫中心系统自动产生事件请求(自动派单),通过呼叫中心系统和集中运维服务之间的接口将事件信息传递到事件管理流程。支持人工在监控平台中手工派单,以及监控管理平台自动产生事件请求(自动派单),通过监控平台和集中运维服务之间的接口将告警传递到事件管理,产生一条新的事件。根据提交方式的不同,支持WEB、Email、电话和其它管理软件自动发送等方式:Web方式:经过授权的用户可以登录界面输入事件信息,并且能够查看知识库,判断是否可以自助解决问题。用户按要求填写故障处理请求内容,不能漏掉必需的关键字段,否则无法生成事件。若注册成功需自动将故障处理请求的ID号送回请求者,以便随时查看自己提交的请求状
46、态。人工方式:用户打电话向服务台接线员报告问题,接线员根据记录的内容,注册故障处理请求。系统应当提供每个故障处理请求的检查列表(预先定义的一些常规问题,以标准化的方式收集信息),受理员可以通过检查列表的帮助,询问必要信息,然后系统自动将问题结果填入故障处理请求中,实现信息采集标准化。其它系统:其它系统可以通过集中运维服务API接口自动或手工产生事件。事件管理提供了预先定义好的模板,对于新建的事件提供了默认值,大多数的数据项都由系统自动产生,不需要用户手动输入,大量避免了人工差错。事件管理模块还支持用户对重复事件进行关联,使得支持人员可以快速解决大量事件,也可以从大量重复事件中迅速总结出问题。事
47、件分类和优先级事件管理内置默认的分类和级别,同时支持对事件分类和级别的灵活自定义功能。事件管理提供大量的各种类型的字段来记录服务管理的相关信息,字段的类型包括:数字、字符、下拉列表、布尔变量、时间、人员等。而且完全依照ITIL设计,所以在服务管理中一些重要的、通用的属性已经定义好,用户可以直接使用。另外为了记录更多个性化的信息内容,提供了自定义字段,可以按照用户的需要定义新的字段记录特殊的信息。具体的实现在大量的预留字段中选择合适的类型,设定字段的名称就可以了,这种操作完全在图形界面下通过鼠标的点击、拖拽选择来实现的,不需要编程也不会对数据库结构产生影响。支持下拉列表型的字段属性,保证录入信息
48、的准确,用户只需要鼠标的选择就可以决定字段的内容。可以在图形界面下由管理员预先按照事件的级别层次和内容定义事件的分类,并且可以随时灵活调整,立即投入使用,不需要重启服务器等繁琐的操作,前端用户正在进行的操作不会受到影响。资产记录中包含配置元素的搜索代码,同时在其他服务流程分类中有“配置项”这种数据的类型,所以只要监控管理平台上传的告警信息中包含有正确的CI代码,就可以确定是哪个设备、此设备提供的服务、服务级别、优先级等。根据发生告警的对象自身属性和所影响的服务自动计算出来此突发事件的优先级、最终期限等相关的信息,并且可以由管理员决定操作者是否可以修改。同时,每个处理人员可以能够变更状态的范围可
49、以由管理员进行限制,例如一线工程师只能够从接收、故障处理中、中断三种状态中转换,而不能够新建或关闭故障单,避免了管理中的漏洞。事件调查和诊断在运维服务平台中事件管理与问题管理、变更管理等功能本来就是紧密集成、相互关联的,可以互相引用。知识库管理允许以工单记录作为知识基础,形成相关问题草稿库,经知识经理的评审后,提升至经验库。经验库的管理权限分为提交,可读,修改,删除,审批等权限。可以根据问题的类别把问题组织成树状结构,允许用户按类检索查询。在调查和诊断过程中,应该充分发挥历史经验和资料的作用,借助以前或他人积累的案例解决问题。运维服务平台提供了灵活、有效的历史事件和问题经验检索功能,允许用户随
50、时、方便地查找相关资料,可以大大提高各级人员的工作效率、提高事件的一次解决率。事件处理事件处理包含以下一些子功能:系统可以实现人工指派和自动指派方式,并且可以重新指派,如:故障处理请求是某台设备出现故障,则自动将故障处理请求派发给管理该设备的部门和人员。可以向受理人员发出提示信息,如手机短信、电子邮件等,提示工单的生成。在受理工单人员登录进入系统后,能够根据自己的权限看到自己应处理的故障单,并且根据角色的不同所看到的表现形式也是不同的。受理部门生成事件工单后可以有以下几种处理动作:事件处理请求批准:系统定义一个事件处理请求的批准流程,只有按照步骤由有权限的经理批准后,才可以进行下一步的操作。确
51、认事件工单:可将事件处理分派到工作组或个人。退回事件工单:受理人如认为工单分派错误,可填写理由,退回上一级人员修改,工单进入退回状态。转发事件工单:支持事件工单的同级别转发、以及转发到其它部门的管理平台。通知:支持通知功能,受理人如有阶段性处理成果,可填写阶段处理结果通知相关人员(可进行多次阶段通知)。处理过程的监控:系统可根据事件优先级、处理时间、转派次数等进行监控,根据预定义条件,自动向相关的负责人发送通知或转派。可以通过事件日志来监控事件处理。事件处理请求查询:支持多角度的查询功能,可以根据事件处理请求中的任意字段查询事件工单的信息。事件升级可以参数化定义自动升级处理的阀值,系统可基于时
52、间信息升级处理。当事件处理超过预期时限,根据预定义的升级条件,运维服务平台将该事件自动/手工升级到指定的级别。另外,在事件处理的过程中,如果某一事件不能在规定的时间内由一线支持小组解决,那么更多有经验的人员和有更高权限的人员将不得不参与进来,即由二线解决。事件结束允许管理员按照需要任意定制事件的结束代码,而且这些代码是按照多级层次化的树状结构显示的,使用非常方便。与各种监控系统紧密结合对于监控系统自动产生的事件工单,可以自动关闭,可以从监控系统接受事件、对事件的阶段性处理回复给监控系统、也可以由监控系统更新事件的处理进展,所以可以通过配置在监控系统发现问题结束后发送消息,自动关闭在相关事件中,
53、这一功能可以很方便地配置出来。事件经过事件处理流程后,可以关闭,关闭的事件必须提供一个结束代码。结束代码可以由授权用户自行定义,灵活扩展。事件管理角色事件管理流程角色包括:服务台:服务台人员负责接收所有的事件,对事件进行初步的处理,并根据实际情况将事件分派给一线支持工程师;一线支持:专业技术人员,接受并处理由服务台专派过来的事件;二线支持:二线支持人员是企业内部相关问题领域的专家。负责提供对一线无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务。可以考虑按照所维护的应用、系统进行分组,如:网络组、主机组、应用组等;三线支持:产品及设备供应商,问题处理过程中由于产品及设备产生的问题寻求第三
54、方供应商的支持;事件经理:事件经理负责事件解决过程中的协调和监控,以及事件升级的判断及具体执行。在建设事件管理流程时,需要考虑将这些流程角色与客户的运维组织和人员进行对应,某些运维人员可能会同时拥有服务台/一线支持等多重角色。具体如何对应将根据实际情况进行建设。事件管理特点独立的流程分类产品基于ITIL最佳实践开发,产品中有事件管理、问题管理等ITIL中规范的分类定义,不同分类有各自独立的字段、表单、业务逻辑、安全设定等,绝对不会将不同的流程混淆在一起。对ITIL就有良好的支持,用户可以很方便地把ITIL的管理思想贯彻到实际环境中。事件处理的模版事件处理模板预先定义出事件处理的手段、步骤、期限
55、等,保障处理的及时准确,实现可预期的服务承诺。可以定义任意多种模板。通过事件处理模板,规范了业务处理,无论在任何时候有任何人去解决,都可以按照模板的内容指示在规定的时间内采用最优化的方法解决问题。灵活的通告机制提供了通知机制,可以以Mail、短消息等方式通知运维人员,并且可以在各个管理流程的任意触发点触发。确保安全提供安全管理,包括授权、认证和审计功能,可以针对角色进行权限的定义。同时针对不同的角色,可以定义其不同的数据视图、表单、操作,保证不同用户在登录时,只看到与其职责相关的数据,只能进行与其职责相关的操作。对于操作员对数据的修改,平台提供了严格的审计,所有的修改都可以作为历史信息记录下来
56、,保证数据的安全性。事件管理考核指标(KPI)事件管理考核指标(KPI)包括:事件的总数;平均解决时间;按优先级计算的平均解决时间;在规定时间内解决的事件所占的百分比;由一线支持解决(不将事件转交)的事件所占的百分比;每个服务台工作站或每个服务台员工平均解决的事件数;不需拜访用户就解决的事件数;初步分类正确的事件数量(或所占的比例);正确转交的事件数量(或所占的比例);可根据客户实际现状制定考核指标。问题管理问题管理目标问题是一个或几个已暂时处理但根本原因尚不明确的事件,许多事件往往是由同一个问题引起的。问题的来源主要有以下几种:已经关闭的事件,经过回顾分析后,可能形成一个问题;重大事件,虽然
57、经过紧急处理恢复服务,但未找到根本原因,也形成一个问题;对于趋势性事件的分析,形成问题。问题管理流程的根本目的是消除或减少事件的发生,将系统内部缺陷导致的业务事件或问题的负面影响降到最低限度。通过问题管理流程,问题分析专家分析发生在生产环境的事件(常常是已关闭的事件记录),确定最常发生或具有最大影响的事件,找出根本原因;然后生成变更请求(RFC)、变通方法或建议的预防性措施来防止事件的再次发生。所以问题管理流程需要和变更管理流程一起来实施找出的解决方案以从根本上解决问题。问题通常具有以下特征中的一个或全部:一组具有一定关系的已结束的事件;一个重大或紧急事件(事件处理结束后定义为问题,由问题管理
58、找出根本解决方案)。问题管理与事件管理之间的差异问题管理与事件管理并不相同,它的主要目的是查明事件的潜在原因,并制定随后的解决方案和预防方法。在大多情况下,问题管理目的与事件管理目的之间有一定冲突,因为事件管理的目的是尽快地恢复客户服务,通常是通过实施替代方案,而非确定一个永久性的解决方案(例如为了尽可能地预防未来可能出现的事件,寻求改善信息技术基础架构的结构)。就问题管理而言,对潜在原因的调查可能需要一定的时间,找到解决方案的速度是次要的考虑因素,但是预防了问题的再次发生。问题管理流程可以按照不同领域的问题(如网络问题,或应用问题等)由相关组的技术支持专家来执行。原则上这些专家可以是事件管理
59、的二线支持专家,他们在负责接受来自一线支持人员(服务台员工)的支持请求的同时,也负责对以往事件进行分析,找出事件产生的根本原因,从而确定解决方案,消除这些根本原因,最终使此类事件不再发生;另一方面,问题分析专家也要从发生的事件中找出事件的发展趋势或潜在可能发生的问题,从而预先采取措施,保证系统服务的正常化。问题的根本原因找出后即成为已知错误,对已知错误实施解决方案,从而解决问题。所以问题管理流程的输出有:变更请求变通方法根本解决方案预防性措施已知错误通过问题和事件的分离,可以使得突发事件和常见问题得以分开处理,避免重复处理类似问题或者已知错误,大大减去了支持人员的工作量。通过对常见事件总结成问
60、题,可以对运维经验进行积累。通过规范的流程,确定了管理人员的职责,可以解决职责不清的问题。通过流程角色的设置,而不是组织结构的设置,来解决一人多岗情况下的各人对业务流程的不熟悉,或者职责不清的问题。通过通知机制和最终期限的设置,可以使网管人员及时的处理问题,达到加速了故障的解决时间。问题管理功能问题生成问题管理模块可以支持以下几种创建问题的方式:用户通过电话反映用户通过服务台系统自行申报自动监控系统产生事件解决过程中派生问题管理模块通过历史事件进行统计分析,从中分析出潜在的问题,自动或手工创建一个问题记录,该问题记录与相关事件信息进行关联。直接录入:在问题管理模块界面中创建问题记录,直接录入问
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论