IT运维监管控一体化解决方案_第1页
IT运维监管控一体化解决方案_第2页
IT运维监管控一体化解决方案_第3页
IT运维监管控一体化解决方案_第4页
IT运维监管控一体化解决方案_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、-作者xxxx-日期xxxxIT运维监管控一体化解决方案【精品文档】IT运维监管控一体化解决方案IT运维管理闭环体系2010-11-17本文论述了IT运维监管控一体化趋势,建设要求、原则,方案整体设计和具体实现。目 录1.IT运维服务管理概述52.IT运维管理一体化管理解决之道63.IT运维一体化建设目标64.系统设计原则74.1.系统的先进性74.2.系统的实用性74.3.系统的有效性74.4.系统的可行性74.5.系统的可靠性84.6.系统的开放性84.7.系统的扩展性84.8.系统的安全性85.IT运维一体化平台建设原则85.1.统一规划85.2.转变观念95.3.分步实施95.4.可插

2、拔模块化95.5.有所为,有所不为105.6.不唯美,而唯实106.IT运维一体化解决方案106.1.理解IT运维一体化106.2.监视模块建设126.3.流程管理模块建设126.4.自动化操作模块建设136.5.CMDB建设146.5.1.CMDB战略核心地位146.5.2.CMDB建设方法15.3.CMDB建设保障166.5.4.构建CMDB模型176.5.5.避免CMDB建设误区186.6.模块之间接口实现186.6.1.监与管之间的接口186.6.2.管与控之间的接口196.7.报表系统197.IT运维一体化特点207.1.监管控一体化整合207.2.层级化展现平台207.3.综合事件

3、管理平台207.4.全方位IT资源管理平台207.5.面向基础设施207.6.面向维护管理者207.7.面向领导决策者218.IT运维一体化系统功能218.1.信息门户218.2.事故管理218.3.问题管理228.4.变更管理:228.5.发布管理238.6.配置管理238.7.工单管理238.8.作业计划238.9.值班管理248.10.考核管理248.11.代维管理248.12.知识管理258.13.安全管理258.14.服务持续性管理258.15.容量管理258.16.可用性管理269.总结269.1.IT运维管理内容层面269.2.IT运维一体化优势271. IT运维服务管理概述随着

4、企业信息化程度的提高、IT环境规模的扩大和IT环境复杂度的增加、行业内服务竞争的加剧,如何保证IT系统安全稳定运行,为业务提供可持继性的支撑,最优化IT环境的性能,有效控制IT成本和计划IT投资,这些都对IT系统运行维护支持以及IT服务水平提出了新的要求和挑战。面对的挑战:n 越来越高的服务成本n 以流程管理为驱动的转型阶段n 从以“技术为中心”向“业务驱动”的转型n 服务协议成为最佳成果的代名词n 合作伙伴关系将替代“客户供应商”的简单关系n 服务成为应用的代名词信息技术在业务中起着越来越重要的作用,越来越多的业务流程依赖IT技术。从技术和业务的双重视角对其进行有效管理,保障业务处理平台高效

5、、安全、正常运行,为业务服务提供有力支撑成了运维人员和IT部门的常态工作。如何在企业内部建立起一套有效的运维交互平台,理顺不同部门以及上下级之间的协作关系,规范工作流程,提高工作效率,实现故障处理、资源调度优化、系统割接、业务保障等运维工作的闭环流程监控和管理,是目前各IT运维部门关心的问题。但是,由于业务快速变化、用户环境日益复杂、IT应用日益繁多等因素导致了IT服务与实际业务需求脱钩,IT服务与业务部门的实际要求出现鸿沟,由此催生了面向“IT服务”的管理挑战与需求IT服务管理。IT服务管理立足于服务,建立以客户为中心,以流程为导向,从业务角度出发的全新的IT管理模式,通过整合IT 服务与业

6、务,提高了组织对外提供服务的能力,是真正实现这种服务管理的有效途径,能帮助用户最终实现IT与业务的融合。2. IT运维管理一体化管理解决之道受习惯、时间、财力等诸多因素的影响,在迈入IT服务管理过渡阶段过程中,大多数客户的IT服务部门管理的变革没能跟上技术的发展,未对IT服务管理进行整体规划,没有导入适合现阶段的管理机制,依然沿用“被动响应、救火队”服务支持管理模式,依然缺乏适用的自动化管理流程,导致IT服务管理能力低下。IT运维一体化平台依靠对复杂异构的IT资源环境(网络设备、安全设备、服务器、存储、机房环境、操作系统、数据库、中间件、业务系统、IT资产、日常工作、外包管理.)的一体化监(面

7、向业务服务的监视)、管(面向运维流程的管理)、控(面向日常运维的控制),最终达到保障IT基础架构稳定可靠运行、降低系统和业务应用宕机风险、提高运维支持和服务管理效率、优化运维流程、建立绩效体系、控制运维成本、改进决策过程的目标。3. IT运维一体化建设目标IT运维一体化平台的总体目标是建立一个稳定、高效、灵活的IT运行和维护管理体系,涵盖IT运维工作中的监、管、控三方面,为业务应用正常运行提供有力的支撑,提高信息系统运行效率,提高服务质量,降低运营的成本。n 实时管理:及时发现故障与异常,并迅速定位,尽快解决;通过运行分析,调整运行策略;通过业务系统性能的测量和管理,优化系统性能,提高系统运行

8、效率。n 闭环管理:通过科学规范化的流程管理保证故障、异常、隐患由相应的人员采用必要的方式闭环处理;促进巡检、变更的工作标准化、规范化;通过流程运行的考核数据,促进运维质量和运维效率的提高。n 精益管理:通过丰富完善的报表和图档资料,为运行维护工作提供直观准确基础数据;避免维护工作中的疏漏而带来的人力、资金浪费;分析信息基础设施的运行负荷,制定合理的资源调配方案。n 战略管理:优化现有的IT基础设施的运行性能;提升系统性能;预测并计划信息基础设施的需求;考核并不断提升服务水平。4. 系统设计原则...1. 系统的先进性先进性是每一个IT系统建设不断追求

9、的目标。随着IT技术的迅速发展,更新的、更先进的技术和思想总是在不断出现,因此,系统设计必须兼顾先进性。系统规划的先进性是将系统看成一个有机的整体工程,不但在规划时要考虑到它的目前现状,还要考虑它的发展和未来。不论硬件或软件,在应用目前相对成熟的技术基础之上,系统必须能够不断完善、扩充,功能越来越丰富,尽可能小的代价来适应系统需求的不断增长和技术的不断发展,使现有系统能够与IT运维需求同步增长。4.2. 系统的实用性IT运维一体化平台建设能否成功,实用性非常重要。系统设计必须以实用为出发点,而不是一味追求新技术、新理念和照搬国外模式。IT运维平台是为IT环境支撑提供运维管理的基础。要达到实用性

10、的要求,必须设计时充分考虑到国内情况、本行业特点和本企业实际状况,充分明确:提高自身的IT运维管理水平和提供更好的业务服务能力才是IT运维管理平台建设的根本目标。4.3. 系统的有效性IT运维管理系统是IT部门每天工作的基础和平台,是IT部门的根本。如果不具备有效性,华而不实,很难设想IT部门如何开展工作,如何实现有效的IT运维管理,更无法谈论提供高质和高效的IT服务。4.4. 系统的可行性IT运维的理念和设计规划再好,如果不具备可行性,也只是空中楼阁。因此,必须考虑系统建设的可行性。可行性的考虑包括:目前技术上是否可以实现、自身人力、物力和财力上的支撑。4.5. 系统的可靠性IT运维系统的重

11、要性不言而喻。如果IT运维系统运行故障而停止工作,那么企业的IT环境犹如没有控制盘的汽车,处在无序、惯性行驶的状态。此时,IT环境对于IT运维人员而言,完全陌生,处于隔离、未知、失控的状态。对于IT运维管理系统,监控的失败或瘫痪相当于人失聪、失明,流程管理的失败相当于大脑丧失了思考能力,自动化运维操作的失败相当于截肢瘫痪。因此,任何模块的失败,后果都是严重的。IT运维系统本身的健壮性、自身完善性、稳定性是至关重要的。IT运维平台是企业IT环境中实现正常运维工作的基础和管理平台。因此,IT系统建设一定要考虑系统的可靠性。4.6. 系统的开放性IT技术发展日新月异,IT系统的开放性和标准性越来越成

12、为一种趋势。只有采用开放的系统,使用开放的技术,才能保证整个系统有持久的生命周期,才能长期保护企业在IT运维的有效投入。例如:接口之间采用Corba,xml,jdbc,ftp,jdbc等开放技术。4.7. 系统的扩展性随着IT业务系统的增加和IT环境规模的扩大,随着时间的推移和情况的变化,无不需要考虑系统功能的变化和调整。因此,IT运维一体化平台系统需要具有很强的扩展能力和适应能力。4.8. 系统的安全性基于IT运维管理系统的角色,IT运维系统的安全变得至为关键。很难想象,IT运维管理系统由于病毒或者安全入侵,导致IT运维平台瘫痪带来的后果。5. IT运维一体化平台建设原则. 统

13、一规划IT运维一体化建设中必须坚持统一的规划、明确的发展方向和思路,在全局、宏观上做到统筹安排,合理规划。实施对整体架构和数据模型的统一管控。5.2. 转变观念任何生产活动都是人来主导的,IT运维管理体系的建设不单是一个软硬件系统的建设,还是一个运维团队和人文的建设。IT运维一体化平台的建设,是IT运维理念和管理上的一次划阶段的变革,它需要整个IT运维部门的文化、体制和思想也要作相应的转变和调整才能成功。根据以往情况,企业的IT部门往往都是技术至上的工程师文化,而这种源于研发企业的文化和现今IT管理部门作为业务支撑部门的定位严重不符。因此,完善IT服务管理的过程,也必然是部门文化和IT运维理念

14、和体制转变的过程。在建设IT服务管理体系的过程中应遵循以下2个原则:n 高起点,借鉴业界先进的管理模型和方法。n 重执行,任何管理规范和流程的制定都要以可执行,可考核为前提。5.3. 分步实施IT管理体系的建立和完善不可能一蹴而就,需要有长期的计划步骤实施,必须循序渐进,遵循分阶段和迭代实施的原则。n 横向扩展:从个别的业务系统扩展到所有的业务系统,规模上逐步从小到大。n 纵向加深:功能上逐步完善、丰富和细化,模块和子模块数量从少到多,从有到优。n 制定计划,“有重点、分阶段”展开。5.4. 可插拔模块化IT运维一体化平台涵盖了IT运维工作的各个方面,从全局到局部,从宏观到细节。系统架构设计必

15、须以模块化为基础。n 必须平衡考虑系统内部模块的松散性和耦合性。作为同一平台内部的模块,由于相互协作,模块和子系统之间必然存在着耦合性。另一方面,为了控制单点故障带来的对系统整体的影响,必须有效控制单点故障后所影响的范围并在此基础上才有可能提供快速恢复的能力。n 模块化为可插拔性提供了可能,使得系统设计上可扩展性原则得以实现。n 可插拔化:为模块的升级、优化和采用新技术,提供了实现的前提。不同组件、不同层面的模块的替换,对系统的其他模块是透明的。局部的调整和升级并不对系统的整体架构产生必要的调整。5.5. 有所为,有所不为在一个阶段,不求大、不求全。求大求全,则难以有所为,必然陷于被动。必须明

16、确,有所不为而后可以有为。5.6. 不唯美,而唯实过分追求完美,会导致华而不实,会导致系统本身和建设上的虚、浮、躁。只有尊重实际情况,才能脚踏实地,步步为营,有效推进IT运维管理工作的建设并不断提高。6. IT运维一体化解决方案. 理解IT运维一体化针对IT运维,我们划分为三个方面,监视、管理和控制。“监、管、控”三者紧密关联,逻辑上是一条龙过程,并形成闭合环路。监控的结果作为依据来分析、决策和指导IT运维工作的进行;IT运维工作本身需要流程管理来进行规范和控制;自动化运维操作将运维工作中大量、重复的劳动来批量控制,自动完成,节省人力,并提高效率。运维工作的质量和结果需要监控来进

17、一步实现观察和确认,以判断是否符合工作预期,必要时,再次调整和提高。可以说,监视是我们的眼睛,帮助我们透视和认清网络、主机、应用等整个IT环境,是我们的情报来源;流程管理是我们的大脑,帮助我们思考、制定决策和完成流程控制和管理,是我们的情报分析和决策中心;控制是我们的双手,完成自动化批量处理,是我们的实施力量和手段。由此,我们说,“监、管、控”,这是有序的一条龙过程。双手完成运维处理和控制动作之后,我们需要眼睛再次监视,来查看控制结果。继而,需要大脑来审验:是否符合预期?是否需要进一步调整和控制?如是,进而开始新的“监管控”流转过程。由此,我们还可以说,“监、管、控”,这又是一个闭合的环路过程

18、。IT“监管控”一体化运维,就是真正实现上面的一条龙过程和达到闭合环路的目的。在IT“监管控”一体化运维模式下,当监控管理模块发现故障并产生告警后,如满足相应的过滤和触发条件,通过接口会自动触发运维流程管理模块生成相应的工单,运维流程管理模块依据工单信息和相应运维人员预先设置好的关联条件,自动寻找、识别和匹配自动化运维模块中的操作脚本,实现自动和快速的故障操作处理。由此实现从发现故障到解决故障的IT运维全自动化,并自动完成运维操作日志记录,以备事后回顾和审计。IT运维自动化不是IT运维工作简单的维护过程的改变,而是IT运维管理工作的根本变革,是IT运维管理的发展趋势。在IT“监管控”一体化的运

19、维平台中,原来的网管监控、运维流程管理和自动化运维操作平台转化为对应的“监、管、控”三个模块。IT运维一体化平台应在设计之始即充分遵循ITIL理论,并结合国内现状、行业特点与实践经验,建立以服务流程为驱动的管理平台,实现人员、流程、技术三方面的完美结合。唯此,才能够在帮助用户深耕基础架构、夯实基础之后,与用户一起建立遵循先进流程管理思想的ITIL理论、实现以服务流程驱动为导向的实用的“人管流程”。 IT运维一体化平台为用户带来“IT管理理念+系统工具+过程方法”的全新的IT服务管理组合,为用户提供包括管理流程与规范、业务及实施方法在内的全方位IT运维服务管理一体化解决方案。IT服务管理的最终目

20、标是实现业务与技术的融合,IT运维一体化平台紧扣业务部门与IT部门融合要求,提供业务与技术沟通和连接的平台,将业务部门与IT部门紧密结合在一起,能够帮助用户持续提高业务部门和客户的满意度,为客户的IT服务管理做出贡献,提高用户的核心竞争能力。实施IT运维管理一体化可以帮助企业将IT系统原来的混乱状态变到主动的管理状态,包括将技术导向变为流程/服务导向,将被动处理变为预防为主,将孤立、分散系统变为集成化的系统等等。总之,IT运维管理一体化通过将人才、流程和工具技术进行有机结合,实现高质量、高可靠性的IT服务服务管理。6.2. 监视模块建设IT监控内容:网络设备、链路、主机操作系统、数据库、存储、

21、中间件、应用软件、业务服务、机房环境(温度、湿度)、机房门禁等。通过IT网管监控,可以帮助运维部门和人员实现全天候自动检测,可以及时、快速发现故障,通过事件关联分析,并结合问题管理,实现快速定位故障根源、快速预防和恢复,从而提升IT运维响应能力,变被动式管理为主动式运维,使IT运维工作从事后“救火式”管理转变到事前预防型管理。6.3. 流程管理模块建设IT运维管理涉及的对象包括设备、技术和人员。其中,人是IT运维生产力决定的因素。如何有效实现设备、技术和人员的统一管理,如何实现人的组织和行为的科学化和规范化,需要IT运维流程管理。IT运维工作本身具有工作量大、全面、繁琐和复杂的特点,通过有效的

22、IT运维流程管理平台,既可以梳理工作流程,又可以理顺部门之间和人员之间的职责关系,达到标准、规范、统一和科学的运维,保证IT运维工作无论是整体和全局,还是细节和局部,都能有效推进,避免IT运维工作的无序和混乱。IT运维流程管理通过建模,提高流程的可控性。同时,IT运维流程管理提高IT运维管理和执行工作的透明度。传统手工运维流程的不可控性和不透明性给流程定制、管理和优化带来相当大的困难,而IT运维管流程管理可以帮助IT运维部门一目了然地看到整个流程的全局和各运维工作节点的状况。通过标准化的IT运维流程管理,可以不断提高IT运维工作质量,提升企业内外的IT服务满意度。电子运维流程管理系统定位于通过

23、电子化手段来确保运维工作的流程化、工单化、自动化和信息化,实现对流程的实时监控与闭环管理。6.4. 自动化操作模块建设在IT运维工作中,存在着大量和重复的劳动,如补丁安装、合规检查、配置收集、日常巡检等。计算机的一个重要特点,就是可以帮助人类完成大量的、重复的劳动。自动化运维,就是人类在IT运维工作中具体操作层面的计算机化。通过自动化运维:n 实现批量处理,高效、快速工作;n 节省人力,降低人力成本;n 将有限的IT运维人员解放出来,避免大部分时间和精力是处理简单的、大量的、重复的问题和工作,而是更多时间和精力关注如何提高和保障IT运维;n 技术知识和操作脚本共享,运维操作精确化、同质化、优质

24、化、规范化、统一化,避免运维工作中操作质量依赖于个体人员的知识、技术水平、工作责任心和态度等不可控因素;n 实现转变:以前运维工作更多依赖于“运维英雄”和埋头苦干型员工,现在更多依赖于运维集体的力量;n 交由计算机操作,可以避免人工误操作导致的逻辑错误;n 实现运维操作简约化、透明化、规范化、标准化,有利于事前审核和事后检查。6.5. CMDB建设6.5.1. CMDB战略核心地位作为ITIL/ITSM(IT服务管理)的核心,CMDB正从管理软件附属品的地位逐渐走入主流的战略核心地位。企业的IT环境越来越复杂,数量庞大、品种繁多。信息散布在企业的不同地方、不同系统中,而且信息的格式、内容也是千

25、差万别,难以统计、查询、利用这些信息,由此给使用、更新、维护、优化等管理工作造成了很大的麻烦,如何快速提供准确的配置信息是一个重大的挑战。CMDB储存与管理企业IT架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联,一方面支持这些流程的流畅运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。CMDB常常被认为是构建其它ITIL流程的基础而优先考虑,ITIL项目的成败与是否成功建立CMDB有非常大的关系。CMDB是描绘IT基础设施如何构建的一个蓝图,它记录了各种各样的配置项(即硬件、软件、事故、协议、服务级别、文档、部门、人员等资源)是如何相互关联的、以及各个系统是如何

26、发挥作用的。CMDB与传统的资产库有着根本的差别。资产库是一个存储企业所有资产的数据库,而CMDB不仅仅存储所有IT元素,更重要的是可以展示它们之间的相互关联,从而帮助企业了解IT资产的运行状态是什么样子,它对企业业务有什么影响等。 IT环境视图清晰地展现了各种IT设备、其属性以及相互关系;业务视图可以让每个人员明确,业务运作模式是什么样,不同业务关联到哪些设备,每个设备的故障影响到哪些业务等。6.5.2. CMDB建设方法CMDB是一个特殊的数据库,它必须拥有4个至关重要的功能: n 联邦性:是指CMDB能直接获取多种数据源并与数据源联系在一起;n 协调性:能够避免重复,并对来自不同数据源的

27、配置项进行自动匹配;n 同步性:即确保整个系统中的信息是同步更新的;n 可视化:即可提供配置项(CIs)的端对端及层次化视图。CMDB有两种,一种是物理的数据库,要求客户把全部配置项都拷贝到物理数据库里面去;另一种是虚拟的数据库,如MO的CMDB,不要求客户把全部配置项都拷贝到物理数据库里,只维持关联关系就可以。物理型CMDB数据库:存在两个问题:其一,不同数据库中的数据要全部无冗余地拷入CMDB,存在一定困难;其二,不同数据库中的数据也是不断地更新,要想同时把变更之后的数据传递给物理型CMDB,会带来网络流量方面的问题,也很难做维护。 虚拟型CMDB:通过指针索引的方式去获得其他数据库里的配

28、置项信息,不存在以上两个问题。 但是,虚拟性CMDB需要人工梳理和比对大量的关联关系,并不断更新。CMDB通常采用三种实施方法:自上而下、自中而上、自下而上。每种方法对现有配置数据的实施要求在范围和程度上都不一样。n 自下而上的方法:也就是从底层开始,首先查找企业内的所有CI(配置项),着手建立一个大的数据库,然后查找CI之间的关联关系和对业务的影响。这种方法往往要花几年时间才能完成。n 自上而下的方法:就是从小的局部系统开始实施,比如信贷核心系统,从这个业务开始着手,然后把底下与此业务相关的所有IT元素全都关联过来。这样的好处是可以在比较短的时间内即一个月做出一个完整的CMDB,而不需要花若

29、干年。n 自中而上的方法:就是采用折中方法建立CMDB,它是通过在企业建设过程中,将逐步形成的分散的、独立的、自身需要的信息资源库在CI层面上进行逻辑联邦和同步,建立起虚拟的CMDB。 自中而上的方法,可以帮助用户在短时间内建立起企业内需要的CMDB。CI信息全面,同时见效快,既避免大规模的CMDB建设的时间长、见效慢的缺点,也避免了单点突出建设CMDB的CI范围狭窄、完整度不足的缺点。 具体建设CMDB时,需要从两个层面来实施: n 一是采集基础数据。要通过适配器把数据采集上来,然后放到一个大的数据库中。 n 二是建立业务视图和业务影响分析。业务视图反映业务流程运作的情况是不是正常,有没有问

30、题等。这需要按照业务性质、业务流程等建立模型。 通过建模工具,建立描述业务流程的树状模型,模型上的每个结点上把每个配置项(CI)的影响以及相互影响放在上面,一旦某个配置项出现问题,图上就可以实时反映出来。为了建立业务视图,IT部门需要得到业务部门的大力支持。6.5.3. CMDB建设保障企业在实施ITIL项目的时候,配置管理常常被视为项目的软肋,费时费力,却事倍功半。究其原因主要是因为企业在建设CMDB(配置管理数据库)的时候,往往不知所措,耗费了大量的人力和时间收集各类IT基础架构信息,最后得到的却是一个极其复杂而难以维护的“IT基础架构信息库”。这与ITIL描绘的配置管理是企业实践IT服务

31、管理的基础或核心,为ITIL其它流程提供基础信息的关键地位相去甚远。正确来构建CMDB,必须有如下保障:n 制定配置管理政策IT运维管理政策,是指导和规范IT运维管理的行动指南和共同纲领。它使企业在认识上形成统一,减少了不必要的沟通成本,并使企业在流程执行上事半功倍。对于构建CMDB而言,主要有以下两类政策:宏观政策,主要是涉及公司或IT部门层面指导性、方向性的政策,其目标是在企业内部形成统一认识。如:企业IT内部应当使用统一的配置管理流程,并且使用标准的文档记录和汇报机制。运营政策,主要涉及到流程目标、人员、输入、输出、活动以及KPI(关键绩效指标)等各要素以及流程之间相互协调、信息交互方面

32、的指导原则,其目标是使流程能够在政策的指引下稳健、有效地执行。n 确定配置管理的范围政策的制订定为企业构建CMDB营造了良好的环境,配置管理范围的确定才是企业构建CMDB的真正开始。配置管理的范围主要指的是CI的宽度和深度,以及CI的生命周期。(注:ITIL所提到的配置管理范围主要指的是CI的宽度和深度,CI的生命周期ITIL认为是从CI的接收到最终的报废退出,但在实施过程中,由于流程管理主体的差异化,对CI管理的生命周期的划分也有所不同。)6.5.4. 构建CMDB模型有了CMDB建设保障之后,可以来梳理配置项信息及其关系,从而设计出CMDB模型蓝图,主要包括以下步骤:n 定义配置项的关系配

33、置项(CI)之间关系的定义也是配置管理建设和IT资产管理建设的区别点之一。可以采取两种方法进行具体的梳理工作,一种是“自上而下”;另一种是“自下而上”。“自上而下”方法一般要求企业已经明确了对外提供的服务目录,然后基于服务目录按照“业务服务IT服务IT系统IT组件”的顺序进行梳理。顾名思义,“自下而上”方法是“自上而下”方法的逆向过程,企业先从对内部IT组件关系进行梳理的过程开始,然后逐步将IT组件映射到IT服务。相对来说,当前“自下而上”的方法适用范围更广。n 定义配置项的属性在构建CMDB的过程中,除了构建配置项(CI)关系外,还需要为每个配置项(CI)定义属性。n 设计IT服务模型蓝图最

34、后,构建一份IT服务模型蓝图。蓝图主要起到了两个作用,一方面它是对当前企业CMDB建设工作成果的验证;另一方面,它也是对将来企业改进和完善CMDB建设方向的一种指引。通常蓝图中应该包括以下内容:判断CI的标准;定义CI属性、关系的准则 ;持续改进方案和过程;当前的IT服务模型等。CMDB旨在存储与管理企业IT架构中设备的各种配置信息,有别于传统的数据库。CMDB作为统一的配置管理库,必须全面、细致而准确地记录和保存各种软硬件配置信息,以便支撑事件、问题、变更、发布等各种ITSM流程,成为整个 IT运维管理的基础。6.5.5. 避免CMDB建设误区CMDB建设是一项“意义大、投入大、见效缓”的地

35、基工程。需要明确系统定位和理清功能的前提下,应该确立并坚持以下原则:n 应用场景决定管理粒度和幅度;n 数据维护紧密结合ITSM流程;n 自动采集作为数据核查手段;n 专题应用带动数据维护;n 配置项关系呈现直观化作为系统特色。基于了上述原则,才能避免CMBD建设陷入数据“维护难 消费少 不准确 消费更少”的恶性循环,才能把项目带到了实用、有效阶段。在CMDB建设和应用中,必须注意基础数据准确性的问题。如果用户保存了基础资源配置数据,但是存在较大的不规范、不全面的问题:设备的厂家、型号不规范,不符合系统要求;资源之间的关联关系缺乏,无法有效支持IT运维管理。必须认识到,系统功能加上基础数据等于

36、系统能力,系统能力加上频繁使用等于业务成效。如何保证数据质量,使系统成效发挥出来,避免功亏一篑,是CMDB建设中不可忽略的问题。6.6. 模块之间接口实现.................1. 监与管之间的接口网管监控模块与流程管理模块之间的接口,主要体现为某些满足预定条件的告警自动触发生成电子工单,进入流程管理模块。因此,如何实现监与管两个模块之间的接口、数

37、据的转换和正确、准确和全面地确定触发条件,是设置此接口的关键之处。如果未能正确设置触发条件,则会导致错误工单的产生,如工单类别错误。如果未能准确设置触发条件,则会导致工单内容的不准确,如责任人或责任部门的错误。如果未能全面设置触发条件,则会导致漏派发工单。工单中的信息与告警中包含的信息既有交集,又有转换和有所区别。工单的故障信息内容和描述来源于告警信息,但是告警信息应用于网管监控层面,是为了全面准确反映监控结果,描述故障现象。工单信息是应用于流程管理平台,是为了描述故障、界定责任范围、规范工单流转、跟踪工单等目的。6.6.2. 管与控之间的接口IT流程管理的最终目的和效果反映在对运维操作的指导

38、上,而对于批量的、重复的运维工作,可以高效、优质和规范化地通过自动化运维操作来实现。借助于IT“监管控”一体化运维平台,其中的流程管理和自动化运维操作模块之间的接口,运维部门和人员可以预先设置过滤和触发条件,根据工单信息,关联个别的自动化运维操作脚本。因此,如何实现监与管两个模块之间的接口、数据的转换和正确、准确和全面地确定触发条件,是设置此接口的关键之处。如果未能正确设置触发条件,则会启动不必要的自动化运维操作,造成严重后果。如果未能准确设置触发条件,则会导致非预期的自动化运维操作。如果未能全面设置触发条件,则会导致遗漏预期的自动化运维操作。6.7. 报表系统专业的IT运维报表可以准确、系统

39、地反应IT信息系统运行状况和IT运维管理状况。对IT基础架构、业务系统运行走势和IT运维工作本身进行分析,反应目前整体现状,发现趋势和潜在问题,采用科学的手段完成评估,指导现在和未来的IT环境建设,促进后续工作的展开。包括:n 事件类报表n 告警类报表n 问题报表n 配置报表n 工单类报表n 报表提供订阅的功能,对于用户订阅的报表,将定期自动生成html文件发送到用户邮箱中,方便用户查看。用户也可根据需要选择将报表转换为pdf等其他格式。7. IT运维一体化特点. 监管控一体化整合采用portal技术架构,克服了基础架构监控、运维服务管理和自动化操作运维的人为分割,实现集中管理、

40、统一展示、统一配置、随需定制、分权使用。7.2. 层级化展现平台以业务监控为中心,以事件为基础,将基础资源监控与业务服务贯穿在一起,建立从整体到局部、从宏观到细节的不同颗粒细度的层级化IT运维视图,以满足不同部门、不同级别领导和运维人员的关注层面和工作需求。7.3. 综合事件管理平台各类基础架构的故障、性能、配置事件汇总并通过规则策略库和服务依赖模型,提供全面、及时、准确的、高效灵活的事件压缩、过滤、关联能力。7.4. 全方位IT资源管理平台自动发现的IT资源数据库(RDB)与流程管理配置管理库(CMDB)的定期同步,实现资源管理数据的整个生命周期的管理。7.5. 面向基础设施全面的系统资源管

41、理:提供对网络、主机、存储设备、安全设备、数据库、中间件及应用软件、机房环境等IT资源的全面监控管理。智能化的故障管理:自动收集、过滤、关联和分析各种管理功能产生的故障事件,实现对故障的快速定位和处理。性能管理与优化:对网络和业务应用等IT资源的性能进行监控,定期提供性能报表和趋势报表,为IT环境性能优化提供科学依据。7.6. 面向维护管理者运维服务管理:将人、技术与流程进行有效地融合,实现日常运维工作的自动化、信息化和标准化。智能总控中心:实时展现当前企业IT系统的运行状态及趋势,帮助管理人员快速发现问题,分析和确定问题所在。知识库:自动实现运维知识的积累、沉淀和共享,从而降低IT运维管理对

42、个人的依赖。7.7. 面向领导决策者综合报表:对系统运行状况的信息进行汇总,帮助领导更全面的了解网络系统的运行状况和趋势,为领导决策提供科学依据。绩效评估依据解决:借助自动生成的各种工作记录,领导可对运维人员的绩效进行客观的评估8. IT运维一体化系统功能8.8.1. 信息门户IT运维一体化系统应该基于WEB实现,提供统一的portal信息门户平台,可以呈现各类发布信息,和各项IT运维工作的统一入口。同时提供个人工作室功能,不同用户可根据日常使用各项功能的频次自行定义工作桌面,为操作者迅速进入各项功能模块提供快捷手段。n 个人桌面管理n 待办事宜n 已处理事宜n 日程安排n 工作计划及总结n

43、个人收藏夹n 任务管理n 便笺管理 等8.2. 事故管理事故管理负责记录、归类和安排专家处理事故并监督整个处理过程直至事故得到解决和终止。事故管理的目的是在尽可能最小地影响客户和用户业务的情况下使IT系统恢复到服务级别协议所定义的服务级别。8.3. 问题管理当事件在第一时间没得到及时解决,就进入问题管理程序。问题管理的重要性:通常80%的服务品质下降都是因为20%的问题,所以专注与20%的问题解决可以大大的提升服务。问题管理的目标:将 IT 基础设施内的错误引起的事故和问题对业务的负面影响减到最小,并防止与这些错误相关的事故再度发生。为了实现这个目标,“故障管理”力求找到引发事故的根源,然后才

44、着手改善或纠正该情况。问题管理流程具有被动和主动两个方面:被动方面是作为对一个或多个事故的反应而解决问题。问题分析方法:定义问题; 按个体、地点、时间以及范围大小描述问题; 建立可能的原因; 测试最有可能发生的原因; 验证真正的原因。 主动“故障管理”是指通过趋势分析和定期的事件统计表,在事故发生前确定并解决问题和已知错误。8.4. 变更管理:变更管理流程的目标:确保利用标准化的方法和规程有效、及时地处理所有变更,以便将由变更引起的事故对服务质量的影响减到最小或将事件数减少,并因此改进日常运维。最常见的是终端用户提出的请求,其中有些是系统改进或增加功能的请求,有些是常规变更(如帮新进人员建立新

45、的账号),有的可能是系统出错,这在IT 中通常称为事件,如果是系统出错就要找出原因和解决步骤,才能进入到变更管理的第一步:RFC提出变更请求,变更请求应该包括(RFC编号、问题编号、那些配置项需要改变、变更的理由、如果不变更会造成的影响、变更人的联系方式);变更管理员负责监督变更从提出到解决的整个过程记录进CMDB、对变更请求进行过滤;同时提交变更到公司指定的变更管理委员会批准。变更管理需要有准确的CMDB配置管理数据库,对变更进行分析。8.5. 发布管理发布管理是指对经过测试后导入实际应用的新增或修改后的配置项进行分发和宣传的管理流程。发布管理以前又称为软件控制与分发,它由变更管理流程控制。

46、8.6. 配置管理在上边的变更管理中,我们提到当一个RFC进入变更程序的时,管理员和CAB需要有一个方法评估变更可能造成的影响,而评估需要的相关信息需要一个机制来提供,这个机制就是配置管理。配置管理的目标是:a.对公司内部的所有 IT 资产和配置及其服务作出说明“服务管理”流程“事故管理”、“故障管理”、“变更管理”和“发布管理”提供坚实的基础8.7. 工单管理提供电子化工作流程和工作人员的考核依据,实现运维工作管理的科学化、规范化和自动化。支持工单流程的自定义,方便配置成适合特定用户需求的流程管理平台。基于工单的流程管理是流程管理模块的核心功能。工单管理有三个来源入口:n 监视模块:网管监控

47、系统发出告警,满足预先设置的过滤等条件触发产生工单,送转到流程管理系统。n 领导派单;n 服务台报单。8.8. 作业计划作业计划模块主要实现针对各类运维作业计划工作的电子化管理,包括作业计划大纲管理、年度作业计划管理、月度作业计划、周作业计划、日作业计划等管理等模块。用户根据下发的作业计划年度大纲,进行作业计划模板定制和模板管理,再使用作业计划管理模块制定年度计划、月度计划、周计划和日计划。本功能模块主要包括如下功能:n 大纲的制定、查询、修改n 年度计划的建立、查询和审核n 月度计划的建立、查询和审核n 基于模板的作业计划制定n 待执行作业计划提醒n 作业计划执行情况考核n 作业计划执行情况

48、统计分析8.9. 值班管理值班管理功能模块主要实现统一的机房电子化值班管理,将排班安排、值班日志、交班记录、维护作业记录,以及由各项维护规程和管理办法中确定的周期性维护作业计划等任务集成至该系统中,使得当班人员能够准确、高效地完成各项维护任务。值班管理具有以下功能:n 电子化排班:排班任务制定后值班人员直接收到排班结果;n 值班机房配置:支持对所有机房值班相关数据的灵活配置;n 值班信息管理:故障巡查、线路巡检、网管巡查等值班数据信息的自动记录;n 交接班管理:交接班人员通过本系统进行交接班,并自动记录交接班日志;n 值班日志管理:对值班日志提供查询统计功能。8.10. 考核管理结合用户的运维

49、考核制度和考核办法,根据系统对日常运维工作的自动记录,考核模块能够实现对作业计划、工单调度、值班、代维等工作的考核管理功能。8.11. 代维管理代维管理:针对行业特点和企业实际,增加代维管理。很多企业为了更让自己关注自己的核心业务并提高IT运维水平,而将自己的IT运维工作或者部分IT运维工作外包给更专业的第三方。因此,有必要规范外包方与承包方之间的关系和管理,包括工作内容、工作量的考核。代维管理通过电子化平台实现与代维公司之间的联系,将代维公司的日常工作与用户的管理流程结合起来。由此实现对代维工作的规范化和高效的管理,同时建立代维公司的考核机制,实现优胜劣汰。n 代维项目管理n 代维合同管理n

50、 代维公司、代维队、代维人员管理n 代维工作计划n 代维记录n 代维报告n 代维问题跟踪n 代维考核8.12. 知识管理n 经验库管理:保存故障分析、问题分析经验或分析系统问题产生的原因等知识,为操作人员在解决各类问题时提供必要的经验或知识支持的专家经验系统。n 资料管理:运用电子化手段对包括备品备件、各专业日常操作维护资料、运维人员资料、相关部门资料等信息进行添加、修改、删除、分类、归档、查看等操作。8.13. 安全管理n 多用户、分级别、分权限设置n 用户登录日志n 用户操作日志n 用户数量、登录位置、密码等安全限制8.14. 服务持续性管理IT服务持续性管理是指确保发生灾难后有足够的技术、财务和管理资源来确保IT服务持续性的管理流程。IT

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论