下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于 ITIL 的H运维管理研究Research on theegration Operation and MaenanceManagement in H bbased on ITIL林勇LIN YONG分类号密级 UDC 题目:基于 ITIL 的H运维管理研究姓学学名号院林勇2011220011 学位类别:学术专业同等学力 学科专业指导教师第二导师工商管理(MBA) 提交日期:二一四年三月十七日独创性本人郑重:所呈交的是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,究成果,也不包含为获得中不包含其他人已经或撰写过的研财经大学或其他教育机构的学位
2、或所使用过的材料。与我一同工作的对本做的任何贡献均已在中作了明确的说明并表示了谢意。作者签名:二一四年三月十七日使用书本作者完全了解财经大学有关保留、使用学位的规定。特财经大学可以将的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等保存、汇编以供查阅和借阅。同意学校按规定向国家有关部门或机构送交和磁盘。在(的后适用本说明)作者签名:二一四年三月十七日导师签名:二一四年三月十七日基于 ITIL 的 H运维管理研究林勇摘 要国内集中后,业基本完成了电子化、帐务电子化和同城到省、到的数据大信息系统越来越复杂,业务对信息系统的依赖程度也越来越高,信息系统运行的稳定与否直接关系到业务连续性
3、。如何合理利用 IT 资源、有效控制IT 风险和提高IT 服务质量,对商业的综合竞争力,具有很重要的意义。本选择 H运维管理实践作为案例,该行信息化建设在完成数据和系统大集中后,为了保障业务系统的安全稳定运行,构建一套“以业务为中心,以流程本、以自动工具为对 ITIL 的基础架构和”的运维管理体系成为当务之急。发展及运维管理理论进行了深入研究,在 ITIL理论指导下,从该行实际出发,提出了运维管理的概念,来实现业务系统和 IT 系统资源之间的动态关联,实时感知 IT 系统资源对业务系统的影响,构建可量化的运维管理指标体系,优化ITIL 服务管理流程,从“监视、管理、控制”三个方面着手,实现管理
4、规范的、管理技术的和管理的,促进了该行运维管理技术标准化和管理工作规范化,提高了整体运维水平和质量。通过运维管理实施,有效推动行内各项规章制度的执行,并H深入到 IT 运维管理工作的各个环节,切实保障运维工作的有序开展,为该行节约了运维管理成本;提高了故障解决率;缩短了故障平均恢复时间;完善了的知识沉淀机制;建设了高效的运维管理体系。真正实现“、控”三位一体的综合运维管理目标,最终达到提高 IT 部门的运行质量和服务水平。管理能力,该行业务服务本的研究成果为国内商业,特别是中小的 IT 运维服务管理流程体系建设提供了切实可行的管理模式和应用系统解决方案,对于商业IT 部门实现 IT 管理的规范
5、化和流程化,提高 IT 管理的质量和效率具有很强的实践性和指导意义。关键字:ITIL业Abstracting basically completed channel electronic, electronicAfter the domestic bbilling and dentralization of the city to the province, and to the country, binginformation systems areing increasingly complex. Meanwhile , the dependenceof the bing on infor
6、mation systems hase more sophisticated. Whats more ,whether the information systemis stable is directly related to business continuity. Soin order toenhance the overall competitiveness of commerl bs, how to use ITresourand how to control the IT risk effectively and how to improve the IT servicequali
7、ty have very important significance.his pr,the auther takes H-bsegrating management practias anexle. In order to guarantee the safe and stable operation of business systems, it isvery important for the bto build a maenance management system which isbusiness-centric, pros-oriented ,and automated tool
8、s as a means after completing thecentralization of data and systems.This prs has in-depth research on basic schema of ITIL , the latest developmentand the games dimenmanagement theory .According to the ITIL theory and reality ,the authroe a concept of theegration dimenmanagement platform whichis toa
9、chieve resour.Fromdynamic assotion betn thebusiness system and IT systemmonitored, and management, and control the three aspects, it canachieve the management specification of unified, and unified management platformmanagement technology as well . In the end , the Bs IT operations managementchanged
10、from the traditional way of loosely coupledo a tightly coupledservice-oriented manner which promots the standard of managementand the overalllevel and quality of operation and maenance,too.nks to theegrated operation management platform, H bpromotes the o all aspects ofimplemenion of the rules and r
11、egulations effectively, and developsIT operation which protect the operation and maenance work orderlly . The platformaslo saves the cost of operation management and improves problem-solving rate andreduthe recovery time . “Supervi, management, control, the threeegratingmanagement objectives are rea
12、lized. As the result , it improves the quality of the Bsoperational serviand service levels ultimay.The research results of this pr provides practical management pattern of prossystems and application systems solutions for IT service management ofthe domesticcommerl bs espelly smaller bs. It has str
13、ong pracitcal and instructivemeaning toachieve the standardization of IT management and to improve the quality and efficiency of IT management.Key words: ITIL;egrated operation and maenance management;Bing目 录第一章绪论1第一节研究背景和选题意义1第二节本的研究方法和内容2第三节第二章第一节本的章节安排3运维管理4IT 运维成熟度模型4ITIL 基本架构及发展现状5运维框架11运维管理体系1
14、3案例介绍13第二节第三节第三章 H第一节第二节技术部门的任务13H第三节同业IT 运维服务管理情况分析14第四节IT 运维服务管理现状15运维管理体系的内容和目标18运维管理框架19H第五节H第六节第四章 H第一节H运维管理建设和运行34总体架构34总体功能35分阶段实施41第二节第三节第四节实施的效果42第五章 结论与展望49第一节 研究成果总结49第二节和展望50参考文献52致谢54第一章绪论第一节研究背景和选题意义社会,业务信息化已经广泛应用,商业的 IT 建设越来越受到公司的重视,并逐年增加对 IT 系统建设的投资,通过引进或自建,逐步建设了林林总总的系统,这些业务系统的稳定运行已经
15、成为发展的生命线。IT服务管理是 IT 管理的一个重要方法,随着各企业对 IT 投资回报率、IT 与业务协调发展的重视程度进一步提高,其作用与地位也越来越突出。随着IT 系统越来越复杂,传统的以 IT 系统设备和问题响应为主的运维管理方式已经越来越新时期运维管理的要求。根据分工细化、专业明确、责任明细的发展要求,业内提出了运维管理理念。运维管理的目标是整合企业业务流程,厘清工作角色,逐步实现从例外管理向例行管理、粗放式管理向精确管理、功能型管理向服务型管理的转变,实现运维管理工作的制度化、流程化、规范化、电子化和高效化管理。自 20 世纪 80 年代起,以商业为首的西方商业纷纷开始进行信息系统
16、数据大集中建设工作,传统的、孤立的、分散的“救火队”式 IT 运维管理模式已业务需求,建立一套集中运维管理体系成为必然选择。同时,国外众多厂商纷纷参与运维标准的制定和产品的研发,伴随着管理理念和技术的不断和创新,目前国外规模较大的商业的 IT 运维管理已经达到了智能化、自动化、可视化、可控化和可量化的水平。随着我国商业正在,的参与国际竞争,金融行业的信息化建设在加速推进,工商建设,随后,中小型商业、建设等国有商业开始进行集中化业务系统建设。国内规划和业基本也开始了集中式完成电子化、帐务电子化、同城到省、到的数据大集中,IT 系统变得越来越复杂,对 IT 系统的依赖程度也越来越高,信息系统稳定运
17、行直接关系到业务的连续性。如何有效的利用IT 资源、控制IT 风险、提高IT 服务质量,对商业的综合竞争力,具有很重要的意义,同时,对 IT 部门的运维管理提出了更高的。对于数据集中模式下的运维管理,各商业都在积极引进国外先进经验、管理工具及理念。以 ITIL 框架模型为基础,建设运维管理系统,逐步探索基于大集中模式下、贴合自身业务需求的运维管理方法,来实现业务系统和 IT 系统资源的动态关联,实时感知IT 系统资源对业务系统的影响,从“监视、管理、控制”三个方面着手,实现管理规范的、管理技术的和管理的,促进运维管理技术标准化和管理工作规范化,提高了整体运维管理水平和质量,使以前繁杂的、效率角
18、色,本的IT 运维管理变得更加有序,使 IT 部门逐步摆脱原先的“救火队”业务部门对IT 技术部门的满意度。的研究成果以及在 H的实践,对国内商业,特别是中小制理的IT 运维管理体系建设具有很强的实践性和指导意义,通过运维管的建设有效推动行内各项规章制度的执行、并深入到运维工作的各个环节;切实保障运维工作的有序开展,提高运维工作效率,节约运维管理成本;提高故障解决率,缩短故障平均恢复时间;完善知识沉淀机制,建设高效的运维管理体系,真正实现“、控”三位一体的综合运维管理目标,最终达到提高 IT 部门的运行管理能力,业务服务质量和服务水平。第二节 本的研究方法和内容本采用研究和特例相结合的分析方法
19、,分析了运维管理的必要性。在信息系统越来越复杂的背景下,为了保障业务连续性,信息系统自身的运维管理就变得越来越重要,尤其是在全网集中系统模式下,对信息系统的运维管理提出了更高的。本从 IT 运维管理的国际标杆入手,深入研究 ITIL模型,该模型紧跟信息系统建设的脉搏,为IT 运维管理提供先进的理论指导。ITIL从 20 世纪 80 年行进一步的完善,始发布第一个版本,到目前已发布三个版本,并在 2011 年进的 ITIL 版本,引入生命周期管理框架,实现对 IT 运维的全方位管理,并通过对每一个流程的具体描述,包括各个服务之间的方向、动作、进入和退出,以及它们之间的关系,对 IT 服务的规划和
20、 IT 部门流程的制定提供了可供操作的基础。在 ITIL 模型的指导下,从运维的角度对ITIL 的实施的关键点进行分析,规划了设提供指导。运维管理的框架,从理论上为 IT 部门的运维管理体系建在ITIL 模型和运维管理框架的理论指导下,本选择H作为案例,该行作为范围内的制,并在国内主板上市,通过多年的建设实现了 IT服务的基本管理能力,具有很强的代表性。但是在大集中的背景下,该行IT 技术运部门,对业务部门的支撑和响应的压力越来越大。从服务的角度进行维管理的建设是当前最佳的选择,在 ITIL 理论的指导下,该行设计服务管理流程、运维管理指标体系、交易级应用理论指导和该行的实际情况设计的,实现
21、IT 管理与业务服务的融合。结合运维管理框架通过总体设计、分步实施的模式最终建设,并取得了很好的实施效果,提高IT 部门的运行能力和提升业务服务质量和服务水平。最后,本了总结和展望。对 H的运维管理体系进行第三节 本的章节安排本重点探讨通过服务运维管理的建设,使中小制商业IT提高IT 部门的运行管理能力及业务服务质量和服务水平。本分为五章,各章节具体安排如下:第一章 绪论。介绍商业IT 运维管理的背景和选题意义,分析了 IT运维管理的必要性,国外 IT 运维管理的发展,国内信息化建设的情况,在大集中模式下的主要问题,确立了本研究的内容和目标。第二章运维管理。首先介绍ITIL 的发展和特点,重点
22、介绍ITIL v3 基于生命周期的架构。基于 ITIL 的理论指导,介绍运维管理框架,为后续章节做好理论铺垫。第三章 H系统建设情况,分析 H运维管理体系。介绍 H目前的运维管理现状和信息运维管理当前的主要问题,设计 H运维管理框架,该框架重点包括:H服务管理流程、运维管理指标体系、面向交易级应用。第四章运维建设和运行。介绍运维实施的总体H架构、总体功能、分阶段实施方式以及实施效果。第五章 结论与展望。对H的运维建设进行总结,并对中小制商业运维管理的发展前景进行了展望。第二章运维管理第一节 IT 运维成熟度模型IT 运维管理是指IT 部门采用相关的方法、技术、制度、流程和文档等,对IT 运行环
23、境(如软硬件环境、网络环境等)、IT 业务系统和IT 运维行的综合管理。进IDC 认为,在一个企业发展过程中,其 IT 系统的建设和运维管理模式会经历四个阶段(如图 2.1 所示):第一阶段:单一设备阶段(SEM),此阶段重点是基础架构建设,进行一些硬件和应用的采购,该阶段通常没有专门的 IT 管理,一般都是硬件设备厂商提供的设备级的管理工具;第二阶段:网络管理阶段(NSM),企业的 IT 系统初具规模,产生了 IT 运维和管理的要求。网络管理阶段侧重于对网络和硬件设备的管理,对网络中的底层设备进行,当出现问题时向进行告警;第三阶段:IT 服务管理阶段(ITSM),随着 IT 系统进一步扩大,
24、企业业务日趋复杂,IT 部门越来越像救火队,这时就产生了对 IT 服务流程进行管理的需求。IT服务管理阶段企业的关注点从单点管理向综合管理转变,从关注单一网络到对业务系统关注。20 世纪 80 年代,ITIL 的出现推动了IT 运维的流程化管理。以上三个阶段,IT 运维管理都是以“资源”为中心进行管理,IT 间接产生业务价值。第四阶段:业务服务管理阶段(BSM),企业开始关心 IT 服务对业务带来的影响,强调从业务目标角度出发来优化 IT 服务。业务服务管理阶段以 ITIL 流程框架为中心,通过端到端流程整合,以可视化为管理者提供一览式的 IT 服务状况,实现 IT 和业务管理的整合和互补,既
25、满足企业服务水平的要求,又确保业务系统的最佳表现,辅助整个企业的业务运营和IT 决策。该阶段是以“业务”为中心。从 IT 运维管理发展的四个阶段看,IT 运维管理的发展是沿着单一设备管理、IT 基础架构管理、IT 服务流程管理、业务服务管理的路线来不断进步和发展的,并从“以资源为中心”向“以业务为中心”进行演进。有机一体,体现了 IT 服务的价值。2011 年,OGC 针对 3.0 版本进行优化完善,发布 3.1 版本。ITIL 提供了一个指导性框架,这个框架规划了重要的流程、角色和活动,指明他们之间的关系以及那些是必要的沟通。由于每个组织是不同的,ITIL 并没有这些活动如何实施,而其重点是
26、在实践中得到证明的方法。因此,企业在实施 ITIL 时,在保留组织现有 IT 管理方法中的合理部分的基础上,同时增加必要的技术,方便了各种 IT 职能间的沟通和协调,对业务功能和流程进行重新设计,改进 IT 部门和业务部门的关系,提高质量和增进客户满意度,降低成本,缩短周转时间,提高IT 服务的可用性,改善资源的管理与使用,有助于最终完善服务管理。二、ITIL v3 主要特点ITIL v3 是一个巩固和提高 ITIL 最佳实践的过程,这些最佳实践不仅规定了行业实践中的前沿信息,还会随着客户需求的改变而不断变化。ITIL v3 在继承v2 中仍被ITSM 团体广泛实践和运用的那部分内容的基础上,
27、还增加了部分新概念,尤其是引入了“服务生命周期”。此外,ITIL V3 解释ITIL 在不同的行业该如何切入,使得ITIL 跟企业的关系更紧密。ITIL v3 的主要创新点如下:(一)引入生命周期模型ITIL v3 引入的“生命周期模型”改变了模块之间相互割裂、独立实施的局面,从、战术和三个层面针对业务和 IT 快速变化提出服务管理实践方法。它通过连贯的逻辑体系,以服务作为总纲,通过服务设计、服务转换和服务加以实施,并借助持续服务改进不断完善整个过程,使 IT 服务管理的实施过程被有机整合为一个良性循环的整体。(二)更便于企业实践与应用ITIL v3 为企业提供丰富的业务典型案例、案例研究、通
28、用模板和实施工作包,这些内容可以为企业管理者理解并积极采用 ITIL 提供指导。同时,企业也可以通过借鉴和修改模板、满足自身的实际需求,解决无从下手的尴尬。(三)融合了多种新标准融合了多种新和实践,这些从实践中提取精华,凝练形成的指南,必将以崭新的指导 ITSM 的持续发展。新标准对关键绩效指标方面进行加强,对服务生命周期提供有力支持,从而对 ITIL 需要的关键绩效指标(KPI)的设计、应用和实例提供了更有效的指导。三、ITIL v3架构ITIL v3 的架构是基于“服务生命周期”的概念,IT 服务从开始到结束的整个过程就是服务管理的生命周期,服务是生命周期运转的轴心;服务设计,服务转换和服
29、务运营是实施阶段;服务改进则在于对服务的定位和基于目标对有关的进程和项目的优化改进。服务生命周期框架如下图所示。指导了组织如何开发设计服务管理的能力。(三)服务转换:为如何将新的或变更的服务转换到运营过程中有关能力的开发和改进的指导。服务需求通过服务设计进行编码,而服务转换则是探讨如何将这种编码有效地导入到服务运营的体系中,与此同时,还应控制失败的风险和服务中断。(四)服务运营:包含了在服务运营管理方面的实践。它对如何达到服务支持和交付的效果和效率,以确保客户与服务供应商的价值提供了指导。目标最终需要通过服务运营来实现,因此,它是一种非常重要的能力。它对如何在设计、规模和服务水平变化的情况下,
30、如何保持服务运营稳定性提供指导。服务运营有两种主要的控制:的和主动的。(五)持续服务改进:为创造和保持客户价值,而用更优化的服务设计、导入和运营提供指导。它结合了质量管理、变更管理和能力改进方面的原则、实践和方法。组织要学会在服务质量、运营效率和业务连续性方面的不断提高和改进的意识。四、ITIL v3模块ITIL v3 将概念性的知识与更次的实践经验和结构化应用系统联系在了一起,并对生命周期每一阶段的具体指导作了讲解,能够使读者获取最大收益。读者可根据在 IT 服务管理工作中的需要,地关注某个理论及知识体系,以便为自身的工作内容,提供更次的指导。但如果能对较大范围的服务生命周期内的各项服务都有
31、的了解,则是非常重要且有必要的。ITIL v3 针对服务、服务设计、服务转换、服务运维细化了模块。主要有以下部分:(一)服务相关的模块1需求管理需求管理是服务管理的重要内容,需求的不确定对 IT 服务来说是一个重大的风险源。业务流程是服务最主要的需求源。业务活动的模式影响了需求的模式,识别和分析客户业务模式,并将其编译为展开能力管理的数据基础的研究是非常重要的。2财务管理财务管理为 IT 服务提供了一个工具,通过财务术语描述 IT 为业务带来的价值,进一步研究如何更经济的提供IT 服务。比如成本确认、分配、和等体现在“成本核算”中,这些活动有助于加强成本管理,强化成本意识。(二)服务设计相关的
32、模块1服务目录管理服务目录管理用于生成和维持服务目录,服务目录包括生产环境的所有服务。服务目录分为业务服务目录和技术服务目录。业务服务目录是客户视角的服务目录。技术服务目录支撑业务服务目录,比如提供业务服务所需的支持服务、组件、配置项等。2服务级别管理服务级别管理是按照约定的服务级别协议,提供满足服务级别要求的服务。服务提供商需要对提供的服务进行、分析,在必要的时候实施改进。服务级别管理应该是管理客户的期望,使交付的服务质量是服务客户需要的。3可用性管理可用性管理是在考虑成本效率的情况下,通过部署适当的资源、方法和技巧,从而确保所有服务和组件的可用性的交付是满足了与客户议定的业务目标。可用性管
33、理不包括业务连续性管理,但是,两个流程有着密切的联系,可用性管理是业务连续性管理的关键输入。4管理管理目标是按照安全性需求通常和业务目标、性、完整性和可用性的要求来保护信息的价值。和组织的政策相关,通过将 IT 安全和业务安全结合起来,确保所有的服务和服务管理活动都能实现。为了达到有效的,必须建立管理系统。5能力管理能力管理的目标是在成本合理的情况下,确保 IT 能力符合当前和未来业务的既定需求。能力管理主要涉及资源管理、性能管理、需求管理、模拟测试、能力规划、负载管理以及应用选型。如果没有能力管理信息的输入,其他流程将变得缺乏效能。6IT 服务持续性管理IT 服务持续性管理的目标是在发生后,
34、确保与客户约定的服务所涉及的IT 技术和服务设备能够在规定的业务时间进度内重新,从而支持整个业务连续性。不同的组织对坏等角度进行分析。事件有不同的定义,通常是从财务损失,声誉和规则的破(三)服务转换相关的模块1变更管理服务变更是指对已运营的服务或服务组件进行添加、修改和移除。变更管理需要进行和控制,确保在对客户业务需求变化做出快速响应,同时将服务变更的影响可以降到最低。变更的实施需要遵循定义、规划、构建、测试、验收、实施和评估这样一个特定的路径。2服务资产和配置管理服务资产和配置管理是对不断变化的 IT 基础设施进行控制,收集、和管理重要组件的信息,对组件状态进行,提供一份完整的资产目录,方便
35、进行资产管理,并为其他模块提供这些组件的信息,让使用者能够在正确的时间做出决策,从而维持高效的服务管理流程。3发布和部署管理发布和部署管理的目标是将服务部署发布到生产环境中,将服务传递到服务运营阶段,从而满足业务方的需求和预计目标。发布和部署管理包括发布和部署的规划、准备、构建、测试、执行部署、署、回顾和关闭部署等。发布和部署管理和变更管理关系密切,实际的变更实施是通过发布管理活动执行的。(四)服务运维相关的模块1事件管理事件可被定义为任何可察觉和可识别的,对 IT 服务造成影响和背离的重要现象。通过管理系统,对 IT 设施运行状态及时掌控,并对任何服务偏移进行识别,并解决事件,尽快恢复服务的
36、供应。事件管理的好坏直接影响到其他流程的有效性。2事故管理事故是指对一项IT 服务或一项IT 服务质量减少的非计划中断。事故管理的目标是根据服务级别协议的要求,在尽可能小地影响客户和用户业务的情况下尽可能快的将服务恢复到“正常状态”。尽管事故和事件都给服务台,但是两者并不相同,并不是所有的事件都是事故,许多事件并不与服务中断相关。3请求实现服务请求是 IT 部门向用户提供的不同种类的普通需求,比如低风险、经常发生且成本低的微小变更,或者信息的请求。由于这些请求经常发生,因而需要一个独立的流程进行管理。服务请求流程相对简单,一个典型的服务请求流程包括标准的服务请求,相关、请求实现、请求关闭等环节
37、。4问题管理问题是一个或多个不知原因的事件。问题管理的目标是预防问题和事故的再次发生。问题管理首先要查明该问题产生的潜在原因,制定恰当的解决方案或预防措施。问题管理还对问题进行、应急方案和解决方案的信息,以使组织能够减少事故的数量和影响。5管理管理是给合适的用户合理的使用服务,同时也限制未用户的访问。管理是对安全和可用性管理定义的政策和行动的执行。为了能对管理的协调有一个单一控制点,经常由服务台的服务请求发起。管理不仅响应客户的请求,还需要对活动进行,确保这些权限被正确的使用。第三节运维框架运维服务管理面向整个IT 系统,以ITIL v3 理论为指导,以服务管理为,从IT 管理的角度来整合所有
38、与IT 相关的资源,例如工具、流程、质量等。根据业务发展规划和 IT 发展规划建立 IT 服务策略体系,为 IT 服务体系的发展提供方向性指导。通过组织构架的调整,融合业务与 IT ,并制定 IT 服务运营体系,规范化 IT 服务流程与日常管理。加上现流程自动化。、运营等各种工具的架设实运维管理体系框架(如图 2.3 所示),由策略体系、组织体系、运营体系、技术体系四系,其中策略体系是其他三个方面的指导策略,需要在体系建设前期予以制定,并在之后的阶段予以完善。运维策略可以从组织层面和服务层面两个层次来定义,组织层面的作用是根据 IT 策略制定服务策略,通过制定服务策略为达到 IT 策略提供管理
39、和技术的支撑;服务层面的作用是以客户资产为基础分析服务价值,并通过规则和目标的制定保证服务价值的实现;组织体系为其他各方面提供组织或团队支持,服务台、各支持团队分别负责运营体系、技术体系中的各部分内容,组织体系的建设进度直接关系到其他两个方面的进程;运营体系内的各个流程需要在配备完成以及服务台成立后才可投入运行,运营体系的设计直接影响着组织体系内的配备,同样运营体系内的各个流程需要在服务管理基础功能搭建完成后才可进行流程的,IT 基础设施的技术规范可以在其他部分之前开展;运营体系中的流程以及组织体系中所需要的考核数据需要依赖于技术体系来提供,服务管理技术工具为服务台及各个支持小组提供服务支撑工
40、具。第三章 H运维管理体系第一节 案例介绍是范围的制商业,并在国内主板上市。该行的信息化建设H已完成数据和系统大集中,IT 运维管理变成了一件复杂而又繁重的工作。为了保障业务系统的安全稳定运行,确保业务系统稳定、安全运行,构建一套“以业务为中心,以流程、以自动工具为”的运维管理体系成为当务之急。业的重中之重,本着“以业务为中心”的 IT业务系统的安全稳定运行是服务管理理念,该行通过学习和借鉴国际先进的运维管理模式,并结合该行实际,在经过广泛充分论证的基础上,采用“引进、消化、创新”的建设路线,提出了一体化运维管理的概念,来实现业务系统和 IT 系统资源之间的动态关联,实时感知 IT 系统资源对
41、业务系统的影响。从“监视、管理、控制”三个方面着手,实现管理规范的、管理技术的和管理的,覆盖了该行 IT 运维管理全生命周期的所有阶段:“感知问题、影响评估、问题、问题、修复问题”,实现了以“规范管理制度、强化管理工作、提供决策支持”的管理目标,提高 IT部门的运行航。能力,该行业务服务质量和服务水平,为该行业务运营保驾护对比 IT 运维成熟度模型,H目前的 IT 运维成熟度处于第三阶段,计划通过本次实施使IT 运维成熟度达到第四阶段,处于业内领先水平。第二节 H技术部门的任务该行的部是负责全行信息科技管理、信息系统运行和风险控制的部门,同时是信息科技管理和信息科技项目审定的日常办事机构。信息
42、技术部的主要职责为:负责拟订信息科技规章制度、操作流程、专业规范和技术标准,建立和完善信息科技制度管理体系,并组织实施;负责拟订信息科技发展战略、发展规划和年度计划,并组织实施;负责组织编制信息科技项目需求计划,信息科技费用计划和项目,并监督执行;负责依据信息科技发展规划和需求计划,组织信息科技项目立项可行性研究,负责受理信息科技项目立项,并监督执行;负责信息系统、基础设施、网络和设备的运行、升级和管理;负责技术运用和安全运行管理;负责信息科技商务管理和外包管理,组织开展软硬件系统技术选型;负责信息科技固定资产管理;负责信息系统恢复管理以及备份中心的建设、运维和管理;负责信息系统应急处置,组织
43、拟订信息系统应急预案,并组织演练;负责信息科技风险管理,拟订并信息科技风险管理策略,对信息科技风险进行、自评估、计量和,提交信息科技风险管理;负责信息科技业务连续性管理,拟订信息科技业务连续性管理策略,进行风险分析和业务影响分析;负责信息科技内控管理、合规管理防控和操作风险管理等工作;负责科技成果鉴定、登记、推广及科技工作,知识保护工作;负责指导、协调、监督、检查分交流。信息科技工作,组织培训和业务部下设规划与验收室、制度与操作管理室、科技安全室、商务管理室、设备管理室、数据中心、数据中心生产运行室、数据中心系统管理室、数据中心应急与灾备室、数据中心网络管理室。第三节 同业 IT 运维服务管理
44、情况分析一、工商完成总行 3 家数据中心及 31 家省分行及海外分行网络基础设备,并实现了总行主热备系统建设;开始实施开放主机,计划完成 3 家数据中心及 31 家省分行部署,并实现数据中心及 31 家省分行主备系统热备;已实施了部分 IT 管理流程建设;完成基于开放的业务服务管理模型分析。对比 IT运维成熟度模型,工商的IT 运维成熟度介于第三阶段和第四阶段之间。二、中国完成总行数据中心及 31 家分行网络基础设备,并实现了热备系统建设;开始实施基于开放主机系统;已实施了部分 IT 运维管理流程建设;基于开放的业务服务管理模型分析工作尚未展开;开始实施开放作业调度的实施。对比IT 运维成熟度
45、模型,中国的IT 运维成熟度处于第三阶段。三、建设完成总行数据中心及分行网络基础设备,并实现了热备系统建设;已实施了部分 IT 管理流程建设;针对数据中心实施基于开放的业务服务管理模型分析。对比 IT 运维成熟度模型,建设段和第四阶段之间。的 IT 运维成熟度介于第三阶、农业完成总行数据中心的网络基础开始实施全行行网络基础;使用热备机制,建立了热备系统;开放主机尚未实施;部分省行自行实施了 IT管理流程;完成基于网络的服务管理模型,基于开放的业务管理模型分析尚未列入计划;基于开放的作业调度尚未开始。对比IT 运维成熟度模型,农业银行的IT 运维成熟度开始进入第三阶段。节 HIT 运维服务管理现
46、状第该行已经完成全行部分主机系统的运行一期项目,实现了全行(总、分、支三级)网络系统和及部分运维流程。系统覆盖了全行生产系统的网络资源和部分主机资源,所有故障和性能数据自动完成丰富、关联、格式,最终通过定制的视图呈现给运维。运维可以使用电脑直观网络、主机设备的实时运行状况;同时可通过告警,获知网络、主机设备的故障信息;从而能够做到第一时间发现故障,迅速解决问题,极大提高了工作效率,实现了该行生产运维管理自动化的突破。全行一期项目的实施范围和定制开发内容见下表:表 3.1:HIT 服务系统实施范围实施范围管理内容及范围总行及家分1204 台网络设备、4761 个端口(其中包括 500 余条广域网
47、线路)32主机服务器:1106 台;数据库:491 个;应用进程:5233 个;RSA 集中认证:60 台;运维流程推广:3 个(问题流程、故障处理流程,变更流程)表 3.2:HIT 服务系统实施定制功能域序号功能域功能描述对多厂商的设备进行管理和故障管理1收集重要业务服务器的运行状态、应用进程状态、数据库信息、操作系统自身信息、中间件等状态信息四四能够灵活的定制和改变策略,从而方便的调整对网络事件的定义能够通过类似 ICMP 和 SNMP 的标准协议的方式,设备和应用服务器关键参数到网络能够对网络事件进行优化处理,对事件进行压缩、过滤、关联等等功能,使管理能够在海量事件中,通过系统方便的把握
48、到重要的网络事件信息,从而能够快速的解决排障和能够对MPLS/进行要求可以实现对具体网络指标的内容和对象可以通过web 的方式定制,使用标准的 ICMP 和 SNMP 协议,能够 24 小时不间断的以实时图形方式显示要求性能图能够以管理员输入的任意时间进行绘制,同时具有性能管理定期生成报表的功能,从而能够提供网络管理分析网络运升级网络系2行情况,统作参考网络业务增长趋势,为网络管理提供全面性能分析,包括对设备性能、线路质量、端到端的响应时间、端口流量统计等要求可以对网络拓扑进行管理,可以进行分层拓扑,能够分别产生清晰的二层和三层网络拓扑图,便于用户掌握网络设备的物理连接和逻辑结构网络拓扑展现,
49、网络拓扑能够以矢量图形和矢量字体高质量地展现,实现对拓扑图的缩放,便于用户了解网络拓扑整体和局部细节3拓扑管理能够在显示拓扑的同时,表明网络设备的运行状态,与事件管理器中收集到的事件关联起来,并可在拓扑视图中实时调用事件查询工具,从而方便管理能够在观察拓扑结构的同时,把握到整个网络的状态和事件发生点拓扑管理中,应该具有根原因分析功能,能够把收集到的信息精确定位到相应的故障设备上,从而协助管理定位故障和排错能够快速的信息将以多样的形式进行呈现。要求可以通过主流的 B/S 结构进行呈现,同时也可以通过C/S 方式进行呈现对于实时的信息,可以通过动态刷新的方式,对事件进行实时的呈现对于历史的信息,可
50、以通过定时的统计和查询的方式,提供接口,进行信息呈现4提供多种不同的方式进行告警。告警多样性,反映了系统告警管理在不同的情况下,与外界沟通的能力。能够通过声、光、的方式进行告警,同时提供标准的接口,以方便集成或被第三方工具集成,接口符合业内标准。5突出以角色为的集中管理;能够通过一次登录完成管理人员的所有工作,真正做到各个系统功能模块之间,无缝联系,形成系统信息集中呈现,风格;能够做到网络管理分权的实现:如分权管理按照职能进行分权,针对技术、业务、管理6划分不同的管理视图;或按照管理域进行分权:如总行、各分提供用户等功能系统的认证信息传输加密及至少需要包含以下:上线流程(如:设备上线流程、系统
51、上线流程等)、故障处理流程(如:故障受理、申报、触发分配等)、资源管理流程(如:IP 地址管理、配置管理、备份管理等功能),流程管理7从而为、信贷、总帐、前置、人力资源等大集中系统建立与网络相关的服务支持;能够快速灵活的定制和修改、能够快速的部署能够提供对各分机构到数据中心的流量进行双向监视对数据中心与数据中心之间的流量进行双向监视分析不同应用的流量分布对进出数据中心的应用流量进行策略控制,保障关键的业务流量,抑制非主要的应用流量管理8系统有能力进行数据收集、数据管理、数据存贮生成能够方便随时向管理层提供各管理域流量提供可靠的原始数据和细腻的分析以方便规划网络发展要求能够将IT 应用或设备故障
52、的成功解决方案导入知识库并提供行之有效的解决方案知识库系统应该便于查找和统计和,建立相应的知识类库,便于知识库9知识具有生命周期,对于老化的知识和问题,系统能够设置生命周期,以保证知识库的更新故障定故障定位主要应该由两部分:综合系统故障定位和网络故10位障定位故障定位要求系统自身有分析能力,通过外部的故障分析规则的定制,能够对此类信息进行影响方便不同的管理决能力的故障根源定位,从而提供对故障快速解要求系统应该具备自身管理的功能,能够在非灾情况下,能够系统自身对自身进行,尽量减少人为的干预,从而能够保障系统的11持续运行和稳定性随着系统应用的深入,其重要性逐步显现。通过总结经验、寻找差距,相关对
53、运维管理的认识在不断发展,要求也不断提高。为更好地服务于业务生产和其他相关处室,有必要在目前系统的基础上进一步完善功能、优化性能,进该行运维管理水平。一步挖掘数据的有效性,第五节 H运维管理体系的内容和目标该行运维管理体系的建设目标为:有效推动行内各项规章制度的执行、并深入到运维工作的各个环节;切实保障运维工作的有序开展,提高运维工作效率,为该行节约运维管理成本;提高故障解决率,缩短故障平均恢复时间;完善 H 银行的知识沉淀机制,建设高效的运维管理体系,真正实现“、控”三位该行业务一体的综合运维管理目标,最终达到提高 IT 部门的运行服务质量和服务水平。具体建设目标如下:能力,一是建设覆盖全行
54、的集中管理子系统,建设的事件管理中心,汇聚各个系统的故障和事件,进行过滤、转发、自动响应、等处理,事件管理中心承上启下,成为连接各系统故障和事件的纽带,完成事件级集成并实现交易级的应用。二是以业界标准的ITIL V3 为理论指导,构建覆盖全行的流程管理子系统,实现、技术和流程的有机整合,通过工作流引擎的自动调度实现流程的自动化,方便运维使用相关的管理流程进行日常运维,以IT 服务质量和运维部门的生产力。三是引入自动化工具,运维可以通过自动化工具快速有效地实现网络配置管理、应用部署、批量作业集中化调度管理及自动执行等,减轻了的工作量,降低了手工操作风险,节约了人力成本。四是对基础设施与 IT 基
55、础架构的运行情况进行,实现故障与异常的实时发现与通知;对数据搜集与整理,为容量管理、事件管理、问题管理、符合性管理提供分析的基础,最终实现数据中心高可用的目标。第六节 H运维管理框架一、总体模型通过学习和借鉴国际先进的运维管理模式,从该行实际出发,在经过广泛充分论证的基础上,采用“引进、消化、创新”的建设路线,该行提出运维管理的概念,来实现业务系统和 IT 系统资源之间的动态关联,实时感知 IT 系统资源对业务系统的影响,从“监视、管理、控制”三个方面着手,实现管理规范的统一、管理技术的和管理的,实现了该行运维管理方式从传统的松耦合方式转化为面向服务的紧耦合方式,促进了该行运维管理技术标准化和
56、管理工作规范化,提高了整体运维管理水平和质量。IT 运维服务管理总体模型(如图 3.1 所示):H(二)登录到基于RSA+ACS 的安全认证管理模块保护下的(三)查看事件列表发现红色 5 级事件;子系统;(四)事件通过实时告警;(五)故障事件自动触发故障管理流程;(六)根据流程环节分配、处理;(七)涉及变更的触发变更管理流程;(八)变更流程中变更时间、变更内容通过消息队列传递到作业调度的任务调度中;(九)作业执行结束后事件自动降级为绿色事件。“、控”协同的闭环式处理流程覆盖了该行IT 运维管理全生命周期的所有阶段:“感知问题、影响评估、问题、问题、修复问题(自动/手工)”,同时每一个阶段的活动
57、都有相应的操作,为管理提供详实的管理信息,提高了IT 部门的运行能力。二、基于 ITIL 的服务流程管理以ITIL V3 为理论指导,结合该行实际需求而建设IT 运维服务管理流程,主要关注三个要素,首先是重点,应与要求和管理关注重点一致,实现流程管理需要和要求重点一致,实现流程管理需要和管理诉求一致;其次是风险,应该将风险降到最低,提高流程的成熟度,注意设计方案可行性;降低对现有流程与行组织的影响;再次是相关性,梳理清楚运维体系中各个流程、功能之间的依赖关系,降低流程过程中每个阶段之间的相互依赖关系。(一)问题管理流程问题流程(如图 3.2 所示)用于总分行日常生产运行中遇到的业务问题上报及受
58、理。各将日常生产运行中遇到的业务问题通过 ITSM 提交问题单分行,对本分行能解决,由分行按流程处理解决;如需总行或其他分行协助解决的,由总行问题服务台受理并分配到相关解决。总行在日常生产运行中遇到的业务问题通过 ITSM 提交问题单,直接由总行支持中心或其他分行协助解决。受理并分配到相关的变更的及实施,从而有效防范操作风险,并使各类变更实现审计功能,便于查询和统计。(三)生产数据非计划性修改流程生产数据非计划性修改流程(如图 3.4 所示)用于总分行生产数据非计划性修改的及实施。各分通过 ITSM 提交生产数据非计划性修改申请单,对生产数据保存在分行的,按照分行流程进行和实施;如生产数据保存
59、在总行,分行后提交至总行,按照总行流程进行和实施。行流程进行和实施。指定,总行通过录入、复核后将信息返回给分行录入。中间件信息,按流程进行后进行操作。的指标 IT 管理能力衡量指标、IT 服务质量衡量指标起到支撑作用。IT 管理能力衡量指标、IT 服务质量衡量指标处于框架的中间层,抽象和综合后形成其上层领域指标IT 业务价值衡量指标。系统资源等。同时,尽可能提供对各级支撑(一线系统运维、二线应用部署人员、三线应用开发测试)有价值的信息通过交易系统提供的信息帮助应用部署/应用配置的区域并帮助前端应用支持以及应用开发/应用测试做出及时响应。快速定位存在问题通过对业务逻辑关系和各个交易节点的日志分析
60、,不仅能够获取单节点交易失败的原因和错误返回码,而且能够清晰勾画出组合交易的逻辑路由和关联关系,结合各个节点不同对象,赋予相应的指标集和不同权重,建立故障根源性分析和影响性分析模型,能够实现跨业务系统交易信息挖掘。当业务交易出现异常情况时,自动定位交易链路报错节点,分析故障原因;从而提高了问题解决的效率。同时建立了一套业务交易系统的可用性以及性能的主动探测机制。一是可以通过虚拟用户模仿客户应用,主动地检测业务交易系统的可用性,而且通过依托 KPI指标体系建立的系统健康度功能主动探测系统运行的各项性能指标,帮助运维在故障发生前及时发现问题,降低了业务系统故障所带来的风险,提高了业务系统的健壮性,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国土工作计划范文
- 顶岗实习的个人计划与心得
- 《DXP使用教程》课件
- 物业财务年终总结及明年计划物业财务年终工作总结
- 2024年八年级地理教学计划范文
- 关于初二上整整学期教学计划
- 社区妇联2024工作计划
- 小学语文继续教育工作计划范文
- 公司年度工会工作计划
- 煤矿应急救援培训计划
- 设备验证(IQ、OQ、PQ)文件模板
- 10kV电力电缆技术规范标准
- 流媒体平台管理软件平台用户操作指南
- 建筑工程团体意外伤害保险投保单
- AC2000-CH-Jianwei
- 春夜喜雨PPT最好课件
- 高频电路原理与分析课后习题答案.doc
- 武汉地区区域稳定性评价
- 民航客舱中乘务员对于方言区乘客的言语交际研究
- 三翼自动旋转门设计—毕业设计(论文)
- 量子力学自学辅导与参考答案
评论
0/150
提交评论