机房设备硬件维护服务技术文件_第1页
机房设备硬件维护服务技术文件_第2页
机房设备硬件维护服务技术文件_第3页
机房设备硬件维护服务技术文件_第4页
机房设备硬件维护服务技术文件_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、目目录录第第 1 1 章章项目概述与内容项目概述与内容.41.1.项目背景 .41.2.项目目标 .41.3.设备列表 .51.4.项目需求 .71.4.1.服务要求.71.4.2.服务器及存储维护服务.101.4.3.ORACLE数据库系统维护服务.101.4.4.WebLogic维护服务.111.4.5.网络设备维护服务.111.4.6.安全设备维护服务.121.4.7.分析诊断及优化系统的服务.131.4.8.服务器备件操作和管理.141.4.9.服务器、存储等核心设备配置管理.141.4.10.资源及能耗评估、整合、分配.151.4.11.数据中心灾备管理.161.4.12.空调设备管

2、理.171.4.13.建设要求..服务人员的要求.17第第 2 2 章章项目理论依据项目理论依据.182.1.ITIL 介绍.182.1.1.突发事件管理.202.1.2.配置管理.212.1.3.服务台.222.1.4.问题管理.222.1.5.变更管理.232.1.6.发布管理.242.1.7.服务级别管理.242.1.8.IT服务财务管理.252.1.9.能力管理.252.1.10.持续性管理.262.1.11.可用性管理.262.2.ISO/IEC20000.27第第 3 3 章章项目实施方案项目实施方案.323.1.统一报障电话 .323.2.远程服务 .323.

3、3.现场服务 .323.4.值班服务 .333.5.紧急或重大事件 .333.6.巡检服务 .333.6.1.巡检服务实施要求.333.6.2.服务目标.343.6.3.服务器及存储巡检.343.6.4.网络巡检内容.34 第 2 页 3.6.5.机房巡检.3.机房物理环境检查.3.机房管理.353.7.资产配置管理 .363.7.1.建立完善IT核心资产管理服务体系.363.8.维护报告管理 .373.9.应急预案管理 .373.10.备件支持服务.373.10.1.服务器备件管理.373.11.服务响应时间.383.12.服务质量体系和规范 .383.12.

4、1.服务工程师规范.383.12.2.现场技术支持服务内容.393.12.3.现场技术支持服务实施步骤.393.12.4.日常维护技术支持工作.403.13.ORACLE数据库服务 .403.13.1.数据库概要诊断.403.13.2.SQL信息收集与分析.403.13.3.SQL语句优化.413.13.4.数据库空间管理和碎片重组.413.13.5.规范化数据库.423.13.6.使用约束来提高查询优化.423.13.7.在复杂查询中使用 REOPT 绑定选项和输入变量.423.13.8.使用参数标记来减少动态语句的编辑时间.423.13.9.设置 DB2_REDUCED_OPTIMIZAT

5、ION 注册表变量.433.14.WEBLOGIC维护服务.433.15.服务器维护服务 .433.15.1.分析和优化服务.433.15.2.服务器使用管理.443.15.3.服务器资源整合.453.16.数据容灾服务.45第第 4 4 章章项目质量保障、应急措施项目质量保障、应急措施.464.1.项目组织架构 .464.2.服务资源管理 .474.3.事件严重等级标准.474.4.质量保证总则 .474.5.文档资料和文档质量管理.484.5.1.维护文档管理规范.494.5.2.文档管理不规范造成的常见问题.494.5.3.制定文档编制策略.504.6.质量管理 .514.6.1.质量管

6、理介绍.514.6.2.质量管理方针.514.7.风险管理 .514.7.1.风险管理.514.7.2.风险管理步骤.524.8.沟通管理 .544.8.1.沟通管理的作用.54 第 3 页 4.8.2.实施沟通管理的方式.55第第 5 5 章章应急方案应急方案.565.1.应急处理措施 .565.1.1.病毒爆发应急处理.565.1.2.非法入侵及攻击应急处理.575.1.3.服务器软件系统故障应急处理.575.1.4.核心设备硬件故障应急预案.585.1.5.业务数据损坏应急预案.585.1.6.雷击事故应急处理.585.1.7.火灾处理措施.595.1.8.断电处理措施.595.1.9.

7、设备入水措施.605.2.应急工作机构 .60第第 6 6 章章项目验收方案项目验收方案.616.1.项目验收材料 .616.2.具体验收方案 .616.2.1.验收标准.616.2.2.验收交付文档.61 第 4 页 第第 1 1 章章项目概述与内容项目概述与内容. 项目背景项目背景广东省食品药品监督管理局现有大量各类服务器、网络设备、安全设备、机房设备。随着软硬件设备的不断增加、业务系统复杂程度的提高,对各类服务器、网络设备、安全设备、机房设备等核心软硬件设备的运维、管理成为广东省食品药品监督管理局需要解决的一个重要问题。而且随着设备的硬件元器件逐渐老化,系统所运行的各类操作

8、系统、数据库及应用软件系统的维护也超过了原服务商支持的服务期限,因此,须对广东省食品药品监督管理局各类服务器、网络设备、安全设备、机房设备等核心资源的软硬件进行维保。. 项目项目目标目标为本项目范围内的资源提供二年的现场维护和设备保修服务。在广东省食品药品监督管理局现有软硬件运行平台的基础上,配合建立的报障服务台实现统一管理,统一目标、统一调度、统一流程、统一评估,建立核心设备详细档案管理和维护记录,形成有效的管理制度,提供设备运维设计管理指南和维护手册,实现核心资源的有序管理。 统一管理。在实现对服务商统一的管理要求及配套制度保证下,形成一个高度可控的运维服务体系,达到信息平台

9、整体维护要求。 统一目标。以已建的统一报障服务台为运维管理核心,在运维一体化的要求前提下,以保障核心后台服务器等核心设备为主要运维内容,主动运维,降低故障,提升资源利用率。 统一调度。除了接受报障服务台的维护任务单指派外,还需要做好核心服务器设备维护工作,按规定做好日常的巡检工作,同时配合相关应用软件的上线、服务器资源的调整、服务器资产的登记、服务器硬件运行性能检查和保障等工作。 第 5 页 统一流程。按照已有的维护流程实施资产登记、使用、检修和报废等,依照相关的规定和流程,利用已有的运维流程管理工具实施并优化服务器运维管理工作。 统一评估。按照用户对运维服务的质量评估和服务绩效要求,除了对服

10、务商在投我公司承诺的服务质量保证进行定期检查和审核外,还需要按照用户提出的服务绩效评估标准进行改进,根据服务的合理评分,获得用户对款额支付的保证,绩效评估最终结果将是本项目中标费用尾款支付的依据,根据不同的分值和绩效档次,用户将按要求支付尾款费用。通过主动运维的服务模式,降低后台核心资源故障率,并提升资源利用率,保障广东省食品药品监督管理局数据中心的服务器、存储系统、数据库及中间件等核心资源高效、安全的运行,从而为业务系统的稳定运行提供最大限度的支持。 。. 设备列表设备列表. 项目需求项目需求1.4.1.服务要求服务要求1)1)主动的预防服务主动的预防服务对设备进

11、行安全巡检,提交详细巡检报告,并对发现的故障隐患提出改进方案,最大限度的将故障扼杀于故障发生的前期阶段。根据用户要求定期对核心硬件设备和软件系统进行预防性检查与维护,提供服务报告及合理化建议,排除系统的故障隐患。巡检服务应包括但不仅限于以下内容: (1)基本配置 (2)错误检查 (3)备份恢复 (4)空间管理 (5)对象管理 (6)安全管理 (7)负载管理 (8)性能管理 第 6 页 (9)机房环境 (10)清洗工作(11)诊断机房电源使用健康情况2)2)快速的故障排除服务快速的故障排除服务提供 7*24 小时的硬件现场服务。2 小时内到达现场(紧急情况 1 小时内到达现场) 。在维保期间,负

12、责对正常使用条件下的系统整体硬件的故障判断、维保及系统性能调优维护,同时对损坏的硬件提供免费更换,以及对扩容设备进行免费安装调试与免费更换,主要包括以下硬件设备: 主机的系统主板 CPU(含 CPU 板) 系统电源,系统风扇及电源线 内存条及内存板 内置磁盘各种适配卡 所有连接系统的各种线缆制定服务细则,并为每种服务制定严格的远程响应时间、现场响应时间。该服务包括多种服务细则: 7*24 小时的现场备件更换服务、电话支持服务、现场支持服务以及远程拨入分析服务、备机服务、软件补丁测试与升级、系统及数据备份与恢复服务、第三方设备无条件配合服务。现场支持服务工程师必须在服务结束后,得到用户确认后方可

13、离开现场。服务工程师应在现场服务结束后内提供现场技术支持服务报告,经用户方负责人员签字认可后才认为本次现场服务有效完成。如果本次现场服务为后续服务的有效构成部分,技术支持方应该在问题完成后 3 天内提供完整的技术支持服务报告。如果本次现场服务为后续服务的有效构成部分,技术支持方应该为在问题完成提供完整的技术支持服务报告。1、现场技术支持服务内容1) 主机恢复运行支持在用户方主机系统重启动时(包括计划内和计划外) 。为保证主机系统重启动后的稳定、高效运行,技术支持方服务工程师应按用户方提出的时间要求及操作要求,准时到达现场提供技术支持服务。 第 7 页 2) 系统故障定位当出现与主机系统相关但难

14、以准确定位故障原因的系统问题时,为了保证故障得到及时、准确定位和处理。服务工程师应根据要求现场提供技术支持服务。配合用户和其他相关厂商工程师对故障进行分析定位并及时解决故障。3) 根据用户要求实施的其他现场技术支持服务,如系统安装、补丁安装、系统升级、系统迁移等。2、现场技术支持服务实施步骤1) 数据收集服务工程师对用户方主机系统情况进行现场检查,收集相关技术及现场状况、环境等多方面信息。2) 数据分析服务工程师对所收集信息进行整理和分析,并与投标方独有知识库和最佳实践经验自动比较和验证。3) 形成报告服务工程师对搜集的用户方数据进行分析后,提出合理建议和方案,形成现场初步工作报告。4) 现场

15、报告陈述服务工程师向用户方按照所发现问题及其严重级别,顺序陈述提出的改进建议。5) 行动计划制定和实施服务工程师配合用户方根据系统运行情况和业务运行情况共同制定改进计划并配合实施改进计划。6) 分析跟踪服务工程师在完成现场服务后一个月内负责对用户方系统进行跟踪分析,与用户方共同确认现场服务的质量和其他关联问题的解决。3 3)日常维护技术支持工作)日常维护技术支持工作熟悉并掌握用户方服务器及网络设备等配置情况,能及时对用户方提供日常维护技术支持工作; 第 8 页 1.4.2.服务器及存储维护服务服务器及存储维护服务1 1、巡检服务巡检服务对服务器、存储等设备按日进行巡检,每周提交详细巡检报告,每

16、月提交服务器维护月报,报告中除了说明维护情况外,还需要有统计数据和分析,对发现的故障隐患提出改进方案和协助解决计划。通过日常有序的运维服务,将故障控制在萌芽状态,尽最大可能将故障隐患及早发现并提前排除。在统一运维的体系下,能够合理利用已有的运维服务资源,通过运维流程的完善,提高维护业务服务水平。 巡检维护服务,要对关键业务应用提供服务器性能健康检查和可用性评估,对硬件运行状况和配套的操作系统进行预防性检查维护,提出升级优化建议。按需要对硬件进行微代码升级,如磁盘、控制器等按需要安装补丁程序操作系统健康检查系统基本的性能分析 向广东省食品药品监督管理局提交详细的预防性维护报告,根据广东省食品药品

17、监督管理局自身实际特点,提供系统维护的整体服务方案。1.4.3.ORACLEORACLE 数据库系统维护服务数据库系统维护服务1、性能评估及调优:性能评估及调优:针对数据库文件分布的变化情况提出建议,以及根据应用压力的变化,评测应用的性能,评估系统中存在或潜在的问题,并及时提交系统性能优化调整建议方案,保证数据库的高效运行。2、数据库的规划:数据库的规划:在数据库无法以最佳状态运行的情况下,根据实际情况,对数据库进行规划。3、现场技术支持现场技术支持1) 包括数据库紧急救援服务。如出现故障,导致数据库不能正常工作,服务方须尽快安排工程师到现场解决问题并保证问题完全解决。如果不能解决问题,服务方

18、需自行请专家或其他高级技术人员对采购人系统情况进行分析,直至解决问题。 第 9 页 2) 服务方在接到采购人的现场系统维护请求后 1 小时内响应,对宕机或紧急恢复等严重问题,应在 2 小时内到达现场。4、咨询服务咨询服务:提供电话或现场技术咨询和技术支持服务。1.4.4.WebLogicWebLogic 维护服务维护服务应用服务器(WebLogic)在目前的广东省食品药品监督管理局系统中启着越来越重要的作用,核心的应用都运行在应用服务器上,因此了解应用服务器的运行状态,性能信息及运行在应用服务器上的运行响应时间显得格外重要。提供服务器性能信息和资源的运行性能的解决办法,如:CPU 利用率,JV

19、M 利用率等。提供应用系统级问题管理手段。1.4.5.网络设备维护服务网络设备维护服务1 1、快速备件先行更换服务、快速备件先行更换服务为用户方所要求提供保修的设备提供备件服务,要求服务方准备相关设备备件,在用户方相关设备出现硬件故障时,能够以最快速度提供临时性或永久性备件更换,对可维修的硬件故障采取临时性备件更换,不可维修的硬件故障采取永久性备件更换。按用户要求将部分维修量大的设备需存放备件以备用户方应急使用。备件服务需在设备故障发生后四小时内完成。2 2、故障处理响应时间和方式、故障处理响应时间和方式接障后技术支持人员必须在 30 分钟内作出响应,向客户详细了解故障现象,分析故障原因、制定

20、解决方案,需要时按规定时间内上门服务。故障处理时限:故障产生后顺延六个工作小时内恢复广东省食品药品监督管理局网络故障。一旦用户报障后,维护方必须在规定的响应时间内到达现场进行故障诊断,然后采取有效的措施进行解决问题。根据系统故障的程度提供不同的响应时间和故障排除时间;如由于用户特殊原因,造成技术人员不能满足以上维护响应时间,需要用户在延时申请表上签字确认相应响应、处理时间的顺延;如维护工程师不能在规定时限内解决问题,必须 第 10 页 提前向用户及相关上级领导报告,并与用户沟通,同时充分调动各方面资源以便尽快解决故障,并在事后提交故障分析报告。3 3、定期巡检服务、定期巡检服务对广域网节点设备

21、、核心机房网络设备等关键网络设备定期进行巡检,每周提交详细巡检报告,每月提交网络维护月报,报告中除了说明维护情况外,还需要有统计数据和分析,对发现的故障隐患提出改进方案和协助解决计划。通过日常有序的运维服务,将故障控制在萌芽状态,尽最大可能将故障隐患提前排除。在统一运维的体系下,能够合理利用已有的运维服务资源,通过运维流程的完善,提高维护业务服务水平。4 4、重要时刻专人值守服务、重要时刻专人值守服务在重要关键时刻,包括重大会议期间、网络重大割接或其它任何可能对业务运营产生重大影响的时刻,服务方需要为客户提供重要时刻的专人无限次现场值守支持。1、熟悉并掌握用户方网络设备等配置,能及时对用户方提

22、供日常维护技术支持工作;2、客户机房设备位置调整、理线及设备贴标签等工作;1.4.6.安全设备维护服务安全设备维护服务1、安全设备保修及维护要求为安全设备提供相当于原厂的设备保修及维护服务清单详见保修范围2、维护要求服务内容包括对意外事故的处理、非法入侵的处理和调查恢复、网络攻击的应急防护等。对防火墙、防病毒、数据备份、核心交换机、路由器等设备提供现场网络接入安全维护和工作时间安全维护服务。安全设备维护服务的主要目的是通过加强安全运维工作,提高覆盖全省的安全系统的运行维护质量,确保我单位安全防护体系的严密有效。1.4.7.分析诊断及优化系统的服务分析诊断及优化系统的服务1、广东省食品药品监督管

23、理局对应用系统的可用性和性能有着非常高的要求。应用系统主要由主机、数据库、中间件应用服务器和应用等构成。为了保证系统的性能和可用性, 第 11 页 服务商在服务期内提供相关工具进行诊断和调优服务。1)定期利用平台工具检查主动发现应用系统核心组件数据库和应用服务器中可能出现的问题。2)发现问题或潜在的故障因素,利用平台工具能够快速判断问题,确定产生这些问题的根本原因,进行深入诊断。3)对所有纳入服务范围的系统,定期利用平台工具对其数据库、应用服务器、HTTP服务器作全面分析、诊断、优化。提升应用系统的使用质量。4)对使用过程中遇到的疑难问题进行技术支持。5)对授权软件进行支持。6)对系统性能优化

24、和系统安全、网络配置提供建议及支持。7)现场进行疑难问题解决。8)现场系统性能优化。9)现场进行系统配置。2、服务器使用管理1)服务器使用效率管理每周至少一次完成对服务器性能等方面的数据进行收集,获取服务器使用效率方面的数据(性能数据、空间使用数据、IP 占用数据等)。2)服务器与应用系统的对应关系管理 明确应用系统名称及版本,明确应用系统的组成部分(应用服务器、数据库服务器等),明确应用系统的端口使用情况,为系统安全做好防范。3)服务器日常使用管理 检查服务器的补丁升级情况,配合客户实施对服务器的安全与防病毒管理,排除不必要的目录共享、软件安装等。1.4.8.服务器备件操作和管理服务器备件操

25、作和管理服务商必须建立备件库,对项目范围提到的服务器、存储设备提供新件备件服务,备件 第 12 页 包括服务器和存储设备的电源、内存、硬盘等部件。1)当过保的服务器电源、内存、硬盘发生故障的时候,必须免费更换;当过保的储存设备的控制器、电源、电池、主板等部件发生故障的时候,必须免费更换;2)当未过保的服务器和存储设备发生故障时,应主动联系厂家进行维护,涉及的费用均已包含在该项目的总费用中;3)当服务器的其它部件发生故障时,如服务器的主板等,服务商将故障件转由客户方进行维修或更换,为了保证服务器正常运行,服务商还需要提供相应的备件更替,直至客户方将故障件维修完成或采购新件进行替换,替换操作工作服

26、务商根据客户要求免费进行,换下的备件由服务商取回;4)备件的更换工作由服务商负责免费实施,包括更换前的故障定位、检查、拆卸、更换和调试。5)当服务器、存储、等设备或系统出现故障时,及时进行检查、维修或更换故障部件。如果硬件设备故障,保证在 8 小时内提供不低于故障设备规格型号档次的备用设备替代使用,直至故障设备修复为止,以最大限度保证业务系统不间断地正常运行。1.4.9.服务器、存储等核心设备配置管理服务器、存储等核心设备配置管理 1、健全服务器配置信息并维护配置信息。 对服务器管理按照对象方式进行服务,通过对其的硬件属性(CPU、内存、硬盘、IP 地址及网络连接情况等)及软件属性(操作系统、

27、数据库、中间件)定期普查,设定配置信息,并根据实际变动情况进行信息变更,以便于在对服务器的维护中及时获得维护信息,将故障及时定位,同时获得对象服务重要级别。2、完善 IT 核心资产管理服务体系完善核心服务器、软硬件设备的配置管理体系,并实施。在对广东省食品药品监督管理局软硬件平台充分了解的基础上,建立管理档案,形成有效的管理制度,提供设备运维管理指南,最终达到有序管理所有软硬件设备从采购、使用、变更升级到报废整个生命周期的目的。整合服务器资源,提升服务器的使用效率。 第 13 页 1.4.10.资源及能耗评估、整合、分配资源及能耗评估、整合、分配1、针对当前的应用对服务器的需求以及将来对服务器

28、的需求进行详细分析,对服务器的使用进行合理规划,从而做到服务能力与服务成本、业务需求的良好平衡。服务内容:1)服务器使用效率管理。每周完成对服务器性能等方面的数据进行收集,获取服务器使用效率方面的数据(性能数据、空间使用数据、IP 占用数据等) 。2)优化服务器资源的使用。在效率数据的基础上,对使用效率较低的服务器上的应用进行整合,将剩余服务器资源分配到对服务器资源要求较高的应用上去。保障各类应用的稳定运转。3)服务器与应用系统的对应关系管理。明确应用系统名称及版本,明确应用系统的组成部分(应用服务器、数据库服务器等) ,明确应用系统的端口使用情况,为系统安全做好防范。4)服务器日常使用管理。

29、检查服务器的补丁升级情况,配合客户实施对服务器的安全与防病毒管理,排除不必要的目录共享、软件安装等。5)通过市局现有监控系统周期性采集性能信息,每周分析采集的数据找出高居性能占用率的设备对其进行调整。6)每日巡检主动发现性能问题的机器,分析巡检日志,优化性能低下的设备。7)主动运维服务,主动发现性能问题服务器,优化服务器性能平衡性能负载,规划服务器性能负载平衡。2、服务器资源整合1)根据客户当前资源整合、合理规划、重复利用被资源整合后剩余机器,评估这些服务器占用资源及能耗情况,根据应用要求合理的投入生产环境中使用。2)根据应用系统、配置分级建立其他应用环境,用以提供扩展服务。3)配合客户仓库、

30、报废制度对性能极其低且达到报废年龄的机器进行管理控制。 第 14 页 1.4.11.数据中心灾备管理数据中心灾备管理1、对核心、容易发生单点故障的业务系统的设备及对中断恢复时限较短的重要业务,服务商应提供业务中断时紧急恢复业务的应急预案,应急预案包含预案所需资源、启动条件、工作流程及工作机构等内容。该项内容是主动运维工作的重要部分。2、结合信息中心运营规划,通过进一步整合来实现虚拟化规模效应。大量的服务器、存储和网络集中在一个资源池中管理,可以按需配置。从灾难恢复的角度来看,当灾难发生时,资源池可以配置更多的容量和网络接入来帮助恢复主要生产环境。 1)配套资源整理:根据灾备技术要求,以及现场环

31、境收集各种支持生产环境的要素。这些要素包括处理器资源(存储、设备界面等)、磁盘资源(存储阵列、存储场地网络 SAN、磁盘簇等)、外围设备(控制单元、终端、刀片等)、基础设施(外部交换机)和网络连通性(交换机、带宽等)。2)恢复计划测试:制定灾难恢复策略,以有效地了解特定时间段内工作量对资源的要求,同时验证业务的完整性和基础设施的有效性。3)工作计划表格编制:不论是真实情况下还是演练过程中,制定详细的计划表格管理整个过程中,控制不断变化的工作量。包括实施时间表、资源分配的备选资源表、日常备份流程表、测试恢复计划表。4)灾难恢复风险控制:制定灾难恢复策略,结合给业务带来的风险,制定应对措施。5)清

32、晰明确的工作计划:确定灾难恢复的工作量。明确业务的优先次序和临界点,制定出与处理流程、应用的集成和相互依赖性、以及 IT 支持模块相关的详细计划,从而保证虚拟化环境的可恢复性。6)保持完整性的规则:建立包括问题、变更、事件、配置和资产管理在内的严格的系统管理规则,做好灾难恢复策略的前提。保持恢复环境的完整性,管理资源池的最终操作、监控和维护的有效性。 7)业务和 IT 报告:对灾难恢复项目进程的跟踪、状态的传递和结果输出分析柏高,以供客户方判断 IT 功能所进行的大量投入的效果。 第 15 页 8)降低无法预知的 IT 硬件设备的损坏、断电、火灾、自然灾害、恐怖袭击等,造成数据丢失或业务的突然

33、中断。 9)降低系统人员误操作造成意外宕机或关键数据丢失的情况,无法避免。10)减少手段频多的黑客攻击、病毒入侵、垃圾邮件、网络与系统的漏洞,造成网络瘫痪、系统崩溃。1.4.12.空调设备管理空调设备管理1、加强巡检,保证 UPS 电房柜式空调及中心机房精密空调的正常运行;2、每季度对 UPS 电房柜式空调及中心机房精密空调室外机进行清洗及补雪种等工作;1.4.13.建设要求建设要求..服务人员的要求服务人员的要求1维护驻场人员 1 名。1)项目经理:具有 3 年以上的服务器维护管理经验。2)维护人员:计算机专业本科以上学历,从事 IT 维护工作至少 3 年,具

34、有良好的技术基础和管理素质技能十分娴熟,工作责任心强。3)二线技术人员:资深网络工程师至少 1 名,资深数据库管理员和 Microsoft SQL数据库工程师至少 1 名,资深操作系统工程师 1 名,资深安全系统工程师 1 名。2服务要求:1)维护人员必须经过与用户使用环境相关的专业系统或数据库的培训,自乙方接到中标通知书后,5 个工作日内,开始展开项目实施工作。维护人员能够迅速掌握用户方网络设备及服务器系统的安装、调试和故障排除能力,并协助用户方的技术人员进行这些设备及系统的安装、调试和故障排除。2)维护人员要求具有信息系统维护经验,能够较快熟悉业务流程,技术细节,制定详 第 16 页 细的

35、维护流程和方法,要求维护方案中给出服务器维护的实施方案。3)维护人员应具有较强的协调、管理、沟通能力。第第 2 2 章章项目理论依据项目理论依据. ITILITIL 介绍介绍ITIL 是由英国政府与一些领先的 IT 厂商于 1980 年中期开发的服务管理模型。IBM一直以来对 ITIL 模型的制定做出了巨大的贡献。ITIL 以服务为中心提供最好的管理方法确保业务的运作。该方法对于大型企业和小型企业同样适用,无论它是主机用户还是开放平台用户。二十世纪八十年代末,英国政府认识到需要建立并标准化政府部门信息系统管理的流程、规范和最佳实践经验。实现的想法是结合不同政府 IT 部门的管理知

36、识并参考企业界经验,建立标准加以实施并由此受益。ITIL 版本 2 从 2000 年开始制定,为运作单位提供更强壮和符合现实要求的模型。下图说明了版本 2 的模型:任何管理模型的实施,尤其是服务管理流程的设计,不可能是孤立进行的,它与一下服务提交服务提交服务提交服务提交安全管理业务管理ICT基础设施管理实施服务管理计划应用管理服务支持服务支持服务支持服务支持 第 17 页 因素都有联系:组织结构: 流程的改变不可避免地将引起组织结构地变化。然而为了正确地实施,满足用户的需求,将尽量将此变化限制在最小的范围内,将通过评估角色和职责来确定需要增加的角色以支持流程的成功实施。IT 工具:服务管理流程

37、是非常复杂的,需要有自动化的管理工具来辅助执行。为了确保流成的有效执行,需要同时实施管理工具来进行服务管理。在 ITIL 中有 12 个服务管理模块,其中 1 个是功能,11 个是流程,如下图:其中 5 个为服务提供流程:服务水平管理服务水平管理可用性管理容量管理IT 持续性管理事件管理问题管理变更管理版本管理配置管理服务台服务台服务台服务台服务提交服务提交服务提交财务管理操作管理关系管理服务支持服务支持服务支持 第 18 页 可用性管理财务管理容量管理IT 持续性管理5 个服务支持流程:事件管理变更管理问题管理 版本管理配置管理最后一个是功能部分服务台2.1.1.突发事件管理突发事件管理事件

38、管理流程通常都是与服务台联系在一起的。服务台是进行事件管理的主要部门。这两个部分结合在一起确保用户能够尽快地恢复正常工作。它们是由故障驱动的,主要目的就是使业务流程能够尽快恢复执行。事件管理流程使用来自于问题管理流程的信息(解决方法,已知问题) ,并与配置管理流程有关联。启动条件启动条件描述产生启动条件的过程名可能的替代条件故障服务请求客户投诉客户咨询客户其它任务结束条件结束条件描述过程中产生结束条件的活动可能的替代条件问题关闭回访客户项目经理确认,通过其它途径解决输入 第 19 页 输入名称产生输入的过程名称计算机系统报障单问题接收过程计算机系统维护现场服务单问题处理过程输出输出名称过程中产

39、生输出的活动月度总结报告CASE 分析汇总过程2.1.2.配置管理配置管理通过记录目前 IT 系统的配置状况,为其它管理流程包括事件管理,问题管理,变更管理,版本管理提供基础。配置管理需要服务管理工具的支持,该工具不仅需要能够满足你目前的需求还应该能够满足未来业务发展的需求。配置管理系统记录所有的 IT 资产和配置信息,它为其它服务管理流程提供准确的配置信息和文档。 启动条件启动条件描述产生启动条件的过程名可能的替代条件创建新的配置项配置调整需求故障处理结束条件结束条件描述过程中产生结束条件的活动可能的替代条件配置创建或调整配置变更输入输入名称产生输入的过程名称创建新的配置项变更申请配置调整需

40、求约定先更换后审批的零配件列表设备更换输出输出名称过程中产生输出的活动更新配置项配置变更 第 20 页 变更审批表变更/采购申请计算机系统维护费用审批表变更/采购申请2.1.3.服务台服务台服务台是一项管理职能而不是一个管理流程。它是 IT 服务提供方与 IT 服务客户/用户之间的统一联系点。一方面当客户或用户提出服务请求、报告事故和问题时,服务台负责记录这些请求、事故、问题,尽量解决它们,在不能解决时可以转交给相应的支持小组并负责协调各小组与用户的交互;另一方面服务台根据支持小组的要求,进一步联系客户,了解有关情况,并把支持小组的处理进展及时通报给用户。此外,服务台还为其他管理流程如变更管理

41、、配置管理、发布管理、服务水平管理及 IT 服务持续性管理提供接口。2.1.4.问题管理问题管理实施问题管理的目的:在 IT 基础架构中,尽可能减少由于错误而引发的事件或问题对于业务带来的负面影响,并且减少类似错误的再次发生。问题管理流程的驱动力是提高对问题的响应和解决速度,而问题管理模块将这套基本流程提高了一个层次,其驱动力是消除 IT 基础架构中的已知错误。启动条件启动条件描述产生启动条件的过程名可能的替代条件事件升级故障处理客户要求突出问题或现象客户投诉结束条件结束条件描述过程中产生结束条件的活动可能的替代条件得到问题的解决方案或替代方案流程回顾输入输入名称产生输入的过程名称问题处理计划

42、书制定问题处理计划 第 21 页 输出输出名称过程中产生输出的活动问题或隐患分析报告问题分析解决方案问题分析2.1.5.变更管理变更管理变更管理流程必须将所有的变更纳入其中进行管理,这样确保对 IT 基础设施有一个完全的变更管理。变更管理不是消除变更所带来的所有风险,而是尽可能地将变更风险降到最小,或明确风险的存在并接受风险,所以变更管理流程通常需要与用户沟通。所有的项目需要从变更管理开始因为所有的项目都会对 IT 系统引发一些变更。它们要么增强现有系统,要么增加新的功能。变更可以是由于需要升级某些系统以提升效率引起的,也可以是因为一个问题引起的。所有这些都需要在变更管理系统中提交变更申请。但

43、有一种例外就是由问题引发的变更。在时间不允许的情况下可以先执行变更,然后再在系统中补交申请。变更管理流程需要从其它所有流程中获取信息以有效地评估风险(变更失败的可能性)和影响(失败后的结果) 。启动条件启动条件描述产生启动条件的过程名可能的替代条件创建新的配置项配置调整需求故障处理结束条件结束条件描述过程中产生结束条件的活动可能的替代条件配置创建或调整配置变更输入输入名称产生输入的过程名称创建新的配置项变更申请配置调整需求约定先更换后审批的零配件列表设备更换 第 22 页 输出输出名称过程中产生输出的活动更新配置项配置变更变更审批表变更/采购申请计算机系统维护费用审批表变更/采购申请2.1.6

44、.发布管理发布管理发布是指一组配置项目(Configuration Items CI)经过测试被引入处于活动状态的环境中。发布管理的主要目标是确保发布信息被成功地公布, 包括归纳综合, 测试与存档。发布管理确保只有经过测试和正确授权的软硬件版本才能提供给IT 运行环境。 发布管理与配置管理和变更管理的行为密切相关。真实的变更实施经常通过发布管理行为得以贯彻。变更的结果可能经常来自于新硬件, 新版本软件, 以及新的文档(自行建立, 或购买而来)等。对它们进行控制, 并打包和颁发。有关存档安全和公布程序应该和变更管理和配置管理流程紧密集成。发布的程序也可能作为突发事件管理和问题管理流程中不可分割的

45、一部分, 同时还和CMDB 密切相连, 以维护及时更新的记录。2.1.7.服务级别管理服务级别管理服务级别管理的目标是与客户之间有关IT 服务的协议, 并付诸实施。 因此, 服务级别管理需要收集客户需求, IT 服务组织可提供的设施, 以及可用的财务资源。 服务级别管理针对提供给客户的服务 (聚焦客户的)。因此是基于客户需求建立服务 (需求拉动),而非单纯基于现有技术所及(供应驱动), 从而使IT 服务组织提高客户满意度. 服务级别管理阐述的内容有:如何在服务级别协议(Service Level Agreement SLA)中清楚地定义条款,使其可优化IT 服务成本, 并为用户所接受。如何监控

46、和讨论所提供的服务。 第 23 页 如何管理 IT 服务组织的供应商及其下包合同。服务级别管理(Service Level Management SLM)流程是用来确保服务级别协议(Service Level Agreements (SLAs), 并支持运行级别协议(Operational LevelAgreements (OLAs)及其它合同, 保证所有对服务质量的影响减少到最小。此流程在服务质量和SLA 基础上评估各种变更造成的影响, 包含预期变更前的影响, 也包含评估实施变更后的影响。SLA 中某些最重要的目标和服务可用性、以及在容许周期内对突发事件形成决策有关。SLM 是服务支持和服务

47、交付的关键。由于它依赖于其它流程的存在性, 有效性及运行效率, 它不可孤立存在。一个缺乏基础支持流程的SLA 是没有意义的, 缺乏支持的SLA 就失去了承认其内容的基础。2.1.8.ITIT 服务财务管理服务财务管理财务管理针对于IT 服务的谨慎从事。例如, 当所提供的IT 服务在进行中时, 财务管理将提供其导致的成本信息。这样使考虑IT 架构或IT 服务的改变时, 能够合理地考虑成本和利益(价格和性能)之间的关系。财务管理中对成本的鉴别, 分配, 预测和监控使成本成为可知因素, 减少成本和预算的差距。重点结合IT 服务组织的赢利, IT 服务的财务管理描述了多种支付方法, 包括设立支付和定价

48、的目标, 以及预算计划。财务管理负责对成本及IT 服务投资回报的会计核算, 并管理任何来自于客户的成本。财务管理需要与能力管理(Capacity Management), 配置管理(Configuration Management,包含资产数据), 以及SLM 的良好接口, 来确定服务的真实成本。在IT 组织预算谈判阶段和客户的IT 耗费核算阶段, 财务管理很可能与业务关系管理(Business RelationshipManagement)及IT 组织密切相关。2.1.9.能力管理能力管理能力管理是优化成本, 获得时间, 以及开发IT 资源的流程, 来支持与客户签订的服务条款。能力管理针对资

49、源管理, 性能管理, 需求管理, 建模, 能力计划, 负载管理, 以及IT 第 24 页 应用软件能力推测。能力管理强调用计划来确保所签订的服务级别可以被履行和成长。能力管理(Capacity Managemen)负责确保在所有时间具备足够的可用能力, 以满足业务需求. 能力管理不是简单地与系统部件的性能相关, 而是直接与业务需求相关。在那些与能力问题相关的困难面前, 能力管理在突发事件决策和问题鉴别过程中被引入。能力管理提交变更请求(Requests for Change RFCs)以确保得到适当的可用能力. 这些RFC 被提交给变更管理流程, 其实施可能影响若干CI, 包括硬件, 软件和文

50、档, 并需要提供有效的版本管理(Release Management)。能力管理应该在评估所有变更时被引入, 用来确定变更导致的在能力和性能上的影响。这种影响在变更实施前后都有可能出现。能力管理应该特别关注变更在一定周期后引起的累积性变化。容易被忽略的单个的变更往往在经过累积后, 引起响应时间衰减, 文件存储问题, 和对处理能力的过度需求。2.1.10.持续性管理持续性管理此流程在业务中断时对IT 服务进行灾难恢复措施的准备和计划。业务持续性管理为客户组织遇到灾难时准备好紧急预案, 根据此预案采取与IT 服务相关的预防灾难发生的措施。IT 服务持续性管理流程对技术, 财务和管理资源需求做好计划

51、和协调, 确保灾难发生后可持续提供服务, 并就其内容达成客户同意。IT 服务持续性管理与一个组织在业务中断后在某个可允许范围内继续运作的能力密切相关. 至少要保证最基本的业务运行所需要的IT服务, 预先对其服务级别作出规定, 并和客户达成一致。有效的IT 服务持续性需要一个平衡的风险缩减措施, 例如有弹性的系统和备份恢复设施。配置管理流程中的数据被用来辅助其计划和预防措施. 需要对架构和业务变更对持续性计划造成的潜在影响进行评估。有关IT 和业务的计划应该提交变更管理程序。 在持续性管理流程中, 服务台承担着重要角色。 第 25 页 2.1.11.可用性管理可用性管理可用性管理是确保资源, 方

52、法和技术得以适当拓展的流程, 以支持与客户签订的IT 服务条款。可用性管理针对所遇到的问题, 如优化维护等, 并且设计测量指标, 最大程度减少意外突发事件的数量。可用性管理与IT 服务的设计, 实施, 测量和管理相关, 确保规定的业务需求中有关可用性的内容被贯彻。可用性管理需要理解IT 服务失效发生的原因和恢复服务所需的事件。突发事件管理和问题管理提供了关键输入SLA 中描述的可用性的目标在可用性管理流程中被监控, 并包含在其报表中。此外,在支持服务核查制度所提供的测量和报表中, 可用性管理对服务级别管理(SLM)流程提供了支持。. ISO/IEC20000ISO/IEC2000

53、0ISO/IEC20000是一个关于IT服务管理体系的要求的国际标准,它帮助识别和管理IT服务的关键过程,保证提供有效的IT服务满足客户和业务的需求。ISO20000, 共分为两部分 : ISO/IEC 20000-1 Information technology-Service management Part-1:Specification(信息技术服务管理标准规范, 认证要求) ISO/IEC 20000-1 Information technology-Service management Part-2:Code of practice(信息技术服务管理最佳实践) 在ISO20000中的

54、信息安全管理部份,以ISO27002/ISO27001为参考规范。在企业组织ISO20000的实施范围不大于ISO27001/ISO27002 实施的范围的情况下,若该组织/企业已通过ISO27001认证,则该企业组织的ISO20000中信息安全管理部份也将符合标准。 ISO20000 标准包括了 5 大过程及 13 个管理面, 如下:服务交付过程 服务等级管理 服务报告 第 26 页 能力管理 服务持续性与可用性管理 信息安全管理 IT 服务预算编制与会计核算 控制过程 配置管理 变更管理 发布过程 发布管理解决过程 事故管理 问题管理 业务过程 业务关系管理 供应商管理实施 ISO2000

55、0 效益 得以获得业界普遍认同的国际证书 ISO20000 认证; 就服务质量和服务承诺与业务及供货商达成一致,建立和业务及供货商统一的沟通平台;达到相关利益方均满意的 IT 服务管理目标; 提高 IT 服务的可用性、可靠性和安全性,为业务用户提供高质量的服务; 持续优化服务流程,提升服务水平,提高业务满意度; 提高项目的可提供性并确保如期交付; 从总体上提高组织 /企业 IT 投资的报酬率,提升组织 /企业的综合竞争力; 建立 IT 部门一整套行之有效的持续改善机制和内控机制; 明晰 IT 管理成本和组织/企业业务战略和 IT 战略目标的结合点,完善现有 IT服务结构和资源配置,使各项 IT

56、 资源的运用符合公司业务战略和 IT 战略目标; 第 27 页 通过建立优化、透明的管理流程和权责的定义,监控管理流程、进行绩效评价;降低 IT 运营的管理成本和风险; 易于整合服务管理流程和其它管理系统,如:信息安全管理体系 ISMS 、质量管理体系 ISO9000 等; 将现有管理体系和业务流程整合,规范 IT 部门服务水平,规范工作流程,降低由人员变动导致的风险; 提高 IT 部门相关员工的专业素质,提高员工的服务能力和工作效率; 提升 IT 部门整体运作及部门间沟通的能力。ISO 20000-1:2005 IT 服务管理(ITSM)规范是关于 IT 服务的标准,提出了用户实施 IT 管

57、理的基本基线,对用户如何解决客户化和专业化问题提出了明确的要求,它主要表现为前端客户需求管理和后端流程管理。在前端,ITSM 要解决如何明确客户需求,明确了解客户的业务需求和对 IT 服务的需求,核心就是对 IT 服务的级别的明确和管理。在签订了服务级别协议后,ITSM 要解决一个增值化角度。既然签订了服务级别协议,那么该怎样提供服务呢?ITSM 的后端思路,就是通过流程化、规范化和最佳实践,来处理IT 的事件处理、变更管理、配置管理、发布管理、确保性能和客户服务,用流程方法来跟踪完成,保证效率和服务水平。把前端和后端两点贯穿起来,这个流程就是如何客户化和专业化的过程。 就目前而言,IT 已成

58、为许多业务流程必不可少的部分,它和业务流程形成了一个有机的整体,这对 IT 本身是件好事。但这种地位的提升同时意味着 IT 要承担更大的责任。一方面为了提高业务流程的质量和效率,IT 必须满足业务流程不断变化的需求;另一方面,为了降低业务流程的运营成本,IT 有关的成本也必须不断降低。可是,实际情况是 IT 在这两个方面都没有做出令人满意的回答。部分原因是 IT 提供者自认为是的“特殊组织”,不能以常规对待它,往往从技术角度考虑问题,出现问题时往往是一句 “这就是 IT”就推掉了所有责任。业务部门或组织因为不懂 IT,即使感觉不对劲,也不知原因何在。为了解决这种情况,ITSM 贯彻质量思想,应

59、用质量方法和标准来管理 IT 服务。服务提供流程制定服务级别协议、监督协议的执行并评价最终结果,服务提供流程根据服务协议提供服务。这整个过程关注的不仅仅是 IT 服务提供者是否提供了某种服务,更重要的 第 28 页 是 IT 服务提供者是否提供了用户满意的服务,并且这个过程是符合成本效益原则的。通过 ITSM,业务部门可以避免前面提到的尴尬局面,根据一套量化的质量指标,“理直气壮”地处理与 IT 部门之间的关系;IT 部门也可以提高服务质量、降低服务成本、学习以前的经验并处理好和业务部门之间的关系。ISO 20000-1:2005 相对于传统的 IT 管理,更加强调客户的需求及其实现,并将 I

60、T服务的预算和核算引入 IT 服务管理,将财务管理和服务管理有机的结合起来,促进 IT 服务的改进和提高。传统的 IT 管理 转变 IT 服务管理(ITSM) 技术导向 流程导向 救火队 预防为主 被动 客户 用户 主动 集中式、企业自己完成 分布式、外包 孤立的、分散的 集成的、企业范围内的 一次性的、混乱的 可重复的、职责明确的 非正式的流程 正式的最佳实践 从 IT 部门内部考虑 从业务的角度考虑 具体的运营 面向服务的 ISO20000-1:2005 促进采用整合的过程方法,有效辨别组织的功能并管理相关的活动。其过程方法强调理解和满足需求、在过程中寻找附加价值、从过程执行中获取结果、持

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论