机房设备硬件维护服务技术文件_第1页
机房设备硬件维护服务技术文件_第2页
机房设备硬件维护服务技术文件_第3页
机房设备硬件维护服务技术文件_第4页
机房设备硬件维护服务技术文件_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精品文档 欢迎下载 。精品文档 欢迎下载 。第 1章项目概述与内容 TOC o 1-5 h z HYPERLINK l bookmark6 o Current Document 项目背景 4 HYPERLINK l bookmark8 o Current Document 项目目标 4设备列表 5项目需求 5 HYPERLINK l bookmark13 o Current Document 服务要求5 HYPERLINK l bookmark15 o Current Document 服务器及存储维护服务7ORACL做据库系统维护服务8WebLogic维护服务8 HYPERLINK l bo

2、okmark17 o Current Document 网络设备维护服务8 HYPERLINK l bookmark19 o Current Document 安全设备维护服务9 HYPERLINK l bookmark21 o Current Document 分析诊断及优化系统的服务10 HYPERLINK l bookmark23 o Current Document 服务器备件操作和管理11 HYPERLINK l bookmark25 o Current Document 服务器、存储等核心设备配置管理11 HYPERLINK l bookmark27 o Current Docum

3、ent 资源及能耗评估、整合、分配12 HYPERLINK l bookmark29 o Current Document 数据中心灾备管理12 HYPERLINK l bookmark31 o Current Document 空调设备管理13建设要求141414服务人员的要求第 2 章 项目理论依据 HYPERLINK l bookmark35 o Current Document ITIL 介绍 14 HYPERLINK l bookmark37 o Current Document 突发事件管理16 HYPERLINK l bookmark39 o Current Document 配

4、置管理 17 HYPERLINK l bookmark41 o Current Document 服务台 18 HYPERLINK l bookmark43 o Current Document 问题管理 18 HYPERLINK l bookmark45 o Current Document 变更管理 19 HYPERLINK l bookmark47 o Current Document 发布管理 20 HYPERLINK l bookmark49 o Current Document 服务级别管理20IT 服务财务管理21 HYPERLINK l bookmark51 o Current

5、 Document 能力管理21 HYPERLINK l bookmark53 o Current Document 持续性管理22 HYPERLINK l bookmark55 o Current Document 可用性管理22 HYPERLINK l bookmark57 o Current Document ISO/IEC20000 22 HYPERLINK l bookmark59 o Current Document 第 3 章 项目实施方案 27 HYPERLINK l bookmark61 o Current Document 统一报障电话27 HYPERLINK l book

6、mark63 o Current Document 远程服务 27 HYPERLINK l bookmark65 o Current Document 现场服务 27 HYPERLINK l bookmark67 o Current Document 值班服务 28 HYPERLINK l bookmark69 o Current Document 紧急或重大事件28 HYPERLINK l bookmark71 o Current Document 巡检服务 28 HYPERLINK l bookmark73 o Current Document 巡检服务实施要求28 HYPERLINK l

7、 bookmark75 o Current Document 服务目标29 HYPERLINK l bookmark77 o Current Document 服务器及存储巡检29 HYPERLINK l bookmark79 o Current Document 网络巡检内容29 HYPERLINK l bookmark81 o Current Document 机房巡检303030机房物理环境检查机房管理 HYPERLINK l bookmark85 o Current Document 资产配置管理 31 HYPERLINK l bookmark87 o Current Document

8、 建立完善IT 核心资产管理服务体系31 HYPERLINK l bookmark89 o Current Document 维护报告管理 31 HYPERLINK l bookmark91 o Current Document 应急预案管理 31 HYPERLINK l bookmark93 o Current Document 备件支持服务32 HYPERLINK l bookmark95 o Current Document 服务器备件管理32 HYPERLINK l bookmark97 o Current Document 服务响应时间32 HYPERLINK l bookmark9

9、9 o Current Document 服务质量体系和规范33 HYPERLINK l bookmark101 o Current Document 服务工程师规范33 HYPERLINK l bookmark103 o Current Document 现场技术支持服务内容33 HYPERLINK l bookmark105 o Current Document 现场技术支持服务实施步骤34 HYPERLINK l bookmark107 o Current Document 日常维护技术支持工作34 HYPERLINK l bookmark109 o Current Document O

10、RACL散据库服务34 HYPERLINK l bookmark111 o Current Document 数据库概要诊断35SQL信息收集与分析35SQL语句优化35 HYPERLINK l bookmark113 o Current Document 数据库空间管理和碎片重组35 HYPERLINK l bookmark115 o Current Document 规范化数据库36 HYPERLINK l bookmark117 o Current Document 使用约束来提高查询优化36 HYPERLINK l bookmark119 o Current Document 在复杂查

11、询中使用REOPT绑定选项和输入变量36 HYPERLINK l bookmark121 o Current Document 使用参数标记来减少动态语句的编辑时间36设置 DB2_REDUCED_OPTIMIZATIOO表变量37 HYPERLINK l bookmark123 o Current Document WEBLOGIC隹护服务37 HYPERLINK l bookmark125 o Current Document 服务器维护服务37 HYPERLINK l bookmark127 o Current Document 分析和优化服务37 HYPERLINK l bookmar

12、k129 o Current Document 服务器使用管理38 HYPERLINK l bookmark131 o Current Document 服务器资源整合38 HYPERLINK l bookmark133 o Current Document 数据容灾服务39第 4 章 项目质量保障、应急措施 HYPERLINK l bookmark137 o Current Document 项目组织架构 40 HYPERLINK l bookmark139 o Current Document 服务资源管理 40 HYPERLINK l bookmark141 o Current Docu

13、ment 事件严重等级标准40 HYPERLINK l bookmark143 o Current Document 质量保证总则 41 HYPERLINK l bookmark145 o Current Document 文档资料和文档质量管理41 HYPERLINK l bookmark147 o Current Document 维护文档管理规范42 HYPERLINK l bookmark149 o Current Document 文档管理不规范造成的常见问题42 HYPERLINK l bookmark151 o Current Document 制定文档编制策略43 HYPERL

14、INK l bookmark153 o Current Document 质量管理44 HYPERLINK l bookmark155 o Current Document 质量管理介绍44 HYPERLINK l bookmark157 o Current Document 质量管理方针44 HYPERLINK l bookmark159 o Current Document 风险管理44 HYPERLINK l bookmark161 o Current Document 风险管理44 HYPERLINK l bookmark163 o Current Document 风险管理步骤45

15、HYPERLINK l bookmark165 o Current Document 沟通管理47 HYPERLINK l bookmark167 o Current Document 沟通管理的作用47 HYPERLINK l bookmark169 o Current Document 实施沟通管理的方式47第 5 章应急方案 HYPERLINK l bookmark173 o Current Document 应急处理措施48 HYPERLINK l bookmark175 o Current Document 病毒爆发应急处理49 HYPERLINK l bookmark177 o C

16、urrent Document 非法入侵及攻击应急处理49 HYPERLINK l bookmark179 o Current Document 服务器软件系统故障应急处理50 HYPERLINK l bookmark181 o Current Document 核心设备硬件故障应急预案50 HYPERLINK l bookmark183 o Current Document 业务数据损坏应急预案50 HYPERLINK l bookmark185 o Current Document 雷击事故应急处理51 HYPERLINK l bookmark187 o Current Document

17、火灾处理措施51 HYPERLINK l bookmark189 o Current Document 断电处理措施514048 HYPERLINK l bookmark191 o Current Document 设备入水措施52 HYPERLINK l bookmark193 o Current Document 应急工作机构 5253第 6 章项目验收方案 HYPERLINK l bookmark197 o Current Document 项目验收材料 53 HYPERLINK l bookmark199 o Current Document 具体验收方案 53验收标准53验收交付文档

18、53精品文档 欢迎下载精品文档 欢迎下载第1章项目概述与内容项目背景广东省食品药品监督管理局现有大量各类服务器、网络设备、安全设备、机房设备。 随着软硬件设备的不断增加、业务系统复杂程度的提高,对各类服务器、网络设备、安全 设备、机房设备等核心软硬件设备的运维、管理成为广东省食品药品监督管理局需要解决 的一个重要问题。而且随着设备的硬件元器件逐渐老化,系统所运行的各类操作系统、数据库及应用软 件系统的维护也超过了原服务商支持的服务期限,因此,须对广东省食品药品监督管理局 各类服务器、网络设备、安全设备、机房设备等核心资源的软硬件进行维保。项目目标为本项目范围内的资源提供二年的现场维护和设备保修

19、服务。在广东省食品药品监督管理局现有软硬件运行平台的基础上,配合建立的报障服务台实现统一管理,统一目标、 统一调度、统一流程、统一评估,建立核心设备详细档案管理和维护记录,形成有效的管 理制度,提供设备运维设计管理指南和维护手册,实现核心资源的有序管理。统一管理。在实现对服务商统一的管理要求及配套制度保证下,形成一个高度可控 的运维服务体系,达到信息平台整体维护要求。统一目标。以已建的统一报障服务台为运维管理核心, 在运维一体化的要求前提下, 以保障核心后台服务器等核心设备为主要运维内容,主动运维,降低故障,提升资源利用 率。统一调度。除了接受报障服务台的维护任务单指派外,还需要做好核心服务器

20、设备 维护工作,按规定做好日常的巡检工作,同时配合相关应用软件的上线、服务器资源的调 整、服务器资产的登记、服务器硬件运行性能检查和保障等工作。统一流程。按照已有的维护流程实施资产登记、使用、检修和报废等,依照相关的 规定和流程,利用已有的运维流程管理工具实施并优化服务器运维管理工作。统一评估。按照用户对运维服务的质量评估和服务绩效要求,除了对服务商在投我公司承诺的服务质量保证进行定期检查和审核外,还需要按照用户提出的服务绩效 评估标准进行改进,根据服务的合理评分,获得用户对款额支付的保证,绩效评估最终结 果将是本项目中标费用尾款支付的依据,根据不同的分值和绩效档次,用户将按要求支付 尾款费用

21、。通过主动运维的服务模式,降低后台核心资源故障率,并提升资源利用率,保障广东 省食品药品监督管理局数据中心的服务器、存储系统、数据库及中间件等核心资源高效、 安全的运行,从而为业务系统的稳定运行提供最大限度的支持。设备列表项目需求服务要求1)主动的预防服务对设备进行安全巡检,提交详细巡检报告,并对发现的故障隐患提出改进方案,最大 限度的将故障扼杀于故障发生的前期阶段。根据用户要求定期对核心硬件设备和软件系统进行预防性检查与维护,提供服务报告及合理化建议,排除系统的故障隐患。巡检服务应包括但不仅限于以下内容:(1)基本配置(2)错误检查(3)备份恢复(4)空间管理(5)对象管理(6)安全管理(7

22、)负载管理(8)性能管理(9)机房环境(10)清洗工作(11)诊断机房电源使用健康情况2)快速的故障排除服务提供7*24小时的硬件现场服务。2小时内到达现场(紧急情况1小时内到达现场)。在 维保期间,负责对正常使用条件下的系统整体硬件的故障判断、维保及系统性能调优维护, 同时对损坏的硬件提供免费更换,以及对扩容设备进行免费安装调试与免费更换,主要包括以下硬件设备:主机的系统主板cpu(含 cpuK)系统电源,系统风扇及电源线内存条及内存板内置磁盘各种适配卡所有连接系统的各种线缆制定服务细则,并为每种服务制定严格的远程响应时间、现场响应时间。该服务包括 多种服务细则:7*24小时的现场备件更换服

23、务、电话支持服务、现场支持服务以及远程拨 入分析服务、备机服务、软件补丁测试与升级、系统及数据备份与恢复服务、第三方设备 无条件配合服务。现场支持服务工程师必须在服务结束后,得到用户确认后方可离开现场。服务工程师 应在现场服务结束后内提供现场技术支持服务报告,经用户方负责人员签字认可后才认为 本次现场服务有效完成。如果本次现场服务为后续服务的有效构成部分,技术支持方应该 在问题完成后3天内提供完整的技术支持服务报告。如果本次现场服务为后续服务的有效 构成部分,技术支持方应该为在问题完成提供完整的技术支持服务报告。1、现场技术支持服务内容1)主机恢复运行支持在用户方主机系统重启动时(包括计划内和

24、计划外)。为保证主机系统重启动后的稳 定、高效运行,技术支持方服务工程师应按用户方提出的时间要求及操作要求,准时到达 现场提供技术支持服务。2)系统故障定位当出现与主机系统相关但难以准确定位故障原因的系统问题时,为了保证故障得到及 时、准确定位和处理。服务工程师应根据要求现场提供技术支持服务。配合用户和其他相 关厂商工程师对故障进行分析定位并及时解决故障。3)根据用户要求实施的其他现场技术支持服务,如系统安装、补丁安装、系统 升级、系统迁移等。2、现场技术支持服务实施步骤1)数据收集服务工程师对用户方主机系统情况进行现场检查,收集相关技术及现场状况、环 境等多方面信息。2)数据分析服务工程师对

25、所收集信息进行整理和分析,并与投标方独有知识库和最佳实践经 验自动比较和验证。3)形成报告服务工程师对搜集的用户方数据进行分析后,提出合理建议和方案,形成现场初步工作报告。4)现场报告陈述服务工程师向用户方按照所发现问题及其严重级别,顺序陈述提出的改进建议。5)行动计划制定和实施服务工程师配合用户方根据系统运行情况和业务运行情况共同制定改进计划并配合实施改进计划。6)分析跟踪服务工程师在完成现场服务后一个月内负责对用户方系统进行跟踪分析,与用户方共同确认现场服务的质量和其他关联问题的解决。3)日常维护技术支持工作熟悉并掌握用户方服务器及网络设备等配置情况,能及时对用户方提供日常维护技术支持工作

26、;服务器及存储维护服务1、巡检服务对服务器、存储等设备按日进行巡检,每周提交详细巡检报告,每月提交服务器维护 月报,报告中除了说明维护情况外,还需要有统计数据和分析,对发现的故障隐患提出改 进方案和协助解决计划。通过日常有序的运维服务,将故障控制在萌芽状态,尽最大可能 将故障隐患及早发现并提前排除。在统一运维的体系下,能够合理利用已有的运维服务资 源,通过运维流程的完善,提高维护业务服务水平。巡检维护服务,要对关键业务应用提供服务器性能健康检查和可用性评估,对硬件运 行状况和配套的操作系统进行预防性检查维护,提出升级优化建议。? 按需要对硬件进行微代码升级,如磁盘、控制器等?按需要安装补丁程序

27、?操作系统健康检查?系统基本的性能分析向广东省食品药品监督管理局提交详细的预防性维护报告,根据广东省食品药品监督 管理局自身实际特点,提供系统维护的整体服务方案。ORACL遮据库系统维护服务性能评估及调优:针对数据库文件分布的变化情况提出建议, 以及根据应用压力的变化,评测应用的性能,评估系统中存在或潜在的问题,并及时提交系统性能优化调整 建议方案,保证数据库的高效运行。数据库的规划:在数据库无法以最佳状态运行的情况下, 根据实际情况,对数据库进行规划。现场技术支持1)包括数据库紧急救援服务。如出现故障,导致数据库不能正常工作,服务方须尽快 安排工程师到现场解决问题并保证问题完全解决。如果不能

28、解决问题,服务方需自行请专家或其他高级技术人员对采购人系统情况进行分析,直至解决问题。2)服务方在接到采购人的现场系统维护请求后 1小时内响应,对宕机或紧急恢复等严 重问题,应在2小时内到达现场。咨询服务:提供电话或现场技术咨询和技术支持服务。VebLogic 维护服务应用服务器(WebLogic)在目前的广东省食品药品监督管理局系统中启着越来越重要的 作用,核心的应用都运行在应用服务器上,因此了解应用服务器的运行状态,性能信息及 运行在应用服务器上的运行响应时间显得格外重要。提供服务器性能信息和资源的运行性 能的解决办法,如:CPURJ用率,JVMPJ用率等。提供应用系统级问题管理手段。网络

29、设备维护服务1、快速备件先行更换服务为用户方所要求提供保修的设备提供备件服务,要求服务方准备相关设备备件,在用户方相关设备出现硬件故障时,能够以最快速度提供临时性或永久性备件更换,对可维修的 硬件故障采取临时性备件更换,不可维修的硬件故障采取永久性备件更换。按用户要求将 部分维修量大的设备需存放备件以备用户方应急使用。备件服务需在设备故障发生后四小 时内完成。2、故障处理响应时间和方式接障后技术支持人员必须在 30分钟内作出响应,向客户详细了解故障现象,分析故障 原因、制定解决方案,需要时按规定时间内上门服务。故障处理时限:故障产生后顺延六个工作小时内恢复广东省食品药品监督管理局网络故 障。一

30、旦用户报障后,维护方必须在规定的响应时间内到达现场进行故障诊断,然后采取 有效的措施进行解决问题。根据系统故障的程度提供不同的响应时间和故障排除时间;如 由于用户特殊原因,造成技术人员不能满足以上维护响应时间,需要用户在延时申请表上 签字确认相应响应、处理时间的顺延;如维护工程师不能在规定时限内解决问题,必须提 前向用户及相关上级领导报告,并与用户沟通,同时充分调动各方面资源以便尽快解决故 障,并在事后提交故障分析报告。3、定期巡检服务对广域网节点设备、核心机房网络设备等关键网络设备定期进行巡检, 每周提交详细巡 检报告,每月提交网络维护月报,报告中除了说明维护情况外,还需要有统计数据和分析,

31、 对发现的故障隐患提出改进方案和协助解决计划。通过日常有序的运维服务,将故障控制 在萌芽状态,尽最大可能将故障隐患提前排除。在统一运维的体系下,能够合理利用已有 的运维服务资源,通过运维流程的完善,提高维护业务服务水平。4、重要时刻专人值守服务在重要关键时刻,包括重大会议期间、网络重大割接或其它任何可能对业务运营产生重 大影响的时刻,服务方需要为客户提供重要时刻的专人无限次现场值守支持。1、熟悉并掌握用户方网络设备等配置,能及时对用户方提供日常维护技术支持工作;2、客户机房设备位置调整、理线及设备贴标签等工作;安全设备维护服务1、安全设备保修及维护要求为安全设备提供相当于原厂的设备保修及维护服

32、务清单详见保修范围2、维护要求服务内容包括对意外事故的处理、非法入侵的处理和调查恢复、网络攻击的应急防护等。精品文档 #欢迎下载精品文档 欢迎下载精品文档1皴迎下载对防火墙、防病毒、数据备份、核心交换机、路由器等设备提供现场网络接入安全维护和 工作时间安全维护服务。安全设备维护服务的主要目的是通过加强安全运维工作,提高覆 盖全省的安全系统的运行维护质量,确保我单位安全防护体系的严密有效。分析诊断及优化系统的服务1、广东省食品药品监督管理局对应用系统的可用性和性能有着非常高的要求。应用系 统主要由主机、数据库、中间件应用服务器和应用等构成。为了保证系统的性能和可用性, 服务商在服务期内提供相关工

33、具进行诊断和调优服务。1)定期利用平台工具检查主动发现应用系统核心组件数据库和应用服务器中可能出现的问题。2)发现问题或潜在的故障因素,利用平台工具能够快速判断问题,确定产生这些问题 的根本原因,进行深入诊断。3)对所有纳入服务范围的系统,定期利用平台工具对其数据库、应用服务器、HTTP服务器作全面分析、诊断、优化。提升应用系统的使用质量。4)对使用过程中遇到的疑难问题进行技术支持。5)对授权软件进行支持。6)对系统性能优化和系统安全、网络配置提供建议及支持。7)现场进行疑难问题解决。8)现场系统性能优化。9)现场进行系统配置。2、服务器使用管理1)服务器使用效率管理每周至少一次完成对服务器性

34、能等方面的数据进行收集,获取服务器使用效率方面的数 据(性能数据、空间使用数据、IP占用数据等)。2)服务器与应用系统的对应关系管理明确应用系统名称及版本,明确应用系统的组成部分(应用服务器、数据库服务器等), 明确应用系统的端口使用情况,为系统安全做好防范。3)服务器日常使用管理检查服务器的补丁升级情况,配合客户实施对服务器的安全与防病毒管理,排除不必 要的目录共享、软件安装等。服务器备件操作和管理服务商必须建立备件库,对项目范围提到的服务器、存储设备提供新件备件服务,备件 包括服务器和存储设备的电源、内存、硬盘等部件。1)当过保的服务器电源、内存、硬盘发生故障的时候,必须免费更换;当过保的

35、储存 设备的控制器、电源、电池、主板等部件发生故障的时候,必须免费更换;2)当未过保的服务器和存储设备发生故障时,应主动联系厂家进行维护,涉及的费用 均已包含在该项目的总费用中;3)当服务器的其它部件发生故障时,如服务器的主板等,服务商将故障件转由客户方 进行维修或更换,为了保证服务器正常运行,服务商还需要提供相应的备件更替,直至客 户方将故障件维修完成或采购新件进行替换,替换操作工作服务商根据客户要求免费进行, 换下的备件由服务商取回;4)备件的更换工作由服务商负责免费实施,包括更换前的故障定位、检查、拆卸、 更换和调试。5)当服务器、存储、等设备或系统出现故障时,及时进行检查、维修或更换故

36、障部件。 如果硬件设备故障,保证在 8小时内提供不低于故障设备规格型号档次的备用设备替代使 用,直至故障设备修复为止,以最大限度保证业务系统不间断地正常运行。服务器、存储等核心设备配置管理1、健全服务器配置信息并维护配置信息。对服务器管理按照对象方式进行服务,通过对其的硬件属性(CPU内存、硬盘、IP地址及网络连接情况等)及软件属性(操作系统、数据库、中间件)定期普查,设定配置 信息,并根据实际变动情况进行信息变更,以便于在对服务器的维护中及时获得维护信息, 将故障及时定位,同时获得对象服务重要级别。2、完善IT核心资产管理服务体系完善核心服务器、软硬件设备的配置管理体系,并实施。在对广东省食

37、品药品监督管 理局软硬件平台充分了解的基础上,建立管理档案,形成有效的管理制度,提供设备运维 管理指南,最终达到有序管理所有软硬件设备从采购、使用、变更升级到报废整个生命周 期的目的。整合服务器资源,提升服务器的使用效率。精品文档1/迎下载精品文档1/迎下载精品文档1期迎下载资源及能耗评估、整合、分配1、针对当前的应用对服务器的需求以及将来对服务器的需求进行详细分析,对服务器 的使用进行合理规划,从而做到服务能力与服务成本、业务需求的良好平衡。服务内容:1)服务器使用效率管理。每周完成对服务器性能等方面的数据进行收集,获取服务器 使用效率方面的数据(性能数据、空间使用数据、IP占用数据等)。2

38、)优化服务器资源的使用。在效率数据的基础上,对使用效率较低的服务器上的应用 进行整合,将剩余服务器资源分配到对服务器资源要求较高的应用上去。保障各类应用的 稳定运转。3)服务器与应用系统的对应关系管理。明确应用系统名称及版本,明确应用系统的组 成部分(应用服务器、数据库服务器等),明确应用系统的端口使用情况,为系统安全做好 防范。4)服务器日常使用管理。检查服务器的补丁升级情况,配合客户实施对服务器的安全 与防病毒管理,排除不必要的目录共享、软件安装等。5)通过市局现有监控系统周期性采集性能信息,每周分析采集的数据找出高居性能占 用率的设备对其进行调整。6)每日巡检主动发现性能问题的机器,分析

39、巡检日志,优化性能低下的设备。7)主动运维服务,主动发现性能问题服务器,优化服务器性能平衡性能负载,规划服 务器性能负载平衡。2、服务器资源整合1)根据客户当前资源整合、合理规划、重复利用被资源整合后剩余机器,评估这些服 务器占用资源及能耗情况,根据应用要求合理的投入生产环境中使用。2)根据应用系统、配置分级建立其他应用环境,用以提供扩展服务。3)配合客户仓库、报废制度对性能极其低且达到报废年龄的机器进行管理控制。数据中心灾备管理1、对核心、容易发生单点故障的业务系统的设备及对中断恢复时限较短的重要业务, 服务商应提供业务中断时紧急恢复业务的应急预案,应急预案包含预案所需资源、启动条 件、工作

40、流程及工作机构等内容。该项内容是主动运维工作的重要部分。2、结合信息中心运营规划,通过进一步整合来实现虚拟化规模效应。大量的服务器、 存储和网络集中在一个资源池中管理,可以按需配置。从灾难恢复的角度来看,当灾难 发生时,资源池可以配置更多的容量和网络接入来帮助恢复主要生产环境。1)配套资源整理:根据灾备技术要求,以及现场环境收集各种支持生产环境的要素。这些要素包括处理器资源(存储、设备界面等)、磁盘资源(存储阵列、存储场地网络 SAN 磁盘簇等)、外围设备(控制单元、终端、刀片等)、基础设施(外部交换机)和网络连通性(交 换机、带宽等)。2)恢复计划测试:制定灾难恢复策略,以有效地了解特定时间

41、段内工作量对资源的要 求,同时验证业务的完整性和基础设施的有效性。3)工作计划表格编制:不论是真实情况下还是演练过程中,制定详细的计划表格管理 整个过程中,控制不断变化的工作量。包括实施时间表、资源分配的备选资源表、日常备 份流程表、测试恢复计划表。4)灾难恢复风险控制:制定灾难恢复策略,结合给业务带来的风险,制定应对措施。5)清晰明确的工作计划:确定灾难恢复的工作量。明确业务的优先次序和临界点,制定出与处理流程、应用的集成和相互依赖性、以及 IT支持模块相关的详细计划,从而保证 虚拟化环境的可恢复性。6)保持完整性的规则:建立包括问题、变更、事件、配置和资产管理在内的严格的系 统管理规则,做

42、好灾难恢复策略的前提。保持恢复环境的完整性,管理资源池的最终操作、 监控和维护的有效性。)业务和IT报告:对灾难恢复项目进程的跟踪、状态的传递和结果输出分析柏高, 以供客户方判断IT功能所进行的大量投入的效果。)降低无法预知的IT硬件设备的损坏、断电、火灾、自然灾害、恐怖袭击等,造成 数据丢失或业务的突然中断。)降低系统人员误操作造成意外宕机或关键数据丢失的情况,无法避免。10)减少手段频多的黑客攻击、病毒入侵、垃圾邮件、网络与系统的漏洞,造成网络 瘫痪、系统崩溃。空调设备管理1、加强巡检,保证UPSt房柜式空调及中心机房精密空调的正常运行;2、每季度对UPSt房柜式空调及中心机房精密空调室外

43、机进行清洗及补雪种等工作;精品文档精品文档精品文档1嵌迎下载建设要求服务人员的要求 1,维护驻场人员1名。1)项目经理:具有3年以上的服务器维护管理经验。2)维护人员:计算机专业本科以上学历,从事 IT维护工作至少3年,具有良好的技术 基础和管理素质技能十分娴熟,工作责任心强。3)二线技术人员:资深网络工程师至少 1名,资深数据库管理员和 Microsoft SQL数 据库工程师至少1名,资深操作系统工程师1名,资深安全系统工程师1名。2.服务要求:1)维护人员必须经过与用户使用环境相关的专业系统或数据库的培训,自乙方接到中 标通知书后,5个工作日内,开始展开项目实施工作。维护人员能够迅速掌握

44、用户方 网络设备及服务器系统的安装、调试和故障排除能力,并协助用户方的技术人员进 行这些设备及系统的安装、调试和故障排除。2)维护人员要求具有信息系统维护经验,能够较快熟悉业务流程,技术细节,制定详 细的维护流程和方法,要求维护方案中给出服务器维护的实施方案。3)维护人员应具有较强的协调、管理、沟通能力。第2章项目理论依据ITIL 介绍ITIL是由英国政府与一些领先的IT厂商于1980年中期开发的服务管理模型。 旧M 直以来对ITIL模型的制定做出了巨大的贡献。ITIL以服务为中心提供最好的管理方法确保 业务的运作。该方法对于大型企业和小型企业同样适用,无论它是主机用户还是开放平台 用户。二十

45、世纪八十年代末,英国政府认识到需要建立并标准化政府部门信息系统管理的流程、规范和最佳实践经验。实现的想法是结合不同政府IT部门的管理知识并参考企业界经验,建立标准加以实施并由此受益。下图ITIL版本2从2000年开始制定,为运作单位提供更强壮和符合现实要求的模型。 说明了版本2的模型:he Business实施服务管理计划应用管理-The technology任何管理模型的实施,尤其是服务管理流程的设计,不可能是孤立进行的,它与一下 因素都有联系:组织结构:流程的改变不可避免地将引起组织结构地变化。然而为了正确地实施,满 足用户的需求,将尽量将此变化限制在最小的范围内,将通过评估角色和职责来确

46、定需要 增加的角色以支持流程的成功实施。IT工具:服务管理流程是非常复杂的,需要有自动化的管理工具来辅助执行。为了确 保流成的有效执行,需要同时实施管理工具来进行服务管理。在ITIL中有12个服务管理模块,其中1个是功能,11个是流程,如下图:精品文档1迎下载精品文档1迎下载精品文档1缶迎下载其中5个为服务提供流程:服务水平管理可用性管理财务管理容量管理IT持续性管理5个服务支持流程:事件管理变更管理问题管理版本管理配置管理最后一个是功能部分服务台突发事件管理事件管理流程通常都是与服务台联系在一起的。服务台是进行事件管理的主要部门。这两个部分结合在一起确保用户能够尽快地恢复正常工作。它们是由故

47、障驱动的,主要目的就是使业务流程能够尽快恢复执行。事件管理流程使用来自于问题管理流程的信息(解决方法,已知问题),并与配置管理 流程有关联启动条件启动条件描述产生启动条件的过程名可能的替代条件故障服务请求客户投诉客户咨询客户其它任务结束条件结束条件描述过程中产生结束条件的活动可能的替代条件问题关闭回访客户项目经理确认,通过其它途径解决输入输入名称产生输入的过程名称计算机系统报障单问题接收过程计算机系统维护现场服务单问题处理过程输出输出名称过程中产生输出的活动月度总结报告CASE析汇总过程配置管理通过记录目前IT系统的配置状况,为其它管理流程包括事件管理,问题管理,变更管 理,版本管理提供基础。

48、配置管理需要服务管理工具的支持,该工具不仅需要能够满足你目前的需求还应该能 够满足未来业务发展的需求。配置管理系统记录所有的IT资产和配置信息,它为其它服务管理流程提供准确的配置 信息和文档。启动条件启动条件描述产生启动条件的过程名可能的替代条件卜建新的配置项卜置调整需求故障处理结束条件笔束条件描述过程中产生2吉束条件的活动可能的替代条件配置创建或调整配置变更输入输入名称产生输入的过程名称。建新的配置项变更申请精品文档1激迎下载精品文档1激迎下载配置调整需求约定先更换后审批的零配件列表设备更换输出输出名称过程中产生输出的活动更新配置项配置艾更卜父更审批表变更/米购申请计算机系统维护费用审批表变

49、更/米购申请服务台服务台是一项管理职能而不是一个管理流程。它是IT服务提供方与IT服务客户/用户之间的统一联系点。一方面当客户或用户提出服务请求、报告事故和问题时,服务台负责 记录这些请求、事故、问题,尽量解决它们,在不能解决时可以转交给相应的支持小组并 负责协调各小组与用户的交互;另一方面服务台根据支持小组的要求,进一步联系客户, 了解有关情况,并把支持小组的处理进展及时通报给用户。止匕外,服务台还为其他管理流 程如变更管理、配置管理、发布管理、服务水平管理及IT服务持续性管理提供接口。问题管理实施问题管理的目的:在IT基础架构中,尽可能减少由于错误而引发的事件或问题对 于业务带来的负面影响

50、,并且减少类似错误的再次发生。问题管理流程的驱动力是提高对问题的响应和解决速度,而问题管理模块将这套基本流程提高了一个层次,其驱动力是消除IT基础架构中的已知错误。启动条件启动条件描述产生启动条件的过程名可能的替代条件事件升级故障处理客户要求突出问题或现象客户投诉结束条件结束条件描述过程中产生结束条件的活动可能的替代条件得到问题的解决方案或替 代方案流程回顾输入精品文档 皴迎下载精品文档 皴迎下载输入名称产生输入的过程名称问题处理计划书制定问题处理计划输出输出名称过程中产生输出的活动问题或隐患分析报告问题分析解决方案问题分析变更管理变更管理流程必须将所有的变更纳入其中进行管理,这样确保对IT基

51、础设施有一个完 全的变更管理。变更管理不是消除变更所带来的所有风险,而是尽可能地将变更风险降到最小,或明 确风险的存在并接受风险,所以变更管理流程通常需要与用户沟通。所有的项目需要从变更管理开始因为所有的项目都会对IT系统引发一些变更。它们要么增强现有系统,要么增加新的功能。变更可以是由于需要升级某些系统以提升效率引起 的,也可以是因为一个问题引起的。所有这些都需要在变更管理系统中提交变更申请。但有一种例外就是由问题引发的变 更。在时间不允许的情况下可以先执行变更,然后再在系统中补交申请。变更管理流程需要从其它所有流程中获取信息以有效地评估风险(变更失败的可能性) 和影响(失败后的结果)。启动

52、条件启动条件描述产生启动条件的过程名可能的替代条件M建新的配置项卜置调整需求故障处理结束条件结束条件描述过程中产生结束条件的活动可能的替代条件配置创建或调整k置变更输入输入名称产生输入的过程名称)建新的配置项变更申请卜置调整需求约定先更换后审批的零配件列表设备更换输出输出名称过程中产生输出的活动更新配置项配置艾更卜父更审批表变更/米购申请计算机系统维护费用审批表变更/米购申请发布管理发布是指一组配置项目(Configuration Items - CI)经过测试被引入处于活动状态的 环境中。发布管理的主要目标是确保发布信息被成功地公布,包括归纳综合,测试与存档。发布管理确保只有经过测试和正确授

53、权的软硬件版本才能提供给IT运行环境。发布管理与配置管理和变更管理的行为密切相关。真实的变更实施经常通过发布管理行为得以 贯彻。变更的结果可能经常来自于新硬件,新版本软件,以及新的文档(自行建立,或购买 而来)等。对它们进行控制,并打包和颁发。有关存档安全和公布程序应该和变更管理和配 置管理流程紧密集成。发布的程序也可能作为突发事件管理和问题管理流程中不可分割的 一部分,同时还和CMD的切相连,以维护及时更新的记录。服务级别管理服务级别管理的目标是与客户之间有关IT服务的协议,并付诸实施。因此,服务级别管理需要收集客户需求,IT服务组织可提供的设施,以及可用的财务资源。服务级别 管理针对提供给

54、客户的服务(聚焦客户的)。因此是基于客户需求建立服务(需求拉动),而 非单纯基于现有技术所及(供应驱动),从而使IT服务组织提高客户满意度.服务级别管 理阐述的内容有:? 如何在服务级别协议(Service Level Agreement - SLA)中清楚地定义条款,使其可优 化IT服务成本,并为用户所接受。? 如何监控和讨论所提供的服务。? 如何管理IT服务组织的供应商及其下包合同。服务级别管理(Service Level ManagementSLM流程是用来确保服务级别协议(Service Level Agreements (SLAs),并支持运行级别协议(Operational Lev

55、elAgreements (OLAs)及其它合同,保证所有对服务质量的影响减少到最小。此流程在服务 质量和SLA基础上评估各种变更造成的影响,包含预期变更前的影响,也包含评估实施变 精品文档2期迎下载精品文档2期迎下载精品文档21欢迎下载更后的影响。SLA中某些最重要的目标和服务可用性、以及在容许周期内对突发事件形成 决策有关。SLM是服务支持和服务交付的关键。由于它依赖于其它流程的存在性,有效性及运行 效率,它不可孤立存在。一个缺乏基础支持流程的 SLA是没有意义的,缺乏支持的SLA就 失去了承认其内容的基础。I T服务财务管理财务管理针对于IT服务的谨慎从事。例如,当所提供的IT服务在进行

56、中时,财务管 理将提供其导致的成本信息。这样使考虑IT架构或IT服务的改变时,能够合理地考虑成 本和利益(价格和性能)之间的关系。财务管理中对成本的鉴别,分配,预测和监控使成本 成为可知因素,减少成本和预算的差距。重点结合IT服务组织的赢利,IT服务的财务管 理描述了多种支付方法,包括设立支付和定价的目标,以及预算计划。财务管理负责对成本及IT服务投资回报的会计核算,并管理任何来自于客户的成本。财务管理需要与能力管理(Capacity Management), 配置管理(Configuration Management包含资产数据),以及SLM的良好接口,来确定服务的真实成本。在IT组织预 算

57、谈判阶段和客户的IT耗费核算阶段,财务管理很可能与业务关系管理(Business RelationshipManagement)及IT 组织密切相关。能力管理能力管理是优化成本,获得时间,以及开发IT资源的流程,来支持与客户签订的服 务条款。能力管理针对资源管理,性能管理,需求管理,建模,能力计划,负载管理,以 及IT应用软件能力推测。能力管理强调用计划来确保所签订的服务级别可以被履行和成长。能力管理(Capacity Managemen)负责确保在所有时间具备足够的可用能力,以满 足业务需求.能力管理不是简单地与系统部件的性能相关,而是直接与业务需求相关。在 那些与能力问题相关的困难面前,能

58、力管理在突发事件决策和问题鉴别过程中被引入。能力管理提交变更请求(Requests for Change - RFCs)以确保得到适当的可用能 力.这些RFC被提交给变更管理流程,其实施可能影响若干CI,包括硬件,软件和文 档,并需要提供有效的版本管理(Release Management)。能力管理应该在评估所有变更时被引入,用来确定变更导致的在能力和性能上的影响。这种影响在变更实施前后都有可能出现。能力管理应该特别关注变更在一定周期后 引起的累积性变化。容易被忽略的单个的变更往往在经过累积后,引起响应时 间衰减,文件存储问题,和对处理能力的过度需求。持续性管理此流程在业务中断时对IT服务进

59、行灾难恢复措施的准备和计划。业务持续性管理为客 户组织遇到灾难时准备好紧急预案,根据此预案采取与IT服务相关的预防灾难发生的措 施。IT服务持续性管理流程对技术,财务和管理资源需求做好计划和协调,确保灾难发生 后可持续提供服务,并就其内容达成客户同意。IT服务持续性管理与一个组织在业务中断后在某个可允许范围内继续运作的能力密 切相关.至少要保证最基本的业务运行所需要的IT服务,预先对其服务级别作出规定,并 和客户达成一致。有效的IT服务持续性需要一个平衡的风险缩减措施,例如有弹性的系统 和备份恢复设施。配置管理流程中的数据被用来辅助其计划和预防措施.需要对架构和业务变更对持续性计划造成的潜在影

60、响进行评估。有关 IT和业务的计划应该提交变更管理程 序。在持续性管理流程中,服务台承担着重要角色。可用性管理可用性管理是确保资源,方法和技术得以适当拓展的流程,以支持与客户签订的IT 服务条款。可用性管理针对所遇到的问题,如优化维护等,并且设计测量指标,最大程度 减少意外突发事件的数量。可用性管理与IT服务的设计,实施,测量和管理相关,确保规定的业务需求中有关 可用性的内容被贯彻。可用性管理需要理解IT服务失效发生的原因和恢复服务所需的事 件。突发事件管理和问题管理提供了关键输入 SLA中描述的可用性的目标在可用性管理流 程中被监控,并包含在其报表中。此外,在支持服务核查制度所提供的测量和报

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论