机房设备硬件维护服务技术文件_第1页
机房设备硬件维护服务技术文件_第2页
机房设备硬件维护服务技术文件_第3页
机房设备硬件维护服务技术文件_第4页
机房设备硬件维护服务技术文件_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录TOC\o"1-5"\h\z\u第1章工程概述与内容41.1. 工程背景41.2. 工程目标41.3. 设备列表51.4. 工程需求71.4.1. 效劳要求71.4.2. 效劳器及存储维护效劳101.4.3. ORACLE数据库系统维护效劳101.4.4. WebLogic维护效劳111.4.5. 网络设备维护效劳111.4.6. 平安设备维护效劳121.4.7. 分析诊断及优化系统的效劳131.4.8. 效劳器备件操作和管理141.4.9. 效劳器、存储等核心设备配置管理141.4.10. 资源及能耗评估、整合、分配151.4.11. 数据中心灾备管理161.4.12. 空调设备管理171.4.13. 建设要求17. 效劳人员的要求17第2章工程理论依据182.1. ITIL介绍182.1.1. 突发事件管理202.1.2. 配置管理212.1.3. 效劳台222.1.4. 问题管理222.1.5. 变更管理232.1.6. 发布管理242.1.7. 效劳级别管理242.1.8. IT效劳财务管理252.1.9. 能力管理252.1.10. 持续性管理262.1.11. 可用性管理262.2. ISO/IEC2000027第3章工程实施方案323.1. 统一报障323.2. 远程效劳323.3. 现场效劳323.4. 值班效劳333.5. 紧急或重大事件333.6. 巡检效劳333.6.1. 巡检效劳实施要求333.6.2. 效劳目标343.6.3. 效劳器及存储巡检343.6.4. 网络巡检内容343.6.5. 机房巡检35. 机房物理环境检查35. 机房管理353.7. 资产配置管理363.7.1. 建立完善IT核心资产管理效劳体系363.8. 维护报告管理373.9. 应急预案管理373.10. 备件支持效劳373.10.1. 效劳器备件管理373.11. 效劳响应时间383.12. 效劳质量体系和标准383.12.1. 效劳工程师标准383.12.2. 现场技术支持效劳内容393.12.3. 现场技术支持效劳实施步骤393.12.4. 日常维护技术支持工作403.13. Oracle数据库效劳403.13.1. 数据库概要诊断403.13.2. SQL信息收集与分析403.13.3. SQL语句优化413.13.4. 数据库空间管理和碎片重组413.13.5. 标准化数据库423.13.6. 使用约束来提高查询优化423.13.7. 在复杂查询中使用REOPT绑定选项和输入变量423.13.8. 使用参数标记来减少动态语句的编辑时间423.13.9. 设置DB2_REDUCED_OPTIMIZATION注册表变量433.14. WebLogic维护效劳433.15. 效劳器维护效劳433.15.1. 分析和优化效劳433.15.2. 效劳器使用管理443.15.3. 效劳器资源整合453.16. 数据容灾效劳45第4章工程质量保障、应急措施464.1. 工程组织架构464.2. 效劳资源管理474.3. 事件严重等级标准474.4. 质量保证总那么474.5. 文档资料和文档质量管理484.5.1. 维护文档管理标准494.5.2. 文档管理不标准造成的常见问题494.5.3. 制定文档编制策略504.6. 质量管理514.6.1. 质量管理介绍514.6.2. 质量管理方针514.7. 风险管理514.7.1. 风险管理514.7.2. 风险管理步骤524.8. 沟通管理544.8.1. 沟通管理的作用544.8.2. 实施沟通管理的方式55第5章应急方案565.1. 应急处理措施565.1.1. 病毒爆发应急处理565.1.2. 非法入侵及攻击应急处理575.1.3. 效劳器软件系统故障应急处理575.1.4. 核心设备硬件故障应急预案585.1.5. 业务数据损坏应急预案585.1.6. 雷击事故应急处理585.1.7. 火灾处理措施595.1.8. 断电处理措施595.1.9. 设备入水措施605.2. 应急工作机构60第6章工程验收方案616.1. 工程验收材料616.2. 具体验收方案616.2.1. 验收标准616.2.2. 验收交付文档61工程概述与内容工程背景广东省食品药品监督管理局现有大量各类效劳器、网络设备、平安设备、机房设备。随着软硬件设备的不断增加、业务系统复杂程度的提高,对各类效劳器、网络设备、平安设备、机房设备等核心软硬件设备的运维、管理成为广东省食品药品监督管理局需要解决的一个重要问题。而且随着设备的硬件元器件逐渐老化,系统所运行的各类操作系统、数据库及应用软件系统的维护也超过了原效劳商支持的效劳期限,因此,须对广东省食品药品监督管理局各类效劳器、网络设备、平安设备、机房设备等核心资源的软硬件进行维保。工程目标为本工程范围内的资源提供二年的现场维护和设备保修效劳。在广东省食品药品监督管理局现有软硬件运行平台的根底上,配合建立的报障效劳台实现统一管理,统一目标、统一调度、统一流程、统一评估,建立核心设备详细档案管理和维护记录,形成有效的管理制度,提供设备运维设计管理指南和维护手册,实现核心资源的有序管理。 统一管理。在实现对效劳商统一的管理要求及配套制度保证下,形成一个高度可控的运维效劳体系,到达信息平台整体维护要求。 统一目标。以已建的统一报障效劳台为运维管理核心,在运维一体化的要求前提下,以保障核心后台效劳器等核心设备为主要运维内容,主动运维,降低故障,提升资源利用率。 统一调度。除了接受报障效劳台的维护任务单指派外,还需要做好核心效劳器设备维护工作,按规定做好日常的巡检工作,同时配合相关应用软件的上线、效劳器资源的调整、效劳器资产的登记、效劳器硬件运行性能检查和保障等工作。 统一流程。按照已有的维护流程实施资产登记、使用、检修和报废等,依照相关的规定和流程,利用已有的运维流程管理工具实施并优化效劳器运维管理工作。 统一评估。按照用户对运维效劳的质量评估和效劳绩效要求,除了对效劳商在投我公司承诺的效劳质量保证进行定期检查和审核外,还需要按照用户提出的效劳绩效评估标准进行改进,根据效劳的合理评分,获得用户对款额支付的保证,绩效评估最终结果将是本工程中标费用尾款支付的依据,根据不同的分值和绩效档次,用户将按要求支付尾款费用。通过主动运维的效劳模式,降低后台核心资源故障率,并提升资源利用率,保障广东省食品药品监督管理局数据中心的效劳器、存储系统、数据库及中间件等核心资源高效、平安的运行,从而为业务系统的稳定运行提供最大限度的支持。。设备列表工程需求效劳要求主动的预防效劳对设备进行平安巡检,提交详细巡检报告,并对发现的故障隐患提出改进方案,最大限度的将故障扼杀于故障发生的前期阶段。根据用户要求定期对核心硬件设备和软件系统进行预防性检查与维护,提供效劳报告及合理化建议,排除系统的故障隐患。巡检效劳应包括但不仅限于以下内容:〔1〕根本配置〔2〕错误检查〔3〕备份恢复〔4〕空间管理〔5〕对象管理〔6〕平安管理〔7〕负载管理〔8〕性能管理〔9〕机房环境〔10〕清洗工作〔11〕诊断机房电源使用健康情况快速的故障排除效劳提供7*24小时的硬件现场效劳。2小时内到达现场〔紧急情况1小时内到达现场〕。在维保期间,负责对正常使用条件下的系统整体硬件的故障判断、维保及系统性能调优维护,同时对损坏的硬件提供免费更换,以及对扩容设备进行免费安装调试与免费更换,主要包括以下硬件设备:主机的系统主板CPU〔含CPU板〕系统电源,系统风扇及电源线内存条及内存板内置磁盘各种适配卡所有连接系统的各种线缆制定效劳细那么,并为每种效劳制定严格的远程响应时间、现场响应时间。该效劳包括多种效劳细那么:7*24小时的现场备件更换效劳、支持效劳、现场支持效劳以及远程拨入分析效劳、备机效劳、软件补丁测试与升级、系统及数据备份与恢复效劳、第三方设备无条件配合效劳。现场支持效劳工程师必须在效劳结束后,得到用户确认前方可离开现场。效劳工程师应在现场效劳结束后内提供现场技术支持效劳报告,经用户方负责人员签字认可后才认为本次现场效劳有效完成。如果本次现场效劳为后续效劳的有效构成局部,技术支持方应该在问题完成后3天内提供完整的技术支持效劳报告。如果本次现场效劳为后续效劳的有效构成局部,技术支持方应该为在问题完成提供完整的技术支持效劳报告。1、现场技术支持效劳内容主机恢复运行支持在用户方主机系统重启动时〔包括方案内和方案外〕。为保证主机系统重启动后的稳定、高效运行,技术支持方效劳工程师应按用户方提出的时间要求及操作要求,准时到达现场提供技术支持效劳。系统故障定位当出现与主机系统相关但难以准确定位故障原因的系统问题时,为了保证故障得到及时、准确定位和处理。效劳工程师应根据要求现场提供技术支持效劳。配合用户和其他相关厂商工程师对故障进行分析定位并及时解决故障。根据用户要求实施的其他现场技术支持效劳,如系统安装、补丁安装、系统升级、系统迁移等。2、现场技术支持效劳实施步骤数据收集效劳工程师对用户方主机系统情况进行现场检查,收集相关技术及现场状况、环境等多方面信息。数据分析效劳工程师对所收集信息进行整理和分析,并与投标方独有知识库和最正确实践经验自动比拟和验证。形成报告效劳工程师对搜集的用户方数据进行分析后,提出合理建议和方案,形成现场初步工作报告。现场报告陈述效劳工程师向用户方按照所发现问题及其严重级别,顺序陈述提出的改进建议。行动方案制定和实施效劳工程师配合用户方根据系统运行情况和业务运行情况共同制定改进方案并配合实施改进方案。分析跟踪效劳工程师在完成现场效劳后一个月内负责对用户方系统进行跟踪分析,与用户方共同确认现场效劳的质量和其他关联问题的解决。3〕日常维护技术支持工作熟悉并掌握用户方效劳器及网络设备等配置情况,能及时对用户方提供日常维护技术支持工作;效劳器及存储维护效劳1、巡检效劳对效劳器、存储等设备按日进行巡检,每周提交详细巡检报告,每月提交效劳器维护月报,报告中除了说明维护情况外,还需要有统计数据和分析,对发现的故障隐患提出改进方案和协助解决方案。通过日常有序的运维效劳,将故障控制在萌芽状态,尽最大可能将故障隐患及早发现并提前排除。在统一运维的体系下,能够合理利用已有的运维效劳资源,通过运维流程的完善,提高维护业务效劳水平。巡检维护效劳,要对关键业务应用提供效劳器性能健康检查和可用性评估,对硬件运行状况和配套的操作系统进行预防性检查维护,提出升级优化建议。按需要对硬件进行微代码升级,如磁盘、控制器等按需要安装补丁程序操作系统健康检查系统根本的性能分析 向广东省食品药品监督管理局提交详细的预防性维护报告,根据广东省食品药品监督管理局自身实际特点,提供系统维护的整体效劳方案。ORACLE数据库系统维护效劳性能评估及调优:针对数据库文件分布的变化情况提出建议,以及根据应用压力的变化,评测应用的性能,评估系统中存在或潜在的问题,并及时提交系统性能优化调整建议方案,保证数据库的高效运行。数据库的规划:在数据库无法以最正确状态运行的情况下,根据实际情况,对数据库进行规划。现场技术支持包括数据库紧急救援效劳。如出现故障,导致数据库不能正常工作,效劳方须尽快安排工程师到现场解决问题并保证问题完全解决。如果不能解决问题,效劳方需自行请专家或其他高级技术人员对采购人系统情况进行分析,直至解决问题。效劳方在接到采购人的现场系统维护请求后1小时内响应,对宕机或紧急恢复等严重问题,应在2小时内到达现场。咨询效劳:提供或现场技术咨询和技术支持效劳。WebLogic维护效劳应用效劳器(WebLogic)在目前的广东省食品药品监督管理局系统中启着越来越重要的作用,核心的应用都运行在应用效劳器上,因此了解应用效劳器的运行状态,性能信息及运行在应用效劳器上的运行响应时间显得格外重要。提供效劳器性能信息和资源的运行性能的解决方法,如:CPU利用率,JVM利用率等。提供给用系统级问题管理手段。网络设备维护效劳1、快速备件先行更换效劳为用户方所要求提供保修的设备提供备件效劳,要求效劳方准备相关设备备件,在用户方相关设备出现硬件故障时,能够以最快速度提供临时性或永久性备件更换,对可维修的硬件故障采取临时性备件更换,不可维修的硬件故障采取永久性备件更换。按用户要求将局部维修量大的设备需存放备件以备用户方应急使用。备件效劳需在设备故障发生后四小时内完成。2、故障处理响应时间和方式接障后技术支持人员必须在30分钟内作出响应,向客户详细了解故障现象,分析故障原因、制定解决方案,需要时按规定时间内上门效劳。故障处理时限:故障产生后顺延六个工作小时内恢复广东省食品药品监督管理局网络故障。一旦用户报障后,维护方必须在规定的响应时间内到达现场进行故障诊断,然后采取有效的措施进行解决问题。根据系统故障的程度提供不同的响应时间和故障排除时间;如由于用户特殊原因,造成技术人员不能满足以上维护响应时间,需要用户在延时申请表上签字确认相应响应、处理时间的顺延;如维护工程师不能在规定时限内解决问题,必须提前向用户及相关上级领导报告,并与用户沟通,同时充分调动各方面资源以便尽快解决故障,并在事后提交故障分析报告。3、定期巡检效劳对广域网节点设备、核心机房网络设备等关键网络设备定期进行巡检,每周提交详细巡检报告,每月提交网络维护月报,报告中除了说明维护情况外,还需要有统计数据和分析,对发现的故障隐患提出改进方案和协助解决方案。通过日常有序的运维效劳,将故障控制在萌芽状态,尽最大可能将故障隐患提前排除。在统一运维的体系下,能够合理利用已有的运维效劳资源,通过运维流程的完善,提高维护业务效劳水平。4、重要时刻专人值守效劳在重要关键时刻,包括重大会议期间、网络重大割接或其它任何可能对业务运营产生重大影响的时刻,效劳方需要为客户提供重要时刻的专人无限次现场值守支持。1、熟悉并掌握用户方网络设备等配置,能及时对用户方提供日常维护技术支持工作;2、客户机房设备位置调整、理线及设备贴标签等工作;平安设备维护效劳1、平安设备保修及维护要求为平安设备提供相当于原厂的设备保修及维护效劳清单详见保修范围2、维护要求效劳内容包括对意外事故的处理、非法入侵的处理和调查恢复、网络攻击的应急防护等。对防火墙、防病毒、数据备份、核心交换机、路由器等设备提供现场网络接入平安维护和工作时间平安维护效劳。平安设备维护效劳的主要目的是通过加强平安运维工作,提高覆盖全省的平安系统的运行维护质量,确保我单位平安防护体系的严密有效。分析诊断及优化系统的效劳1、广东省食品药品监督管理局对应用系统的可用性和性能有着非常高的要求。应用系统主要由主机、数据库、中间件应用效劳器和应用等构成。为了保证系统的性能和可用性,效劳商在效劳期内提供相关工具进行诊断和调优效劳。1〕定期利用平台工具检查主动发现应用系统核心组件数据库和应用效劳器中可能出现的问题。2〕发现问题或潜在的故障因素,利用平台工具能够快速判断问题,确定产生这些问题的根本原因,进行深入诊断。3〕对所有纳入效劳范围的系统,定期利用平台工具对其数据库、应用效劳器、HTTP效劳器作全面分析、诊断、优化。提升应用系统的使用质量。4〕对使用过程中遇到的疑难问题进行技术支持。5〕对授权软件进行支持。6〕对系统性能优化和系统平安、网络配置提供建议及支持。7〕现场进行疑难问题解决。8〕现场系统性能优化。9〕现场进行系统配置。2、效劳器使用管理1〕效劳器使用效率管理每周至少一次完成对效劳器性能等方面的数据进行收集,获取效劳器使用效率方面的数据〔性能数据、空间使用数据、IP占用数据等〕。2〕效劳器与应用系统的对应关系管理明确应用系统名称及版本,明确应用系统的组成局部〔应用效劳器、数据库效劳器等〕,明确应用系统的端口使用情况,为系统平安做好防范。3〕效劳器日常使用管理检查效劳器的补丁升级情况,配合客户实施对效劳器的平安与防病毒管理,排除不必要的目录共享、软件安装等。效劳器备件操作和管理效劳商必须建立备件库,对工程范围提到的效劳器、存储设备提供新件备件效劳,备件包括效劳器和存储设备的电源、内存、硬盘等部件。1〕当过保的效劳器电源、内存、硬盘发生故障的时候,必须免费更换;当过保的储存设备的控制器、电源、电池、主板等部件发生故障的时候,必须免费更换;2〕当未过保的效劳器和存储设备发生故障时,应主动联系厂家进行维护,涉及的费用均已包含在该工程的总费用中;3〕当效劳器的其它部件发生故障时,如效劳器的主板等,效劳商将故障件转由客户方进行维修或更换,为了保证效劳器正常运行,效劳商还需要提供相应的备件更替,直至客户方将故障件维修完成或采购新件进行替换,替换操作工作效劳商根据客户要求免费进行,换下的备件由效劳商取回;4〕备件的更换工作由效劳商负责免费实施,包括更换前的故障定位、检查、拆卸、更换和调试。5)当效劳器、存储、等设备或系统出现故障时,及时进行检查、维修或更换故障部件。如果硬件设备故障,保证在8小时内提供不低于故障设备规格型号档次的备用设备替代使用,直至故障设备修复为止,以最大限度保证业务系统不间断地正常运行。效劳器、存储等核心设备配置管理1、健全效劳器配置信息并维护配置信息。对效劳器管理按照对象方式进行效劳,通过对其的硬件属性〔CPU、内存、硬盘、IP地址及网络连接情况等〕及软件属性〔操作系统、数据库、中间件〕定期普查,设定配置信息,并根据实际变动情况进行信息变更,以便于在对效劳器的维护中及时获得维护信息,将故障及时定位,同时获得对象效劳重要级别。2、完善IT核心资产管理效劳体系完善核心效劳器、软硬件设备的配置管理体系,并实施。在对广东省食品药品监督管理局软硬件平台充分了解的根底上,建立管理档案,形成有效的管理制度,提供设备运维管理指南,最终到达有序管理所有软硬件设备从采购、使用、变更升级到报废整个生命周期的目的。整合效劳器资源,提升效劳器的使用效率。资源及能耗评估、整合、分配1、针对当前的应用对效劳器的需求以及将来对效劳器的需求进行详细分析,对效劳器的使用进行合理规划,从而做到效劳能力与效劳本钱、业务需求的良好平衡。效劳内容:1〕效劳器使用效率管理。每周完成对效劳器性能等方面的数据进行收集,获取效劳器使用效率方面的数据〔性能数据、空间使用数据、IP占用数据等〕。2〕优化效劳器资源的使用。在效率数据的根底上,对使用效率较低的效劳器上的应用进行整合,将剩余效劳器资源分配到对效劳器资源要求较高的应用上去。保障各类应用的稳定运转。3〕效劳器与应用系统的对应关系管理。明确应用系统名称及版本,明确应用系统的组成局部〔应用效劳器、数据库效劳器等〕,明确应用系统的端口使用情况,为系统平安做好防范。4〕效劳器日常使用管理。检查效劳器的补丁升级情况,配合客户实施对效劳器的平安与防病毒管理,排除不必要的目录共享、软件安装等。5〕通过市局现有监控系统周期性采集性能信息,每周分析采集的数据找出高居性能占用率的设备对其进行调整。6〕每日巡检主动发现性能问题的机器,分析巡检日志,优化性能低下的设备。7〕主动运维效劳,主动发现性能问题效劳器,优化效劳器性能平衡性能负载,规划效劳器性能负载平衡。2、效劳器资源整合1〕根据客户当前资源整合、合理规划、重复利用被资源整合后剩余机器,评估这些效劳器占用资源及能耗情况,根据应用要求合理的投入生产环境中使用。2〕根据应用系统、配置分级建立其他应用环境,用以提供扩展效劳。3〕配合客户仓库、报废制度对性能极其低且到达报废年龄的机器进行管理控制。数据中心灾备管理1、对核心、容易发生单点故障的业务系统的设备及对中断恢复时限较短的重要业务,效劳商应提供业务中断时紧急恢复业务的应急预案,应急预案包含预案所需资源、启动条件、工作流程及工作机构等内容。该项内容是主动运维工作的重要局部。2、结合信息中心运营规划,通过进一步整合来实现虚拟化规模效应。大量的效劳器、存储和网络集中在一个资源池中管理,可以按需配置。从灾难恢复的角度来看,当灾难发生时,资源池可以配置更多的容量和网络接入来帮助恢复主要生产环境。1)配套资源整理:根据灾备技术要求,以及现场环境收集各种支持生产环境的要素。这些要素包括处理器资源(存储、设备界面等)、磁盘资源(存储阵列、存储场地网络SAN、磁盘簇等)、外围设备(控制单元、终端、刀片等)、根底设施(外部交换机)和网络连通性(交换机、带宽等)。2〕恢复方案测试:制定灾难恢复策略,以有效地了解特定时间段内工作量对资源的要求,同时验证业务的完整性和根底设施的有效性。3〕工作方案表格不管是真实情况下还是演练过程中,制定详细的方案表格管理整个过程中,控制不断变化的工作量。包括实施时间表、资源分配的备选资源表、日常备份流程表、测试恢复方案表。4〕灾难恢复风险控制:制定灾难恢复策略,结合给业务带来的风险,制定应对措施。5〕清晰明确的工作方案:确定灾难恢复的工作量。明确业务的优先次序和临界点,制定出与处理流程、应用的集成和相互依赖性、以及IT支持模块相关的详细方案,从而保证虚拟化环境的可恢复性。6〕保持完整性的规那么:建立包括问题、变更、事件、配置和资产管理在内的严格的系统管理规那么,做好灾难恢复策略的前提。保持恢复环境的完整性,管理资源池的最终操作、监控和维护的有效性。7〕业务和IT报告:对灾难恢复工程进程的跟踪、状态的传递和结果输出分析柏高,以供客户方判断IT功能所进行的大量投入的效果。8〕降低无法预知的IT硬件设备的损坏、断电、火灾、自然灾害、恐怖袭击等,造成数据丧失或业务的突然中断。9〕降低系统人员误操作造成意外宕机或关键数据丧失的情况,无法防止。10〕减少手段频多的黑客攻击、病毒入侵、垃圾邮件、网络与系统的漏洞,造成网络瘫痪、系统崩溃。空调设备管理1、加强巡检,保证UPS电房柜式空调及中心机房精密空调的正常运行;2、每季度对UPS电房柜式空调及中心机房精密空调室外机进行清洗及补雪种等工作;建设要求效劳人员的要求★1.维护驻场人员1名。1〕工程经理:具有3年以上的效劳器维护管理经验。2〕维护人员:计算机专业本科以上学历,从事IT维护工作至少3年,具有良好的技术根底和管理素质技能十分娴熟,工作责任心强。3〕二线技术人员:资深网络工程师至少1名,资深数据库管理员和MicrosoftSQL数据库工程师至少1名,资深操作系统工程师1名,资深平安系统工程师1名。2.效劳要求:1〕维护人员必须经过与用户使用环境相关的专业系统或数据库的培训,自乙方接到中标通知书后,5个工作日内,开始展开工程实施工作。维护人员能够迅速掌握用户方网络设备及效劳器系统的安装、调试和故障排除能力,并协助用户方的技术人员进行这些设备及系统的安装、调试和故障排除。2〕维护人员要求具有信息系统维护经验,能够较快熟悉业务流程,技术细节,制定详细的维护流程和方法,要求维护方案中给出效劳器维护的实施方案。3〕维护人员应具有较强的协调、管理、沟通能力。工程理论依据ITIL介绍ITIL是由英国政府与一些领先的IT厂商于1980年中期开发的效劳管理模型。IBM一直以来对ITIL模型的制定做出了巨大的奉献。ITIL以效劳为中心提供最好的管理方法确保业务的运作。该方法对于大型企业和小型企业同样适用,无论它是主机用户还是开放平台用户。二十世纪八十年代末,英国政府认识到需要建立并标准化政府部门信息系统管理的流程、标准和最正确实践经验。实现的想法是结合不同政府IT部门的管理知识并参考企业界经验,建立标准加以实施并由此受益。ITIL版本2从2000年开始制定,为运作单位提供更强壮和符合现实要求的模型。以下图说明了版本2的模型:效劳提交效劳提交平安管理业务管理ICT根底设施管理实施效劳管理方案应用管理效劳支持任何管理模型的实施,尤其是效劳管理流程的设计,不可能是孤立进行的,它与一下因素都有联系:组织结构:流程的改变不可防止地将引起组织结构地变化。然而为了正确地实施,满足用户的需求,将尽量将此变化限制在最小的范围内,将通过评估角色和职责来确定需要增加的角色以支持流程的成功实施。IT工具:效劳管理流程是非常复杂的,需要有自动化的管理工具来辅助执行。为了确保流成的有效执行,需要同时实施管理工具来进行效劳管理。在ITIL中有12个效劳管理模块,其中1个是功能,11个是流程,如以下图:效劳水平管理效劳水平管理可用性管理容量管理IT持续性管理事件管理问题管理变更管理版本管理配置管理效劳台效劳提交财务管理操作管理关系管理效劳支持其中5个为效劳提供流程:效劳水平管理可用性管理财务管理容量管理IT持续性管理5个效劳支持流程:事件管理变更管理问题管理版本管理配置管理最后一个是功能局部效劳台突发事件管理事件管理流程通常都是与效劳台联系在一起的。效劳台是进行事件管理的主要部门。这两个局部结合在一起确保用户能够尽快地恢复正常工作。它们是由故障驱动的,主要目的就是使业务流程能够尽快恢复执行。事件管理流程使用来自于问题管理流程的信息〔解决方法,问题〕,并与配置管理流程有关联。启动条件启动条件描述产生启动条件的过程名可能的替代条件故障效劳请求客户投诉客户咨询客户其它任务结束条件结束条件描述过程中产生结束条件的活动可能的替代条件问题关闭回访客户工程经理确认,通过其它途径解决输入输入名称产生输入的过程名称《计算机系统报障单》问题接收过程《计算机系统维护现场效劳单》问题处理过程输出输知名称过程中产生输出的活动《月度总结报告》CASE分析汇总过程配置管理通过记录目前IT系统的配置状况,为其它管理流程包括事件管理,问题管理,变更管理,版本管理提供根底。配置管理需要效劳管理工具的支持,该工具不仅需要能够满足你目前的需求还应该能够满足未来业务开展的需求。配置管理系统记录所有的IT资产和配置信息,它为其它效劳管理流程提供准确的配置信息和文档。启动条件启动条件描述产生启动条件的过程名可能的替代条件创立新的配置项配置调整需求故障处理结束条件结束条件描述过程中产生结束条件的活动可能的替代条件配置创立或调整配置变更输入输入名称产生输入的过程名称创立新的配置项变更申请配置调整需求《约定先更换后审批的零配件列表》设备更换输出输知名称过程中产生输出的活动更新配置项配置变更《变更审批表》变更/采购申请《计算机系统维护费用审批表》变更/采购申请效劳台效劳台是一项管理职能而不是一个管理流程。它是IT效劳提供方与IT效劳客户/用户之间的统一联系点。一方面当客户或用户提出效劳请求、报告事故和问题时,效劳台负责记录这些请求、事故、问题,尽量解决它们,在不能解决时可以转交给相应的支持小组并负责协调各小组与用户的交互;另一方面效劳台根据支持小组的要求,进一步联系客户,了解有关情况,并把支持小组的处理进展及时通报给用户。此外,效劳台还为其他管理流程如变更管理、配置管理、发布管理、效劳水平管理及IT效劳持续性管理提供接口。问题管理实施问题管理的目的:在IT根底架构中,尽可能减少由于错误而引发的事件或问题对于业务带来的负面影响,并且减少类似错误的再次发生。问题管理流程的驱动力是提高对问题的响应和解决速度,而问题管理模块将这套根本流程提高了一个层次,其驱动力是消除IT根底架构中的错误。启动条件启动条件描述产生启动条件的过程名可能的替代条件事件升级故障处理客户要求突出问题或现象客户投诉结束条件结束条件描述过程中产生结束条件的活动可能的替代条件得到问题的解决方案或替代方案流程回忆输入输入名称产生输入的过程名称《问题处理方案书》制定问题处理方案输出输知名称过程中产生输出的活动《问题或隐患分析报告》问题分析《解决方案》问题分析变更管理变更管理流程必须将所有的变更纳入其中进行管理,这样确保对IT根底设施有一个完全的变更管理。变更管理不是消除变更所带来的所有风险,而是尽可能地将变更风险降到最小,或明确风险的存在并接受风险,所以变更管理流程通常需要与用户沟通。所有的工程需要从变更管理开始因为所有的工程都会对IT系统引发一些变更。它们要么增强现有系统,要么增加新的功能。变更可以是由于需要升级某些系统以提升效率引起的,也可以是因为一个问题引起的。所有这些都需要在变更管理系统中提交变更申请。但有一种例外就是由问题引发的变更。在时间不允许的情况下可以先执行变更,然后再在系统中补交申请。变更管理流程需要从其它所有流程中获取信息以有效地评估风险〔变更失败的可能性〕和影响〔失败后的结果〕。启动条件启动条件描述产生启动条件的过程名可能的替代条件创立新的配置项配置调整需求故障处理结束条件结束条件描述过程中产生结束条件的活动可能的替代条件配置创立或调整配置变更输入输入名称产生输入的过程名称创立新的配置项变更申请配置调整需求《约定先更换后审批的零配件列表》设备更换输出输知名称过程中产生输出的活动更新配置项配置变更《变更审批表》变更/采购申请《计算机系统维护费用审批表》变更/采购申请发布管理发布是指一组配置工程(ConfigurationItems–CI)经过测试被引入处于活动状态的环境中。发布管理的主要目标是确保发布信息被成功地公布,包括归纳综合,测试与存档。发布管理确保只有经过测试和正确授权的软硬件版本才能提供给IT运行环境。发布管理与配置管理和变更管理的行为密切相关。真实的变更实施经常通过发布管理行为得以贯彻。变更的结果可能经常来自于新硬件,新版本软件,以及新的文档(自行建立,或购置而来)等。对它们进行控制,并打包和颁发。有关存档平安和公布程序应该和变更管理和配置管理流程紧密集成。发布的程序也可能作为突发事件管理和问题管理流程中不可分割的一局部,同时还和CMDB密切相连,以维护及时更新的记录。效劳级别管理效劳级别管理的目标是与客户之间有关IT效劳的协议,并付诸实施。因此,效劳级别管理需要收集客户需求,IT效劳组织可提供的设施,以及可用的财务资源。效劳级别管理针对提供给客户的效劳(聚焦客户的)。因此是基于客户需求建立效劳(需求拉动),而非单纯基于现有技术所及(供给驱动),从而使IT效劳组织提高客户满意度.效劳级别管理阐述的内容有:如何在效劳级别协议(ServiceLevelAgreement–SLA)中清楚地定义条款,使其可优化IT效劳本钱,并为用户所接受。如何监控和讨论所提供的效劳。如何管理IT效劳组织的供给商及其下包合同。效劳级别管理(ServiceLevelManagement-SLM)流程是用来确保效劳级别协议(ServiceLevelAgreements(SLAs)),并支持运行级别协议(OperationalLevelAgreements(OLAs))及其它合同,保证所有对效劳质量的影响减少到最小。此流程在效劳质量和SLA根底上评估各种变更造成的影响,包含预期变更前的影响,也包含评估实施变更后的影响。SLA中某些最重要的目标和效劳可用性、以及在容许周期内对突发事件形成决策有关。SLM是效劳支持和效劳交付的关键。由于它依赖于其它流程的存在性,有效性及运行效率,它不可孤立存在。一个缺乏根底支持流程的SLA是没有意义的,缺乏支持的SLA就失去了成认其内容的根底。IT效劳财务管理财务管理针对于IT效劳的谨慎从事。例如,当所提供的IT效劳在进行中时,财务管理将提供其导致的本钱信息。这样使考虑IT架构或IT效劳的改变时,能够合理地考虑本钱和利益(价格和性能)之间的关系。财务管理中对本钱的鉴别,分配,预测和监控使本钱成为可知因素,减少本钱和预算的差距。重点结合IT效劳组织的赢利,IT效劳的财务管理描述了多种支付方法,包括设立支付和定价的目标,以及预算方案。财务管理负责对本钱及IT效劳投资回报的会计核算,并管理任何来自于客户的本钱。财务管理需要与能力管理(CapacityManagement),配置管理(ConfigurationManagement,包含资产数据),以及SLM的良好接口,来确定效劳的真实本钱。在IT组织预算谈判阶段和客户的IT消耗核算阶段,财务管理很可能与业务关系管理(BusinessRelationshipManagement)及IT组织密切相关。能力管理能力管理是优化本钱,获得时间,以及开发IT资源的流程,来支持与客户签订的效劳条款。能力管理针对资源管理,性能管理,需求管理,建模,能力方案,负载管理,以及IT应用软件能力推测。能力管理强调用方案来确保所签订的效劳级别可以被履行和成长。能力管理(CapacityManagemen)负责确保在所有时间具备足够的可用能力,以满足业务需求.能力管理不是简单地与系统部件的性能相关,而是直接与业务需求相关。在那些与能力问题相关的困难面前,能力管理在突发事件决策和问题鉴别过程中被引入。能力管理提交变更请求(RequestsforChange–RFCs)以确保得到适当的可用能力.这些RFC被提交给变更管理流程,其实施可能影响假设干CI,包括硬件,软件和文档,并需要提供有效的版本管理(ReleaseManagement)。能力管理应该在评估所有变更时被引入,用来确定变更导致的在能力和性能上的影响。这种影响在变更实施前后都有可能出现。能力管理应该特别关注变更在一定周期后引起的累积性变化。容易被忽略的单个的变更往往在经过累积后,引起响应时间衰减,文件存储问题,和对处理能力的过度需求。持续性管理此流程在业务中断时对IT效劳进行灾难恢复措施的准备和方案。业务持续性管理为客户组织遇到灾难时准备好紧急预案,根据此预案采取与IT效劳相关的预防灾难发生的措施。IT效劳持续性管理流程对技术,财务和管理资源需求做好方案和协调,确保灾难发生后可持续提供效劳,并就其内容达成客户同意。IT效劳持续性管理与一个组织在业务中断后在某个可允许范围内继续运作的能力密切相关.至少要保证最根本的业务运行所需要的IT效劳,预先对其效劳级别作出规定,并和客户达成一致。有效的IT效劳持续性需要一个平衡的风险缩减措施,例如有弹性的系统和备份恢复设施。配置管理流程中的数据被用来辅助其方案和预防措施.需要对架构和业务变更对持续性方案造成的潜在影响进行评估。有关IT和业务的方案应该提交变更管理程序。在持续性管理流程中,效劳台承当着重要角色。可用性管理可用性管理是确保资源,方法和技术得以适当拓展的流程,以支持与客户签订的IT效劳条款。可用性管理针对所遇到的问题,如优化维护等,并且设计测量指标,最大程度减少意外突发事件的数量。可用性管理与IT效劳的设计,实施,测量和管理相关,确保规定的业务需求中有关可用性的内容被贯彻。可用性管理需要理解IT效劳失效发生的原因和恢复效劳所需的事件。突发事件管理和问题管理提供了关键输入SLA中描述的可用性的目标在可用性管理流程中被监控,并包含在其报表中。此外,在支持效劳核查制度所提供的测量和报表中,可用性管理对效劳级别管理(SLM)流程提供了支持。ISO/IEC20000ISO/IEC20000是一个关于IT效劳管理体系的要求的国际标准,它帮助识别和管理IT效劳的关键过程,保证提供有效的IT效劳满足客户和业务的需求。ISO20000,共分为两局部:ISO/IEC20000-1Informationtechnology-ServicemanagementPart-1:Specification(信息技术效劳管理标准标准,认证要求)ISO/IEC20000-1Informationtechnology-ServicemanagementPart-2:Codeofpractice(信息技术效劳管理最正确实践)在ISO20000中的信息平安管理部份,以ISO27002/ISO27001为参考标准。在企业组织ISO20000的实施范围不大于ISO27001/ISO27002实施的范围的情况下,假设该组织/企业已通过ISO27001认证,那么该企业组织的ISO20000中信息平安管理部份也将符合标准。ISO20000标准包括了5大过程及13个管理面,如下:效劳交付过程•效劳等级管理•效劳报告•能力管理•效劳持续性与可用性管理•信息平安管理•IT效劳预算编制与会计核算控制过程•配置管理•变更管理发布过程•发布管理解决过程•事故管理•问题管理业务过程•业务关系管理•供给商管理实施ISO20000效益•得以获得业界普遍认同的国际证书ISO20000认证;•就效劳质量和效劳承诺与业务及供货商达成一致,建立和业务及供货商统一的沟通平台;到达相关利益方均满意的IT效劳管理目标;•提高IT效劳的可用性、可靠性和平安性,为业务用户提供高质量的效劳;•持续优化效劳流程,提升效劳水平,提高业务满意度;•提高工程的可提供性并确保如期交付;•从总体上提高组织/企业IT投资的报酬率,提升组织/企业的综合竞争力;•建立IT部门一整套行之有效的持续改善机制和内控机制;•明晰IT管理本钱和组织/企业业务战略和IT战略目标的结合点,完善现有IT效劳结构和资源配置,使各项IT资源的运用符合公司业务战略和IT战略目标;•通过建立优化、透明的管理流程和权责的定义,监控管理流程、进行绩效评价;降低IT运营的管理本钱和风险;•易于整合效劳管理流程和其它管理系统,如:信息平安管理体系ISMS、质量管理体系ISO9000等;•将现有管理体系和业务流程整合,标准IT部门效劳水平,标准工作流程,降低由人员变动导致的风险;•提高IT部门相关员工的专业素质,提高员工的效劳能力和工作效率;•提升IT部门整体运作及部门间沟通的能力。ISO20000-1:2005IT效劳管理〔ITSM〕标准是关于IT效劳的标准,提出了用户实施IT管理的根本基线,对用户如何解决客户化和专业化问题提出了明确的要求,它主要表现为前端客户需求管理和后端流程管理。在前端,ITSM要解决如何明确客户需求,明确了解客户的业务需求和对IT效劳的需求,核心就是对IT效劳的级别的明确和管理。在签订了效劳级别协议后,ITSM要解决一个增值化角度。既然签订了效劳级别协议,那么该怎样提供效劳呢?ITSM的后端思路,就是通过流程化、标准化和最正确实践,来处理IT的事件处理、变更管理、配置管理、发布管理、确保性能和客户效劳,用流程方法来跟踪完成,保证效率和效劳水平。把前端和后端两点贯穿起来,这个流程就是如何客户化和专业化的过程。就目前而言,IT已成为许多业务流程必不可少的局部,它和业务流程形成了一个有机的整体,这对IT本身是件好事。但这种地位的提升同时意味着IT要承当更大的责任。一方面为了提高业务流程的质量和效率,IT必须满足业务流程不断变化的需求;另一方面,为了降低业务流程的运营本钱,IT有关的本钱也必须不断降低。可是,实际情况是IT在这两个方面都没有做出令人满意的答复。局部原因是IT提供者自认为是的“特殊组织”,不能以常规对待它,往往从技术角度考虑问题,出现问题时往往是一句“这就是IT”就推掉了所有责任。业务部门或组织因为不懂IT,即使感觉不对劲,也不知原因何在。为了解决这种情况,ITSM贯彻质量思想,应用质量方法和标准来管理IT效劳。效劳提供流程制定效劳级别协议、监督协议的执行并评价最终结果,效劳提供流程根据效劳协议提供效劳。这整个过程关注的不仅仅是IT效劳提供者是否提供了某种效劳,更重要的是IT效劳提供者是否提供了用户满意的效劳,并且这个过程是符合本钱效益原那么的。通过ITSM,业务部门可以防止前面提到的为难局面,根据一套量化的质量指标,“理直气壮”地处理与IT部门之间的关系;IT部门也可以提高效劳质量、降低效劳本钱、学习以前的经验并处理好和业务部门之间的关系。ISO20000-1:2005相对于传统的IT管理,更加强调客户的需求及其实现,并将IT效劳的预算和核算引入IT效劳管理,将财务管理和效劳管理有机的结合起来,促进IT效劳的改进和提高。传统的IT管理转变IT效劳管理〔ITSM〕技术导向→流程导向救火队→预防为主被动→客户用户→主动集中式、企业自己完成→分布式、外包孤立的、分散的→集成的、企业范围内的一次性的、混乱的→可重复的、职责明确的非正式的流程→正式的最正确实践从IT部门内部考虑→从业务的角度考虑具体的运营→面向效劳的ISO20000-1:2005促进采用整合的过程方法,有效区分组织的功能并管理相关的活动。其过程方法强调理解和满足需求、在过程中寻找附加价值、从过程执行中获取结果、持续改进过程。管理体系要求ITSM的目标是提供管理体系,包括方针和框架,以有效管理和实施所有的IT效劳。该条款包括管理职责、文件要求和能力、意识和培训。

效劳管理的筹划与实施对效劳管理的实施和交付进行筹划和实施,整合了ISO管理体系标准基于流程导向的方法〔PDCA〕,包括规划〔Plan效劳管理的筹划〕-执行〔Do实施效劳管理并提供效劳〕-检查〔Check监视、测量和评审〕-行动〔Act持续改进〕的循环和持续改善方法论。

新效劳或变更效劳的筹划与实施采用工程管理的方法进行新工程和变更工程的规划和实施。

效劳交付过程包含6个管理过程,是与客户交互的主要界面,也是后台效劳的依据,其中:效劳等级管理效劳级别管理的目标是通过协调IT用户和提供者双方的观点,实现特定的、一致的、可测量的效劳水平,以为客户节省本钱、提高用户生产率。效劳报告强调与客户的沟通和效劳结果与客户要求的符合性的一致性。效劳连续性及可用性管理连续性管理在尽量少的中断客户业务情况下,提供IT效劳,并在IT系统出现问题时,以可控的方式恢复。可用性管理的目标是优化IT根底设施的性能,它的效劳和支持的组织。可用性管理导致本钱节省的、持续的效劳可用性水平,这种效劳可用性确保业务满足其目标。效劳的预算及核算确定IT效劳的预算,监督预算执行情况,根据提供的效劳收取费用。容量管理使组织在危机出现时管理资源并提前预测需要的额外的能力。它描述了方案、实施和运行该过程必需的规程。信息平安管理在所有效劳活动中有效地管理信息平安。关系过程基于对客户及其业务驱动的理解,区分客户、效劳提供者、供给商三者之间的关系以及建立并保持良好的关系,该过程包括业务关系管理〔效劳提供者与客户〕和供给商管理〔效劳提供者与供给商〕两个局部。

解决过程区分事件和问题管理,事故管理尽快将业务恢复到协定的效劳级别,或尽快响应效劳请求;问题管理通过主动识别和分析效劳事件的根源,管理问题的解决方案,来减小对业务的破坏。控制过程是后台支持的核心,又包括两个管理过程,配置管理定义并控制效劳和根底设施的组件,保持配置信息的准确性;变更管理确保所有的变更都在受控方式下被评估、批准、实施和评审。发布管理把一个或多个变更作为一个发布来交付、分发、追溯到真实环境中。

以上13个过程是实现ISO20000-1:2005IT效劳管理体系必不可少的过程,当然为实现该体系还必须具备内审、管理评审、文档和记录管理等流程。应当注意的是,不同于ISO9001和ISO27001,如果要通过ISO20000-1:2005认证,在在体系构件时不允许进行任何删节,因此其实施还是存在一定难度的。ISO20000-1:2005可应用于以下情况:被向外提供效劳的组织使用;被要求其所有外包效劳供给商在同一供给链中一致工作的组织使用;被测度其IT效劳管理的效劳供给商使用;作为正式认证前的评估根底;被需要证明其有能力提供客户所需效劳的组织使用;旨在通过管理和提升效劳质量流程的有效实施来提升效劳组织使用。通常在实施ITSM有几个主要阶段,第一个阶段是突发事件管理,突发事件的发生并没规律,需要将所有突发事件收集起来,寻求一个统一的解决方法。第二个阶段就上升到了问题,如果企业中10个人做某件事情时都发生了相似的突发事件,ITSM就能发现规律性的问题,从而确保在将来的同样环境中,有效屏蔽突发事件。第三个阶段是效劳水准实施阶段。ITSM的最终目标是帮助企业提升效劳水准,而要到达这个目标,那么需要在效劳级别的管理和效劳提供上作出更多的努力。工程实施方案统一报障我公司建立了统一报障热线-效劳台,统一接收用户的效劳请求,并分派各相应的工程师,维护高速的信息流通道,从而加快效劳的响应,提高用户满意度。远程效劳如果里不能解决的问题,工程师通过远程工具,为用户提供远程效劳,快速解决问题。远程效劳的前提下是用户同意远程效劳方式。现场效劳在工程合同签订起两年时间内,我公司配备1名驻场工程师,提供驻场效劳,在规定的时间内及时处理故障等事件,提高用户满意度。驻场地点:用户指定的其它办公地点;值班效劳在重要关键时刻,包括重大会议期间、网络重大割接或其它任何可能对业务运营产生重大影响的时刻,为客户提供重要时刻的专人无限次现场值守支持。1、熟悉并掌握用户方网络设备等配置,能及时对用户方提供日常维护技术支持工作;2、客户机房设备位置调整、理线及设备贴标签等工作;紧急或重大事件对紧急或重大事故,根据实际需求,公司安排相应的工程师到现场处理,并协调原厂商工程来解决问题,并提供相应的备件。巡检效劳巡检效劳实施要求对所有设备进行平安巡检,提交详细巡检报告,并对发现的故障隐患提出改进方案,最大限度的将故障扼杀于故障发生的前期阶段。根据用户要求定期对核心硬件设备和软件系统进行预防性检查与维护,提供效劳报告及合理化建议,排除系统的故障隐患。巡检效劳应包括但不仅限于以下内容:〔1〕根本配置〔2〕错误检查〔3〕备份恢复〔4〕空间管理〔5〕对象管理〔6〕平安管理〔7〕负载管理〔8〕性能管理〔9〕机房环境〔10〕清洗工作〔11〕诊断机房电源使用健康情况效劳目标对所有设备制定相应巡检方案,就是每日巡检核心和重要的设备,每月进一次全面性的巡检,严格要求工程师按要求完成巡检方案,每日提交详细巡检报告和维护月报,报告中除了说明维护情况外,还需要有统计数据和分析,对发现的故障隐患提出改进方案和协助解决方案。通过日常有序的运维效劳,尽最大可能将故障隐患提前排除,并对硬件运行状况和配套的操作系统进行故障维护、预防性检查维护,提出升级优化建议。效劳器及存储巡检对效劳器、存储等设备按日进行巡检,每周提交详细巡检报告,每月提交效劳器维护月报,报告中除了说明维护情况外,还需要有统计数据和分析,对发现的故障隐患提出改进方案和协助解决方案。通过日常有序的运维效劳,将故障控制在萌芽状态,尽最大可能将故障隐患及早发现并提前排除。在统一运维的体系下,能够合理利用已有的运维效劳资源,通过运维流程的完善,提高维护业务效劳水平。巡检维护效劳,要对关键业务应用提供效劳器性能健康检查和可用性评估,对硬件运行状况和配套的操作系统进行预防性检查维护,提出升级优化建议。按需要对硬件进行微代码升级,如磁盘、控制器等按需要安装补丁程序操作系统健康检查系统根本的性能分析 向广东省食品药品监督管理局提交详细的预防性维护报告,根据广东省食品药品监督管理局自身实际特点,提供系统维护的整体效劳方案。网络巡检内容对广域网节点设备、核心机房网络设备等关键网络设备定期进行巡检,每周提交详细巡检报告,每月提交网络维护月报,报告中除了说明维护情况外,还需要有统计数据和分析,对发现的故障隐患提出改进方案和协助解决方案。通过日常有序的运维效劳,将故障控制在萌芽状态,尽最大可能将故障隐患提前排除。在统一运维的体系下,能够合理利用已有的运维效劳资源,通过运维流程的完善,提高维护业务效劳水平。机房巡检对机房UPS电房柜式空调及中心机房精密空调等关键设备进行巡检,每次巡检要求填写纸面的《机房值班检查记录表》,登记表记录应在巡检期间填写,以记录时间为准,不得事后补填,并及时填写电子版以供做周汇报时附加;纸介质的巡检记录表必须妥善归档保存。机房物理环境检查1、对UPS、空调和中心机方精密空调等设备的状态和读数进行检查。2、巡检期间,进行状态检查发现计算机机房物理环境异常、设备状态异常、网络或应用系统故障,应立即按操作规程执行进行恢复操作,马上通知相关工程师进行紧急处理;并通知客户接口人备案。3、如果故障按恢复规程无法有效恢复,特别是当发生机房环境〔动力、空调〕故障、关键的设备、网络、系统、效劳如无法及时恢复时,应立即通知到本单位及客户处相关领导,由相关领导协调资源进行故障处理。4、每季度对UPS电房柜式空调及中心机房精密空调室外机进行清洗及补雪种等工作;机房管理〔1〕非相关IT运维工程师到机房时,需客户接口人签字前方可进入;同时运维人员要在机房现场,检查监督其人员工作,防止其他人员未经授权擅自接触机房物理设备。非相关IT运维工程师包括:n客户处:除直接负责人及接口人外的所有客户人员;n公司处:除直接负责本客户工作的所有工程师、维修人员、技术支持人员等所有工作人员;n其它:非本公司的设备维修人员、技术支持人员、工程人员〔厂商、效劳商、集成商、电信运营商〕。〔2〕计算机机房的设备到货接货,拆箱验货,配合设备上架安装、加电测试、系统调试工作;〔需在《计算机机房值班登记表》中记录〕;〔3〕计算机机房的机柜、线缆、设备等的标签管理;〔4〕计算机机房环境清理。资产配置管理建立完善IT核心资产管理效劳体系完善核心效劳器、软硬件设备的配置管理体系,并实施。在对广东省食品药品监督管理局软硬件平台充分了解的根底上,建立管理档案,形成有效的管理制度,提供设备运维管理指南,最终到达有序管理所有软硬件设备从采购、使用、变更升级到报废整个生命周期的目的。根据招标文件要求,我公司将对机房设备、效劳器、存储设备、网络系统、平安设备等建立了健全配置信息管理和维护,做好通用设备资产配置信息检查、录入和整理工作,围绕现有的运维资产管理手段,由我公司派人现场完成对通用设备资产相关的配置文档、运行结构拓扑、运行信息的整理和备份。按照统一统筹管理,由我公司提供通用设备资产工具的录入汇总和筛选。通过一段时间对设备档案的清理和完善后,维护相关通用设备资产的配置信息,对通用设备管理按照对象方式进行效劳,通过对其的硬件属性〔CPU、内存、硬盘、IP地址及网络连接情况等〕定期普查和设备变更记录,设定配置信息,并根据实际变动情况进行信息变更,以便于在对通用设备的维护中及时获得维护信息,将故障及时定位,同时获得对象效劳重要级别。对因变更所造成的配置管理信息的变化,进行信息的更新,保障配置管理信息的真实性、符合性。维护报告管理对机房环境、机房设备、效劳器、存储设备、网络系统、数据库、中间件应用效劳器、应用软件等发生的故障或事件进行处理,我公司提交日常故障处理日报、月报表、季度报表、年度报表等等。应急预案管理为了做好对突发事故的应急处理,降低故障处理效率,在效劳提供过程中,我公司将对所承当的效劳内容提出合理的效劳建议,并与用户一起建立重点设备使用应急预案,通过标准的预案实现快捷和可操作的流程。备件支持效劳我公司将协助用户建立备件库,对工程范围提到的通用设备提供备件管理效劳。效劳器备件管理效劳商必须建立备件库,对工程范围提到的效劳器、存储设备提供新件备件效劳,备件包括效劳器和存储设备的电源、内存、硬盘等部件。1〕当过保的效劳器电源、内存、硬盘发生故障的时候,提供免费更换;当过保的储存设备的控制器、电源、电池、主板等部件发生故障的时候,提供免费更换;2〕当未过保的效劳器和存储设备发生故障时,主动联系厂家进行维护,涉及的费用均已包含在该工程的总费用中;3〕当效劳器的其它部件发生故障时,如效劳器的主板等,效劳商将故障件转由客户方进行维修或更换,为了保证效劳器正常运行,效劳商还需要提供相应的备件更替,直至客户方将故障件维修完成或采购新件进行替换,替换操作工作效劳商根据客户要求免费进行,换下的备件由效劳商取回;4〕备件的更换工作由效劳商负责免费实施,包括更换前的故障定位、检查、拆卸、更换和调试。5)当效劳器、存储、等设备或系统出现故障时,及时进行检查、维修或更换故障部件。如果硬件设备故障,保证在8小时内提供不低于故障设备规格型号档次的备用设备替代使用,直至故障设备修复为止,以最大限度保证业务系统不间断地正常运行。效劳响应时间1、提供7*24小时的硬件现场效劳。2小时内到达现场〔紧急情况1小时内到达现场〕。在维保期间,负责对正常使用条件下的系统整体硬件的故障判断、维保及系统性能调优维护,同时对损坏的硬件提供免费更换,以及对扩容设备进行免费安装调试与免费更换。2、我方在接到采购人的现场系统维护请求后30分钟内响应,对宕机或紧急恢复等严重问题,应在2小时内到达现场。3、为用户方所要求提供保修的设备提供备件效劳,要求效劳方准备相关设备备件,在用户方相关设备出现硬件故障时,能够以最快速度提供临时性或永久性备件更换,对可维修的硬件故障采取临时性备件更换,不可维修的硬件故障采取永久性备件更换。按用户要求将局部维修量大的设备需存放备件以备用户方应急使用。备件效劳需在设备故障发生后四小时内完成。效劳质量体系和标准效劳工程师标准现场支持效劳工程师必须在效劳结束后,得到用户确认前方可离开现场。效劳工程师应在现场效劳结束后内提供现场技术支持效劳报告,经用户方负责人员签字认可后才认为本次现场效劳有效完成。如果本次现场效劳为后续效劳的有效构成局部,技术支持方应该在问题完成后3天内提供完整的技术支持效劳报告。如果本次现场效劳为后续效劳的有效构成局部,技术支持方应该为在问题完成提供完整的技术支持效劳报告。现场技术支持效劳内容主机恢复运行支持在用户方主机系统重启动时〔包括方案内和方案外〕。为保证主机系统重启动后的稳定、高效运行,技术支持方效劳工程师应按用户方提出的时间要求及操作要求,准时到达现场提供技术支持效劳。系统故障定位当出现与主机系统相关但难以准确定位故障原因的系统问题时,为了保证故障得到及时、准确定位和处理。效劳工程师应根据要求现场提供技术支持效劳。配合用户和其他相关厂商工程师对故障进行分析定位并及时解决故障。根据用户要求实施的其他现场技术支持效劳,如系统安装、补丁安装、系统升级、系统迁移等。现场技术支持效劳实施步骤数据收集效劳工程师对用户方主机系统情况进行现场检查,收集相关技术及现场状况、环境等多方面信息。数据分析效劳工程师对所收集信息进行整理和分析,并与系统现有知识库和最正确实践经验自动比拟和验证。形成报告效劳工程师对搜集的用户方数据进行分析后,提出合理建议和方案,形成现场初步工作报告。现场报告陈述效劳工程师向用户方按照所发现问题及其严重级别,顺序陈述提出的改进建议。行动方案制定和实施效劳工程师配合用户方根据系统运行情况和业务运行情况共同制定改进方案并配合实施改进方案。分析跟踪效劳工程师在完成现场效劳后一个月内负责对用户方系统进行跟踪分析,与用户方共同确认现场效劳的质量和其他关联问题的解决。日常维护技术支持工作熟悉并掌握用户方效劳器及网络设备等配置情况,能及时对用户方提供日常维护技术支持工作;Oracle数据库效劳性能评估及调优:针对数据库文件分布的变化情况提出建议,以及根据应用压力的变化,评测应用的性能,评估系统中存在或潜在的问题,并及时提交系统性能优化调整建议方案,保证数据库的高效运行。数据库的规划:在数据库无法以最正确状态运行的情况下,根据实际情况,对数据库进行规划。数据库概要诊断提供磁盘I/O报告,帮助DBA了解当前的I/O状况,决定是否应当将数据文件在磁盘间进行重新分布,以平衡总的磁盘I/O。SQL信息收集与分析能根据需要收集数据库中运行的SQL语句的运行信息,并对其进行深入分析。具体包括以下效劳:能够根据需要调度收集SQL运行状态和资源统计数据,占用系统资源少;对于每个SQL,都能收集到响应时间、等待时间、CPU消耗、IO消耗、执行次数、执行方案等详细信息。并且能基于OLAP多维模式从应用、终端、数据库和操作系统用户、命令类型等方面分析系统负载。从而可以根据这些信息快速定位性能瓶颈和找到有问题的应用和SQL语句。SQL语句优化由于不良SQL对性能影响非常严重,优化效劳具备专业的SQL优化能力。具体包括:能够提供与SQL语句优化相关的所有信息,包括SQL的执行方案、每一步的代价〔cost〕、涉及的表\索引、相关的表\索引是否经过分析等等;提供索引建议效劳,能通过虚拟索引的方式不用执行索引就能考察索引效果;由于应用系统本身的复杂性,最好能对多条SQL语句进行综合分析提供索引建议,从而提高推荐索引的使用率;在进行SQL优化时,要能控制对资源的使用。例如,用户可以控制索引建议以及SQL优化的智能级别、设定查询结果的行数限制、设定SQL语句执行时间的长短等。数据库空间管理和碎片重组长期频繁地对数据对象的增、删、改会引起严重的碎片问题,管理效劳必须提供自动检测空间问题,并提供手段解决。具体要求包括:可以收集数据库空间使用的统计信息,利用这些信息来检测空间使用状况,解决和空间使用相关的问题,进行容量规划,对数据库主动地进行空间管理;可以定期生成和空间使用相关的问题报告。可以使用这些报告分析数据库当前空间使用的问题,如丧失的索引、需要重组的表和索引,存在竞争现象的表和索引、高度行链接,数据库对象没有足够空间进行扩展等问题;提供行链接修补功能和对表空间、表和索引的重组效劳。可以选择重组的方法,配置相关的参数,进行失败预测等等。重组对象可以被指定到新的表空间,以实现数据分布。数据库重组的过程对DBA来说具有可视性和可管理性。重组功能一经配置,可以复用和调度。标准化数据库减少了数据冗余,数据量变小,数据行变窄。按照标准化的要求,要在设计时保证数据的逻辑有效性,很多信息都直接冗余在表中,需极大的提高查询的效率,从而减少CPU和I/O操作。使用约束来提高查询优化考虑定义的唯一性,检查并参考一致性约束。在复杂查询中使用REOPT绑定选项和输入变量在一个在线事务处理〔OLTP〕环境的中输入变量有较好的语句准备时间是关键,防止了由于随时更改输入值而造成昂贵的SQL语句编译开销。从动态语句高速缓存上得到好处。REOPT(ONCE)推迟语句的编译直到首个数据变量被绑定。使用这个首个输入变量值编译并优化SQL语句。后续使用不同的值来运行的语句将重用基于第一个输入编译的查询片段。这是一个好方法,如果首个输入变量代表了后续的输入值,并且在输入值未知的情况下比起优化器使用不同的值进行评估,提供个一个更好的查询访问方案。使用参数标记来减少动态语句的编辑时间数据效劳器可以通过在动态语句高速缓存中保存访问片段和语句文本来防止重复预编译一个前面运行过的动态SQL语句。如果它们运行得太频繁,相关SQL语句的编译甚至会造成额外的系统CPU负担。如果你的系统遇到这类性能问题,应该考虑把应用程序改成使用参数标记来把谓词的值传递给DB2编译器,而不要显式的在SQL语句中包含它。不过,对于复杂的查询如果使用参数标记那么得到的访问方案可能不是最优的。更多信息请参见“在复杂查询中使用REOPT绑定选项和输入变量”。设置DB2_REDUCED_OPTIMIZATION注册表变量如果对应用程序设置的优化级别不能充分的减少编译时间,就尝试设置DB2_REDUCED_OPTIMIZATION注册变量。这个注册变量在优化器查找空间上比设置优化级别提供了更多控制。这个注册变量让你可以请求在指定的优化级别中减少优化功能或者严格使用优化功能。如果你减少了使用优化技术的数目,你同样减少了时间和优化过程中使用的资源。应用系统使用数据库的运行状态直接影响应用系统的运行。调整内存分配〔步骤:调操作系统提供足够的内存,调整私有PLSQL区,减少语法分析调用,调整共享池,调整缓冲区高速缓存〕效劳将配合药监局政务中心,对数据库进行运行状况检查,并根据发现的问题进行调整。WebLogic维护效劳应用效劳器(WebLogic)在目前的广东省食品药品监督管理局系统中启着越来越重要的作用,核心的应用都运行在应用效劳器上,因此了解应用效劳器的运行状态,性能信息及运行在应用效劳器上的运行响应时间显得格外重要。提供效劳器性能信息和资源的运行性能的解决方法,如:CPU利用率,JVM利用率等。效劳器维护效劳分析和优化效劳广东省食品药品监督管理局对应用系统的可用性和性能有着非常高的要求。应用系统主要由主机、数据库、中间件应用效劳器和应用等构成。为了保证系统的性能和可用性,效劳商在效劳期内提供相关工具进行诊断和调优效劳。1〕定期利用平台工具检查主动发现应用系统核心组件数据库和应用效劳器中可能出现的问题。2〕发现问题或潜在的故障因素,利用平台工具能够快速判断问题,确定产生这些问题的根本原因,进行深入诊断。3〕对所有纳入效劳范围的系统,定期利用平台工具对其数据库、应用效劳器、HTTP效劳器作全面分析、诊断、优化。提升应用系统的使用质量。4〕对使用过程中遇到的疑难问题进行技术支持。5〕对授权软件进行支持。6〕对系统性能优化和系统平安、网络配置提供建议及支持。7〕现场进行疑难问题解决。8〕现场系统性能优化。9〕现场进行系统配置。效劳器使用管理效劳器使用效率管理每周至少一次完成对效劳器性能等方面的数据进行收集,获取效劳器使用效率方面的数据〔性能数据、空间使用数据、IP占用数据等〕。优化效劳器资源的使用在效率数据的根底上,对使用效率较低的效劳器上的应用进行整合,将剩余效劳器资源分配到对效劳器资源要求较高的应用上去。保障各类应用的稳定运转。效劳器与应用系统的对应关系管理明确应用系统名称及版本,明确应用系统的组成局部〔应用效劳器、数据库效劳器等〕,明确应用系统的端口使用情况,为系统平安做好防范。效劳器日常使用管理检查效劳器的补丁升级情况,配合客户实施对效劳器的平安与防病毒管理,排除不必要的目录共享、软件安装等。5〕通过市局现有监控系统周期性采集性能信息,每周分析采集的数据找出高居性能占用率的设备对其进行调整。6〕每日巡检主动发现性能问题的机器,分析巡检日志,优化性能低下的设备。7〕主动运维效劳,主动发现性能问题效劳器,优化效劳器性能平衡性能负载,规划效劳器性能负载平衡。效劳器资源整合1〕根据客户当前资源整合、合理规划、重复利用被资源整合后剩余机器,评估这些效劳器占用资源及能耗情况,根据应用要求合理的投入生产环境中使用。2〕根据应用系统、配置分级建立其他应用环境,用以提供扩展效劳。3〕配合客户仓库、报废制度对性能极其低且到达报废年龄的机器进行管理控制。数据容灾效劳结合信息中心运营规划,通过进一步整合来实现虚拟化规模效应。大量的效劳器、存储和网络集中在一个资源池中管理,可以按需配置。从灾难恢复的角度来看,当灾难发生时,资源池可以配置更多的容量和网络接入来帮助恢复主要生产环境。1)配套资源整理:根据灾备技术要求,以及现场环境收集各种支持生产环境的要素。这些要素包括处理器资源(存储、设备界面等)、磁盘资源(存储阵列、存储场地网络SAN、磁盘簇等)、外围设备(控制单元、终端、刀片等)、根底设施(外部交换机)和网络连通性(交换机、带宽等)。2〕恢复方案测试:制定灾难恢复策略,以有效地了解特定时间段内工作量对资源的要求,同时验证业务的完整性和根底设施的有效性。3〕工作方案表格不管是真实情况下还是演练过程中,制定详细的方案表格管理整个过程中,控制不断变化的工作量。包括实施时间表、资源分配的备选资源表、日常备份流程表、测试恢复方案表。4〕灾难恢复风险控制:制定灾难恢复策略,结合给业务带来的风险,制定应对措施。5〕清晰明确的工作方案:确定灾难恢复的工作量。明确业务的优先次序和临界点,制定出与处理流程、应用的集成和相互依赖性、以及IT支持模块相关的详细方案,从而保证虚拟化环境的可恢复性。6〕保持完整性的规那么:建

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论