某基础设施维护方案计划_第1页
某基础设施维护方案计划_第2页
某基础设施维护方案计划_第3页
某基础设施维护方案计划_第4页
某基础设施维护方案计划_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

/*/*根底设施维护方案一、概述并且可以延长设备的使用寿命。毫的高度敏感性。二、总则为根底设施的连续性和信息安全性,制定有效的运行维护策略来保证效劳交付的质量,兼顾运行维护过程〔准时和标准〕和运行维护结果〔可用和安全,实现“事前防范,风险前移;事中掌握,快速响应;事后改进,持续评估”的持续改进原则。可用性SLA和备份标准,以满足需方对可用性的要求;进展合理的人员岗位设置和职责定义,保证专人专岗并设置人员备份;配备具有相应力量的人员和必要的工具人员力量具体要求;选择适用的运行维护技术,以保证效劳的可用性;应的运行维护工具,以保证效劳水平。运行维护工具等级;安全性运行维护效劳中的物理安全、网络安全、系统安全、应用安全和数据安全。包括:全保密协议等;保效劳人员了解并遵守数据中心安全、保密相关规定;评估,供给相应的安全建议,并对效劳对象进展适当的监控和保护;发生;建立有效的安全通报机制,以准时通报安全大事相关状况和相应防范处理措施等。准时性实行适当的手段确保供给满足SLA时间指标要求的运行维护效劳。包括:匹配;的准时响应;建立有效的效劳资源调度机制及与效劳相关方的协同机制,配置必要的备品备件,以供给准时的效劳保障;特别时间段〔如法定节假日或重大大事等持;建立有效机制,周期性对大事级别定义进展更,以确保定义准确有效。标准性包括:建立有效的效劳治理流程文件,以保证效劳过程实施标准性;建立或遵循需方的数据中心相关治理制度,如出入场治理制度、安保掌握制度等;对于例行操作效劳,应制定具体、可操作的技术手册,以降低操作风险;对于非例行操作效劳〔响应支持、优化改善、调研评估的实施方案,并进展风险评估及分析,实行相应的风险躲避措施和回退手段;务记录。三、效劳对象与交付说明效劳对象及内容〔具体设备范围因合同;定期升级配套软件的版本;帮助选购人制订安全策略,定期检查、排解风险,保障设备及网络环境安全;针对重要设备,实时监控运行状况,准时觉察故障、排解故障;针对周期性巡检觉察的安全隐患进展防范和处理;供给配件修理、更换效劳系统重部署及调试:机上架帮助及系统移位帮助。帮助选购人,标准硬件治理维护标准化工作。交付内容效劳交付内容包括调研评估、例行操作、响应支持和优化改善四类,其中:运行环境进展现状调研、系统分析和评估并提出相应的建议和效劳方案;和常规作业;和进展趋势等进展记录、分析和告警;条件和运行状况进展检查和趋势分析,觉察其脆弱性,以便消退或改进;常规作业:对数据中心效劳对象进展的日常维护,包括定期保养、配置备份、数据备份、恢复、定期重启等活动,以保证效劳对象的稳定运行。应;失,触发将效劳对象恢复到正常状态的效劳活动。大事驱动响应的处理过程首先争取在最短的时间内恢复效劳或启用备份资源,维持效劳的持续供给,并应对大事做出分析、明确诱发大事的缘由和影响的范围,实行有效的防控措施,削减类似大事的再次发生。大事驱动响应的触发条件包括外部大事、系统大事和安全大事三种;的SLA/SOW做出推断,对效劳的实施进展影响评估,制定具体的实施方案和回退措施,并在条件允许的状况下执行实施方案和回退方案的测试。变更型响应效劳实施完成后,应进展总结,确认已到达预期的目标。此类响应可能涉及效劳等级变更、效劳范围变更、技术资源变更、效劳供给方式变更等;由于政府部门发出行政指令或需方提出要求时,应当启动应急处理程序。优化改善效劳:包括适应性改进、增加性改进和预防性改进三种类型;的改造;据中心的安全性、可用性和牢靠性;风险,满足将来牢靠运行的需求。四、运行维护交付内容效劳对象效劳对象包括空调系统〔周密空调系统、风系统、电力系统〔供配电系统、UPS系统、发电机系统、安防系统〔防雷接地系统、消防系统、视频监控系统和门禁系统、网络系统及设备、PC调研评估根底设施调研评估效劳内容包含但不限于:空调系统〔周密空调系统、风系统关心制冷单元配置建议等;电力系统〔UPS系统、发电机系统房回路调整分析调整建议、机房扩容建议等;发电机负荷分析及调整建议等;UPS运行分析及扩容建议,超过设计使用寿命的电池更换建议、整流直流电容、逆变沟通电容等;安防系统〔防雷接地系统、消防系统、视频监控系统和门禁系统分析及改进建议、消防系统现状分析和改进建议〔依据当地消防治理部门治理要求、视频监控系统的分析和改进建议、门禁系统的分析和改进建议等;综合布线系统等:光纤、铜缆容量、使用效率分析;应用环境及性能分析;数量、路由改进或扩容建议;级别提升建议等。PUE〔、电力系统优化〔回路优化、使用节能型设备等、实施容量治理〔对机柜的电力容量、制冷容量及空间容量进展统筹治理,以充分利用资源〕等。网络及网络设备调研评估〔整体或局部网络实际负荷与承载力量分析〔整体或局部网络预期负荷与承载力量分析与建议〔整体或局部〕网络架构分析与建议〔整体或局部〕网络路由策略分析与建议〔整体或局部〕网络安全策略分析与建议〔整体或局部网络配置调优分析与建议等。分析;效劳器性能分析及调整建议。例行操作根底设施的例行操作效劳包括:监控、预防性检查、常规作业。监控对根底设施的监控内容参见表1,包括但不限于:效劳对象监控内容空调系统〔周密空环境温度、环境湿度、出风温度、回风温度,告警状况等效劳对象监控内容空调系统〔周密空环境温度、环境湿度、出风温度、回风温度,告警状况等调系统、风系统〕电力系统〔供配电 供配电系统:电流、电压、功率因数、有功功率、无功功率、谐波系统、UPS系统、UPS系统、发等电机系统〕发电机:启停状况、电流、电压、负载率、掌握系统供电状况等UPS:输入电流电压、输出电流电压、频率、负载率、温度、报警情况、电池充电/放电电压等电源使用效率:PUE值〔通过监控软件监测或计算得出〕防雷接地系统:浪涌保护器、避雷器状态等安防系统〔防雷接消防系统:消防掌握系统状态、气体灭火钢瓶压力、灭火器有效期地系统、消防系统、检查视频监控系统和门视频监控系统:告警状况、监控录像等禁系统〕门禁系统:门禁状态、告警状况网络设备的安康状况、整体运行状态、各项硬件资源开销状况链路安康状况如端到端时延变化、链路端口工作稳定性、链路负载百分比、部署路由策略状况下端到端选路变化、路由条目变化网络及网络设备治理权限用户的行为审计设备软件配置变动审计设备日志审计安全大事审计效劳器整体运行状态效劳器电源工作状态效劳器CPU效劳器效劳器内存工作状态效劳器硬盘工作状态效劳器网络端口工作状态预防性检查2,包括但不限于:效劳对象性能检查内容脆弱性检查内容效劳对象性能检查内容脆弱性检查内容高压压力、低压压力〔风冷系统,冷冻检查、室外风机运转状况、系统周密空调水压力、温度,冷却水压力、温度〔水冷系统,风机运行状况,灰尘状况等检查等风机运行状况、风速,预处理系统工作风系统状态,上下水状况等过滤网检查、风压差检查配电系统接地电阻、零序电流、器件发热状况等导线、器件发热状况,防浪涌器件状况等发电机转速、发热状况等油位,吸气、排烟通道等系统器件发热状况、电池状况〔外观、非免器件、导线发热状况,电池UPS、检查通风放电时间、通风状况等状况〔风扇、入气口、出气口〕等防雷接地系统接地电阻测试查启动瓶、管道开关、气体压消防系统钢瓶压力、有效期、探头污染等力等视频监控系〔不同照度状况下系统统盘〔磁带〕容量、云台运行等角问题等门禁系统与消防系统和视门禁系统效劳器、掌握器、读卡器、门磁等工作〔如状态果有此功能警检查线缆两端应贴有识别标签,综合布线系统 光纤、铜缆链路测试,性能测试等 标志要与实际拓扑图完全全都设备机身、板卡或模块的工作状况 是否需要升级系统微码网络及网络设备

CPU内存使用峰值状况主要端口的利用率

设备链路的冗余度要求安全大事周期性整理分析设备生命周期评估链路的安康状态,包括IP链路的安康状态,包括IP包传输时延、备件可用性周期性检查检查其它的关键指标项,例如各类关键表项、会话连接数等效劳器资源安排是否超过预定阀值效劳器的资源安排状况和策略效劳器关键部件是否满足CPU运行冗余度要求内存使用峰值状况效劳器关键部件的微码版效劳器文件系统空间使用状况本是否需要升级效劳器关键部件链路的冗网络流量状况等余度要求与存储的链路性能测试效劳器硬盘是否RAID保护效劳器文件空间使用是否到达预定阀值常规作业根底设施的常规作业包括根底类操作、测试类操作和数据类操作,其中:根底类操作:按效劳治理手册的有关规定,执行设备的日常运行、维护和保养;数据类操作:按事先规定的程序,对根底设施运行日志、记录等数据进展操作。3,包括但不限于:效劳对象根底类操作测试类操作效劳对象根底类操作测试类操作数据类操作启停机、清洗更换滤运行日志备份,报空调系 漏水报警测试、周期性主周密空调 网、清洗更换加湿系 警记录备份、去除统 备切换/应急演练等统、清洁冷凝器等 等效劳对象根底类操作测试类操作数据类操作启停机、清洗更换滤运行记录备份〔如风系统网等消防联动测试果有〕配电系统除尘、合闸、分闸等互投测试等运行记录备份空载测试、带载测试、切运行日志备份,报发电机电力系更换三滤、清洁等换演练等警记录备份、去除统等运行日志备份,报UPS旁路、清洁等周期性主备切换/应急演警记录备份、去除练等等防雷接地接地端子、汇流排紧运行记录备份〔如系统固,浪涌、防雷保护接地电阻测试果有〕器复原等报警记录备份、清消防系统探头清洗等启动测试、探头测试等除安防系器件灵敏度、画面清楚度出入记录导出、备视频监控统系统视频监控头清洁,云台保养〔不同照度状况下份,监控图像记录备份、去除,报警运行等记录备份、去除等门禁系统与消防系统和视频监控系统的联动检查测运行日志备份,报门禁系统门禁授权等〔假设有此功能警记录备份、去除测试等综合布线系统线路跳接等链路测试、性能测试布线系统拓扑图数据更设备操作系统软件备份及存档网络及网络设备

系统微码升级设备软件配置备份及存档监控系统日志备份及存档效劳对象效劳对象根底类操作测试类操作数据类操作监控系统日志数据分析与报告生成网络配置变更文件的审核网络配置变更的操作网络配置变更的记录系统微码升级配置文件备份效劳器过期日志和文件系统空间清理效劳器硬盘RAID〔如有RAID〕更换掌握器电池〔如有RAID掌握器〕响应支持大事驱动响应响应效劳,包括但不限于:机系统包括故障排查、启动发电机、油料补充等;UPS系统包括故障排查、旁路系统、关闭非重要输出等;安防系统:防雷接地系统包括浪涌保护器复原、更换,接地电阻降阻等;消防系统包括故障排查、系统启动、报警联动、疏散警示等;视频监控系统包括故障排查、监控头或硬盘更换、检查告警、数据恢复等;门禁系统包括故障排查、手动开启或关闭门禁系统、检查告警或监控记录等;综合布线系统:线缆更换等。网络及网络设备大事驱动响应故障定位;停顿、启动进程;中断、连通网络连接;关闭、启动端口;网络备件更换;更改、恢复配置。效劳器大事驱动响应效劳器重启;更换故障部件,包括主板、电源、CPU、内存、硬盘等;效劳器关键部件微码升级;效劳器硬盘RAID配置修复。效劳恳求响应依据应用系统运行需要或需方空调系统:调整温度、湿度参数等,调整风量等;电力系统:配电系统包括增减回路、增减供电类型〔110V〕等;分支回路相位调整等;发电机为指定负载供电等;UPS增加录像机容量等;门禁系统包括增加、删减、变更门禁权限等;综合布线系统:链路跳接、跳线更换,布线扩容等。网络及网络设备效劳恳求响应增加、降低网络接入的数量或速度;更改网络设备配置;启动、关闭端口或效劳;更换、更或升级设备硬件或软件。效劳器效劳恳求响应效劳器设备搬迁;效劳器设备停机演练;效劳器设备清洁维护等。优化改善适应性改进依据应用系统特点和运行需求,对根底设施进展调整,包括但不限于:空调系统:调整温湿度参数等、调整机组位置、增减风风量等;方式等;系统的变化;综合布线系统:调整综合布线系统,以适应应用系统的变化。网络及网络设备适应性改进路由策略调整;设备或链路负载调整;安全策略调整;监控对象掩盖范围调整;局部交换优化;局部冗余优化。效劳器适应性改进效劳器硬盘RAID配置调整;效劳器网络、光纤链路冗余调整;效劳器电源供电接入冗余调整。增加性改进施进展调整、扩容或升级,包括但不限于:空调系统:增减周密空调机组、增减APU单元,增加风机组、预处理装置等;ATSUPS增加电池数量等;安防系统:防雷接地系统包括增加冗余引下线、接地装置,降低接地电阻阻值等;报警联动、增加终端数量、增加存储容量等;综合布线系统:线路扩容、更换高性能布线等。网络及网络设备增加性改进硬件容量变化,如网络设备硬件、软件升级、带宽升级等;整体网络架构变动;网络架构容量变化,如网络子系统的增减等;系统功能变化,如增功能区、增安全系统、增审计系统等;路由协议应用及部署调整;整体安全策略收紧;交换优化;冗余优化。效劳器增加性改进为本效劳器从存储系统上安排更大空间;效劳器CPU效劳器内存容量增加;效劳器磁盘空间扩容;效劳器网卡和HBA接口卡增加等。预防性改进点,有针对性地进展改进性作业,包括但不限于:空调系统:调整机组位置,调整出回风方式等;加高标号油料等;防性改进〔依据当地消防治理部门治理要求防系统和视频监控系统的联动;综合布线系统:弱电线缆与强电线缆的物理隔离,鼠患排查等。网络及网络设备增加性改进路由收敛速度、加快二层网络生成树收敛速度等;安全优化,例如密码加密,TELNET掌握等;提高软件配置命令可读性。效劳器预防性改进检查效劳器硬盘RAID配置,准时修复或更换故障硬盘;增加效劳器网卡、光纤卡以及链路冗余状况;增加效劳器电源供电模块冗余。五、效劳治理制度标准效劳时间接收效劳恳求和询问:5*8效劳台大事处理结果。7*24小时接听的移动热线,用于解决内部的技术问7*24小时机房监控人员的机房突发状况汇报。(3)效劳响应时间:故障级别响应时间故障解决时间备注I级:属于紧急问题;其具表达象为:系统302具体时间因崩溃导致业务停顿、数据丧失。提交故障处理方案12工程而定II属于严峻问题;其具表达象为:消灭具体时间因30224工程而定不影响正常业务运作。提交故障处理方案III级:属于较严峻问题;其具表达象为:302具体时间因消灭系统报错或警告,但业务系统能连续运提交故障处理方案48工程而定行且性能不受影响。IV属于一般问题;其具表达象为:系统302具体时间因技术功能、安装或配置询问,或其他明显不提交故障处理方案5工程而定影响业务的预约效劳。到故障点前的业务状态。对于“系统瘫痪,业务系统不能运转”的故障级别,假设不能于12小时内解决故障,将在合同小时内提出应急方案,确保业务系统的运行。故障解决后24等状况。行为标准遵守用户的各项规章制度,严格依据用户相应的规章制度办事。工作。消灭疑难技术、业务问题和重大紧急状况时,准时向负责人报告。文明礼貌,语言清楚明白,语气和蔼。遵守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论