数据中心机房运维方案_第1页
数据中心机房运维方案_第2页
数据中心机房运维方案_第3页
数据中心机房运维方案_第4页
数据中心机房运维方案_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据中心运维^庖

2019年8月

.可修编.

目录

*-------1—.性1

二钟围1

四、月弱容3

(-)UPS供配电系统3

(二)机房空调系统5

(三)服务器运维7

(四)存储系统运维9

(五)虚拟化平台运维10

(六)数据库系统运维11

(七)网络设备运维13

(八)其它有关系统或者设备运维15

五逊醐螃16

.可修编.

一、运维的重要性

娄据中心的日常运维工作是至关重要的。设备故障时,应提供快速的备件供应、

技术支持、故障处理等服务。通过机房设备维护保养可以提高设备的使用寿命,降

低设备浮现故障的概率,避免重特大事故发生,避免不必要的经济损失。

数据中心的运维工作专业性很强,通过引入专业的维护公司进行日常运维工

作。建设及使用单位相关管理人员可从日常需要完成专业性很强的维护保养工作中

解放出来,重点做好管理及协调工作,更好的发挥信息或者科技部门的其它职能。

通过专业、系统、全面的维护可以提前发现问题,并解决问题。将故障泯灭在

萌芽状态,提高系统的安全性,做到为客户排难解纷,减少客户人力、物力投入的

成本,为机房各系统及设备的正常运行提供安全保障。可延迟客户设备的淘汰时间,

使可用价值最大化。通过专业的维护,将数据中心机房各类设备的运行数据进行整

理,进行数据分析,给客户的机房基础设施建设、管理和投入提供依据。

二、哪围

数据中心'机房于XX年X月建成并投入使用,数据中心有关设备及基础系统清单如

下:

序号设备材料或者系统名不K型号品牌单位

1

2

3

4

5

6

7

8

9

.可修编.

10

11

12

.......

三、塘廊睡

为更好的服务好客户,确实按质按量的对设备进行维护;我公司根据相关标准

及厂商维护标准,结合自身经验积累和客户需求,制定以下服务容:

1.我公司在本地储备相应设备的备品备件,确保在系统浮现故障时,及时免费

更换新的器件,保障设备使用安全。

2.我公司和客户建立24小时联络机制,同时指定一位负责人与使用方保持沟通,

确保7*24小时都可靠联系到工程技术人员,所有节日都照此标准执行。

3.快速进行故障抢修:故障服务响应时间不多于30分钟,2小时至少2人携带相

关工具、仪器到达故障现场现行故障排查处理,直到设备恢复正常运行。

4.我公司对维修维护的设施设备的使用性能负责,在维修维护过程中严格执行

技术规,保证设施设备的性能符合相关技术标准要求。在维修维护间,我方应对设

施设备可能存在的故障隐患做出评估,并进行恰当的预防性处理,以保证设施设备

的安全运行。若故障隐患超出维修维护围的,及时书面通知客户,并提出消除隐患

戴。

5.维护巡检中我公司提供设备系统图或者使用说明书:将机房设备的整个系统

等汇编成资料,由维护人员进行统一放置,便于应急查询。

6.巡检次数每年不少于四次,每次巡检后,由维修维护方提供巡检报告,并由

使用方签字确认。每月由我公司客户服务人员定期进行回访,听取客户意见反馈,

搭建起双方的沟通渠道。

.可修编.

7.提供系统应急方案:设备在12小时还无法修复的应有备份应急处理方案。如

提供适合负载功率的备机、备用空调等。

8.培训:提供专业理论知识培训和操作培训,维修维护培训I,简单故障处理培

训I,培训文档由我公司整理。

9.人员配置:全年(包括所有的节假日期间)提供不少于2名工程师在常住本地,

确保满足响应时间要求;到现场的绳P维修工程师至少一位B能彻底解决故障并有

丰富从业经验的。

10.我公司每次巡检完毕后提供绸P报告,同时困悬共全年维护报告、每次维修

事故报告等资料,根据事故提出相应的整体解决方案等管理规划层面的容。

11.数据分析:我公司将欷巡检、维修辍据进行整里,对设备运行S缠婉变

化量进行测数,给客户提供一份报告,系统性的介绍机房发生的变化,给客户后期

系统建设、投资提供参考依据。

12.提供M统相关的技和员务:设备搬迁、系驱版保障、突发或者麟应急处置。

13.双方约定的其它相关服务容。

四、服务容

(-)UPS供配电系统

1、供配电:

(1)输入输出配电柜及线缆:测量输入输出开关、线缆载流量的实际值和UPS显

示值的区别。线缆外观有无破损,线缆交叉的情况,连接点的温度是否正常。

(2)线缆是否存在局部过热,通风是否良好。

.可修编.

2、UPS主机:

(1)全包备件保修方式(保修期设备的维护保养、故障维修所需的备件均免费

维修更换)。

(2)每3个月进行一次保养维护检查,容如下:

1)外观检查:面板显示、案件、指示灯、风扇运行是否正常;

2)设备部电感、电解电容和功率线的外观检查;

3)设备部各功率部件及电路板信号线的物理连接检查;

4)检查模块、电路板、轨导、连接端子的键是否浮现氧化;

5)检杳设备清洁程度,特殊是设备部的积尘及其他物质;

6)设备绝缘检查;

7)设备运行^境检查:设备通风及瞬是否良好、环蝙度、设备有无水患

8)UPS运行参数的检查:整流器、逆变器、静态旁路、负载运行参数是否正

常、检测值与实际测量值是否有偏差(不超过5%)。

9)检查所有的电源保险丝、隔离开关的完好程度及是否安装坚固。

10)每季度定期检测UPS输入线电压、输入频率、输入电流谐波成份、输入功

率因数、效率、输出相电压、输出频率、输出火线-零线波形、蓄电池充电电

流等参数,应符合相关要求。

11)对每台UPS电池组进行不低于电池容量50%的放电测试,并对每台UPS电

池组电池阻进行检测,查看直流熔断器和蓄电池连接条的压降或者温升是否

有异常变化。

(4)每年定期用真空吸尘器清扫UPS主机的各部件或者用提供低压空气流吹

.可修编.

机来清除外来的残渣和灰尘。

(5)对1^5主机风扇定期进行逐步更换,每年更换量不少于总量的20%。运

行5年以后逐步更换滤波电容。定期巡检尽量以观察、测量为主,减少停机。

(6)提供《客户现场服务报告》,报告需要客户签字认可。

3、蓄电池维护(不包配件):

(1)电池目检项目

电池外观检查:外观是否变形、渗漏,安全阀周围有无液体;

电池端柱是否有腐蚀、爬酸现象或者有过热痕迹;

电池榔口盖的损坏;

电;雌缘检查;

电池寿命:当电池达到使用年限时,提前通知用户;

电池电压测量:检查充电电压是否和电池数量相匹配;

电池端子连接是否稳固。

视情况进行电池表灰尘处理。

(2)仪器测量

测量和记录电池系统的直流浮充电压,此时也可选择测量和记录交流皱波

电压

测量每一个电池端柱与接地间的直流电压以发现不正常的接地

测量和记录取样电池的温度

测量和记录每一个电池的浮充电压

测量和记录系统均衡充电电压

(3)UPS主机部进行电池自检

.可修编.

电池接触器闭合;

电池处于浮充状态;

整流、逆变通讯正常;

电池状态正常;

整流器工作正常;

市电电压正常;

逆变器正供电;

负载功率大于指定的电池曲线设定的电池自检功率;

UPS不处于联合供电状态。

以上条件都满足时方可进行电池自检。如果在自检过程中,浮现上述允许

条件任意一条不满足,系统将退出自检,转入均充状态。

按住手手动自检,可以中止自检过程,电;西专均充。电池自检结^专均充。

(二)机房空调系统

1.全包备件保修方式(保修期设备的维护保养、故障维修所需的备件均免费维修

更换。包含免费更换过滤网、皮带、风机、压缩机、电路板、室外机电、室外调速器、

氟利昂等)。过滤网视情况进行更换,但每年提供不少于更换四次。皮带每年进行一

瑛奂。

2.每3个月进行一次保养维护检查,巡检容如下:

1)制冷系统:

>检查压缩机工做声音是否正常;油镜油位是否正常;

a检查压缩机吸气排气压力是否正常:

.可修编.

A制冷管路阀门(液管、气管、压缩机吸入及排出口阀门)是否打开;

A热力膨胀阀开启是否正常;

A压缩机转向;供电相序是否反相;

A检查吸气管路、排气管路、回液管路和压缩机机体温度是否正常;

A干燥过滤器先后端有无温差;

A管路(含储液罐)有否漏油痕迹;

A视液镜水分指示是否正常;

A蒸发器盘管是否脏污;

A冷凝器翅片是否脏污;

>检查冷凝器风机工作是否正常;

A检查冷凝器压力开关/风机调速设置是否正确;

2)送风系统:

A检查风机皮带轮和机电皮带轮的平面度;

>检查室因机皮带紧度;

A检查室风机轴承工作是否正常;声音有无异常;

A检查室风机叶轮转动是否正常;

A检查室风压开关、过滤网压差开关设定值是否正确;

>清吉风机;

A检查空气过滤网是否脏污;

»检查所有门板是否可靠;

3)电气系统

>每半年紧所有接线端子;

.可修编.

A检查各交流接触器吸合、分断是否正常;

A检查所有过流保护是否正常;整定值是否正常;

A检查主电源线电压、相电压、各相电流;

»手动启动制冷/除湿、加热、加湿功能,检查电流是否正常;

4)控制系统:

>检巧制器初始设置是否正常;

A检查温湿度探头是否偏差;

A检查显示器工作是否正常;

A检查所有数据及摹拟输入、输出是否正常;

5)加湿系统

A检查加湿器进水电磁阀和排水电磁阀动作;

A检查加湿器的蒸翎非出管是否畅通;

A检查蒸汽凝结水排水是否正常;

>检查加湿罐结垢情况,清洗或者更换;

A检查加湿器的进水过滤器;

A检查加湿器的溢水、排水盘;

A检查加湿器抖卜水是否泄漏;

>检查冷凝水是否泄漏;

6)管路系统

A检查制冷管道保温和包扎是否完好;

A检查所有管路定位是否完好;

>检查室外机连接电缆老化情况是否满足空调运行需要;

.可修编.

A检查空调送风和回风管路/通道是否通畅;

7)给水、排水系统

A检查给水系统是否正常;加湿进水电磁阀的进水过滤网是否脏堵;

A检置^水是否通畅。

最后出具绢户报告,记录各项技术数据,并提出意见和义提触行数据分析报

告。报告需要客户签字认可。

(三)服务器运维

我公司提供主动服务模式,做好服务规划,提前发珊口解决问题,确保系统24*7运

行,具体服务容包括:

.系统故障定位和排错

操作系统安装、升级

.WindowsxLinux

・操作系统补丁的更新

.服务器微码升级

.系统备份和系统恢复

.数据备份和数据恢复

.CPU、存升级扩容

,替换故障硬盘、RAID重建

.更换电源、风扇等易损件

.更换主板和其他故障板卡

,更换小型机和磁盘阵列中的各类到期电池

.系统参数的调整优化

.可修编.

•系统日志的检查和清除

•系统盘的镜像检查

・双机软件的状态检测

•系统目录空间状态使用的监测

•系统运行状态的监测

•安装新版本Linux系统

•在新版本Linux系统上调试系统配置

•对已安装的新版本Linux系统进行测

•维保设备(软件)围其它软件的升级服务

提(期员务器年度维护服务,提供-毋24次定期上门设备巡检,提前发现故障隐

患,减少故障造成的宕机时间。田的期间,机器硬件的损坏由我公司提供免费更换,

客户再也不支付任何其它费用。我公司提供主动服务模式,做好服务规划,提前发现和

解决'可题,确保系统24*7运行,具体服务容包括:

•协助客户进行受支持的软件产品的基本的日常维护和管理。

・协助客户对所报告的问题进行定义及指导客户相关技术人员完成解决问题所

需要的相为言息的采缸作。

・我公司将匡助客户对所报告的问题进行问题根源的分析和诊断。

•对于软件本身的问题,我公司将根据需要向客户免费提供相关的修正性软件。

•对客户所报告的有关受支持软件产品的问题,我公司将根据需要使用标准系

统进行记W口跟踪,并根据实际情形对问题的严重程度和优先级别进行设定

和更新。

我公司将在应用软件安装完毕后应进行基本系统测试

.可修编.

(四)存储系统运维

针对上述的中心'数据机房存储系统相关设备维保服务,我公司提供主动服务模式,

做好服务规划,提前发珊口解决问题,确保系统24*7运行,具体服务容包括:

•设备故障定位和排错

•设备软件版本升级

•配置状态检测

・更换电源、风扇等易损构件

•系统使用状态检测

•系统日志分析和监控

•为信息中心的存储设备产品提供日常维修、维护服务。

・应急保障方案。综合分析xxx客户数据中心服务器的软硬件配置,应用情况,

在第一次巡检后向局方提供安全、可靠、切实可行的应急方案。

•为xxx客户的存储管理软件配置、备份策略审核蓊是供技术支持服务。

•匡助xxx客户对存储系统进行性能分析:磁盘读写性能、数据存储备份安全

性、1/0性能、解决数据存储性t徽障提高存储系统性能、提升xxx客户口

系飨I体性能。

・根据xxx客户信息系统发展需求,规划新的存储备份系统、容灾系统等,解

决用户IT数据安全、高速增长需要。

•为xxx客户提供存储信息生命周期整体规划,保障用户数据的生命力。

主机存储系统基本服务容:

序号服务模块容描述提供方

.可修编.

配合用户进行。按备件到达现场时间工程师金伟业

1现场备牛安装

到达现场

消除软件漏洞给系统带来的安全隐患,并对设备J商

2补丁服务安装补丁所引起的系统连锁反应进行合理

的平衡。

对系统进行软件或者硬件的升级,以改进、完设备厂

3艮务商

辛E-04去金电:离RAE—"4去的:曰:1=1

1Jx-✓u—ILI/iy1jUH

4现场故障诊断金业

5远程技术支持金业

■,JHJ

6问题管理系统设留商

DrR至次1伯力i'^l曰而廿£4二:L之51口匕女

7系统优化对客户辍㈣舌主机存储iS备、操作系究金隆伟业

(五)虚拟化平台运维

主舜勺慈口下:

服务覆盖围

FusionSphere软件系统基本名钳户

FusionSphere系统调优、升级、辘迁移

虚拟机操作系统的病毒防护、调优与基本维护不包含杀毒软件费用

服务器、存储阵列硬件维护不包含配件更换产生的费用

包含服务器及存储阵列的软件升级、配

服务器、存储阵列软件维护

置、调试、优化等

.可修编.

包括网络任觑划、调优、配置等,不包

网络系统维护

含配件更换产生的费用。

硬限码升级

服务响应

覆盖时间7x24〃的

响应时间10分钟

到达客户现场时间2小时

重要时刻到达客户现场的紧急时间系统崩溃、业务停机等严重故障时

问题诊断时间30分钟

问题解决时间1-8小时

服务报告提交服务结束次日

定期巡检与预防性维护

系统定期巡检维护2次/月

健康性检查2次/月

专家巡检1次/月

免费提供FusionSphere备份软件及安

系统及应用备份

装部署

系统软件恢复

系统检查及服务报告

凝蹒

系统分析根据客户要求确定是否开启远程服务

远程故障解决根据客户要求确定是否开启远程服务

远程系统性能监控根据客户要求确定是否开启远程服务

(六)数据库系统运维

1、Oracle

.可修编.

令健康巡检:提供每季度一次的健康巡检,包括:系缔口数据库的可用性、

寒蟒检查;系充黝聊啦用缁然检查;系统的^勾、^恢期骤、

安装、安全扫描事目关问题的检查;对系统错误日志检查与分析,根酶

彳修统及Oracle的艮错信息,捌窿充潜在问题,及早采取措施,抖滁故

障隐患和安全漏洞。要求巡检后提交完整的检查报告和相关的改进建议报

告。

令备份恢复:根据采购人数据库系统实际情况,规划实施符合采购人工作要

求的完善的备份恢复方案,以确保采购人城库系统的安全可靠运行。在

进行数据库备份恢复的规划实施过程中,服务方技术人员应对采购人的技

术人员进行现场培训,确保采购人的技术人员可以独立完成相关备份工

作;在数据库浮现故障寸,月踪方应尽叱鼓术人员^屎购刖场,恢

复客户系统,减少采购人停机时间。

令卬4喔处理:在数据库浮现故障,导魏螃库不能正常工作时,服务方安排

技术人员2小时到现场解决问题并保证问题彻底解决。如果不能解决问

题,服务方需自行请专家或者其他高级技术人员对采购人系统情况进行

分析,直至解决问题。

令远程技相瑞:服务方碰到采购人通知后的30分钟响应,确认相关情

况,进行、拨号等技术支持,如需现场协调现场进行处理。

令性能调优:根据客户的需求不嘤作系统数据库系统的实际情况,定期分析

用户的应用类型不呻户行为、评价客户数据库的的设置、数据分布、硬

佛口系统资源的使用情况等,并提出相关调整建议,必要时可以随时在规

.可修编.

定的时间酒支术专毅I」达客户现场,处理客户系统性能问题,确保客户系

统的高效运转。

令'i因件、软件或者人为操作等各种不同原因,引起的采购人

数据库系统彻底不能正常工作、严重影响业务系统正常运作的故障时。能

提够全年7x24小时(365*7*24)技术支持,在接到采购人请求后,0.5

小时安排技术人员给采购人技术人员回电,并在1小时向用户提供处理方

法。如果远程不能处理的紧急故障,服务方技术人员应在3小时赶赴客户

现场,搜集各种故障信息,诊断故障发生的原因,在4小时之排除故障。

令需求响应:当客户有主机及数据库部署、调整、优化等需求时,及时响应

客户需求,给出客户最佳解决方案,经客户认可允许后,实施方案

2、Oracle海网沟婿

异肉模式下实现Oracle数据库与SQLServer数据库联通,在SQLServer数据库下

可以正常查询Oracle数据库数据

.可修编.

(七)网络设备运维

1、网枪服^

在隹护服务期间,与主机和存储密切配合,乐■个月一次现场巡检服务。

2、网络环境与设备物理状况巡检

1)环境检查巡检

UPS电源、地线、空调、散热、物理安全性。

2)物理状况巡检

包括:设备机体、外观、及风扇、风道及过滤器、状态指示灯、电源、VIP模块、

广域网端口、局域网端口等。

3、硬件部份巡检检查

A设备连接状况检查;

A设备物理安全(电源冗余、机房环境、线缆);

A设备本身冗余性检查,包括引擎的冗余、电源的冗余;

A设备系统及板卡指示灯状态检查分析;

A端口描述,端口安全性,不使用的端口建议关闭,端

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论