机房设备搬迁解决方案_第1页
机房设备搬迁解决方案_第2页
机房设备搬迁解决方案_第3页
机房设备搬迁解决方案_第4页
机房设备搬迁解决方案_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、- 1 - 机房设备搬迁解决方案机房设备搬迁解决方案研发部研发部二二一二年十月一二年十月- 2 -目目 录录一、一、编写目的编写目的.2二、二、总体要求总体要求.2三、三、搬迁前提条件搬迁前提条件.3四、四、搬迁工作内容搬迁工作内容.6五、五、机房搬迁流程机房搬迁流程.13六、六、机房搬迁实施机房搬迁实施.14七、七、机房搬迁时间安排机房搬迁时间安排.17八、八、应急处理应急处理.17九、九、机房迁移设备清单机房迁移设备清单.18十、十、备品备件清单备品备件清单.18十一、搬迁后触发的事故说明十一、搬迁后触发的事故说明 .19- 3 -一、一、编写目的编写目的公司搬迁过程中,机房服务器、网络等

2、设备的搬迁是一项非常重要的工作,涉及多类不同服务器设备,包含单位核心数据、应用等诸多核心资产,是一项系统性工程。为规范性、科学性指导公司服务器、网络等软硬件设备的搬迁工作,对关键性搬迁业务工作进行细化,优化和调整搬迁过程中的关键工作,保障机房搬迁工作合理、有序、高效实施,做好重要文件和数据的备份工作,保证原机房服务器、网络等设备的正常平稳搬迁、恢复和运行,预防或降低在搬迁过程中可能发生的问题和风险,特编制此方案。二、二、总体要求总体要求1.1. 搬迁方案搬迁方案机房服务器、网络等设备的搬迁需要经过前期调研准备,搬迁前系统有效的备份,应急预案的制定和测试,搬迁过程断电、下架、上架、给电等,搬迁后

3、系统的搭建安装,系统完好性测试及有效的监控机制确立等步骤。每一步工作都需要制定周密计划、步骤并严格按照该计划、步骤实施,其中任何一个环节出现差错都将影响整个搬迁工作的进度并增加风险。因此,应当在搬迁前制定周密、详细的搬迁计划、步骤并形成文档资料,其中应包括准确的搬迁实施时间表和具体实施步骤以及紧急情况下的应急方案。同时,对计划中每一个步骤都要明确安排具体责任人员以确保搬迁计划落实和实施。保证搬迁方案的正确性、可执行性,搬迁过程合理、有序。本方案是以尽量不影响公司的日常工作或将影响降低到最低为前提的情况下制定的,即在休息日前开始搬迁工作,到工作日以前完成整个服务器、网络设备、网络安全设备的搬迁、

4、安装及测试。并且在开机以后,继续跟踪系统的运行情况,随时处理系统运行的异常情况。- 4 -2.2. 搬迁要求搬迁要求搬迁时限搬迁时限:为保证业务系统运行的连续性,务必保证全部网络系统、应用系统、办公系统于 48 小时(周末进行)内搬迁并调试完毕,投入正常运行。应急要求应急要求:为最大程度降低因搬迁造成硬件故障从而导致的对业务运行连续性的影响,必须能够对关键设备提供充足的备件以备应急。一旦搬迁过程中出现硬件故障,必须在 2 小时将备件更换完毕。其它设备硬件若因搬迁过程中人为物理损坏,按照损坏程度进行一定的赔偿。3.3. 其他要求其他要求保证搬迁前做好数据备份工作,搬迁后数据不得丢失,系统能够恢复

5、正常运行;保证各硬件设备搬迁过程中不损坏;对重要业务系统提前联系厂家,保证意外情况下的技术支持;三、三、搬迁前提条件搬迁前提条件1.1. 新机房环境新机房环境新机房需要按照规划要求安装和装修完毕,各项条件满足搬迁要求,具体环境要求:温度:摄氏 23 度2 度(夏季) ;20 度2 度(冬季)湿度:45%65%温度变化率:5/h 不结露电源频率:50HZ0.2HZ电源电压:380V/220V5V电源波形失真率:小于或等于己于 5%含尘量:粒径大于或等于 0.3um,粒数小于或等于 10000 粒/无眩光、无频闪、无噪音距离地面 0.8 米高处,照度不低于 300lx计算机系统供电系统零地电压小于

6、 1 伏- 5 -交流工作接地系统接地电阻小于 4 欧姆计算机系统安全保护接地电阻以及静电接地电阻小于 4 欧姆防雷保护接地系统接地电阻小于 1 欧姆均布载荷:大于 800Kg/2.2. 搬迁实施方案搬迁实施方案网络管理员了解公司现在机房的现状以及搬迁后的具体要求。充分考虑在实施过程中可能出现的各种情况,定制详细可行性的迁移实施计划,将机房迁移工作对公司的影响降至最小。流程主要根据搬迁前的需要制定,主要详细了解当前系统设备情况,系统运行情况。针对所了解情况制定详细搬迁方案以及应急方案。现现场场勘勘察察与与各各公公司司技技术术人人员员现现场场交交流流确确定定实实施施方方案案对对所所有有设设备备进

7、进行行分分析析,制制定定应应急急方方案案3.3. 综合布线综合布线综合布线和各专线全部联通并测试通过,相关合作单位出具验收报告等。各种接口和连接孔制作完毕并符合要求。所有的数据专线和普通电话号码所对应的机柜配线架号必须是准确无误的,各工位所使用的电话号码必须提前确定。4.4. 机柜、机柜、UPSUPS如条件许可,机柜安装完毕、并轨合理,KVM 按照标准安装到制定位置。如沿用原机房机柜、UPS 电源等,明确 UPS 电池组位置,焊接好 UPS 电池组支架,明确机柜、机架等应摆放的位置,明确服务器、交换机等所在的机柜和机架位置,并配有准确可靠的强弱电布线设施。机房的供配电应是单独的 UPS 回路,

8、机房 UPS 输出控制的区域必须在开关上明确标识并具相应的配电系统图及电源点位和布置平面图。5.5. 工位信息点及电源工位信息点及电源安装、调试好所有工位所对应的信息点及计算机用配电电源,保证可用。- 6 -6.6. 数据备份数据备份原机房设备重要数据全部进行备份、记录和标记,搬迁人员全部进行相关技术培训,关键设备制定详细的搬迁和运输方案。所有备份数据通过光盘或者磁盘阵列的方式备份,备份数据为防止外露需要网络管理员进行备份和处理。在正式搬迁前,给各个相关业务部门发送数据备份通知,要求各个部门自行进行重要数据和文件的备份工作。7.7. 搬迁工具及设备提前采购搬迁工具及设备提前采购根据机房服务器、

9、网络等设备搬迁过程中所需要的工具,制定工具清单,对没有或无法满足搬迁要求的工具提前采购(含网线) ;新机房所需的设备或公司实际运行所需的设备,如需要,一并提前采购。服务器、网络等部署所需要的网线、跳线等必须是数量足够、质量可靠、分颜色管理,并贴有相对应的标签,满足搬迁后服务器、网络等快速部署的需求。8.8. 光纤迁移准备光纤迁移准备联系公司光纤服务商,告知公司机房搬迁事宜,提前进行新老机房光纤迁移可能性的论证及所需要准备的工作;在确定具体搬迁日期后,联系施工队伍,开展光纤迁移工作。综合来说,新机房的设备安装要合理、美观便于维护和使用,新老机房平滑过渡。四、四、搬迁工作内容搬迁工作内容1. 搬迁

10、技术工作搬迁技术工作1) 确定机房搬迁的负责人以及负责人的联系方式,保证在搬迁的过程中统一指挥管理。2) 确定服务器的数量,服务器的型号,服务器的配置等,如有需要,联系相关服务器的供货商或者厂家提供技术支持或者备件支持服务,并且在搬动- 7 -服务器之前必需有详细的表格记录。3) 确定相关的辅助设备,如:配线架、尾纤、跳线、插排等。4) 服务器数据的备份,所有关键数据(包括程序,数据库,各服务器的配置参数)必须进行备份。5) 确定各个服务器搬迁后的 IP 变动和路由情况,并做好详细日志。6) 各种设备提前做好技术检测工作,登记每个设备的技术检测情况。2. 机房搬迁可能的影响及影响评估机房搬迁可

11、能的影响及影响评估在此过程中,由机房搬迁负责部门组织,相关部门参与,机房搬迁负责人就新机房环境的准备情况,包括:空调环境、电源控制等,机房搬迁设备状况清单、搬迁所涉及的工作范围、内容,以及搬迁过程中可能发生的事故、故障,存在的风险等方面进行汇报,各个部门进行评估,制定出机房搬迁影响评估报告,并交由上级领导审阅。3. 绘制图纸,详细记录搬迁前后的情况绘制图纸,详细记录搬迁前后的情况提前规划各个机柜、各个网络设备的摆放位置,还要事先量好机器的具体尺寸,对所有设备进行编号,并填入登记表中之后到 现场规划机器的具体摆放位置,力争最合理、最充分地利用机房的有效空间。此处需要注意的问题:如果需要扩展机柜,

12、则提前将综合布线的数据信息点打在配线架 上,这样,等把交换机路由器等网络设备搬迁过来,安装好跳线,则网络就可以正常使用。因搬迁后电话及网络需与之前保持一致,对相关点位进行备份,在搬迁后将根据原有机房点位进行恢复。4. 对设备进行分类统计对设备进行分类统计机房设备包括服务器、核心交换机、配线架、防火墙、存储设备、UPS 等,给出进一步详细的设备统计信息,包括设备型号、配置、所在的网络等,在搬迁之前给出相应的表格记录文档,确定相关的辅助设备配件等,同样需要有详细的记录文档。5. 系统备份系统备份建立一个覆盖中心的数据库备份系统,包括数据中心和所有运作中心各种数据的备份,尽可能提高各主机数据的安全性

13、和可管理性。- 8 -备份内容应包括数据中心和运作中心:1)应用数据库备份2)文件系统的备份3)操作系统备份4)系统的灾难恢复5)备份系统应不对应用系统产生任何不良影响。6)要求备份策略和备份手段减少数据的丢失/错误,以便事故发生时快速有效地恢复数据。 所有服务器、小型机和阵列等设备进行操作系统配置信息备份和登记,对于特殊配置的设备需要跟厂家或者供货商提前联系,特殊配置设备建议进行全备份。对于这些设备的硬盘由于长时间的运行,一旦停机后可能会出现各种无法预料的问题,建议根据设备情况预备多块不同容量和型号的硬盘,当某块硬盘出现故障时可以马上替换。所有交换机、防火墙、服务器等智能设备的配置信息进行备

14、份。对搬迁过程中出现的一系列软件和硬件故障要有准备,要和厂商或者供货商提前联系好,找出可能出现的问题点提前规避,无法规避的要做好技术、备件或者替代机准备工作,便于在搬迁后出现故障时可以通过备机或者替代机临时替用。如厂商或者供货商不提供备机或者替代机需要寻求第三方支持时,要提前做好准备。6. 系统检测系统检测全面预防静电虽然计算机是靠电力工作的,但静电却会给计算机带来致命伤害,尤其是可能对主板芯片造成永久性损坏。静电产生的原因很多各种电源设备可能产生静电,计算机 CRT 显示器可能产生静电,工作中的手机、对讲机也会在周围空间产生大量的静电,这就要求我们要特别小心静电的干扰,全面预防。尽量使服务器

15、及其周边设备的接地良好。如果设备没有接地,当我们要接触里面的板卡时,应先用接地导线或其他放电设施对其进行放电。对设备进行操作时,可以用手触摸一下机箱外部的金属来放掉自身携带的静电。保证机箱内布局合理一般来说,服务器机箱内部的部件布局以及空间设计- 9 -都经过科学排列,相互之间结合紧凑却不杂乱,我们在添加和卸载服务器设备的时候,一定要维持这种布局效果。注意:在机箱内部还应有相当一部分预留空间,构成合理的“风道 ” ,这是因为 CPU 已经不仅仅是惟一的热源,高转速硬盘、光驱、各种芯片及板卡都在这个狭小空间里产生着热量,所以在风扇转动时,机箱内空气必须能够充分流动。 设备重启正确操作 关机操作关

16、闭操作系统关闭主机电源关闭外设电源 (如磁盘阵列,磁带库等)关闭其他设备电源和机柜电源关闭总电源 开机操作打开总电源打开机柜电源打开外部设备电源(如磁盘阵列,磁带库等 )待外部设备自检完成后,最后打开主机电源加电启动机器,如果机器能够启动,说明系统完好;如果加电之后就有问题,说明系统在搬迁之前就有问题,不是在搬迁过程中造成的。搬迁方不负任何责任。7. 设备标签和记录设备标签和记录服务器和小型机:对服务器和小型机的网络接口进行标签,当设备有多个网卡时每个网卡如何连接,连接到那个设备都需要进行记录和标签。服务器和小型机电源接口需要进行标签,一般服务器和小型机等重要设备都配置多个电源,每个电源都连接

17、到不同的电源接口上,所以对于多电源接口的设备需要进行详细记录和标签。对键盘和鼠标接口也需要进行标签或者记录。对于设备特殊接口如:备份、呼叫中心、外置硬盘等特殊接口必须进行重点标记和记录,每条特殊跳线都要详细记录和标记。对于空余接口需要记录和标记为不使用。- 10 -位置和用途标记,当有多个相同类型的服务器时,每台都要标记和记录其使用用途。及在机房中的位置等都要记录详细UPS:对机房内的 UPS 的功率和型号机型记录和标记,电源接口的连接方式和供电模式,以及对电源模块的连接方式都要详细记录和标记,每条不同的跳线最好也标记清楚,对电池组内的跳线连接方式和摆放模式进行详细记录和标记。UPS对那些设备

18、供电、电源线的连接方式也要进行记录和标记。通讯设备:通讯器材虽然有通信公司负责,但是也要进行详细的记录和标记,每条线的类型和连接方式都要记录和标记清楚,每条线连接到那个设备上,连接到设备的接口和连接方式等都要详细记录,以及通讯器材的型号和容量等都要标记。网络设备:网络设备是连线最为复杂的设备之一,机房内的设备大多都连接到网络设备里面,如果网络设备有配置内容和划分端口等,就要对每个端口进行标记和记录,每个端口连接到那个设备等等记录和标记。对一个服务器需要连接多个端口的要重点注意,因为一旦连接线路出现错误就将导致整个网络的瘫痪。终端设备:不同的终端提供不同的功能,所以每个终端连接方式、连接端口、电

19、源适配器等都要进行记录和标记,不同的终端需要配合不同的设备使用,每个终端和那个设备配合使用,连接拓扑和跳线模式一定要详细记录和标记。搬迁机房中,大量的设备和连接线往往会将技术人员搞得晕头转向,所以要做到互相监督互相检查才可以尽量做到周全和周密,才会做到万无一失。在标记时要做到尽量细化,标签一定要使用高粘度不易脱落的,以免在搬迁过程中脱落。8. 设备拆卸包装设备拆卸包装设备拆卸的过程和顺序是:服务器系统、UPS、通讯系统,然后网络设备,终端设备,搬迁过程也是如此。拆卸服务器时首先是外围设备的拆除,包括键盘、鼠标、显示器,然后是网线、光纤跳线、读写器和特殊电缆的拆卸,不同的设备要放入不同的容器内,

20、- 11 -最后就是主机的下架,主机一般都固定及机柜里面,每个主机可能有不同的导轨或者工具要将他们和主机放在一起包装和运输,以免到新机房后找不到原配配件而无法上架。主机一般要放在专门的箱子中,箱子中要有防震发泡塑料,防止主机震动造成损坏,然后对主机进行固定,固定好后将箱子封闭。远离高温、高热、强磁环境。UPS 拆卸过程中主要注意电池正负电极短路,在拆卸过程中拆卸下来的电池不要码放,要均匀整齐的摆放在地面上,电池上面不能对方其他物品,以免造成电池放电、漏液、起火等因素。如果原有电池包装箱还有最好是每个电池都进行保证,如果没有包装物在运输过程中要单独运输,注意运输是电池不能码放和堆砌,要逐一放在平

21、面上。通讯设备的拆卸主要有通信公司负责,如果需要拆卸要重点保护拆卸完毕的各种接口,通讯设备一般都是光电设备,光口拆除后内部接口暴露,搬迁过程由于灰尘比较多容易造成光口无法使用,因此在拆除过程中最好是通过接头帽保护接口。装箱时注意不能码放太多,运输箱要防震,内部要放发泡塑料等减震。网络设备在拆除过程中要注意静电保护,一般网络设备接地不理想,网线拆除后静电累积要通过机壳放电来保证设备安全,所以要注意静电放电,同时在拆除网线或者光纤的同时要将接口附近的灰尘清除干净。装箱时一定要采取防震措施,然后固定9. 设备搬迁运输设备搬迁运输所有设备必须装箱不能乱堆乱放,在搬运过程中要平稳轻放,严禁设备倒置,注意

22、搬运过程中的力量,要轻拿轻放不得踢砸等,如果搬运时注意,那设备一般不会损坏,机房搬迁过程中设备的故障和损坏主要是搬运过程不注意,造成设备内部的部件损坏和脱落,造成不应有的损失,因此搬运时注意力道平衡,轻取轻放一般不会造成设备硬件问题。机房设备都不能码放太多,特别是 UPS 电池和服务器,一般服务器都不能承重,码放太多容易造成机器变形,引起设备故障,所以重要设备不要码放,如果码放也不要超过两层。新旧机房如果隔层时通过人力就可以搬运,但如果距离比较远的就需要运- 12 -输车辆,车辆在运输过程中速度不能太快,以慢速形式较易,转弯时要不能太急,要慢速转弯,不能造成设备的位移,如果需要高速路运输的需要

23、对包装箱进行固定。运输时要选择路途平坦,车辆少的路段运输,每次不能运输太多,每次必须有人在货物旁边照应,以备应急情况。到达运输地时在向新机房内搬迁时注意搬运细节,不能用力过猛和扔投设备,还是要轻拿轻放,新机房一般都打扫干净,所以设备不要带着包装箱进入新机房,要先拆箱后清理设备,将设备清理干净后放入机房的制定位置,安装时也要注意不要碰撞和用力过猛。10.设备安装管理设备安装管理所有设备在进入新机房之前最好进行设备清理,条件许可的开箱清理。打开机壳清洁设备内表面的积尘,可用干布喷上专业的清洗液擦拭。布应尽量干,擦拭完毕应该晾干。各种插头插座、扩充插槽、内存插槽及板卡一般不要用水擦拭。也可以用刷子刷

24、或气筒吹掉灰尘。拆装清洗原则:在打开机箱之前,双手应该触摸一下地面或者墙壁,释放身上的静电。保持一定的湿度,空气干燥也容易产生静电,理想湿度应为 40%-60%;清洁内存条和适配卡各种时清洁包括除尘和清洁电路板上的金手指。可以用刷子刷或吹掉灰尘。也可用橡皮擦来擦除金手指表面的灰尘、油污或氧化层,切不可用砂纸类东西来擦拭金手指,否则会损伤极薄的镀层。因为所有设备长时间使用会老化,所有设备在正确设备清洗工作完成后,重新装上设备加电启动电源,如果能启动说明设备完好,如果运行不正常说明不是搬迁过程中造成的。搬迁方不负任何责任。清洁完毕后按照新机房的规划逐一安放设备,设备安装完毕后进行设备登记和标记,记

25、录设备的功用和安装时间、负责人等。设备最好按照不同的应用放在不同的机柜和不同的区间内,最好规划合理,比如:管理区、应用区等,可以按照不同的行业应用和不同的功能来划分设备的区域。一个标准机柜可以放多个设备,但设备要合理搭配,比如电磁环境和温湿度等,每个设备之间要预留至少 10CM 的空隙便于散热和通风,同时设备要固定到机柜上,不能简单的放在机柜托盘上。一个机柜不能摆放太多的设备。- 13 -KVM 等设备要摆放合理,要易于管理员使用和观看,机房内维护人员一般不能长时间呆在机房内部,这样容易造成对人体的危害,所以维护人员都在管理区,通过远程登陆或者远征桌面来管理各种设备。新机房内电源应分别供电,有

26、些设备是多电源结构,这些设备在安装时电源一定要连接到不同的电源插座上,一旦某路电源出现问题也不会造成设备的停机和损害。11.系统检测及恢复系统检测及恢复所有设备上架安装完毕后都要逐一加点测试,测试的主要内容有:服务器硬件配置是否改变、服务启动测试、网络设备启动管理和配置变更、通讯产品端状态灯等,测试的主要原因是设备搬迁过程中可能出现一系列问题,比如硬盘损坏、内存松动、灰尘污染等问题。所以在正式使用之前一定要进行全面的检测,找出问题解决问题,检测出问题后及时解决和排除。当设备硬件没有问题后还要进行一系列软件方面的测试,测试系统是不是正常,有没有系统服务无法启动等问题,对于软件系统无法正常启动的要

27、及时恢复启动,恢复后还是无法使用的需要联系厂商和代理商,找出原因解决问题,如果还是无法解决的需要安排替换机来代替。当所有的设备检测无问题后可以正式启动和应用,对于一些系统需要恢复系统的要恢复系统,需要恢复数据的要及时恢复数据,当设备完好并可以正常使用后就可并到新的网络中。设备在并网的时候有些需要变动 IP 地址和端口,如果需要变动要及时通知网络管理员或者相关负责人,以便变动后更换服务和配置,这些都需要用户技术人员亲自办理,特别是需要保密的数据。系统和设备恢复正常后要及时并网测试,测试要力求全面,当一切正常后搬迁工作既成功完成。12.IP 地址规划地址规划IP 地址规划是针对设备在搬迁后 IP

28、地址有变化,设备需要重新配置制定的配置表。在搬迁前对设备有一个详细 IP 规划,在配置时提高效率避免错误。由于公司采用 IP 地址不变更,所以不需要改变,本项目省略。- 14 -五、五、机房搬迁流程机房搬迁流程系统搬迁实施流程包括:准备、拆卸、装运、安装、调试等五个流程,具体如下:1. 准备:包括相关人员和设备准备、新机房环境准备、网络环境、备份、现场所有设备打标签、模块、设备准备等准备工作。2. 拆卸:主要只核心设备下架装箱等3. 装运:主要指设备由原机房到新机房的搬运过程。4. 安装:主要包括机柜就位、各机柜独立安装、网络连线、强电接线、地板孔调整等工作。5. 调试:主要包括强电调试、网络

29、调试、设备检测、数据库主机系统安装调试、测试、应用服务器系统安装调试测试、系统联测等内容。实施流程如下:备备品品备备件件工工具具准准备备(不不具具备备条条件件)新新机机房房现现场场检检查查设设备备标标记记数数据据备备份份目目的的机机房房检检查查表表数数据据备备份份表表设设备备端端口口标标记记表表设设备备关关机机设设备备下下架架设设备备搬搬运运设设备备连连接接设设备备端端口口标标记记表表设设备备开开机机功功能能测测试试完完成成- 15 -六、六、机房搬迁实施机房搬迁实施根据现有机房内的设备情况,以及咨询相关负责人,制定了搬迁实施计划,按照机房内设备不同的应用和使用情况,将搬迁工作分为 3 部分来

30、执行,第一部分是网络设备的迁移,第二部分是核心设备的迁移,第三部分是其它设备的迁移。 1. 网络设备的迁移网络设备的迁移机房内部的网络设备主要有,H3C1522 交换机 4 台,华为 5328 核心交换机 1 台 ASA 防火墙一台,以及各种网络设备。 具体的搬迁计划如下:1、线路标记和记录 4 小时2、设备配置信息备份和检测 1 小时3、设备断电、打包、搬运 1 小时4、设备运输 1 小时5、设备检测及恢复 2 小时 网络设备是所有设备联网的前提保证,所以网络设备的搬迁是必须首先进行的工作,搬迁选择在晚上或者下午下班后进行,一旦网络设备搬迁结束就必须要马上恢复网络设备,为下一步的关键服务器设

31、备并网工作提供前提保证。网络设备恢复正常后要马上做网络线路连通测试,重要线路还要做压力和持续性测试,当线路测试正常后后续的设备才可以正常使用。2. 核心设备的迁移核心设备的迁移原机房内主要的核心设备有 5328 核心交换机一台,主要用途是网络出口,磁盘阵列一台,主要是存储公司服务器数据。由于设备比较重要所以相关的工作会复杂一些,具体如下:1、设备标记和记录 1 小时2、设备系统检测 1 小时3、5328 核心交换机配置文件备份 24 小时4、磁盘整列数据备份到移动硬盘 48 小时5、设备断电、打包、搬运 1 小时- 16 -6、设备运输 1 小时7、设备检修 1 小时8、设备检测及恢复 2 小

32、时9、设备联网测试 2 小时断电以前的工作需要提前进行,对系统和数据的备份工作因需时比较长,容易出错和故障,需要做好相关的技术支持工作,相关厂商的技术人员最好是现场做技术工作,带有磁盘阵列的主机在开关机时都有一定的时限要求,不能颠倒开关机顺序,不能擅自改变时限要求。在做好磁盘阵列备份后还要适时的进行光盘备份工作,如果条件和时间允许光盘备份可以进行。备份建议:在备份好数据后,建议将数据异地备份,即通过移动介质移动磁盘、光盘或其他介质将数据备份到其他地方,以备服务器有问题时恢复用。其它服务器的备份主要是通过 DVD 光盘的方式来对系统和应用数据进行备份。搬运和运输时最好也是使用专用的包装箱来包装。

33、这些设备在运抵目的地后要进行全面的清理和维护工作,在所有设备重新维护后上架开机测试。测试通过即表面工作完成3. 其它设备的迁移其它设备的迁移机房内其它设备主要有:UPS、服务器、计算机等,这些设备包含了公司的其它大部分业务,如:杀毒、FTP、邮件、等。这些设备的搬迁步骤和时间如下:1、设备的标记和记录 1 小时2、系统设备检测 3 小时3、设备备份 48 小时4、设备断电、打包、搬运 3 小时5、设备运输 1 小时6、设备检修 2 小时7、设备检测及恢复 3 小时8、设备联网测试 2 小时在设备标记过程中除要详细记录各种线缆和接口外,也要遵循上述设备的- 17 -运输管理规定。对设备进行检测时

34、也要全面和详细,具体包括:操作系统、硬件配置、设备管理器、软件配置、硬件连接状况、设备安放情况等。在做完上述工作后需要对系统和数据进行备份,其中杀毒服务器可以适时对其进行备份,备份工具主要是使用 DVD 光盘,本服务器也可以不用做备份,或者在本机内部做备份。邮件服务器为虚拟服务器,可以做快照备份。备份后根据需要在做移动硬盘盘备份,正常情况下快照备份完全可以做到突发情况恢复,但是快照备份在磁盘阵列下,一旦磁盘阵列当机无法恢复快照。因此还要异地移动存储介质备份。断电顺序:服务器主机-磁盘阵列加电顺序:阵列-服务器主机。阵列断电:阵列断电方式直接关闭电源即可七、七、机房搬迁时间安排机房搬迁时间安排上

35、述搬迁工作预计需要时间为 3 天,具体搬迁时间安排如下:设备标记和记录用时 0.5 天(提前做完)重要设备备份用时 23 天(提前做完)设备检测用时 0.3 天设备断电和打包 0.3 天设备搬迁和运输 0.5 天设备安装和上架 0.5 天设备检测及恢复 0.5 天八、八、应急处理应急处理在设备搬迁后出现异常情况时现场技术人员立即检查设备,检查故障现象,确定故障位置。硬件故障在备件准备范围内的立即更换,不在范围内的立即使用备用设备- 18 -最短时间内启用备用设备。由于配置数据或系统不能启动的立即使用系统光盘备份数据等先前准备的备用工具软件系统软件重新按装或恢复。九、九、机房迁移设备清单机房迁移

36、设备清单序号序号设备名称设备名称型号型号数量数量备注备注1二层交换机H3C 152242三层交换机华为 532813防火墙ASA14电话交换机国威15ROS 路由电脑机箱16服务器戴尔67UPS 电源ON-Line18空调美的19机柜图腾2十、十、备品备件清单备品备件清单在搬迁过程中经常会有一些易损件损坏,影响搬迁工作的顺利进行,甚至影响到用户的工作。我根据以下服务器配置列表将提供额外的备品备件以备急需。公司网络管理人员需要携带必要工具:螺丝刀,笔记本电脑,偏口钳等工具。设备数量单位光纤1条内存 1*2GB1对300GB SAS1块硬盘500GB SAS1块测线仪1个替换网线1条- 19 -捆

37、扎带1包X3650 电源个Windows 2008 Server 企业版 安装光盘1片 Windows 2008 Server 标准版 安装光盘1片十一、十一、搬迁后触发的事故说明搬迁后触发的事故说明 1 1、ExchangeExchange 与域控当机事故与域控当机事故 事故时间:2012 年 7 月 8 号下午 16 时2012 年 7 月 9 号上午 10 时 30 分 事故前情况:邮件服务器及公司各服务器网络正常运转。收发邮件及访问邮箱无不良反应。 事故发生经过和处理情况:2012 年 7 月 8 号下午 16 时。由于装修人员擅自断电导致机房断电,网络管理人员立刻前去机房查看,服务器

38、安顺序开机,其中 Exchange 服务器开机后无法正常运行,随后展开针对 Exchange 服务器问题讨论并实施经过处理能正常访问。但是在 2012 年 7 月 9 号上午 10 时 30 分。由于装修人员误关闭电闸机房设备再次意外断电,网络维护人员再前去处理的时候发现其它服务器可以正常运行,其中预控、Exchange 服务器无法开启。针对这两台虚拟服务器展开排查。确认是系统文件丢失及备份数据快照丢失。因此无法进行数据还原。我们尝试一切所能想到的方法都失败告终其中包括:用光盘引导修复系统文件、检查系统内存、安全模式都无法恢复系统。李胜磊李总和张杰张总知道发生事故帮助我们共同讨论但最终也无终而

39、果。但好在我们通过 PE 的手段进入到邮件系统成功拷贝出了 Exchange 数据库文件。尝试过新建 Exchange 服务器导入数据库文件、使用软件读取数据库文件。但至今没找到数据恢复的办法,不过我们一直在不断的寻找方法恢复数据文件。 解决方案:- 20 -Exchange 服务器:1) 通过 EP 进入邮件服务器,导出数据文件。2)新建邮件服务器导入数据(发现导入不成功)我们现在正在跟进,寻找解决方法。3)新建免费 Linux 邮箱 poftfix。因为是刚建立免费邮箱,问题如下: 通讯组的不完善,邮件服务器运行仍然存在问题。我们会实时跟进,找出原因。做到邮箱服务器的稳定与安全。 域控服务

40、器:1) 目前公司没有域控,暂时借用电信 DNS。等公司搬家事项稳定。控将重新建立。2) 考虑到正版化问题,DNS 解析服务器建立在 Linux 系统上。 事故原因:装修人员没有跟公司网络管理人员沟通直接关电导致机房断电装修人员误关电闸导致机房断电 事故损失情况: Exchange 服务器当机,直接导致公司邮件无法发送影响公司全体员工办公效率, 其中公司高层领导重要邮件数据无法读取。不过我们在 Exchange 服务器当机 1 周之内从新搭建免费邮箱先暂时供大家使用,后续我们会尽早恢复 Exchange 邮箱服务器。预控服务器当机,直接影响公司网络通信导致外网无法访问公司服务器以及员工用网问题

41、。我们通过电信 DNS 已经解决网络问题,新的预控服务器已经搭建完毕我们逐步完善,后续会重新使用公司预控。事故暴露问题1) 搬家计划细节问题没有考虑到导致 UPS 没有及时安装2) 没有做到紧急事故的处理方案3) 网络管理人员责任心存在不足预防事故重复发生的措施1) 加强网络管理人员的责任心及做工作的严谨态度- 21 -2) 加强员工的职业技能,定期做相关培训3) 要每天对机房进行检查,发现问题及时处理,如处理不了及时上报领导。4) 做好每天的机房运行日志。 对事故责任的分析1)装修工程队负首要责任2)机房搬家部门负连带责任 体会:通过这次搬家出现的重大事故给我们敲响了警钟,做任何事之前一定要

42、想好周密的计划以及出现突发事件的决绝方法。提高员工工作态度以及责任心是重重之重!网络管理人员加强自身的责任心以外还要加强职业技能。技能提高了遇事才能沉着冷静! 2 2、网络的混乱、网络的混乱1)搬迁至 7 楼打乱原有 VLAN 划分。2)没有做好网络分布计划3)实施缓慢 体会: 在搬迁之前应做好搬迁后网络分布详细计划,以及 VLAN 分布图,根据计划实施。有计划的实施效率会更高,事故率会更低。工作态度与积极性不高,思考不够全面。 3 3、UPSUPS 安装不及时安装不及时造成损失:由于各服务器再没有 UPS 保护情况下运行,导致邮件、域控当机。直接造成公司网络及收发邮件瘫痪为公司带来直接工作效

43、率损失。体会:公司新办公环境正在装修,电压不稳定。随时都能有断电的可能,由于公司领导出差,安装费用没有审批抱着侥幸的心理导致 UPS 电源没有及时安装。遇事第一想到的是领导,领导不决定或者不在工作就暂停。导致事故发生,说明主见性与自我分析能力不强。- 22 - 4 4、针对事故的有利方面、针对事故的有利方面 1)邮件服务器当机 利端: 让我们学习到了搭建免费邮箱,在搭建的同时考虑到今后公司发展,本着节约成本的想法把免费 Postfix 邮箱搭建在 Linux 系统上。避免了后续安装正版系统问题。 2)域控服务器当机利端:学习在 Linux 系统上搭建 DNS 解析服务。从中了解 Linux 系统各项服。学习到了做事要留存技术方法文档。八、搬迁工作中问题总结八、搬迁工作中问题总结 “工作责任心”通过本次搬迁,总结到个人工作态度,以及对处理事务的责任心不强,例如:如果我们有着很强的责任心,我想不会出现服务器当机的情况发生。 “工作积极性”工作积极性不高,做任何事情都是领导说什

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论