




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
可用性计划目录1. 目的 42. 范围 43. 可用性需求 44. 检测、维护及恢复方案 45. 供应商服务方案 56. 培训 57. 评审 5目的对向本公司信息部提供计算机软、硬件设备的运维服务的描述实施可用性计划的目的。范围向本公司信息部提供计算机软、硬件设备的运维服务可用性需求根据业务需求提出客户的可用性需求MTBF:5000h-10000h宕机时间:每年宕机≦3h每年对平台可用性进行评审,评审完产出可行性报告。检测、维护及恢复方案启动和关机,涉及所属子系统。由不同责任管理员分三个层次操作和处理:1.操作系统管理人员实行操作系统层面上实行重启、关机2.服务器管理人员实行硬件层面实行远程启动、重启、关机3.数据中心管理人员现场实行物理机电力层面实行启动、重启、关机监控。利用机房,通过外部端口连接对客户的Coremail邮件系统进行监控。主要包括以下功能:4.其他功能需求需要生成简单的统计报表,包括响应时间,延迟,故障时间等服务器管理任务。1.资产管理系统记录服务器的所有物理相关信息:品牌、型号、设备编号、硬件参数、购买日期、保修期限物理位置、主机名、所属平台、角色、操作系统和管理IP2.服务器上线、下线实时更新资产管理系统记录密码维护。1.维护人员拥有所负责平台的密码设置、定期更改和删除权限2.负责相台平台的维护人员共享密码权限3.非维护人员如果要获得密码权限,必须通过申请和审核评估所需权限的安全风险备份与恢复方法。1.异地镜像的实时同步机制2.本地每天定期冷备3.联机备份机制在系统恢复时不影响正在运行的服务升级与修订方法。1.定期检测版本及补丁信息,尽量在不影响运行服务的前提下及时升级及修订。2.如果升级或修订时需要暂停服务,需要事先评估暂停时长及可能出现的风险,编制具体操作方案并通知相关人员做好应对措施。运用联机备份与联机配置特性的机会。1.前端服务器使用HA冗余机制共享后台存储。2.后台存储使用RAID1、RAID6确保数据安全、无损及高效读写。最新厂商文档。1.保持与厂商联系,获得最新产品信息,由厂商提供从部署到使用及保修等解决方案文档供应商服务方案网络安全维护标准对现有网络安全架构熟习,并根据网络运行情况提出新的安全建议;及时更新病毒库,检查防火墙性能;定时进行安全扫描;及时修正已发现的安全漏洞;对可预见的或已预报的安全警报,提出有交的解决方案。网络安全检测规范提供最完整的网络安全漏洞集合;并顶事查看安全公告更新;定时针对路由器与linux服务器及所有TCP/IP网络设备进行安全扫描;建议适当的处置方法;依据最新扫描所得的漏洞进行持续性的修正;聘请网络安全顾问;对安全风险进行可控制性分析并提出解决方案;列出所有网络上的设备组件,并文档存储;依据现况作为未来之评估参考;安全政策施行的封闭式回馈功能。网络防病毒规范提倡尊重知识产权的观念,使用合法原版的软件,拒绝使用翻版软件,只有这样才能够确实降低使用中计算机发生中毒的机会;平常就要将重要的资料备份起来,并建立备份历史档案,保证可恢复备份达到十四天;创建紧急救援磁盘;不使用来路不明的软盘或光盘,就算要使用,先用最新版本扫毒软件扫描;随时注意特殊的文件的长度与日期,并做备份;监控内存使用的情形;避免用软盘开机;准备多种防毒、扫毒、解毒软件,并且定期扫描;建立正确病毒基本观念,熟悉病毒感染、发作的原理;妥善保存各种文档资料。系统数据备份策略对系统数据进行定时备份,建议每日备份前24小时的数据,并建立备份档案,每30天数据进行封档,保证数据的备份量在14天-30天内。灾难恢复方案一、灾难分类:类别描述A类计算机软硬件故障B类人为操作故障C类资源不足引起的计划性停机D类其他二、恢复方案相对应级别的处置方法当发生时。应先报告网络维护人员,由灾难鉴定小组进行灾难鉴定,确定灾难级别,上报灾难小组组长,并对灾难发生时间,解决方法,恢复时间进行记录。发生A类灾难时,灾难鉴定人员确定灾难级别后,上报灾难恢复组组长,确定恢复方案,排除硬件原因,在主机正常启动后,检查缺失的文件或不能正常启动的服务,上报灾难组组长,并准备备份文件,进行恢复。进行恢复后,由恢复后检查人员检查主机是否恢复正常服务,文件是否完整且可以被正常访问,检查无误后。上报灾难恢复小组组长,并对灾难恢复的过程进行记录。发生B类灾难时,灾难发现人应及时上报网络部及灾难恢复小组组长,明确丢失的文件,确定文件丢失原因,并对丢失原因和责任人进行记录。由丢失文件部门提出书面“恢复文件申请”,由灾难鉴定确定丢失文件,在灾难恢复小组组长批准后,准备备份文件恢复。恢复后,由丢失文件所在部门进行确认。当发生C类灾难,由灾难坚定人员确定主机故障,并上报灾难恢复小组组长.确认为主机操纵系统故障或硬件资源不足所引起宕机时,先确认该主机是否为应用服务器(如是应用服务器,应先断开该主机的网络连接),如有需要,应及时转移服务,由其他服务器代为承接业务。故障主机再进行维修。如确认系统不能正常运行,但通过短时间维护(不超过2小时)可以恢复正常,报请灾难恢复小组组长,并对原因进行说明。在得到批准后,实行对主机的全面恢复(在断开主机网络连接后,回复到最近一次的正常备份状态)。在恢复后由恢复检查人员对主机进行检查,确认主机确实恢复后,再接入网络,恢复后检查人员应在48小时内对恢复后的主机密切关注,确实恢复正常后,报告灾难恢复小组组长。并对主机恢复情况留有详细记录,以备后续检查。三、灾备演练针对平台的系统故障和数据存储故障做灾备恢复演练。灾备演练时间:序号演练项目时间安排1生产系统故障半年一次2存储故障半年一次3网关故障半年一次人员职责平台负责人:负责演练的执行部门负责人:负责演练方案的评估PM:负责演练过程的规划指导监控演练过程规划利用旧设备搭建出模拟的生产环境和镜像容灾环境模拟故障发生通知到PMPM记录事件,通知相关人员平台负责人处理故障,恢复业务测试故障是否完成恢复具体操作方案系统故障:切换到镜像容灾平台-修改网关配置-恢复后切
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论