电信公司计算机系统应急预案演练方案_综合业务支撑系统(IBSS-CRM)_V0.2.doc_第1页
电信公司计算机系统应急预案演练方案_综合业务支撑系统(IBSS-CRM)_V0.2.doc_第2页
电信公司计算机系统应急预案演练方案_综合业务支撑系统(IBSS-CRM)_V0.2.doc_第3页
电信公司计算机系统应急预案演练方案_综合业务支撑系统(IBSS-CRM)_V0.2.doc_第4页
电信公司计算机系统应急预案演练方案_综合业务支撑系统(IBSS-CRM)_V0.2.doc_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

广东分公司计算机系统应急预案_综合业务支撑系统(ibss)v1.0xxxxxx公司计算机系统应急预案演练方案综合业务支撑系统(ibss&crm)version 0.2中国电信股份有限公司xxx分公司2008年06月修订控制页修订号修订日期修订内容简述修订人版本号12008-6-6初稿陈军苏智唐凯超陈辉0.122008-6-11审核确认陈辉0.2目 录修订控制页21.总则51.1.编写目的51.2.适用范围51.3.编制依据51.4.编写人员51.5.解释权61.6.版权62.应急演练预案62.1.演练内容索引62.2.演练要求72.3.职责分工72.4.演练时间安排73.演练方案83.1.演练方案1:应用服务器1(含接口)无法提供服务83.1.1.目的83.1.2.注意事项83.1.3.历时要求83.1.4.参考操作步骤83.2.演练方案2:应用服务器2(含后台独立进程)无法提供服务113.2.1.目的113.2.2.注意事项113.2.3.历时要求113.2.4.参考操作步骤113.3.演练方案3:任意一台数据库服务器无法提供服务123.3.1.目的123.3.2.注意事项123.3.3.历时要求123.3.4.参考操作步骤123.4.演练方案4:任意一台数据库和应用服务器1(含接口)无法提供服务153.4.1.目的153.4.2.注意事项153.4.3.历时要求153.4.4.参考操作步骤153.5.演练方案5:任意一台数据库和应用服务器2(含后台进程)无法提供服务163.5.1.目的163.5.2.注意事项163.5.3.历时要求163.5.4.参考操作步骤163.6.演练方案6:在应急环境下存储系统恢复性测试演练(it内控要求)173.6.1.目的 模拟磁盘存储设备出现不可预知的问题导致配置信息或者数据丢失,利用备份好的数据进行恢复工作。173.6.2.注意事项173.6.3.历时要求193.6.4.参考操作步骤 1)、配置信息恢复194.演练结束255.附件一:演练记录表格266.业务验证参考用例266.1.1.检查主机系统运行状态266.1.2.检查数据库运行状态266.1.3.检查ibss应用状态266.1.4.进行实单测试271. 总则1.1. 编写目的本地综合业务支撑系统(ibss&crm)为xxx电信的核心bss系统之一,其不间断运行的能力对xxx电信有着重要的作用。本文的编写目的是为各分公司重大系统的应急演练提供指导,确保在系统异常时,可以有序的实施恢复操作,及时恢复业务。本方案是模拟分公司综合业务支撑系统(ibss)在运行过程中或者操作过程中出现的常见系统重大故障进行故障处理的演练方案,其目的是增强分公司各部门对综合业务支撑系统(ibss)故障处理及配合的能力,在发生故障时,能采用快速有效的手段,迅速恢复业务,尽可能减少故障对业务的影响。1.2. 适用范围适用系统:综合业务支撑系统(ibss)1.x,客户关系管理系统(crm) 2.x适用对象:各分公司的ibss系统管理员、维护支撑人员以及其他相关部门的管理人员。1.3. 编制依据xxxxxx公司计算机系统应急预案_综合业务支撑系统(ibss)_v1.0,中国电信股份有限公司xxx分公司1.4. 编写人员一、xxxxxx公司计算机系统应急预案编写工作小组人员名单:组长:孙丹宇副组长:杜涛成员:徐文罕、梁振宇、陈辉、林群辉、黄书成、刘长成、陈军、江粤雄、唐凯超(亿迅)、苏智(亿迅)二、本分册主要编写人员名单:陈军、陈辉、唐凯超(亿迅)、苏智(亿迅)1.5. 解释权本规范的解释权属于中国电信股份有限公司xxx分公司。1.6. 版权本规范的版权属于中国电信股份有限公司xxx分公司。2. 应急演练预案2.1. 演练内容索引本演练方案包括如下内容,各分公司可以根据实际情况进行调整:演练序号演练预案演练预案分类备注1应用服务器1(含接口)出现严重故障无法提供服务单点故障2应用服务器2(含后台独立进程)出现严重故障无法提供服务单点故障3任意一台数据库服务器出现严重故障无法提供服务单点故障4任意一台数据库服务器和应用服务器1(含接口)出现严重故障无法提供服务多点故障5任意一台数据库服务器和应用服务器2(含后台独立进程)出现严重故障无法提供服务多点故障6在应急环境下存储系统恢复性测试演练(it内控要求)存储故障特别提示:由于应急演练比较复杂,为确保应急演练正常进行,应该在维护单位的指导下进行。2.2. 演练要求演练要求如下:1、 每系统每年至少演练一次。2、 每次演练至少演练2.1小节中的两个典型预案。3、 演练时间建议在业务非营业时间和非业务忙时进行。4、 演练按照相关维护管理规定进行。5、 各分公司演练前应在本方案基础上结合本地实际情况制定详细的演练计划和业务验证用例。6、 每次演练后,需要编写演练总结,对发现的问题及时进行整改。2.3. 职责分工部门职责描述责任人联系电话备注网络运营部协调各部门、演练发文通知、组织演练it维护中心负责演练牵头、组织、演练操作业务支持中心负责业务运行记录、观察,业务测试工作10000号中心负责客户解释工作网络监控中心业务运行记录、演练过程监控亿迅公司技术支持2.4. 演练时间安排演练序号演练预案演练时间范围备注123. 演练方案3.1. 演练方案1:应用服务器1(含接口)无法提供服务3.1.1. 目的模拟应用服务器1(含接口)宕机情况下,无法提供服务,在短时间完成故障处理,恢复业务。3.1.2. 注意事项演练过程影响应用服务器2(含后台独立进程)中断服务。3.1.3. 历时要求总历时:xx分钟以内。3.1.4. 参考操作步骤1、 通知业务支持中心准备开始进行演练,并作相关记录、观察。2、 模拟应用服务器1(含接口)宕机 3、 用ibss用户登陆应用服务器2(含后台独立进程)并停掉全部应用,执行命令如下:tmshutdown y w1cd /export/home/ibss/batchibsssupershell.sh stopall修改应用服务器2(含后台独立进程)的ip为应用服务器1(含接口)的ip,修改应用服务器2机的机器名为应用服务器1机的机器名。执行:ifconfig lan0:1 plumbifcofnig lan0:1 ibssapp1_ip netmask 255.255.255.0 uphostname 新主机名(注:应用服务器1的主机名)4、 修改应用服务器2机/export/home/ibss/batch目录下的配置文件:(注意以下凡是要修改配置文件,修改之前先作好备份)ibss_process_data 中:找到第一行,如:ibssapp2 /ip2:4888修改成应用服务器1的机器名和ip:端口(ibssapp1 /ip1:4888) 当前目录下tux.env 文件,修改下面内容相对的ip:wsnaddr=/ibssapp2_ip:4888改为: wsnaddr=/ ibssapp1_ip:4888imwsnaddr=/ ibssapp2_ip:4878 改为:imwsnaddr=/ibssapp1_ip:48785、 修改应用服务器2机器/export/home/ibss/config目录下ibss域的相关配置ibss域的ubb修改内容:ibssapp2 lmid=simple改为应用服务器1的机器名ibssapp1wsl srvgrp=wslgroup1 srvid=210 clopt=-a -t - -n / ibssapp2_ip:4888 -m 50 -m 100 -x 10 -t 10修改ip,为:wsl srvgrp=wslgroup1 srvid=210 clopt=-a -t - -n / ibssapp1_ip:4888 -m 50 -m 100 -x 10 -t 10重新编译ubb:tmloadcf y ubbibss域dmconfig文件的修改内容:simpapp nwaddr=/ibssapp2_ip:4688 nwdevice=/dev/tcp改为:simpapp nwaddr=/ibssapp1_ip:4688 nwdevice=/dev/tcp重新编译dmconfig:dmloadcf y dmconfigtux.env 文件中修改下面内容相对的ip:wsnaddr=/ ibssapp2_ip :4888; export wsnaddr改为: wsnaddr=/ ibssapp1_ip:4888; export wsnaddr6、 重新编译应用服务器2机器上接口域的域间通信dmconfig和ubb。7、 建立接口目录下的data目录的数据链接link。8、 将之前备份的应用服务器1机的crontab内容加进应用服务器2机的crontab里,运行crontab e进入编辑,增加和应用服务器1上一样的内容,保存退出即可。9、 全部启动应用服务器2上的ibss域和接口域的所有服务和后台独立进程、适配器进程、转换进程。进入目录:cd /export/home/ibss/config执行:. ./tux.env 执行:tmboot y进入目录:cd /export/home/ibss/batch 执行:ibsssupershell.sh startall进入目录:cd /export/home/intf/tuxedo/config 执行:. ./intf.envtmboot y进入目录:cd /export/home/intf/runprog/adapter 执行:adaptersupershell.sh startall进入目录:cd /export/home/intf/runprog/calltranall 执行:calltranallsupershell.sh startall10、 通知业务支持中心切换完毕,并进行业务方面的测试。11、 记录测试结果。12、 恢复系统运行。3.2. 演练方案2:应用服务器2(含后台独立进程)无法提供服务3.2.1. 目的模拟在ibss系统应用服务器2(含后台独立进程)宕机,无法提供服务,在短时间完成故障处理,恢复业务。3.2.2. 注意事项3.2.3. 历时要求总历时:xx分钟以内。3.2.4. 参考操作步骤1、 通知业务支持中心准备开始进行演练,并作相关记录、观察。2、 模拟应用服务器2(含后台独立进程)宕机3、 修改相关配置文件1) 修改应用服务器1(含接口)/export/home/ibss/batch目录下的配置文件: ibss_process_data 找到头一行:如:ibssapp2 /ip2:4888修改成应用服务器1(含接口)机器名和ip:端口(ibssapp1 /ip1:4888)tux.env 中修改下面内容相对的ip:wsnaddr=/ ibssapp2_ip:4888改为: wsnaddr=/ ibssapp1_ip 4888imwsnaddr=/ ibssapp2_ip:4878改为:imwsnaddr=/ ibssapp1_ip:48782) 建立将之前备份的应用服务器2机的crontab内容加进应用服务器1机的crontab里。3) 将/export/home/ibss/batch目录下程序赋予执行权限cd /export/home/ibss/batchchmod 755 *4) 启动此/export/home/ibss/batch目录下的独立进程:ibsssupershell.sh startall4、 通知业务支持中心切换完毕,并进行业务方面的测试。5、 记录测试结果。6、 恢复系统运行。3.3. 演练方案3:任意一台数据库服务器无法提供服务3.3.1. 目的模拟在ibss系统任意一台数据库服务器单机宕机情况下,实现在短时间完成故障处理,恢复业务。3.3.2. 注意事项演练过程影响部分连接到故障数据库服务器上的业务(部分业务需要重启,并再连接另一数据库)。3.3.3. 历时要求总历时:xx分钟以内。3.3.4. 参考操作步骤1、通知业务支持中心准备开始进行演练,并作相关记录、观察。2、模拟数据库服务器1(ibss1)宕机 (注:具体模拟方法可以考虑拔网线或者停数据库服务) 3、用oracle用户登陆两台中间件应用服务器1、2分别修改两台中间件应用服务器上面oracle客户端目录中的tnsnames.ora文件,将故障数据库主机的ip和实例名连接修改为正常的那台数据库2(ibss2)的连接。su oracle9icd $oracle_home/network/admin/tnsnames.ora修改tnsnames.ora文件vi tnsnames.ora将ibss1 = (description = (address_list = (address = (protocol = tcp)(host = ibss1)(port = 1521) ) (connect_data = (service_name = ibss1) ) )修改为:ibss1 = (description = (address_list = (address = (protocol = tcp)(host = ibss2)(port = 1521) ) (connect_data = (service_name = ibss2) ) ) (注:具体主机名、实例名请参照各本地网环境)4、重启中间件应用服务器1(含接口)的服务和进程进入目录:cd /export/home/ibss/config执行:. ./tux.env 执行:tmboot y进入目录:cd /export/home/intf/tuxedo/config 执行:. ./intf.envtmboot y进入目录:cd /export/home/intf/runprog/adapter 执行:adaptersupershell.sh startall进入目录:cd /export/home/intf/runprog/calltranall 执行:calltranallsupershell.sh startall5、重启中间件应用服务器2(含后台独立进程)的服务和进程进入目录:cd /export/home/ibss/config执行:. ./tux.env 执行:tmboot y进入目录:cd /export/home/ibss/batch 执行:ibsssupershell.sh startall6、通知业务支持中心切换完毕,并进行业务方面的测试。7、记录测试结果。8、恢复系统运行。3.4. 演练方案4:任意一台数据库和应用服务器1(含接口)无法提供服务3.4.1. 目的模拟在ibss系统任意一台数据库服务器以及应用服务器1(含接口)宕机况下,实现在短时间完成故障处理,恢复业务。3.4.2. 注意事项演练过程影响部分连接到故障数据库服务器上的业务(部分业务需要重启,并再连接另一数据库)。3.4.3. 历时要求总历时:xx分钟以内。3.4.4. 参考操作步骤1、通知业务支持中心准备开始进行演练,并作相关记录、观察。2、模拟应用服务器1(含接口)和任意一台数据库服务器宕机 3、参照演练方案1方式修改应用服务器2(含后台独立进程)上面的相关配置。4、参照演练方案3方式修改应用服务器2(含后台独立进程)上面的数据库连接配置。5、全部启动应用服务器2(含后台独立进程)上面的ibss服务和进程。6、通知业务支持中心切换完毕,并进行业务方面的测试。7、记录测试结果。8、恢复系统运行。3.5. 演练方案5:任意一台数据库和应用服务器2(含后台进程)无法提供服务3.5.1. 目的模拟在ibss系统任意一台数据库服务器以及应用服务器2(含后台独立进程)宕机情况下实现在短时间完成故障处理,恢复业务。3.5.2. 注意事项演练过程影响部分连接到故障数据库服务器上的业务(部分业务需要重启,并再连接另一数据库)。3.5.3. 历时要求总历时:xx分钟以内。3.5.4. 参考操作步骤1、通知业务支持中心准备开始进行演练,并作相关记录、观察。2、模拟应用服务器2(含后台独立进程)和任意一台数据库服务器宕机 3、参照演练方案2方式修改应用服务器1(含接口)上面的相关配置。4、参照演练方案3方式修改应用服务器1(含接口)上面的数据库连接配置。5、全部启动应用服务器1(含接口)上面的ibss后台服务和进程。6、通知业务支持中心切换完毕,并进行业务方面的测试。7、记录测试结果。8、恢复系统运行。3.6. 演练方案6:在应急环境下存储系统恢复性测试演练(it内控要求) 3.6.1. 目的模拟磁盘存储设备出现不可预知的问题导致配置信息或者数据丢失,利用备份好的数据进行恢复工作。3.6.2. 注意事项 首先应做好磁盘阵列备份工作,具体操作如下: 1)、配置信息备份磁盘阵列的备份需要通过手工方式将阵列信息及划分情况记录成文档,信息包括raid方式、lun的划分。以emc cx3-40为例,配置信息列表:配置项目设置raid类型raid 0+1lun 大小60g/个端口mapmap到所有端口连接主机ibssdb1,ibssdb2,ibssapp1,ibssapp2存储组存储组1(ibssdb1,ibssdb2,lun1-lun20)存储组2(ibssapp1,ibssapp2,lun21-lun40)操作系统中所使用的存储划分情况可用以下命令收集:sun平台: # vxprint ht hostname_vxprint.outhp平台: # vgdisplay v hostname_vgdisplay.outibm平台: #lsvg hostname_lsvg.out2)、数据备份l dp备份软件通过运行软件hp onmiback 6.0客户端软件backup选项在文件列表中选择备份策略进行备份(系统平时按定制的策略自动执行备份,也可进行手工备份)。备份内容备注/lbill一般每月备份一次l nbu备份软件打开nbu console,然后选择policies,选中文件系统的备份策略,然后选右键菜单的manual backup,做手工备份。3.6.3. 历时要求总历时:xx分钟以内。3.6.4. 参考操作步骤1)、配置信息恢复阵列配置信息的恢复需要建立在原来信息备份的基础上。阵列配置信息的备份主要是记录配置参数, 如果阵列出现配置信息丢失的情况,通过原来记录的配置参数文档重建raid及lun,划分给相应的主机使用即可。注意:配置信息的恢复操作存在不可逆性,出现此类故障时,建议在厂家的指导下进行。 2)、文件系统数据恢复阵列的文件系统数据出现丢失时,可以使用最近的备份进行恢复。由于阵列的数据量大,目前我们一般都通过备份软件(dp或nbu)采用磁带库进行数据备份。基于备份基础之上,如果出现数据丢失,按以下方法进行数据恢复:l dp恢复步骤通过运行软件hp onmiback 6.0客户端软件restore选项在文件列表中选择需要恢复的文件进行恢复。l nbu恢复步骤1. 先进入nbu console2. 选file菜单,选择backup、archive、restore进入到这个界面:选择file -specify netbackup machines and policy type选择恢复的server,source and destination client在这里server 选master,source client 选择

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论