下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
111计算机系统重大突发性事件应急预案第一章计算机系统重大突发性事件应急预案.说明华夏人寿保险股份有限公司信息系统应急方案是为了确保当华夏人寿关键系统发生故障或供应链因以外中断时,关键业务仍可继续运作,而预先制定和准备的一系列操作方案。本应急方案并不能代替解决问题的工作,它只提供一个最低可接受的服务水平,以便有充足的时间去修复出现故障的系统。其价值在于,计划和方案在危机出现前就已经制定好,能最大限度地争取时间。通过应急方案主动的有预见性的,而不是被动地仓促地对紧急情况做出反应。.应急方案的目标 /范围目标与范围(1)业务连续:确保华夏人寿的日常业务能够连续运行,不出现中断。在某些系统或子系统功能失效的情况下,关键系统不至于瘫痪,主要功能不会丧失。(2)降低风险:应急方案必须采取各种措施,把由于问题而产生的风险降到最低。(3)减少损失:对于可能产生的风险,采取技术和管理方面的补救措施,尽量将各种损失减少到最低。(4)避免灾害:尽量避免因为系统故障而产生灾害的高危系统造成的直接或间接影响,确保人民生命财产安全和社会稳定。目前,华夏人寿保险公司基于计算机和网络的业务处理系统主要包括核心业务系统、财务系统和办公系统。关键业务系统描述核心业务系统业务生产系统配置 1台8420服务器和1台7420,8420和7420分别划分两个硬件分区,一个硬件分区配置是 4、8G内存作为业务系统的数据库服务器,另一个硬件分区是 4、4G内存作为业务系统的应用服务器。一套磁盘阵列500,作为核心业务系统和财务系统 1/14的硬件支撑平台。另外配置一台3410作为核心业务系统及财务系统的测试服务器 ,运行非关键的开发和测试工作。财务系统财务系统安装在 1台4440服务器上,同时与核心业务系统共用一套磁盘阵列500。4440也划分两个硬件分区,一个硬件分区配置是 2、4G内存,运行财务系统的数据库,另一个硬件分区配置是 2、2G内存,运行财务系统的应用程序。核心业务系统的服务器与财务系统的服务器做双机互备,平时业务系统运行在8420上,财务系统运行在4440上,当一台服务器的一个分区发生故障时系统切换到另一台服务器的相应分区上运行。.应急团队组织结构应急方案都是在发生灾害的非常时期进行。因此,充足的人力资源配备和明确的责任分工显得尤为重要。如果没有一个组织有序的团队,很难保证灾难发生时能够在既定时间内完整、成功地实现灾难处理和业务恢复。从华夏自身来看,其实施应急的团队组成不仅要横跨各个部门,还要纵向包含省分和市分等多级机构。因此,合理地组织华夏各级机构的各个业务部门的人力资源,根据灾难恢复方案的需要明确各个团队成员分工,是保证应急方案顺利实施的基础。更重要的一点是,将各个组织部门的管理层纳入应急实施团队或至少得到他们的充分承诺是整个应急系统成功的关键因素之一。这里需要说明的是:由于灾难的偶然性和突发性,应急团队并不需要全职地投入到应急工作中。实际上,整个团队中除了应急实施负责人和协调人之外,其他成员在日常工作中都是兼职地加入应急团队,其担负的任务和责任也只是其日常工作地一部分而不是全部。但是,整个应急团队需要在建立和修订应急方案时全职地投入应急工作,这些工作至少持续到整个方案测试结束,以保证团队对应急方案的实施能力。团队负责人根据华夏的组织结构情况,设立应急负责人组成整个应急系统的最高管理层。应急负责人是整个应急系统的最高负责人,是具体实施 2/14应急的领导者。作用应急负责人全面负责整个华夏的业务持续和灾难恢复工作,包括方案制定、人员组织沟通、方案演练、文档和测试工作。应急负责人的主要作用就是保证华夏能够在发生灾难的情况下保持关键业务的持续运行,将灾难损失降低到最小程度。职责保持和本级高级管理层的联络; ?具体负责应急方案的制定和实施;保证所负责的区域内的灾难恢复和业务持续; ?共同保持整个华夏范围内的应急知识普及;?协同华夏各部门的应急工作。 ?3.2应急协调人作用具体联络相关小组实施应急负责人下达的各项任务,协调上下级之间和各部门之间的联络和协同,并且他们还要作为制定和实施应急方案的联络人。职责组织和协调所负责区域的应急相关的各项工作;?对本区域的人员进行相应的应急知识培训;?组织各部门的应急演习和评审;?联络和沟通本区域的各个部门以及外部供应商和服务商。?3.3灾难恢复小组灾难恢复小组是应急方案的具体执行者,负责执行和灾难恢复相关的具体职能。根据各项职能的要求,每个小组大约包括 3到5名成员,由组长负责本组的工作,并且在每个组中还要有一个候补的小组负责人。各个小组都需要由应急中心和所支持的省公司的相关人员共同组成,在灾难发生时共同利用应急中心的资源完成灾难恢复和业务延续。各个小组在应急负责人的领导下进行工作,通过应急协调人和各级部3/14门之间进行沟通。根据实际工作的需要,可以对小组的工作进行具体的详细划分,或者增加新的职能小组。3/14应急负责人、协调人和各小组的组长一起构成整个应急团队的管理层,由他们负责指导华夏应急方案的制定和实施。以下具体描述各小组的职能和组成。3.3.1设施恢复组设施恢复组负责监控本区域内所有的物理设施,包括平时的预防工作和灾难发生时的损失评估、保护、维修和转移,以及在应急管理层的指导下,进行灾难地和应急中心之间地物理设备切换。根据其职能,设施恢复组主要包括以下人员:设施规划和运行维护人员; ?资产管理和审计人员 ?供应商和服务商联络人员?设施相关的技术专家 ?安全管理人员 ?法律和保险管理人员 ?3.3.2行政管理组行政管理组负责为其他职能部门作好所需的后期保障工作,包括运输、安全保卫、资金、人员调配和公共关系等。行政管理组主要包括以下人员:具有足够资源调度授权的经理; ?运输、财务、人事、安全保卫、公共关系相关人员; ?外部服务商、 供应商联络人员;?行政助理?3.3.3系统恢复组系统恢复组负责保证支撑关键业务应用的平台系统的恢复,并及时提供给相关的业务部门。系统恢复组主要由以下人员组成:系统管理员?供应商联络人员 ?3.3.4通讯恢复组通讯恢复组负责维护和保障应急方案中的通讯需要,包括语音通 4/14讯和数据通讯,尤其是灾难恢复所需的指挥通讯和恢复关键业务应用所需的数据通讯。通常通讯恢复组需要借助第三方的网络供应商来完成所需的通讯保障工作。因此,通讯恢复组包括:网络及通讯系统维护人员 ?网络服务供应商联络人员; ?设备供应商联络人员;?3.3.5用户联络组用户联络组负责应急团队和各业务部门的沟通和联络,以使应急团队及时了解详细的灾难影响以及来自业务部门的需求,同时,也是业务部门了解应急团队的灾难恢复工作进展情况,帮助双方更准确地进行相应的决策。用户联络组人员组成:各业务部门代表 ?应用系统专家 ?3.3.6数据控制组数据控制组负责应急的数据备份和恢复工作,包括制定相应的备份计划、恢复优先级的评估以及恢复方式,并在灾难发生时负责实施相应的数据恢复工作。数据控制组由以下人员组成:数据控制经理; ?数据备份管理人员; ?备份介质管理人员;?原始单据管理人员; ?数据录入组织人员; ?3.3.7应用恢复组应用恢复组负责业务应用系统的恢复,这个小组和系统恢复组、数据实现业务的延续运行。控制组一起完成业务支撑应用系统的恢复工作,
实现业务的延续运行。应用恢复组的成员主要有:应用系统管理员;巧/14应用系统开发商维护人员;?3.3.8配合协作组配合协作组负责应用系统发生问题时,和其它恢复小组一起完成业务支撑系统的恢复工作。主要成员根据业务系统影响的范围而定,例如在与分公司、支公司或者营销部的某些业务受到影响时, 则需要当地技术人员的配合,一同完成业务系统的恢复工作。.关键业务监控技术平台针对华夏人寿业务系统技术新、规模大、可用性要求高、管理任务重的特点,华夏人寿除了配备了高素质的技术支持团队,而且采用了完整的数据库管理解决方案,能够完全满足寿险核心业务系统管理需求。.应急处理流程应急处理流程分为事件级别判定、事件处理及升级程序。事件级别判定事件级别定义:.序号事件级别颜色标识故障现象描述系统运行中断,对用户业务的运行有严红色1一级故障重影响。系统运行中断,对用户业务的运行有严红色1一级故障重影响。系统中重要功能受损、主要性能指标严橙色二级故障2重下降,影响和限制了部分业务运营。在系统主要功能及性能指标运行正常的 3三级故障黄色情况下,系统部分功能与性能受损对于华夏人寿重要的核心业务系统、财务系统,主机、数据库、网络系统有着至关重要的作用,根据事件级别的定义,主机、数据库、网络系统的事件级别判定标准如下:/14事件颜故障现象描主机系数据网标级红系统运行中断,核心业务核心交换机用户业务的运行机瘫痪故骨干网络线严重影响法正常使用不能使用橙系统中重要功能核心业务交换机或路损、主要性能指响应缓慢故器性能下降严重下降,影响慢、出现或者网络带限制了部分业务重报警信使用率超出营性等错误载能力误黄在系统主要功能核心主机故性能指标运行正本上正常基本正常常,但是出的情况下,系统作,但存网络数据偶硬件或系停顿等现象损级错误,得主机系行不够稳定性能有所降蓝在系统无故障或主机系统故影响用户业务运行正常,运行正常常,对网络的情况下,用户是在主机路使用或设系统的功能安装配置、性能优化置、或性数进行调整进使用方面提出技优化方面咨询服务要求要改进/14.2事件处理程序.事件预防措施类型事件紧急处理程序级机房强电停电,二关闭非关键业环服务器与相关检测,增加待时时统管理员联系好系统关机准备三司吸扫漏水警系统,加强切环管小面积漏水,水源房环境巡检,联系相关积1/,没有决问题及强、弱电模块防水工络设备的运机房漏水,漏水一司吸扫漏水警系统,加强切环水源房环境巡检,,水联系相关面积"决问题防水工电短路、弱电模不能正常通立即与集成商二业务生产主机、施行双机热备商联系报告故障加强系统巡检系主机宕份主机启动备统备加强系统巡检迅速与集成商一磁盘阵列宕系期进行诊断,和解决问备加强系统备份邮件系统故障,二加强系统巡检的用户联系软系内恢决问题,增加复件冗余措考虑硬件冗余三考虑线路冗余系商系统集成商线路出现故障,加强日常监小理时间超决问考虑硬件冗余二营8/14,系统集成商联商、公考虑线路冗余,连接的分系统公司解和原因加强日常监控聚端出现故系分析司汇决问题障,影响分公司通三考虑硬件冗余系统集成商商考虑线路冗余系线路出现故障,加强日常监决问小理时间超一考虑硬件冗余系统集成商聚端出现故障,考虑线路冗余商系加强日常监分公司的通决问二考虑硬件冗余并手动切换系加强日常监控系备份设统备立即与集成商台核心路由器考虑硬件冗余一借用设商联系系台核心交换机加强日常监控暂时恢复服务发生故统备对设备进行修复修改外网地址二安装防火务攻击出口堵事即联系集成商内部网络遭入侵一安装防火备份击的端口并教要日志文件厂商系集成商行分析和处理9/14.3事件处理时限和升级程序时一级故二级故三级故四级故相关业务部门相关业务部门3(分公司)主(分公司)主管高级工程(分公司)主管工程工程工程小信息技术部门分公司)主管级工程小分管信息工作信息技术部门(分公司)主高级工程公司领导(分公司息管理领(分公司)公司领信息技术部门小管高级工程2保监分管信息工作信息技术部门公司领导(分公司息管理领公司领4信息技术部 7信息技术部门司)信息管领导信息系统重大事项汇报制度第二章一、概述可能引起或已经产生严重不良后果的本制度定义了部门工作中,事项:包括重大项目和重大事故,统称为重大事项。本制度针对不同的情况规范了对此类事项的汇报过程和实施、处理途径。10/14目的制订本制度的目的是:改善部门内部沟通机制,保证部门负责 ?人对重大事项及其可能产生的不良影响有充分的了解。并在此基础上充分运用其岗位职能,协调组织重大项目的实施工作和重大事故的处理工作,从而最大限度的避免潜在隐患的发生、降低事故造成的影响。重点重大项目的汇报实施制度重点在于实施前的周密计划和严谨 ?设计、实施过程中的科学控制和严格测试。汇报内容重大事故的汇报处理制度重点在于汇报过程的及时、?的准确完整、处理过程的高效率和高质量、事故处理完成后的及时总结。二、重大事项的定义重大事项指部门日常工作中,可能引起或已经产生严重不良后果的事项,它包括重大项目和重大事故。(一)重大项目重大项目指具有较高复杂性的、实施细节比较陌生且有一定难度的,影响面较大的并且因为上述特点而存在较大的实施风险的工作。重大项目包括但不仅指如下工作:(1)核心业务系统更换或核心业务系统中重要功能的开发、改造:系统整体更替或改造、一级模块的整体改造(如保全流程改造),公用模块的开发、改造(如统一核保)或其他重要项目。(2)重要系统的硬件平台迁移,操作系统、应用服务器、数据库管理系统产品更替、版本升级或为了调整现有系统性能而修改系统配置和参数。(3)比较复杂的新型产品上线:现有系统不能完全支持,需要进行较大规模修改的新型产品(如万能险、投资连结险)。(4)办公系统、外挂业务系统的开发或重大改造。(5)对公司经营具有重要战略意义的项目(如数据仓库,,)。(二)重大事故重大事故在部门日常工作中因为各方面的原因造成或可能造成11/14严重不良影响的事件。重大事故包括但不仅指如下情况:(1)生产系统数据库或应用服务器非正常宕机:因为系统硬件故障、系统软件错误、恶意攻击或管理员操作失误导致系统较长时间(定义)无法正常使用。(2)生产系统数据严重错误:因为业务部门提供的数据错误、上传数据失误、手工操作数据失误,程序逻辑错误等原因造成的大量系统基础数据或业务数据错误,严重影响正常的业务结果(如大量的保单打印错误、收费、红利、生存金数据错误)。(3)公司网络大面积瘫痪或阻塞,严重影响生产系统、办公系统的运行:因为网络提供商的责任、主干线路或节点设备的物理损坏、恶意攻击等原因造成的公司网络的大面积瘫痪或阻塞导致生产系统、办公系统较长时间(定义)不能正常使用。(4)公司电脑系统的安全正在或可能受到严重的外来侵害:公司计算机系统自外部被攻破,遭到或即将遭受严重破坏。恶性计算机病毒在公司计算机系统内出现,已经或可能严重破坏公司计算机系统。(5)贵重设备、重要数据损坏或遗失。(6)各种原因造成的设备损坏或遗失、各种原因造成的备份数据损坏或遗失。三、重大事项的汇报(一)重大项目的汇报重大项目的汇报过程也是项目实施的前期准备过程。部门负责人指定的项目负责人有义务通过书面或当面报告,让部门负责人了解整个项目的内容、复杂程度、可能存在的风险等情况。必要时应该编写《项目可行性分析报告》。部门负责人确定某项目为重大项目后,项目负责人应该编写《项目计划书》。《项目计划书》应包括项目实施的目标,责任分解表,项目进度表,项目实施中各项责任的负责人,项目实施各阶段的关键指标及检测要点。项目负责人在编写完《项目计划书》后应该及时发送给部门负责人确认。项目负责人根据《项目计划书》和项目具体情况安排相关人员编12/14写项目实施方案和检测方案,对于项目实施一旦失败可能造成业务停顿等严重后果的项目还应编写《项目实施过程应急预案》。对于软件开发项目,实施方案指《需求规格说明书》和《概要设计》,检测方案指《内部测试计划书》;对于其他项目应该根据具体情况编制实施方案和检测方案。实施方案、检测方案和《项目实施过程应急预案》经部门负责人确认后,项目进入实施阶段。(二)重大事故的汇报当部门工作因为各方面的原因,不可避免的发生了重大事故时,部门内的每一位员工都有义务及时将事故原因和严重程度向部门负责人直接汇报。以便其对内协调相关资源及时解决问题,减少损失,杜绝后患;对外澄清事实,明确部门间责任,争取主动,体现部门整体工作效率。对于明显属于第二节中所列举的重大事故和其他可以肯定会产生严重不良影响的事故的必须在第一时间直接汇报; 对于无法直接确定为重大事故的,应先向相关人员报告,确定为重大事故后再汇报。对于尚未造成严重影响或错误正在发生的事故, 应该先设法阻止不良影响的蔓延,然后汇报,汇报后再设法彻底解决问题;对于已经产生严重后果的事故,应该在第一时间直
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年亲子园所特许经营协议
- 二零二五版环保管家技术服务合同样本:企业环保审计服务3篇
- 2025年度临床试验知识产权合同主体权益保护措施4篇
- 二零二五年度退休人员劳动解除合同及退休金领取及后续保障合同
- 2025年度临时工岗位临时性加班合同
- 2025年度电影演员演出合同书:科幻灾难片主演合约
- 2025年度门窗安装与智能化系统集成合同4篇
- 2025年度城市综合体门头租赁管理服务协议
- 二零二五年度C型钢智能化生产系统建设合同3篇
- 二零二五年度锂电池回收利用项目投资合作协议
- 二年级数学上册100道口算题大全 (每日一套共26套)
- 物流无人机垂直起降场选址与建设规范
- 肺炎临床路径
- 外科手术铺巾顺序
- 创新者的窘境读书课件
- 如何克服高中生的社交恐惧症
- 聚焦任务的学习设计作业改革新视角
- 移动商务内容运营(吴洪贵)任务三 APP的品牌建立与价值提供
- 电子竞技范文10篇
- 食堂服务质量控制方案与保障措施
- VI设计辅助图形设计(2022版)
评论
0/150
提交评论