门户网站运维投标方案(技术标)_第1页
门户网站运维投标方案(技术标)_第2页
门户网站运维投标方案(技术标)_第3页
门户网站运维投标方案(技术标)_第4页
门户网站运维投标方案(技术标)_第5页
已阅读5页,还剩414页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1门户网站运维投标方案 二、运维服务目标 第二节运维服务设想 二、运维服务计划 三、运维服务体系 第一节运维协作环境 第二节运维服务内容 二、日常巡检服务 三、网站安全服务 四、技术支持 2三、文档、流程、系统交接 四、运维对象调查及其内容再识别 五、交接工作总结会 第四节运维保障服务方案 一、系统安全性保障服务 二、系统稳定性保障服务 三、系统故障处理保障服务 四、系统突发事件处理保障服务 五、内容发布响应保障服务 六、网站运维文档保障服务 七、响应时间保障服务 八、日常工作管理保障服务 第五节售后服务保障方案 二、售后服务规范 三、售后服务方式及内容 四、售后服务流程及跟踪 五、售后服务保障措施 六、售后服务承诺 第三章项目应急方案 第一节应急总预案 一、应急预案编制 3二、救援流程 三、消防培训演练 四、常用急救常识培训 五、应急人员安排 六、应急指挥安排 七、其他应急培训演练 第二节意外触电应急预案 第三节设备故障应急预案 二、意外事件处理 第四节火灾应急预案 二、管理主体及职责 三、内部火警分级 四、火情报警 五、火警处理程序 第四章运维团队组织方案 第一节组织计划 二、工作岗位设置 4 二、培训的必要性 三、培训对象 四、培训计划 五、培训方式与内容 5简介6第一章项目整体服务设想第一节项目概述2.有效性原则7第二节运维服务设想(1)不间断服务提供7*24不间断服务,专人值守,监控网站。意外情况下,及(2)访问响应时间8(1)项目前期的准备工作,包括服务管理制度流程的建立、人(2)我方将在签订合同后的5个工作日内,提供详细的项目实施工作计划(包括:项目组成员、运维服务的内容、进度安排、应急预案等)。(1)启动阶段和运维体系的导入9(2)正常服务阶段2)正常的维护管理。3)风险评估。(3)收尾阶段段工作主要以总结为主)。这个阶段的主要工作是和客户充分沟通,1)收集服务期中各部分的服务文档资料。2)汇总、装订,提交用户并存档。3)项目评估、总结。4)向甲方或甲方指定的其他组织进行档案和知识转移,人员培XXX公司作为国内积极参与政府信息化建设的大型企业之一,长1)客户需求2)响应体系3)维护体系4)质量监督体系IT服务体系最终都可以通过本次项目ITIL(2)响应体系故障级别服务请求时间响应方式、时间一级故障服务台接到服务请求后,即刻响应,服务人员工作时间内马上到达现场,非工作时间1小时内到达,进行现场服务。二级故障服务台接到服务请求后,对于电话未解决故障,15分钟内再次回应,提供电话技术支持,工作时间内服务人员1小时到达现场。三级故障服务台接到服务请求后,30分钟内再次回应,提供电话技术支持,工作时间内服务人员2小时到达现场,或与用户协商(3)质量监督体系(1)导入ITIL是一个长期过程,运维初期,以"系统日常运行后,再关注运维服务的长期计划和改进,考虑服务提供"问题管理"流程,运维人员按照既定的流程,在"知识库”和“配置管理"的支持下,解决故障,并把积累的经验表1:系统运维故障级别定义故障级别服务请求时间响应方式、时间一级故障服务台接到服务请求后,即刻响应,服务人员工作时间内马上到达现场,非工作时间1小时内到达,进行现场服务。二级故障服务台接到服务请求后,对于电话未解决故障,15分钟内再次回应,提供电话技术支持,工作时间内服务人员1小时到达现场。三级故障服务台接到服务请求后,30分钟内再次回应,提供电话技术支持,工作时间内服务人员2小时到达现场,或与用户协商注:故障级别描述:一级故障是指系统发生严重故障,业务发生中断,或虽然业务未中断但已经无法保证及时、正确的情况,对用户业务的运行有严重影二级故障是指对于系统发生的非严重故障,业务并未中断,业务仍然及时、正确的情况,但性能有所下降。三级故障是指系统发生轻微的故障,系统有警告信息等,对系统没有较大影响的故障。3.系统运维制度建设在信息化运维中,制度建设是一道必要的保障。信息化不能一蹴而就,在信息化发展到一定阶段,建设重点应该要从系统实施转向以应用运维提升为主,运维质量保障、安全机制变得重要起来,这时除(1)转变运维观念,树立规范化意识。树立只有建立制度化的IT运维意识,才能在日常繁杂琐碎的工作中有效的区分任务的优先(2)建立事件处理流程,强化规范执行力度。首先需要建立故“三分建设,七分管理”,XXX公司采用多重管理制度,并加强(1)升级管理机制(2)报告系统1)突发事件管理报告2)问题管理报告(3)月、季度总结机制每月10日之前,具体时间可以与XXX信息中心协商确定。会前双方(4)客户满意度调查系统开始时间结束时间对主机设备使用评价□好口较好□一般口差对网络设备使用评价□好口较好□一般口差对运维服务人员评价□好口较好□一般口差对整体工作评价好口较好□一般口差评价人(签字):日期:年月日(5)事件信息发布通知1)事件内容。2)事件类型(一般、紧急)。3)发生的时间段。4)影响范围(部分、全部)。5)客户应采取措施(如需要的话)。(6)投诉管理3)运维商设立投诉专线受理甲方投诉。4)运维商在受理XXX用户投诉后的8个工作小时内向投诉方提(1)内部团队沟通1)在每个角色组或在特定系统工作的所有角色中每天或定期举3)在为从发布到生产所作的最后准备工作中与开发和部署组队4)实施阶段可以承担产品或系统的运行支持工作了,要分发和阅读(例如e-mail的格式编写)定期状态报告,提交给IT管理层,以及针对操作的关键绩效指标方面的业务内容(例如,依照服务级别协议的量度、服务台日志统计、项目目标实现进展等等)。(2)外部客户沟通1)会议或交谈2)工作联系单项目实施期间所有收发的工作联系单都代表着项目执行过程中3)电话或电话会议4)书面报告、备忘录和传真5)电子邮件确实保障项目走向成功呢?我们认为需要针对XXX门户网站运维项(1)机构保障(2)人员保障1)运维优秀人员2)核心人员备选3)凝聚人才的企业文化4)规范管理规避人员流动风险5)人员调动须经同意(3)培训和技术保障(4)积极参与XXX信息化建设1)参与统一规划管理2)参与其他系统建设第二章运维服务方案第一节运维协作环境二、提供临时驻场工位4至5个、网络接入端口、接入方式、内第二节运维服务内容一、网站内容保障服务XXX公司应遵照现行的XXX网站内容管理系列制度及工作流程完9.制作XXX网站工作简报(每月)。(1)设备运行物理状态(每月/次)。(2)电源稳定性和线路检查(每天/次)。(3)系统性能检查(每月/次)。(4)逻辑卷检查(每月/次)。(5)内存交换区检查(每月/次)。(6)系统硬件诊断(每月/次)。(7)数据安全存储检查(每天/次)。(8)数据备份状况(每天/次)。(9)系统错误报告的分析、记录和清理(每天/次)。(10)及时更换损坏的或有潜在故障的部件(每月/次)。(11)设备物理检查(包括机体、风扇、风道及过滤器等)与清洁(每月/次)。(12)针对巡检工作应提交完善的巡检报告,并且存档、编辑成日至少2次,分上下午分别进行。(1)提供故障报告等触发性报告。1)日常巡检报告等日常报告。2)周报、月报、季报、半年报、年报等总结性报告。3.硬件巡检列表(在用)序号设备型号设备用途数量(台)1234567894.虚拟机巡检列表(在用)序号123456789(2)网站安全性检查。作系统进行安全性检查以及进行系统杀毒。负责XXX内网论坛(6)数据库备份及备份验证2.XXX网站7X24小时网站监控服务(1)监控原则1)我们将对系统进行7*24不间断监控。2)监控岗保证一直有人值守。3)每日分别于上、下午对服务器进行巡检,并于当天提交运维(2)监控方案1)网站访问监控①响应时间B.监控详情:点击菜单"网站访问监控"-"网站访问监控详情",系统在列表中显示每个已经添加并指定需要监控的网址,并在列表中显示该网址的响应时间。C.数据采集:系统按照在"监控网址管理"中的设置,按指定间隔Ping出该网址的响应时间,并将数据保存至监控数据库中。②连接数每间隔指定时间,取得指定网站的连接数。A.监控详情:点击菜单“网站访问监控"-"网站访问监控详情”,系统在列表中显示每个已经添加并指定需要监控的网址,并在列表中显示该网址的当前连接数量。B.数据采集:系统按照在"监控网址管理"中的设置,按指定间隔测试该网址的当前连接数量,并将数据保存至监控数据库中。③网络流量每间隔指定时间,取得并统计指定网站的网络流量,上传和下载流量分别显示。A.监控详情:点击菜单"网站访问监控"-"网站访问监控详情",系统在列表中显示每个已经添加并指定需要监控的网址,并在列表中显示该网址的累计网络流量。B.数据采集:系统按照在“监控网址管理”中的设置,按指定间隔测试该网址的累计网络流量,并将数据保存至监控数据库中。④网站页面纠错在特定(或全部)页面嵌入脚本,当浏览的用户发现页面内容有误时提交后,管理员可以从此功能中发现有误的内容并根据实际情况A.监控详情:点击菜单"网站访问监控"一“网站内容纠错”,内容然后按一个快捷键(如Ctrl+Enter)提交,页面直接保存相关C.监控预警统计表:统计指定时段内,全部(或指定)网站中,已经产生的(邮件或短信)预警的次数。(蓝色)及告警级别(红色),达到告警级别后系统将按设置发送邮序号为顺序升序显示。勾选"是否监控"并保存后,系统开始以指定的频率读取相关的监控数值并保存。2)设备监控在设备监控界面中,列表显示了全部设备的最近一次监控情况,常等。可以在左上方选择不同的分组以关注不同分组的设备,也可以勾选右上方的“仅显示异常服务器”以迅速找到运行异常的设备。①Ping返回时间每隔一段时间,首先Ping设备判断设备是否能正常连接,以及连接所需的时长等,较长的返回时间或无响应通常表示设备可能已经A.监控详情:点击菜单“设备监控”一“设备监控详情”,系统在列表中显示每台已经添加并指定需要监控的计算机设备,并在列表显示该计算机设备的Ping返回时间。B.数据采集:系统按照在"监控设备管理"中的设置,按指定间隔读取该计算机设备的监控数值,并将数据保存至监控数据库中。每隔一段时间,检测目标计算机上CPU的使用率情况。CPU使用率反映的是当前CPU的繁忙程度。A.监控详情:点击菜单“设备监控”一“设备监控详情”,系统在列表中显示每台已经添加并指定需要监控的计算机设备,并在列表显示该计算机设备的CPU使用率情况。B.数据采集:系统按照在“监控设备管理”中的设置,按指定间隔读取该计算机设备的CPU使用率,并将数据保存至监控数据库中。每隔一段时间,检测目标计算机上CPU的负载情况。CPU负载指某段时间内占用CPU时间的进程和等待CPU时间的进程数,这里等待CPU时间的进程是指等待被唤醒的进程,不包括处于wait状态进程。A.监控详情:点击菜单“设备监控”一“设备监控详情”,系统在列表中显示每台已经添加并指定需要监控的计算机设备,并在列表显示该计算机设备的CPU负载情况。B.数据采集:系统按照在"监控设备管理"中的设置,按指定间隔读取该计算机设备的CPU负载,并将数据保存到监控数据库中。④内存使用率每隔一段时间,检测目标计算机上内存情况。内存使用率指已经使用的物理内存与全部物理内存的比率。A.监控详情:点击菜单“设备监控”一“设备监控详情”,系统在列表中显示每台已经添加并指定需要监控的计算机设备,并在列表显示该计算机设备的内存使用率情况。B.数据采集:系统按照在“监控设备管理”中的设置,按指定间隔读取该计算机设备的内存使用率,并将数据保存到监控数据库中。⑤磁盘空间使用率每隔指定时间,检测目标计算机上磁盘空间使用率情况。A.监控详情:点击菜单“设备监控”一“设备监控详情”,系统在列表中显示每台已经添加并指定需要监控的计算机设备,并在列表显示该计算机设备的磁盘使用率情况。B.数据采集:系统按照在"监控设备管理"中的设置,按指定间隔读取该计算机设备的磁盘使用率,并将数据保存到监控数据库中。⑥网络流量间隔指定时间,检测目标计算机上网络流量情况,包括网络上传流量与网络下载流量。流量可简略反映计算机的网络传输流量是否在A.监控详情:点击菜单“设备监控"一"设备监控详情”,系统在列表中显示每台已经添加并指定需要监控的计算机设备,并在列表显示该计算机设备的网络上传下载流量。B.数据采集:系统按照在"监控设备管理"中的设置,按指定间隔读取该计算机设备的网络流量,并将数据保存至监控数据库中。⑦系统进程数每隔一段时间,检测目标计算机上系统进程数量。系统进程数量表示当前监控的计算机在运行中的进程,进程越多,通常占用的CPUA.监控详情:点击菜单“设备监控”一“设备监控详情”,系统在列表中显示每台已经添加并指定需要监控的计算机设备,并显示该计算机设备的系统进程数量。B.数据采集:系统按照在"监控设备管理"中的设置,按指定间隔读取该计算机设备的,并将数据保存至监控数据库中。⑧统计分析针对设备监控中的各项指标进行统计分析,统计的条件包括时间范围、设备名称及指标值范围等。A.监控情况统计表:统计指定时段内,设备各项监控指标的监控B.监控指标趋势表:统计指定时段内,设备监控指标的统计值及趋势走向,同时以表格和图表形式展示。C.监控预警统计表:统计指定时段内,全部(或指定)设备中,已经产生的(邮件或短信)预警的次数。⑨监控设备管理A.添加需要监控的设备,从IP及端口唯一指定需要监控的设备,并加以描述。可以选择哪些设备需要发送告警信息。预警级别分为两级,预警级别(蓝色)及告警级别(红色,达到告警级别后系统将按设置发送邮件或短信对管理员进行提醒。B.可以更改每个网址的序号,在网址访问监控界面列表显示时,以序号为顺序升序显示。C.在列表中可以设置每个设备的分组信息,如“外网服务器”、“内网服务器"或"网络设备”,以查看监控情况时能迅速查看及判断设备监控情况。D.勾选“是否监控”并保存后,系统开始以指定的频率读取相关的监控数值并保存。3)应用服务监控在这种情况下可能需要通过TivoliPerformanceViewer工具来获得4)数据库监控(3)日常检查监测表格服务器服务器功能监测项目检测方法正常范围实测情况结果备注备务器IE浏览XXXXXX.正常iguard服务进程2正常程正常CPU及系统负载正常服务器服务器功能监测项目检测方法正常范围实测情况结果备注硬盘占用空闲正常内存占用G正常系统时间1--5分钟正常Iguard篡改日志pwarnalert.log正常用户登录情况ar/log/messages|10网段正常9公众参与平台IE浏览XXX88.19:正常CPU及系统负载正常硬盘占用空闲正常服务器服务器功能监测项目检测方法正常范围实测情况结果备注数据库进程正常0正常more/opt/WebSphere/AppServer/ImErr.log正常more/opt/WebSphere/AppSerSystemOut.log常正常正常服务器服务器功能监测项目检测方法正常范围实测情况结果备注WW.log端口监听情况运行正常正常用户登录情况ar/log/messages|10网段正常数据库进程正常WW.log正常Iguard篡改警告正常服务器服务器功能监测项目检测方法正常范围实测情况结果备注CPU及系统负载0-3正常硬盘占用空闲正常系统时间1--5分钟正常端口监听情况运行正常正常用户登录情况ar/log/messages|10网段正常0繁体版IE浏览正常CPU及系统负载正常硬盘空闲正常服务器服务器功能监测项目检测方法正常范围实测情况结果备注正常端口监听情况运行正常正常用户登录情况ar/log/messages|10网段正常pIE浏览正常正常日志正常Iguard篡改警告正常CPU及系统负载0-3正常内存占用硬盘占用空闲正常服务器服务器功能监测项目检测方法正常范围实测情况结果备注系统时间端口监听情况用户登录情况ar/log/messages|1新表单IE后台浏览XXX8.151:正常CPU及系统负载正常硬盘占用空闲正常tomcat进程正常数据库进正常服务器服务器功能监测项目检测方法正常范围实测情况结果备注程端口监听情况运行正常正常用户登录情况ar/log/messages|10网段正常3工业许可证IE后台浏览正常CPU及系统负载正常硬盘占用空闲正常tomcat进程t1正常数据库进程0正常服务器功能监测项目检测方法正常范围实测情况结果备注端口监听情况运行正常正常用户登录情况ar/log/messages|10网段正常IE浏览正常CPU及系统负载正常硬盘占用空闲正常正常程d2正常端口监听情况运行正常正常用户登录10网正常服务器服务器功能监测项目检测方法正常范围实测情况结果备注情况段XXX内网IE浏览正常CPU及系统负载正常硬盘占用空闲正常端口监听情况运行正常正常用户登录情况ar/log/messages|10网段正常流媒体服务IE浏览正常CPU及系统负载正常硬盘占用空闲正常正常服务器服务器功能监测项目检测方法正常范围实测情况结果备注wc-I程1正常端口监听情况运行正常正常用户登录情况ar/log/messages|10网段正常2XXX8.负载均衡IE管理XXX88.10:正常CPU及系统负载正常硬盘占用空闲正常正常端口监听运行正常服务器服务器功能监测项目正常范围实测情况结果备注情况正常统计用户连接数0正常用户登录情况10网段正常(1)阻断应用攻击(2)屏蔽安全隐患(3)防止网页篡改XXX公司按照XXX网站技术规范和安全管理规范,定期对服务器操作系统进行安全性检查以及进行系统杀毒。负责XXX内网论坛 毒,确保服务器设备正常,对具有安全隐患的设备及时更换,并向XXX相关领导及时汇报。服务器服务器功监测项目正常范围实测情况结果备注备能务器IE浏览正常iguard服务进程d2正常程0正常CPU及系统负载正常硬盘占用空闲正常内存占用G正常系统时间分钟正常Iguard篡改日志正常用户登录情况10网段正常9公众参与平台IE浏览正常CPU及系统负载正常硬盘占用空闲正常数据库进程0正常程t正常g正常正常正常mp/alertwww.log正常端口监听情况运行正常正常用户登录情况10网段正常IE浏览正常正常数据库进程正常g正常XXXwcm日志正常mp/alertwww.log正常Iguard篡改警告正常CPU及系统负载0-3正常硬盘占用空闲正常系统时间分钟正常端口监听情况运行正常正常用户登录情况10网段正常0繁体版IE浏览正常CPU及系统负载正常硬盘占用空闲正常0正常端口监听情况运行正常正常用户登录情况10网段正常数据库数据库进程wWW.log CPU及系统负载硬盘占用内存占用内存异常情况系统时间端口监听情况用户登录情况1新表单IE后台浏览XXX8.151:正常CPU及系统负载正常硬盘占用空闲正常tomcat进程here正常数据库进程0正常端口监听情况运行正常正常用户登录情况10网段正常3工业许可证IE后台浏览ch/gyxkz/正常CPU及系统负载正常硬盘占用空闲正常tomcat进程1正常数据库进程正常端口监听情况运行正常正常用户登录情况10网段正常SIE浏览正常CPU及系统负载正常硬盘占用空闲正常正常2正常d端口监听情况运行正常正常用户登录情况10网段正常XXX内网IE浏览正常CPU及系统负载正常硬盘占用空闲正常端口监听情况运行正常正常用户登录情况10网段正常流媒IE浏览正常体服务CPU及系统负载正常硬盘占用空闲正常0正常程t1正常d2正常端口监听情况运行正常正常用户登录情况10网段正常21负载均衡IE管理XXX88.10:正常CPU及系统正常负载硬盘占用空闲正常0正常端口监听情况运行正常正常统计用户连接数正常用户登录情况10网段正常5.数据库备份及备份验证XXX公司按照XXX网站技术规范和安全管理规范,制定科学有效(1)爱数容灾备份:1)系统备份:按每个月对服务器进行系统备份一次,关键业务系统备份1个月,非关键业务系统备份1个月。2)文件备份:按每月进行一次服务器完全备份,重要服务器每天有1次增量备份,非关键业务每周进行1次增量备份。部分业务占用存储量会按空间进行相应调整。3)数据库备份:每天进行增量备份,每周进行一次完整备份。部分关键业务可以进行两次完整备份。(2)服务器数据备份:1)备份数据按每日备份一次。备份到存贮空间服务器的备份数据存放期为一个月,本机备份数据存放期为一年,备份数据保存量由各个服务器的可用空间决定。2)备份数据按每日备份一次。备份到存贮空间服务器的备份数据存放期为一个星期,本机备份数据存放期为一年,备份数据保存量由各个服务器的可用空间决定。3)备份数据按每日备份一次。备份到存贮空间服务器的备份数据存放期为一个星期,本机备份数据存放期为一个月,备份数据保存量由各个服务器的可用空间决定。①XXX网站内网论坛管理服务器相关应用数据及mysq1数据。⑤全国工业生产许可证查询服务器相关应用数据及oracle数6.应对黑客攻击XXX公司按照XXX网站技术规范和安全管理规范进行应对黑客攻击,保证网站防篡改系统正常运行且发挥作用,确保XXX网站不被黑客攻破,防止黑客篡改网站内容及数据的破坏。XXX公司定期监控系统访问记录,及时查找异常访问记录并查找原因,消除隐患。并及时修复不安全漏洞,消除隐患。定期出具服务器运行情况及被攻击情况报告。(1)工作时间内,发现黑客攻击应在第一时间通知具体责任人。具体责任人接到通知后,应详细记录有关现象和显示器上出现的信息,将被攻击的服务器等设备从网络中隔离出来,保护现场。同时通知总负责人,召集相关技术人员共同分析攻击现象,提供主机系统管理员和应用软件系统管理员负责被攻击或破坏系统的恢复与重建工作。视情况向部领导汇报事件情况。(2)非工作时间内发现的攻击事件,值班人员应首先立即切断被攻击外网服务器的网络连接,并做好相关记录。然后通知具体责任7.网站故障处理网站在运维过程中出现的系统故障,XXX公司应进行紧急处理和大故障要在1小时内恢复XXX网站页面的正常浏览。对于特别重大而涉及面广的安全事件,要在4小时内恢复XXX网站页面的正常浏览。(1)事件定级级)、重大(Ⅱ级)和特别重大(I级)。①一般(IV级):指能够导致较小影响或破坏的信息安全事件。②较大(III级):指能够导致较严重影响或破坏的信息安全事③重大(Ⅱ级):指能够导致严重影响或破坏的信息安全事件。④特别重大(I级):指能够导致特别严重影响或破坏的信息安2)对于处理故障时,遇到信息安全突发事件按以下四个级别执①一般(IV级),处理故障时间不能超过4个小时。②较大(III级),处理故障时间不能超过8个小时。③重大(Ⅱ级),处理故障时间不能超过12个小时。④特别重大(I级),处理故障时间不应超过24小时。⑤故障解决后24小时内,提交故障处理报告。说明故障种类、(2)应急处理流程“IV/一般”级别的信息安全事件由部门通过预警信息沟通,自级/特别重大"级别的信息安全事件的报告时,应报请网站处领导,1)项目实施小组向网站处领导通报信息安全事件情况,得到指2)项目实施小组及时向网站处领导报告信息安全事件的发展情(3)组织机构与职责1)应急处理领导小组2)值班巡检小组3)应急处理小组4)系统运维小组(4)预案启动前提击等故障现象,经验证之后立刻给网站管理处丰处(丰苏)、单处、(5)现场故障排查详细流程1)接到报警①当收到网景盛世发送的服务器报警短信息后,第一时间联系丰处,请示相应处理意见。如有网络可以进行相关页面查看,查看是否2)业务排查①查看服务器是否正常连通,进行相关服务器ping服务(如:pingXXX8.22)。②如果正常能够ping通,进行访问服务器的进程是不是正常③查看服务器的相关进程是不是正常启动。3)查看网站情况是否正常明属于网络的问题,如果不正常说明是服务器的问题。③查看一下cpu及其负载情况。查看命令为:top是不是负载过高引起系统运转缓慢。④看一下硬盘占用空间是不是已经满了。查看命令为:df-h查看空间是不是已经写满。⑤查看内存情况是不是有剩余,查看命令为:free。more/usr/local/iguard/syncserver/logs/syncd.log查看有无异常4)如果apache服务有问题,可以进行重新启动,命令如下:①servicehttpdstop(apache关闭)。③如果iguard进程出现问题,可以联系相关iguard厂商协助解5)查看发布平台服务正常,如果不能访问需要查看相应服务器服务是否正常。②登陆XXX.153查看tomcat进程是psefgrepTomcat④.start.sh进行启动⑥如igurad不正常可以联系iguard工程师协助解决。⑦如遇到重大情况无法及时解决,将发布系统维护中index.htm页面暂时替换首页进行发布。等待问题解决后,按领导指示进行相应⑧查看iguard日志文件⑨cd/usr/local/iguardstagingdlogs⑩查看相应的日志文件alert-201209XX。log进行分析。6)查看wcm日志文件②查看cpu及其负载状况:执行命令为:top,查看是否运转正④查看监听情况,执行命令为:netstat-ntlp查看22端口和80端口是否正常。7)查看发布平台数据库①查看oracle进程:执行命令为:B.ps-ef|grepLISTENER查看监听是否正常③查看相应日志文件tailhomeoracleadminWWWbdumpalertWWW(6)数据备份1)XXX数据库文件已经备份到XXX.150服务器oracle用户下2)XXX网页文件备份到XXX.153服务器/home/liyonghong/目录3)数据库文件可以拷贝到XXX8.22数据库服务器作为XXX.150数据库服务器备份。4)临时可以应用作为XXX.150服务器硬件故障的补充。(7)应急处置工作要求发生安全事件时,应急处置工作人员30分钟内到达现场(判断为黑客攻击情况,并得到领导指示,可用vpn关闭XXX8.11和XXX8.12),一般情况下一小时内解决故障,恢复运行。对于有些特别重大而涉及面广的安全事件,也要在4小时内解决,不能解决的要及时上报中心领导,并说明原因和处理办法,需要请求中心支援的及时向中心领导报告。(8)常见故障诊断及处理1)服务器物理设备故障①故障现象服务器无法正常连接,且设备面板指示灯有异常提示(细节参考服务器随机文档)。②检查及处理方式A.观察服务器指示灯信号,并根据设备随机手册查找故障说明。B.处理方式——检查设备的网线、电源线、光纤线缆是否松脱。C.如外接设备无松脱现象,应尽快联系设备售后服务机构现场处理,不得随意拆卸设备部件自行维修。2)网络设备/链路故障注:此类故障发生概率一般较小,且通常会被总部先监控到。但当发生网站无法访问的故障时,维护人员应先排除是否有此类故障的可能性之后,再进行下一步排查工作。①故障现象互联网访问链路中断,网站服务器无法被外部访问到。故障现象是内网访问网站正常,但不能通过互联网访问网站。②检查及处理方式A.检查服务器自身服务是否正常运行。B.在服务器控制台桌面(注意:指通过服务器设备直连的显示器、键盘、鼠标等设备访问服务器)。C.打开IE或其他web浏览器,访问XXX88.10,如能正常显示首页,则表示服务器自身服务运行正常,可能是网络故障引起。D.在监控终端中,使用如下命令:pingXXX.47。pingXXX.49。③如果返回超时,则表明网络故障可能发生在机房,请联系运行④如果返回正常,则表明网络故障可能发生在上一环节,可能是前端的负载均衡设备工作异常或网络链路中断,请同时联系运行处处3)XXX网站未能正常运行①故障分析A.当前网络环境正常,但无法通过内、外网访问网站首页。客户端浏览器显示网站无法访问之类的错误提示。B.导致该故障的可能原因有:服务未启动或启动了错误的Apache版本。系统自带软件防火墙或安全策略干扰。②检查及处理方式检查服务器自身服务是否正常运行。分别登录到两台Web服务器(XXX.47/XXXSSH或服务器控制台终端,并切换到root账户,输入如下命令:如果返回结果表明无httpd进程运行,需要重启Apache服务,如经过以上方式的排查,仍未能解决问题,则可能是Apache配置错误导致网站服务工作不正常,可通过errorlog文件进行详细检4)XXX网站响应缓慢①故障分析A.网站能访问,但响应极其缓慢,打开网页时间远超正常范围。B.导致该故障的可能原因有:C.服务器磁盘设备故障导致I/0性能低下。D.服务器网卡故障。E.网络设备或线路繁忙。F.服务器忙于处理大规模的并发请求(很可能是DDoS攻击)。G.IHS自身不稳定导致资源耗尽而不能正常工作。②检查及处理方式A.检查机房网管监控中是否有网络流量异常现象。B.检查服务器硬盘指示灯是否有故障提示。C.检查当前的CPU和内容占用情况,观察httpd进程是否占用资源过多,操作命令:检查服务器当前tcp连接情况,观察对80端口的访问请求是否过多(正常情况一般在1000以下)。A.统计访问日志中的IP地址,观察是否有可疑的IP活动(访问次数明显过高)。cataccesslogawkprintsortuniqsortC.断开网线后,在服务器控制台桌面访问XXX88.10,如果访问速度正常,则表明服务器软、硬件工作正常。5)XXX网站页面更新不及时①故障分析A.网站能访问,但网站中页面与后台发布信息不一致。B.导致该故障的可能原因有:WCM发布引擎未能正常生成HTML静态页面。文件未能正常同步到web服务器中。未能正常监控到WCM发布目录中文件变化情况。②检查及处理方式A.直接访问WCM服务器XXX88.10,检查页面是否更新正常。B.如果WCM服务器中网页也未能正常更新,可重新在WCM中发布页面,或重新启动WCM服务器。C.如果WCM服务器中网页更新正常,则登录到XXX.153服务器SSH终端,检查文件iguard服务是否工作正常:D.如该服务未能正常启动,可通过如下命令启动:usrlocaliguardstagingdadmtoolstartE.如果监控服务已经在运行,则检查web服务器端iguard服务F.通过SSH终端登录到XXX.47/XXX.49中,检查iguard服务是否工作正常。如iguard服务未工作,可启动iguard服务。usrlocaliguardsyncserveradmtoolstartG.如以上方式均检查无问题,可在iguard服务器端,运行同步命令强制同步,并观察是否有错误信息输出。同时检查webiguard服务器端口是否有错误提示。6)搜索引擎工作不正常①故障分析A.网站能访问,但网站搜索引擎页面出现错误信息且无法正常返B.导致该故障的可能原因有:搜索引擎中未正常配置搜索相关路径反向代理。搜索引擎服务运行故障。②检查及处理方式A.检查IHS配置文件是否加入对XXX8.21服务器的反向代理。B.vi/etc/httpd/conf/httpd.conf。C.如未能加入,则加入相关配置后重新运行Apache。E.如已经正确配置,则检查文本搜索引擎是否工作正常,并重启相关服务。7)WCM集群版中用户文件不一致①故障分析A.用户上传的文件无法正常访问。B.导致该故障的可能原因有:WCM集群中的应用通过NFS方式共享文件,如果某一节点中未能目录,则可能造成用户无法访问上传的文件。②检查及处理方式A.分别登录到XXX.20和XXX.42服务器中,检查相关目录是否绑optXXXWCMVWCMDataoptXXXWCMVWCMData8)WCM集群中应用工作不正常E.opt/XXXWCMVTomcatbinstartsh9)网站页面异常郑工打电话报告情况,判断为黑客攻击情况得到领导指示,可先用vpn关闭XXX8.11和XXX8.12,并第一时间赶到现场。②检查及处理方式A.查看服务器是否正常连通,进行相关服务器ping服务(如:pingXXX8.22)B.如果正常能够ping通,进行访问服务器的进程是不是正常C.查看服务器的相关进程是不是正常启动。D.查看网站情况是否正常:a.内网浏览器访问XXX8.47和XXX8.49是不是正常,如果正常说明属于网络的问题,如果不正常说明是服务器的问题。高引起系统运转缓慢。d.查看一下硬盘占用空间是不是已经满了。查看命令为:df-h查看空间是不是已经写满。more/usr/local/iguard/syncserver/logs/syncd.log查看有无异常E.如果apache服务有问题,可以进行重新启动,命令如下:(4)其它(1)做好标记,方便维护(3)防电磁干扰(5)做好防雷击措施(6)防断电(7)尽量避免撞击、震荡2)对于一些气候干燥的地方(如北方地区)在干燥季节应适当(10)其他运行维护方案3)让路由器远离灰尘的烦嚣。4)注意安全防范。(1)配置信息表(2)用户权限检查(3)系统服务检查(4)系统状态指示灯(5)文件系统空间使用情况命令查看文件系统的使用率,如果所有文件系统的使用率小于96%,等于96%,则在报告上标明异常。并通知此系统负责人。如果有文件系统的使用率达到100%,要立即通知此系统负责人。如果有文件系统的使用率虽然没有达到96%,但其使用率每天增长超过2%,则需要(7)错误日志(8)双机热备软件运行情况检测(9)系统整体使用情况周报(10)系统备份为了对主机操作系统做磁带备份,以备系统崩溃时可以快速恢(11)填写报告1)对于硬件故障,需填写《故障记录单》。2)对于系统参数调整,需填写《系统调整记录单》。(1)不需停止应用的参数修改1)备件支持在线更换。2)参数修改可立即生效,且不影响应用软件的正常使用。3)负责工程师与厂家工程师确定。(2)需要停止应用的修改(3)不需停止应用的维护(4)需要停止应用的维护(5)填写报告1)对于硬件故障,需填写《故障记录单》。2)对于系统参数调整,需填写《系统调整记录单》。每天定时登陆各数据库服务器,通过sql语句检查数据库(2)检查警告日志等文件(3)检查SQL*NET日志文件(4)检查数据库会话情况(5)检查表空间使用情况(6)监控数据库文件状态间数据文件的使用情况(数据文件名称、状态),并填写每日数据库(9)监控数据库联机日志(10)监控数据库JOB(11)监控数据库数据文件的I0情况件IO是否正常(数据文件名、物理读,物理写),并填写每日数据(12)检查文件系统使用情况(13)监控数据库服务器性能每天定时登陆各数据库服务器,通过使用vmstat,iostat,(14)逻辑备份(15)逻辑备份恢复测试(16)检查对象增长情况(17)监控topsql情况(18)数据库空间扩展每周根据每天的表空间增长情况报告分析出合理的表空间增长(19)系统健康检查(20)检查无效对象(21)将所有的警告日志存档(22)物理备份第三节运维服务交接第四节运维保障服务方案(1)确保网站能够正常访问。确保网站内容正确,同要求发布(2)积极配合XXX信息中心网站运行处对所涉及网络的调试工(1)确保网站数据正确,发布的信息同要求发布的信息一致。(2)采用有效的、多层次的策略和技术,鉴别登录者身份和保(3)采用有效的、多层次的策略和技术,对系统数据和信息的(4)采用有效的、全面的系统日志管理机制。(5)建立有效的、全面的灾难备份恢复机制和措施。(6)建立有效的、全面的网站内容审核发布机制。(1)建立有效的、全面的机房访问控制制度并落实到位。(2)建立有效的、全面的备份与恢复方面的管理措施。(3)建立有效的、全面的设备故障处理措施。(4)其他涉及机房安全的规范制度,遵照机房管理部门制定的(5)机房访问控制1)机房作为设备的集中地,对于进入有严格的要求。2)只有授予权限的系统管理员及数据库管理员才有权限进入机3)外来人员进入机房,须有管理人员全程陪同并书面记录进出4)严格遵守XXX信息中心机房管理制度。(6)备份与恢复1)明确需要定期备份的重要业务数据、系统数据等。4)定期执行恢复程序,检查并测试备份介质的有效性,确保可(7)密码保护1)禁止明文显示密码,应使用相同位数的同一特殊字符(例如*和#)代替。2)密码应有复杂度的要求,包括:①长度至少6位,支持字母和数字共同组成。1)会话安全:2)防止感信息泄露:3)防止SQL注入攻击:②禁止仅在客户端以脚本形式对客户的输入进行合法性判断和4)防止跨站脚本攻击:应通过严格限制客户端可提交的数据类型以及对提交的数据进5)防止拒绝服务攻击:4.数据安全(1)日志管理1)严格控制系统日志的访问权限,只有工作需要并通过审批的2)定期检查日志,对其中可疑的记录进行分析审核。3)及时将日志备份到其他服务器或安全介质内。(2)灾难备份和恢复1)应建立重要数据的定期数据备份机制,至少每天进行一次数2)应对系统数据进行异地的备份。3)应制定灾难恢复计划并定期进行测试,确保各个恢复程序的(3)应急数据备份1)应在XXX门户网站内容管理平台统一的应急预案框架下,制2)应对门户网站相关人员进行应急预案培训。3)应制定应急预案演练计划,定期对门户网站群应急预案进行(4)网站内容1)应按XXX信息中心网站管理处的要求对上网发布的内容进行4)信息发布内容不要添加不必要的外部链接。5)各部门内容保障人员对本部门网站维护的内容信息,必须在本地保存至少3个月以上。6)另我公司承诺在参与本项目过程中,对于XXX信息中心提供的任何形式的任何信息(包括技术信息和内容信息)均为保密信息,7)本项目终止或XXX信息中心提出书面要求后,我方将立即销(1)超级用户的口令要求不能过于简单,长度不能小于8个字(3)创建普通工作用户,该用户将用于日常操作检查等。(4)关闭FTP服务,日常服务器将关闭FTP服务,如果需要有时打开FTP服务,文件上传完成后,关闭FTP服务。和sys,口令长度要求不能过短,至少大于8个字符,并且字母数字XXX公司按照XXX对网站稳定性的服务要求,采用人工或技术手段对网站系统的相关指标(页面响应时间、CPU及内存占用率)进行(1)我们将对系统进行7*24不间断监控。(2)监控岗保证一直有人值守。(3)每日分别于上、下午对服务器进行巡检,并于当天提交运(1)网站访问1)响应时间②监控详情:点击菜单"网站访问监控"-"网站访问监控详情",③数据采集:系统按照在"监控网址管理"中的设置,按指定间2)连接数①监控详情:点击菜单"网站访问监控"一"网站访问监控详情",②数据采集:系统按照在"监控网址管理"中的设置,按指定间3)网络流量①监控详情:点击菜单"网站访问监控"-"网站访问监控详情",4)网站页面纠错在特定(或全部)页面嵌入脚本,当浏览的用户发现页面内容有①监控详情:点击菜单“网站访问监控”一“网站内容纠错”,系统在列表中按日期显示每个页面链接及提交的错误内容,以供管理②数据采集:当浏览的用户发现页面内容有误时,可以通过选中内容然后按一个快捷键(如Ctrl+Enter)提交,页面直接保存相关信息至数据表中。5)统计分析针对网站监控中的各项指标进行统计分析,统计的条件包括时间范围、网址及指标值范围等。①监控情况统计表:统计指定时段内,网站各项监控指标的监控②监控预警趋势表:统计指定时段内,网站监控指标的统计值及趋势走向,同时以表格和图表形式展示。③监控预警统计表:统计指定时段内,全部(或指定)网站中,已经产生的(邮件或短信)预警的次数。6)监控网站管理①添加需要监控的网站,从网址或IP确定需要监控的网站页面。可以选择哪些设备需要发送告警信息。预警级别分为两级,预警级别 (蓝色)及告警级别(红色),达到告警级别后系统将按设置发送邮件或短信对管理员进行提醒。②可以更改每个网址的序号,在网址访问监控界面列表显示时,以序号为顺序升序显示。勾选“是否监控”并保存后,系统开始以指(2)设备访问②数据采集:系统按照在"监控设备管理"中的设置,按指定间②数据采集:系统按照在"监控设备管理"中的设置,按指定间②数据采集:系统按照在"监控设备管理"中的设置,按指定间4)内存使用率5)磁盘空间使用率6)网络流量7)系统进程数8)统计分析③监控预警统计表:统计指定时段内,全部(或指定)设备中,已经产生的(邮件或短信)预警的次数。9)监控设备管理级,预警级别(蓝色)及告警级别(红色,达到告警级别后系统将按③在列表中可以设置每个设备的分组信息,如“外网服务器”"内网服务器"或“网络设备”,以查看监控情况时能迅速查看及判(3)应用服务访问1)监控指定应用服务(如Apache、WebSphere及Tomcat等)的(4)数据库访问进一步完善XXX政府网站运维项目网络与信息安全突(1)初步诊断,及时汇报(2)判断级别、启动预案运维项目组应急领导小组和相关业务部门根据监控人员汇总的(3)严格执行节日值班制度员及公司相关人员的手机24小时开机,随叫随到。XXX公司按照XXX网站技术规范和安全管理规XXX公司定期监控系统访问记录,及时查找异常访问记录主机系统管理员和应用软件系统管理员负责被攻击或破坏系统的恢(2)非工作时间内发现的攻击事件,值班人员应首先立即切断(1)页面被篡改、出现非法言论(2)网站无法访问1)发现网站无法访问的情况后,立即通知具体负责人。2)具体负责人接到通知后,应及时确定故障原因。如因主机设备或软件系统故障导致且不能在2小时内解决,应及时启动备用网(3)服务器物理设备故障1)故障现象服务器随机文档)。2)检查及处理方式(4)网络设备/链路故障1)故障现象2)检查及处理方式键盘、鼠标等设备访问服务器)。③打开IE或其他web浏览器,访问XXX88.10,如能正常显示首页,则表示服务器自身服务运行正常,可能是网络故障引起。④在监控终端中,使用如下命令:⑤如果返回超时,则表明网络故障可能发生在机房,请联系运行⑥如果返回正常,则表明网络故障可能发生在上一环节,可能是前端的负载均衡设备工作异常或网络链路中断,请同时联系运行处处(5)XXX网站不能正常运行1)故障分析①当前网络环境正常,但无法通过内、外网访问网站首页。客户端浏览器显示网站无法访问之类的错误提示。②导致该故障的可能原因有:A.服务未启动或启动了错误的Apache版本。B.系统自带软件防火墙或安全策略干扰2)检查及处理方式①检查服务器自身服务是否正常运行端或服务器控制台终端,并切换到root账户,输入如下命令:③如果返回结果表明无httpd进程运行,需要重启Apache服务,④如经过以上方式的排查,仍未能解决问题,则可能是Apache配置错误导致网站服务工作不正常,可通过errorlog文件进行详细检查。1)故障分析①网站能访问,但响应极其缓慢,打开网页时间远超正常范围。②导致该故障的可能原因有:A.服务器磁盘设备故障导致I/0性能低下。B.服务器网卡故障。C.网络设备或线路繁忙。D.服务器忙于处理大规模的并发请求(很可能是DDoS攻击)。E.IHS自身不稳定导致资源耗尽而不能正常工作。2)检查及处理方式①检查机房网管监控中是否有网络流量异常现象。②检查服务器硬盘指示灯是否有故障提示。③检查当前的CPU和内容占用情况,观察httpd进程源过多,操作命令:检查服务器当前tcp连接情况,观察对80端口的访问请求是否过多(正常情况一般在1000以下)。统计访问日志中的IP地址,观察是否有可疑的IP活动(访问次数明显过高)。cataccesslogawkprintsortu1)故障分析C.未能正常监控到WCM发布目录中文件变化情况。2)检查及处理方式psaux|grepiguard④如该服务未能正常启动,可通过如下命令启动:/usrlocaliguardstagingdadmtoolstart⑤如果监控服务已经在运行,则检查web服务器端iguard服务是否工作正常。否工作正常⑦如iguard服务未工作,可启动iguard服务/usrlocaliguardsyncserveradmtoolstart⑧如以上方式均检查无问题,可在iguard服务器端,运行同步命令强制同步,并观察是否有错误信息输出。⑨同时检查webiguard服务器端口是否有错误提示。(8)搜索引擎工作不正常1)故障分析①网站能访问,但网站搜索引擎页面出现错误信息且无法正常返②导致该故障的可能原因有:A.搜索引擎中未正常配置搜索相关路径反向代理。B.搜索引擎服务运行故障。2)检查及处理方式A.检查IHS配置文件是否加入对XXX8.21服务器的反向代理vi/etc/httpd/conf/httpd.conf。B.如未能加入,则加入相关配置后重新运行ApacheC.如已经正确配置,则检查文本搜索引擎是否工作正常,并重启相关服务。(9)WCM集群版中用户文件不一致1)故障分析①用户上传的文件无法正常访问。②导致该故障的可能原因有:A.WCM集群中的应用通过NFS方式共享文件,如果某一节点中未能正常mount上/optXXXWCMVWCMDataB.目录,则可能造成用户无法访问上传的文件。2)检查及处理方式①分别登录到XXX.20和XXX.42服务器中,检查相关目录是否绑定到NAS存储中。如发现未能正常绑定,则重新运行mount命令。(10)WCM集群中应用工作不正常1)故障分析①网站能访问,但登录“工作平台”出现系统异常页面。②导致该故障的可能原因有:WCM集群中的应用工作不正常。2)检查及处理方式②重新启动BoptXXXWCMVTomcatbinstartsh(11)网站页面异常1)故障分析①接网景盛世公司报警电话,系统工程师迅速做出判断并验证故②例如:发现XXX网站页面和各司局站点页面无法浏览。被黑客攻击等故障现象,经验证之后立刻给网站管理处丰处(丰苏)、单处、郑工打电话报告情况,判断为黑客攻击情况得到领导指示,可先用vpn关闭XXX8.11和XXX8.12,并第一时间赶到现场。2)检查及处理方式①查看服务器是否正常连通,进行相关服务器ping服务(如:pingXXX8.22)。②如果正常能够ping通,进行访问服务器的进程是不是正常③查看服务器的相关进程是不是正常启动。④查看网站情况是否正常:more/usr/local/iguard/syncserver/logs/syncd.log查看有无异常XXX公司遵照现行的XXX网站内容管理系列制度及工作流程完成2.XXX英文版网站内容维护,包括网站内容翻7.国家重大节日、重大会议、重大事件期间的24小时编辑响应9.制作XXX网站工作简报(每月)。1.XXX公司在运维过程中将向XXX提交运维(1)服务商须按时提交日报、周报、月报、年报。(2)服务商需每天一次提交运维监控报告(见网站日常监测表监测时间:年月日星期一(8:30---17:00)记录人:监测项目检测方法正常范围实测情况结果备注器IE浏览正常iguard服务进程2正常程正常CPU及系统负载正常硬盘占用空闲内存占用正常系统时间1--5分钟常Iguard篡改日志正常监测项目检测方法正常范围实测情况结果备注用户登录情况10网段常公众参与平台IE浏览XXX88.19:正常CPU及系统负载正常硬盘占用空闲正常数据库进程正常0正常rl/SystemErr.正常监测项目检测方法正常范围实测情况结果备注gr1/SystemOut.正常 正常wwW.log正常端口监听情况运行正常正常监测项目检测方法正常范围实测情况结果备注用户登录情况10网段正常数据库进程正常wwW.log正常Iguard篡改警告rt.log正常CPU及系统负载0-3正常硬盘占用空闲正常系统时间1--5分正服务器功能监测项目检测方法正常范围实测情况结果备注钟常端口监听情况运行正常正常用户登录情况10网段正常繁体版IE浏览正常CPU及系统负载常硬盘占用空闲正常正常端口监听运行正正服务器功能监测项目检测方法正常范围实测情况结果备注情况常常用户登录情况10网段正常IE浏览正常正常XXXwcm日志正常Iguard篡改警告rt.log正常CPU及系统负载0-3正常服务器功能监测项目检测方法正常范围实测情况结果备注内存占用硬盘占用空闲正常系统时间端口监听情况用户登录情况新表单IE后台浏览XXX8.151:正常CPU及系统负载正常硬盘占用空闲正常服务器功能监测项目检测方法正常范围实测情况结果备注tomcat进程正常数据库进程正常端口监听情况运行正常正常用户登录情况10网段正常工业许可证IE后台浏览正常CPU及系统负载正常硬盘占用空闲正常服务器功能监测项目检测方法正常范围实测情况结果备注tomcat进程1正常数据库进程0正常端口监听情况运行正常正常用户登录情况10网段正常IE浏览正常CPU及系统负载正常硬盘占用空闲正常服务器功能监测项目检测方法正常范围实测情况结果备注正常程2正常端口监听情况运行正常正常用户登录情况10网段正常XXX内网IE浏览常CPU及系统负载正常硬盘占用空闲正常服务器功监测项目检测方法正常范围实测情况结果备注端口监听情况netstat-运行正常正常用户登录情况10网段正常流媒体服务IE浏览正常CPU及系统负载正常硬盘占用空闲常正常程1正常端口监听情况运行正常正常服务器功监测项目检测方法正常范围实测情况结果备注用户登录情况10网段正常负载均衡IE管理XXX88.10:正常CPU及系统负载正常硬盘占用空闲正常正常端口监听情况netstat-运行正常正常统计用户连接数0正常用户登录10网段正服务器功能监测项目检测方法正常范围实测情况备注情况常注:所有平台需查看/tmp/log/是否有异常及文件大小,磁盘空间无特殊情况空闲空间20%(1)贯彻统一领导,分级负责,反应及时,措施果断,依靠科(2)遵循预防为主,常备不懈的方针。做好应对突发事件的思发生安全事件时,应急处置工作人员30分钟内到达现场(判断为黑客攻击情况,并得到领导指示,可用vpn关闭XXX8.11和XXX8.12),一般情况下一小时内解决故障,恢复运行。对于有些特组织机构职责由XXX相关领导、技术负责人、专家组成,对整个应急事件进行统筹安排领导工作,负责重大故障应急对应的决策。XXX公司由XXX公司相关领导、技术总监、项目经理、技术专家、销售经理等组成。(1)事件分级高到低的级别顺序,将信息系统事件分为I级(重大)、Ⅱ级(较大)和III级(普通)三个等级。(2)事件说明信息发布造成特别严重的影响,影响内部用户数超过50%2)Ⅱ级事件经营、管理和信息发布造成特别严重的影响,影响内部用户数超过①部分通道与网络故障造成一定小范围影响,但不影响整体访②部分主机设备、操作系统、中间件和数据库软件故障,但不影响应用正常使用。③集群中部分节点应用停止服务故障,但不影响整体访问。④非关键应用系统数据丢失。⑤其他原因。3)III级事件XXX网站建设项目中的部分非关键功能点发生故障,不影响用户对系统的访问及关键业务的正常使用,对于此类的事件统称为II级事件。因下列原因对本单位的生产、经营、管理和信息发布造成特别严重的影响,影响内部用户数不超过30%①部分通道与网络故障造成一定小范围影响,但不影响整体访②部分主机设备、操作系统、中间件和数据库软件故障,但不影响应用正常使用。③集群中部分节点应用停止服务故障,但不影响整体访问。④其他原因。(3)应急预案启动前提1)接网景盛世公司报警电话,项目实施小组系统工程师迅速做2)例如:发现XXX网站页面和各司局站点页面无法浏览。被黑客攻击等故障现象,经验证之后立刻给网站管理处丰处(丰苏)、单(1)应急处理流程“IV/一般”级别的信息安全事件由部门通过预警信息沟通,自级/特别重大"级别的信息安全事件的报告时,应报请网站处领导,1)运维项目组向网站处领导通报信息安全事件情况,得到指令(2)应急处理流程节点描述1)系统监控加强对各类网站网络与信息安全突发公共事件和可能引发突发公共共事件实行态势进程报告和日报告制度。报告内容主要包括信息来2)初步诊断,及时汇报3)判断级别,启动预案应急领导小组和相关业务部门根据监控人员汇总的故障信息和(3)现场故障排查1)接到报警关业务排查。2)业务排查①查看服务器是否正常连通,进行相关服务器ping服务(如:pingXXX8.22)②如果正常能够ping通,进行访问服务器的进程是不是正常③查看服务器的相关进程是不是正常启动。3)查看网站情况是否正常明属于网络的问题,如果不正常说明是服务器的问题。③查看一下cpu及其负载情况。查看命令为:top是不是负载过高引起系统运转缓慢。④看一下硬盘占用空间是不是已经满了。查看命令为:df-h查看空间是不是已经写满。⑥查看igurad日志是不是正常。查看命令为:A.more/usr/local/iguard/syncserver/logs/syncd.log查看有无异常情况出现。B.如果apache服务有问题,可以进行重新启动,命令如下:servicehttpdstop(apache关闭)。C.如果iguard进程出现问题,可以联系相关iguard厂商协助解4)查看发布平台:服务正常,如果不能访问需要查看相应服务器服务是否正常。cd/opt/XXXWCMV65/Tomcat/bin.stop进行关startsh如依然不正常可以联系XXX工程师协助解决。B.如igurad不正常可以联系iguard工程师协助解决。C.如遇到重大情况无法及时解决,将发布系统维护中index.htm页面暂时替换首页进行发布。等待问题解决后,按领导指示进行相应替换为正常页面。5)查看iguard日志文件6)查看wcm日志文件cdoptXXXWCMVTomcatlogstailf7)查看cpu及其负载状况:执行命令为:top,查看是否运转正9)查看监听情况,执行命令为:netstat-ntlp查看22端口和80端口是否正常。(4)查看发布平台数据库:1)查看oracle进程:执行命令为:2)查看监听端口:3)查看相应日志文件(5)数据备份2)XXX网页文件备份到XXXhomeliyonghong3)数据库文件可以拷贝到XXX8.22数据库服务器作为XXX.1504)临时可以应用作为XXX.150服务器硬件故障的补充。(6)故障解决(8)应急结束(1)通信保障(2)物资保障重要网站网络与信息系统在建设系统时应事先预留一定的应急(3)技术保障(4)资金保障(5)人员保障(1)当网站网络与信息安全突发公共事件发生时,应急领导小(2)应急领导小组办公室要密切关注国内外关于网络与信息安(1)后期观察(2)调查与评估(3)改进措施(1)宣传(2)培训(3)演练1)模拟紧急事件发生2)故障排查3)恢复环境报告时间:年月日时分单位名称XXXXXXXXXXXX系统应急预案联系电话通讯地址传真电子邮件本次事件发生时间本次事件的简要描述初步判定的事件原因采取的应对措施本次事件的影响状况预案名称等级涉及部门涉及人员及联系方式预案事件描述预案启动条件应急处置过程用时应急处置结果预案处理要求演练要求预案流程要求XXX公司设有专门的技术支持与售后服务机构——客户服务中(1)运维驻场工程师将认真学习和遵守XXX所有有关外来人员(2)项目组成员在XXX的一切工作都在得到信息中心管理人员(3)项目组成员一旦发生政治事件、泄密、盗用用户资料、擅(4)全面配合XXX信息中心积极参与对其派驻工程师的有效的(5)建立奖励机制,同时参考XXX的建议,为优秀员工提供培(6)坚决杜绝因项目组成员发生的安全问题。2.服务时间(1)在5×8小时工作时间内设置专人值守。(2)在非工作时间设置有专人7×24小时接听的移动电话热线,(1)要加强日常巡检和节假日、重大政治活动、重要敏感时期的应急值守与实时监控。配合网站运行处和其他服务厂商(防篡改iguard、linux)加强技术防护手段,健全安全防范体系,(2)按时提交相关报表,具体包括:根据每日实际工作情况提(3)对需在后台操作的工作认真填写处理《XXX网站运维业务(4)网站相关事件在《工作备忘录》中作出详细记录。中,70%的问题,都是曾经出现过的,如果能够对输入到知识库系统中,项目服务人员可从系统中找到相应的技术资用户的操作水平及技能.(1)我司使用《运维服务单》作为服务记录,记录分别由服务第五节售后服务保障方案(1)现场贴身服务:派遣经验丰富的工程师根据项目支持需要(2)定期回访服务:我公司将采取巡检制度,每季度由公司服(4)定期巡检服务:我公司对本项目在系统安装验收后定期派XXX公司为了更好地为XXX服务,技术服务人员在为XXX提供服对于无法立即回答的问题要向XXX说明原因,并告知XXX解答时间。9.调整客户原有(尤其是正在使用的)设备(包括参数调整)之前,们将对参与项目的所有技术支持与售后服务人员进行统一的培训和1.呼叫中心(内含本项目运维组)户服务中心本部电话为XXXXXXXXXX,传真为(010)XXXXXXXXXXX,服务时间为9:00-18:00,周一至周五(国家法定的休息日和节假日除外)。外,XXX公司客户服务中心全部人员的手机24小时开机(3)在接到XXX的技术支持请求或故障报告后,客户服务中心(4)对于技术咨询,技术人员会结合实际情况及时为XXX提供(1)客户服务中心为本项目特别设置了专门的电子邮件信箱service@XXXXXXXX.,同时公布了所有相关技服务中心,专职服务经理或技术人员在接到报告之XXX(2)客户服务中心也将通过电子邮件为XXX提供解决方案,或(1)用户方可通过XXX网站项目建设,进入XXX公司专门为本(2)我们还在网站上专门为本项目设立讨论区,便于项目单位站提出相关问题我公司将安排专业技术人员常年负责这方面的管理(1)为了提高服务质量,加强与客户的沟通和交流,我公司均(2)我公司指派专人负责集中受理客户投诉,它通过客户投诉(2)在系统运行过程中,出现的故障主要存在以下几类:操作(3)售后服务流程描述:1)当用户开始使用我们的产品时,如果用户存在疑问或系统设2)第一步,当用户出现问题,有疑问需要解决时,可首先通过3)当我中心接到用户的咨询电话时,技术工程师先判断基本属4)如通过电话和远程登录不能给予解决的问题,技术支持人员6)如果用户觉得不需要更换的,我们的技术支持人员会继续提7)如果用户觉得需要对现有设备进行更换的,我公司会派出技8)对用户的电话技术指导或远程登录调试,不能达到修复问题9)如果电话即使知道或远程登录调试将问题成功解决,我公司(1)定期电话回访(2)定期系统巡查(1)7×24小时的服务网站。(2)7×24小时的服务热线。(3)7×24小时的售后服务办公室值守。(4)各类专项服务。(5)总公司、地方分公司和办事处提供的本地化服务。(6)定期巡检各个应用系统及平台。(1)灾难性事件:由于经过大量的测试,系统本身应不含有可统原因造成的灾难性事件(包括系统不能启动等),需要恢复到可运(2)严重程序错误:如果确因系统开发问题而可能造成数据错误(必要的话会到现场对事件进行调研),本公司立即组织开发队伍(3)一般程序错误:如果程序出现开发上的“笔误”,不会造(4)属于用户使用不当问题的,本公司将通过电话进行指导。1)当客户的系统发生一个技术问题后,本客户服务系统允许客分类严重程度委托响应时间服务热线(传到达现场已在现场任意立即立即未在现场灾难性(系统严重损立即通知在接到服务请求电话后1小时内组织出发,到达现场后2小时内给出故障诊断未在现场严重(系统错误)在接到电话后立即响应1小时内组织出发,到达现场后2小时内给出故障诊断一般在接到电话后的1小时内响应根据实际情况到达现场或客户方便3)到场维护时间:如果系统发生灾难性和严重故障,本公司将在电话回复之后,以最快的方式赶到客户现场提供维护服务。4)售后服务档案机制在项目建设过程中将为XXX建立专有的服务档案,并同步更新至服务网站进行注册和档案建立工作,XXX可以通过服务热线、服务网站等多种形式提出问题,售后服务人员将通过查询问题库、知识库和与项目建设人员的沟通在第一时间解决问题,及时反馈给用户。并登记售后服务登记单和更新售后服务档案,进行备案,同时更新问题库和知识库,方便查找和积累。售后服务人员会定期回访客户,进行后续跟踪工作,并通过服务热线和服务网站进行问题的跟踪管理。5)售后服务监督机制③如果用户对我公司的技术服务人员存在不按合同服务标准提6)售后服务提交文档⑥用户现场交流记录(现场填写、打印、签字)。第三章项目应急方案第一节应急总预案(一)编制内容:3.应急响应针对事故险情或事故,依据应急预案采取的应急行(二)资料收集:包括相关法律法规、技术标准、应急预案、同(三)风险评估主要内容包括:(四)应急能力评估(五)基本要求专项应急预案是针对可能发生的具体事故类型而制定的应急预二、救援流程事故发生报警接警低警情判断低响应级别应急启动数援行动否否控制是应急解除应急总结应急结束应急总结按公司计划及项目工作进度安排组织维修项目部的全体人员进(一)应急准备(二)应急响应3.确认火警后,立即向119消防救援指挥中心报警,取得联系,(三)初期火灾扑

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论