信息中心事故报告_第1页
信息中心事故报告_第2页
信息中心事故报告_第3页
信息中心事故报告_第4页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、_内部资料注意保存XXXX信息中心信息系统事故报告第 1 期信息中心二一二年九月三日关于 8 月 20、22 日统一工作平台事故报告统一工作平台分别于2012年 8月20日上午、 8月 22日下午出现两次不能登录的系统故障,故障持续时间分别为76分钟和 27分钟。 现将故障的原因及解决方案报告如下:一、故障描述2012年 8月 20日 8:52 分至 10:08 分,共 76分钟,统一工作平台无法登录,登录页面不能打开。2012年 8月 22日14:38 分至 15:05 分,共 27分钟,统一工作平台无法登录,登录页面不能打开。二、故障分析两次故障发生的原因是由于数据库服务器操作系统内存耗尽

2、导致 。引起内存耗尽的原因是因为在2012年8月15日晚为了数据库ORA-4030 的报错调整了统一工作平台数据库内存参数, 让数据库进程可使用的内存增加了14GB,但服务器的物理内存没有增加。此参数调整在评估时未能考虑到ORACLE数据库 11.2 版本存在 bug 10190759 ,该 Bug 会导致精品资料_数据库部分进程在繁忙时内存的占用是正常值的两倍以上。因此当 8 月 20 日上午、 8 月 22 日下午数据库因业务量增加而繁忙时,出现数据库所需要的内存超过服务器具有的物理内存,而引起内存耗尽,导致应用不可用。另, 2012 年 8 月 20 日在数据库出现故障时,统一工作平台的应用服务同时出现了WebSphere Deploy Manager(DM)的服务功能异常的情况,该异常以前没有出现过,导致分析和解决故障的时间较长。三、解决方案解决的措施是给统一工作平台数据库服务器增加了14GB物理内存 ,使服务器物理内存从56GB扩展到 70GB,解决了数据库连接失败的问题,目前数据库服务器主机的内存使用率和数据库连接正常。四、改进措施1、后续数据库参数在调整前应充分讨论。2、加强监控告警,完善相关告警措施。3、提高统一工作平台系统管理员的维护技能,如遇到服务不能正常启动时,应将所有服务都先停止,然后再启

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论