Q∕SY 1331.3-2010 信息系统运维管理规范 第3部分:监控管理_第1页
Q∕SY 1331.3-2010 信息系统运维管理规范 第3部分:监控管理_第2页
Q∕SY 1331.3-2010 信息系统运维管理规范 第3部分:监控管理_第3页
Q∕SY 1331.3-2010 信息系统运维管理规范 第3部分:监控管理_第4页
Q∕SY 1331.3-2010 信息系统运维管理规范 第3部分:监控管理_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Q/SY中国石油球气賴例企业标准Q/SY 1331. 32010信息系统运维管理规范第3部分:监控管理Specifications for information system operation management一Part 3: Monitoring management2010-08-01 实施2010-05-25 发布中国石油天然气集团公司发布Q/SY 1331. 32010Q/SY 1331. 32010Q/SY 1331. 32010I目 次 TOC o 1-5 h z mw ni麵i2规范性引用文件 13术语和定义14监控对象15基本要求16 26. 1监控管理负责人 26.2

2、 监控管理支持组 27活动及流程28 指标38. 1 指标38. 2 报告4附录A (资料性附录)监控管理表单 5附录B (资料性附录)监控指标 7rrQ/SY 1331信息系统运维管理规范分为七个部分:一第1部分:导则;-第2部分:热线帮助;第3部分:监控管理;-第4部分:事件管理;一第5部分:问题管理;一第6部分:变更管理;第7部分:配置管理。本部分为Q/SY 1331的第3部分。本部分的附录A、附录B为资料性附录。本部分由中国石油天然气集团公司信息技术专业标准化技术委员会提出并归口。 本部分起草单位:中国石油勘探开发研究院。本部分主要起草人:于爱丽、马洵、辛海燕、徐鸿儒、张锼、谢丽红。Q

3、/SY 1331. 32010 Q/SY 1331. 32010 信息系统运维管理规范第3部分:监控管理1范围Q/SY 1331的本部分规定了中国石油天然气集团公司(以下简称“中国石油”)信息系统运维管 理过程中监控管理的目标、流程、角色职责及相关指标。本部分适用于中国石油范围内已正式上线的信息系统运维管理工作。2规范性引用文件下列文件中的条款通过Q/SY 1331的本部分的引用而成为本部分的条款。凡是注日期的引用文 件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本部分,然而,鼓励根据本部分 达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于

4、 本部分。Q/SY 1223. 12009信息系统总体控制规范 第1部分:实施Q/SY 1333-2010广域网建设与运行维护规范3术语和定义下列术语和定义适用于Q/SY 1331的本部分。3.1监控管理 monitor management用于找到信息系统运维环境中的干扰因素,确保由此所产生的影响能够得到及时准确的发现,并 将有关事项进行识别、捕获、记录和分类,监控整个事件的发展;另一方面对信息系统运维管理过程 中的计划性事件进行监控。4监控对象覆盖整个信息系统运维管理中的各个部分,根据组织的基础设施不同而异,包括但不限于以下 分类:a)服务器(群)。b)存储设备。c)应用层交换设备。d)网

5、络。e)操作系统。f)数据库。g)信息系统。h)用户状态。i)数据监控。j)活动操作过程。5基本要求采用人工或自动工具等方法监控信息系统运维环境和过程,合理设计、策划监控的时间间隔,在 约定的时间内进行健康巡检,形成周期性巡检记录。监控管理确保信息系统运维管理符合以下要求:a)符合服务管理计划或服务水平。b)使得约定的信息系统运维管理得到统一、有序、有效地实施和保持。c)对约定服务的监控形成周期性报告。6角色6.1监控管理负责人a)监控流程的效率和敏果。b)管理监控管理支持i的工作并维护监控管C)为运行维护改进工作-換建议。6.2监控管理支持组负责支持执行监控管理的各项具体工作,执行职责范围内

6、的记录、分类、匹配,转交监控的输出 7活动及流程日常监控活动包括以下内容。a)服务器(群):包括但不限于对服务器进行以下周期性监控:一巡查CPU利用率、内存利用率、磁盘I/O读写率、磁盘空间知用率;服务器负载均衡;对系统进行全面防病毒扫描检查;磁盘空间检查和数据文档整理;一系统日志分析;一检查设备状态灯是否正寒(检查频率遵循Q/SY 1223. 12009);散热风扇工作噪声检查(检査频率遵循Q/SY 1223. 12009);批处理作业检查(检杏频率遵循Q/SY 1223. lW)笋。b)存储设备:存储设备监控根据业务需要&行定期或不定期巡检,包括但不限于:-设备是否能够正常启动、关闭;是否

7、在规定的阈值。c)应用层交换设备:层交换设备监控根据业务需要进行定期或不定期巡检,包括但不限于: 带宽管理;f适应性操作冗余;状态故障恢复一-优先级排列与控制;访问控制等。d)网络:包括但不限于对以下网络组成部分进行周期性监控:检查设备状态灯是否正常;-散热风扇工作噪声检查;一所有接口是否正常工作;对端口网线进行检查整理;设备日志分析;更改重要设备的密码;防火墙日志检查(检查频率遵循Q/SY 1223. 1-2009);检查链路可用性(详细事项参见Q/SY 1333-2010中表B.5)等。e)操作系统:包括但不限于对操作系统进行以下周期性监控:检查操作系统是否正常启动;检查操作系统是否能够正

8、常登录;一检查是否安装最新的操作系统补丁;一检查告警消息;一检查配置文件;-操作系统日志分析等(根据信息系统范围内对事件的界定进行日志分析)。0数据库:包括但不限于对数据库进行以下周期性监控:数据库状态;空间管理;数据库性能;对数据库事务的相关信息和状态的监控;分析数据库H志等。g)信息系统:信息系统根据业务需要进行定期或不定期巡检,包括但不限于:各个功能模块可用性;应用程序反应速度;一应用程序日志(检查频率遵循Q/SY 1223. 12009)等。h)用户监控:用户监控根据业务需要进行定期或不定期巡检,包估但不限于:-用户操作情况;监控用户账号和用户权限;一关键权限变化;-闲置的敏感用户账号

9、处理:停用/撤销;远程登录账号(检査频率遵循Q/SY 1223. 12009)等。i)数据监控:数据监控根据业务需要进行定期或不定期巡检,包括但不限于:一是否讎酮加导人及导出;一数据备份情况;一对数据库进行直接数据访问情况(检査频率遵循Q/SYJ-2009)等。J)活动操作过程:活动操作过程监控根据业务需要进行k期或不记朗巡检,包括但不限于: 是否制定活动操作的步骤;是否保存监控记录;一活动是否遵循职责分离原则等。监控管理活动中所引用的表格参见附录A。8指标8.1指标a)健康巡检周期。b)关键监控周期。c)监测到的告警数量。d)由未监测到的异常引发的事件数量。e)由监控管理同时协调两个以上监控

10、流程的次数。f)未监测到异常所占比例。监控指标参见附录B。8.2报告监控报告可以采用以下形式:a)根据报告周期划分:日志、周报、月报、季报、年报。b)根据监控对象范围划分:服务器(群)、存储设备、应用层交换设备、网络、操作系统、数 据库、信息系统、用户、数据和活动操作过程等。附录A(资料性附录) 监控管理表单监控管理表单见表A. 1表A. 5.表A. 1信息系统日志检查记录表系统名称IP地址日志路径检查内容例如:错误信息、登录异常信息等检查日期异常情况(可加附件)处理措施检查人转问题处理 转变更管理 继续观察 忽略注:异常情况应填写所有的异常信息。表A.2设备巡检记录表检查时间:年月日点 分检

11、查人:检查结果正常非正常备注检查项目服务器运转状况服务器电源指示机房室内温度硬盘指示灯服务器位置是否正常机柜内散热风扇工作网线连接是否正常服务器及外设是否完整表A.3服务器例行检查记录表服务器性能检查序号日期服务器名称CPU利用率%占CPU最高的进程内存使用率%网络连接网络使用率%服务器安全及配置系统日志是否正常系统账号 用户是否 正常防病毒软件是否正常防病毒软件客户端运行服务器补丁是否升级磁盘空间 是否正常服务进程情况 是否正常备注检查人*表A. 4备份作业详细说明书表A. 5备份恢复检查记录表 备份作业编号备份恢复测试步骤备份恢复测试结果操作人签字:p监控管理负责人审批签字:年 月日注1.

12、表中各栏应全部填$ 注2. “备份恢复测试步骤”应详细描述,如有必要,可以附件方式补充说明。备份作业编号备份作业描述相关的数据库备份时间及周期备份方式备份操作步骤备份结果验证方法备份数据恢复操作步骤数据恢复结果验证方法异常情况通告生效日期操作人签字审核人答宇:Q/SY 1331. 32010Q/SY 1331. 32010附录B(资料性附录)监控指标监控指标见表B. 1表B.5。表B. 1健康巡检周期指标健康巡检周期描述对信息系统所涉及范围内的设备、信息系统是否处常工作i春、基本性能指标是否处于正常 范围等进行逐项检Sb约定时间用途说明运行管理对设备、信息系统的运行状况检查的刪繁程度,理的周期

13、设置能够有效做到主动 预防相关角色监控管理负责人危险值信息系统运维组自行确定目标值信息系统运维组织自行确定表B.2关键监控周期指标关键监控周朗描述对信息系统所涉及范围内的关键设备、信息系统进能是W处于正常工作状态、关键性能指 标是否在正常范围内等进行逐项检查的约定时间用途同“健康巡检周期”的用途,但根据运行管理的设备、信息系统的重要性,对其关键部分的运行状况加强检查相关角色监控管理负责人危险值信息系统运维组织自行确定目标值信息系统运维组织自行确定表B.3监测到的告警数量指标监测到的告警数量描述一段时期内,由监控管理监测到的信息系统所涉及范1内的设备,ftf息系统的告警数量用途控制范围内告警,说

14、明运行管理过程中监控管理的毛攻性相关角色监控管理支持组危险值信息系统运维组织自行确定目标值信息系统运维组织自行确定表B.4由未监测到的异常引发的事件数量指标由未监测到的异常引发的事件数量描述一段时期内,由于未及时监测到的异常而引起事件,导致启动事件管理流程用途说明监测疏漏的影响,考核监控管理的相关操作的执行是否到位或监控周期是否需要调整相关角色监控管理支持组危险值信息系统运维组织自行确定目标值信息系统运维组织自行确定Q/SY 1331. 32010 #Q/SY 1331. 32010 表B.5未监测到异常所占比例指标未监测到异常所占比例描述一段时期内,未监测到的异常在告警总数量中所占比例用途主要考察监控管理的相关操作是否执行到位相关角色监控管理负

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论