![T∕CATAGS 46-2022 民航信息系统可靠性监控管理规范_第1页](http://file3.renrendoc.com/fileroot_temp3/2022-4/14/9c7c8541-4c71-4cb3-b358-6acc2fd6f687/9c7c8541-4c71-4cb3-b358-6acc2fd6f6871.gif)
![T∕CATAGS 46-2022 民航信息系统可靠性监控管理规范_第2页](http://file3.renrendoc.com/fileroot_temp3/2022-4/14/9c7c8541-4c71-4cb3-b358-6acc2fd6f687/9c7c8541-4c71-4cb3-b358-6acc2fd6f6872.gif)
![T∕CATAGS 46-2022 民航信息系统可靠性监控管理规范_第3页](http://file3.renrendoc.com/fileroot_temp3/2022-4/14/9c7c8541-4c71-4cb3-b358-6acc2fd6f687/9c7c8541-4c71-4cb3-b358-6acc2fd6f6873.gif)
![T∕CATAGS 46-2022 民航信息系统可靠性监控管理规范_第4页](http://file3.renrendoc.com/fileroot_temp3/2022-4/14/9c7c8541-4c71-4cb3-b358-6acc2fd6f687/9c7c8541-4c71-4cb3-b358-6acc2fd6f6874.gif)
![T∕CATAGS 46-2022 民航信息系统可靠性监控管理规范_第5页](http://file3.renrendoc.com/fileroot_temp3/2022-4/14/9c7c8541-4c71-4cb3-b358-6acc2fd6f687/9c7c8541-4c71-4cb3-b358-6acc2fd6f6875.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、ICS 35.020L 07 T/CATAGS中国航空运输协会团体标准T/CATAGS 462022 民用航空信息系统可靠性监控管理规范Management specification for reliability monitoring of civil aviation information system2022 - 02 - 25 发布2022 - 02 - 25 实施中国航空运输协会发 布T/CATAGS 462022目次前言II 1 范围1 2 规范性引用文件1 3 术语和定义1 4 缩略语2 5 应用服务监控系统基本架构2 6 监控点及监控能力3 7 监控系统性能要求6 8 监控
2、系统功能要求6 9 信息采集和存储要求7 10 监控系统管理权限8 附录 A (资料性) 伪请求粒度说明表9 附录 B (资料性) 中国航信航班管理系统可靠性监控分析10 I前言本文件按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中国航空运输协会提出并归口。 本文件起草单位:中国民航信息网络股份有限公司、中国民航大学。 本文件主要起草人:刘晓辉、高思华、周子站、惠康华、陈福荣、李婷。1 T/CATAGS 462022民用航空信息系统可靠性监控管理规范 1 范围本文件
3、规定了民航信息系统应用服务监控系统的基本架构、监控点及监控能力、性能要求、功能要求、信息采集和存储要求以及管理权限要求等。本文件用于民航信息系统可靠性运行的监控管理。 2 规范性引用文件本文件没有规范性引用文件。 3 术语和定义下列术语和定义适用于本文件。 3.1 3.1可靠性reliability 预期行为和结果保持一致的特性。 来源:GB/T 25069-2010,2.1.19 3.2 3.2信息系统可靠性information system reliability信息系统在规定的条件下和规定的时间内完成规定功能的能力。 来源:MH/T 0063-2017,3.2 3.3 3.3应用服务a
4、pplication service用户接口或万维网客户端与数据库及其之间逻辑层的服务。 3.4 3.4伪请求pseudo request可靠性应用服务监控系统上预先编写的代码,故障发生时自动触发,定位问题。 3.5 3.5可用性availability根据授权实体的要求可访问和利用的特性。 来源:GB/T 25647-2010,4.2 数据完整性data integrity数据没有遭受以未授权方式所做的更改或破坏的特性。 来源:GB/T 25069-2010,2.1.36 3.6 3.6通讯交互类数据communication interactive class data监控系统与应用服务间
5、进行信息交互的数据,包括监控系统向应用服务发送的请求数据和应用服务返回的结果数据。 3.7 3.7状态获取类数据state acquisition class data监控系统从应用服务获取的运行状态和日志数据。 4 缩略语下列缩略语适用于本文件。 AMP:应用监控平台 (Application Monitoring Platform) HTTP:超文本传输协议 (Hypertext Transfer Protocol) MQ:消息队列 (Message Queues) CPU:中央处理器 (Central Processing Unit) MEM:内存 (Memory) Telnet:远程终
6、端协议 (Telecommunication Network) Ping: 因 特 网 包 探 器 (Packet Internet Groper) SDK:软件开发工具包 (Software Development Kit) TPS:每秒事务处理量 (Transaction Per Second) ART:平均响应时间 (Average response time) APP:应用 (Application) 5 应用服务监控系统基本架构应用服务监控系统是民航信息系统可靠性监控管理的核心环节,每个分支结构、数据中心分别有一个或若干个监控平台,每个监控平台主要包括被监控的应用服务、监控系统服务器
7、、控制台和其他监控工具,多个监控平台之间能够灵活级联扩展,上下级节点之间能够即时通讯。应用服务监控系统基本架构示例见图1。 在上述架构下,监控系统与应用服务间交互数据的类型包括: 通讯交互类数据; 状态获取类数据。 监控系统与应用服务交互数据的示例见图2。 3 总部监控中心总部应用 总部应用其他监控工具总部维护人员值班人员总部监控中心其他监控工具节点监控中心区域监控中心区域监控中心应用应用应 用 应 用应 用 应 用分支机构、当地维护人员 节点监控中心分支机构维护人员区域监控中心分支机构维护人员区域监控中心节点监控中心节点监控中心应用前端应用前端应用前端应用前端其他监控工具其他监控工具分支机构
8、、分支机构、当地维护人员 节点监控中心当地维护人员 节点监控中心图1应用服务监控系统基本架构示例图应用服务报文日志数据库数据中间件消息队列业务数据通讯交互类数据状态获取类数据监控系统图2监控系统与应用服务交互数据示例图6 监控点及监控能力6.1 系统监控6.1.1 监控能力将监控能力分为状态监控、可用性监控、故障追踪、运维管理和业务监控五部分。其中状态监控、可用性监控为基础监控范畴,故障追踪、运维管理、业务监控为进阶监控范畴。监控能力的每部分又包含监控类型及监控点,监控点中带“*”的为基础监控点,仅在状态监控与可用性监控中设置基础监控点,属于民航信息系统可靠性监控最基本的应用监控能力,重要度高
9、,必须具备。故障追踪、运维管理、业务监控部分是对应用监控能力的完善与补充,属于高监控能力要求。监控能力、监控类型以及监控点相关描述见表1,示例见附录B。 表1监控点描述监控范畴 监控能力 监控类型 监控点 监控点描述 推荐分值 总分值 基础监控范畴 状态监控 网络监控 *Ping 7X24 h 探测服务器网络连通性。 20 210 http 发起 http 请求检测站点状态。 10 *Telnet 监控端口状态。 20 并发监控 监控网络并发数。 10 T/CATAGS 462022监控范畴 监控能力 监控类型 监控点 监控点描述 推荐分值 总分值 基础监控范畴 状态监控 中间件监控 消息队列
10、状态 实时监控消息队列通道状态 10 消息队列深度 实时监控消息队列深度 10 业务中间件 监控管理中间件。 10 服务器监控 *文件系统 发现磁盘空间等异常。 20 *MEM 的利用率 内存用度监控。 20 *CPU 的使用率 CPU 用度监控。 20 IO 延迟 IO 延迟监控。 20 数据库监控 *表空间 监控数据库表空间用度,超过预警阈值后报警。 20 *数据库连接 监控数据库连接状态 20 数据库实例 监控数据库实例状态 20 数据库 job 监控数据库 job 状态 10 数据库备份 监控数据库备份状态 10 表记录数 监控数据库中某个表的记录数,如果与计划的数目不符则报警。 10
11、 Redis 实时监控 Redis 各项参数及运行状况。 10 慢 sql 查询 返回时间超过预设时间的查询 10 数据库锁分析 用于管理对共享资源的并发访问 10 可用性监控 进程监控 *进程状态 能够发现进程僵死、丢失的异常。 20 130 *进程数量 能否发现进程丢失、重复启动等异常。 20 进程占用 MEM 当进程占用过多内存时报警。 10 进程占用 CPU 当进程占用过多 CPU 时报警。 10 功能监控 *性能 1、实时查看性能(TPS、ART)曲线; 2、发生性能异常(如 TPS、ART 超过阈值)报警; 3、监控性能趋势(渐变、陡变)。 20 指令 模拟指令/服务轮询的方式监控
12、后台服务状态。 10 文件监控 *日志关键字 通过监控关键字发现日志中的报错等信息。 20 文件大小 监控文件大小、增长速度等,可发现日志突增等异常情况。 10 运维执行结果 检测运维文件是否按时生成,判断运维作业是否执行成功。 10 进阶监控范畴 故障追踪 故障分析 全局追踪 1、全局流量“交通图”,迅速定位“堵点”; 2、全局交易 ID 关联全局事务; 3、全局报错信息及日志分析。 0-20 0-20 运维管理 自动化运维 应急预案 报警自动触发应急预案执行脚本。 0-10 0-20 自定义脚本 报警关联用户自定义的脚本。 0-10 业务监控 业务数据分析 业务状态 业务系统 I/O 数据
13、,可用于业务状态分析、故障定位等。 0-10 0-20 监控视图 0-10 5 注:被监控系统具备表1中某项监控点,推荐系统获取对应的分数。 6.1.2 监控能力分级根据监控系统是否能够实现监控系统基本状态、监控服务可用性、故障追踪、运维管理以及业务监控等,划分监控能力级别。从一级到五级监控能力逐级递增。根据表1对监控能力进行分级,监控能力级别见表2。 表2监控能力级别能力级别 状态监控 可用性监控 故障追踪 运维管理 业务监控 监控点添加规则 评价规则 一级 - - - - 至少包括状态监控的基础监控点。 添加的监控点分值总和。 二级 - - - 上一级监控点至少再添加可用性监控的基础监控点
14、。 添加的监控点分值总和。 三级 - - 上一级监控点再添加故障追踪监控点。 添加的监控点分值总和。 四级 - 上一级监控点再添加运维管理监控点。 添加的监控点分值总和。 五级 上一级监控点再添加业务监控监控点。 添加的监控点分值总和。 注:“”表示在相应能力级别下必备的监控;“-”表示在相应能力级别下不需要的监控。 6.2 移动 APP 监控6.2.1 监控能力移动应用的监控维度主要包括可用性监控、稳定性监控、安全性监控、服务体验监控、业务监控五部分。其中产品可用性监控、稳定性监控、安全性监控为基础监控范畴,服务体验监控、业务监控为进阶监控范畴。移动APP的质量监控点见表3。 表3移动 AP
15、P 的监控点监控范畴监控能力 监控类型 监控点 监控点描述 推荐分值总分值 基础监控范畴 可用性监控 产品服务性能 崩溃率 监控选定时间段内应用崩溃次数/启动次数。 20 60 错误率 监控选定时间段内应用出现错误次数/总请求次数。 20 响应时间 监控选定时间段内应用总响应时间/请求次数(仅计算成功响应的请求)。 20 稳定性监控 产品服务稳定性 卡顿率 监控选定时间段内应用出现卡顿次数/总操作数。 20 40 耗电量 监控应用在移动设备中的耗电情况。 10 交互耗时 监控用户打开应用到可以正常交互的时间。 10 安全性监控 产品服务安全性 劫持监控 监控域名是否被劫持。 20 60 网络传
16、输监控 监控网络传输内容是否存在明文传输或者敏感字段。 20 敏感权限监控 监控应用和第三方SDK 的敏感权限的申请和使用情况。 20 T/CATAGS 462022表3(续)监控范畴监控能力 监控类型 监控点 监控点描述 推荐分值总分值 进阶监控范畴 服务体验监控 产品服务体验 页面打开次数 监控当前页面打开的总次数。 10 40 页面交互时间 监控页面打开至用户可以正常交互的时间。 10 慢交互次数 监控交互时间超过设定阈值的页面总数。 10 页面流畅性 监控当前页面访问是否流畅。 页面流畅性=1-(慢交互次数/页面打开次数) 10 业务监控 产品业务数据分析 用户行为分析 根据业务具体需
17、求,分析页面转化率或其他自定义业务指标。 20 20 注:被监控的APP具备表3中某项监控点,推荐系统获取对应的分数。 6.2.2 监控能力分级 根据移动APP 监控能力是否能够实现监控移动 APP 可用性监控、稳定性监控、安全性监控、服务体验监控、业务监控等,划分监控能力级别。从一级到五级监控能力逐步递增。根据表2对移动APP监控能力进行分级,移动APP监控能力级别见表4。 表4监控能力级别能力级别 可用性监控 稳定性监控 安全性监控 服务体验监控 业务监控 监控点添加规则 评价规则 一级 - - - - 至少包括可用性监控的基础监控点。 添加的监控点分值总和。 二级 - - - 上一级监控
18、点至少再添加稳定性监控的基础监控点。 添加的监控 点分值总和。 三级 - - 上一级监控点再安全 性监控的基础监控点。 添加的监控 点分值总和。 四级 - 上一级监控点再添加服务体验监控的进阶监控点。 添加的监控 点分值总和。 五级 上一级监控点再添加业务监控的进阶监控点。 添加的监控 点分值总和。 注:“”表示在相应能力级别下必备的监控;“-”表示在相应能力级别下不需要的监控。 7 监控系统性能要求7.1 可靠性监控系统可靠性要求不低于99%。 7.2 处理能力平均处理消息能力应根据自身业务系统自行设定。 8 监控系统功能要求9 8.1 实时记录监控系统应具备对应用系统故障信息进行实时记录的
19、功能。 8.2 审计信息审计信息应记录用户在AMP界面进行的操作,所有涉及到数据库或对应用的管理操作都应记录。 监控系统应具备对应用系统审计信息的功能,应能够得到事后分析的基本要素,主要包括哪些用户,什么时间,做了什么操作以及操作结果等信息。 8.3 故障诊断分析/故障定位应用系统应针对自身应用的各个环节设计一系列伪请求供外部调用。在应用发生故障时,监控系统应触发检测操作,检测操作应依次调用这些伪请求,根据返回结果判断出现问题的环节。伪请求粒度说明参见附录A。 8.4 监控报警系统发生故障时,应及时发送报警信息,报警信息的发送方式可包括但不限于:邮件,短信,电话, 实时报警信息展示平台(报警控
20、制台)等。 8.5 预警/应急预案系统发生故障时,除发出报警外还应具备应急预案功能。 对于这个功能,首先应提供故障的判断标准及方式,其次应提供故障的处理方式。 8.6 监控平台可视化在日常业务中,监控系统会产生大量的报文、日志、数据等,为了协助运行维护人员进行分析判断, 应部署监控展示屏幕,实现监控报警数据的可视化,直观的监控系统的故障点和影响范围。 9 信息采集和存储要求9.1 实时性与完整性系统信息的采集应满足实时性要求,存储应满足数据完整性要求。 9.2 时间与日期系统存储的数据信息及图像信息应包含数据或图像的编号、时间和日期。 9.3 日志备份应根据业务系统及成本要求采取不同的备份策略
21、:完全备份、增量备份、差分备份等。 比如(宜)每周一至周六进行一次增量备份或差分备份,每周日进行全备份,每月底进行一次全备份,每年底进行一次全备份。 9.4 数据存储周期在线库保存周期和历史库保存周期应根据系统大小自行调整; 比如,在线库保存周期采取:3天明细数据,3个月按小时汇总数据,1年按日汇总数据。历史库保存周期采取:1个月明细数据,1年按小时汇总数据。 10 监控系统管理权限监控系统可不设超级管理员,应按角色分配权限(如配置人员角色,管理人员角色),不同角色有不同权限。 同一角色应分不同级别的权限,如查看权限,修改权限。对影响较大的管理操作应该引入管理流程, 多人共同控制权限,多人审批
22、后才拥有操作权限。 附录A(资料性) 伪请求粒度说明表应用系统应针对自身应用的各个环节设计一系列伪请求供外部监控系统调用,而伪请求粒度说明参见表A.1。 表 A.1伪请求粒度说明级别 粒度 内容 效果 1 应用级 以应用为单位,涉及到应用的入口和出口返回响应结果。 能够判断多应用之间的调用关系,如果涉及到业务故障时,能够方便定位问题出在哪个应用,但无法进一步定位问题。 2 服务级 以服务为单位,各个服务在入口和出口返回响应结果。 比级别 1 更进一步,能够探测应用内部各个服务之间的问题。 3 方法级 以函数方法为单位,关键业务方法在入口和出口返回响应结果。 比级别 2 更进一步,能够探测到应用最细粒度的问题。 附录B(资料性)中国航信航班管理系统可靠性监控分析按照本文件,对标中国航信航班管理系统,其可靠性监控的覆盖粒度已达到如下标准。状态监控得分 180,可用性监控得分 100,合计基础监控范畴得分 280。故障追踪得分 20,运维管理得分 10,业务监控得分 10,合计进阶监控范畴得分 40。该系统的监控能力达到五级,可靠性监控整体总得分为 320。表B.1 中国航信航班管理系统可靠性监控覆盖粒度 监控范畴 监控能力 监控类型 监控点 监控概况 推荐分值 得分 基础监控范畴 状态监控 网络监控 *Ping 7X24 h 探测航班管理系统相关服务器
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生活中常见的盐课件
- 2025年遵义年货运从业资格证考试题大全
- 游戏行业创新分享模板
- 建筑工程检测主要技术发展特点探讨
- 主题晚餐营销策划模板
- 幼儿学前教育进展及其发展趋势论文
- 大学生创业软实力培养的思考与对策
- 国家基金申请书
- 低投入大学生创业小项目
- 中秋亲子活动方案
- 五年级下册《Lesson 11 Shopping in Beijing》教案冀教版三年级起点小学英语-五年级英语教案
- 2023年杨凌职业技术学院单招面试题库及答案解析
- 绩效考核管理医院绩效分配方案包括实施细则考核表
- 2022年医学专题-健康危险因素干预
- stm32f103c8t6最小系统客户-中文手册
- 大学成绩单(大专)
- 追溯红色记忆,感受红色精神,社会实践活动记录表
- 中国国防:新中国国防建设成就【2】
- GB/T 15234-1994塑料平托盘
- GB 19641-2015食品安全国家标准食用植物油料
- 教科版科学五年级下册《生物与环境》单元教材解读及教学建议
评论
0/150
提交评论