智能化运维之IT系统统一监控预研报告_第1页
智能化运维之IT系统统一监控预研报告_第2页
智能化运维之IT系统统一监控预研报告_第3页
智能化运维之IT系统统一监控预研报告_第4页
智能化运维之IT系统统一监控预研报告_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

IT监控预研报告1引言管理人员逐渐面临着三大难题:1设备和业务种类繁多,各类资料信息分散,导致位于一线的IT运维监控人员感知故理人员也往往因为信息系统性能数据和故障数据的匮乏而缺少对系统运行健康度的了解;2核心机房可能分布于多个地点,部署范围广泛,设备繁杂,对于大批最网络设备、主率低,业务恢复时间慢;3对关键核心业务系统的运行健康程度缺乏评估手段和预警措施,只能被动等待问题发生,无法提前采取技术手段和管理手段规避问题;公司一线运维人员数量多但是经验不足,后台运维工程师经验丰富但是数量少,这些矛盾促使我司在新系统建设时需同步建设一套一体化的IT运维监控和服务预警平台,协助以自动化的手段完成信息系统的监测和维护;2平台建设的目标2.1建立健全企业IT运行监测指标体系首先,平台的主要目标是加大对公司内部各遗留及专有监控系统的整合力度,提高ITITIT健康度和业务连续性治理;理,主要包含以下方面:上,完善对新核心系统的全流程监控,根据性能数据进行预警,并将性能数据和故障数据引入事件管理平台进行后续治理,以可视化的方式向运维人员提供一览式的IT服务健康状况视图;3构建集成监控平台,对平台的检测插件、检测机制、预警算法、视图展现等监控资源进行统一管理,实现大屏集中式告警,便于后台管理人员直观地看到系统整体健康程度;通过视图的灵活组合可以快速定位故障点,结合知识库缩短处理时间;IT2.2完善公司业务监测指标体系,保障业务连续性IT实现了流程的司内部业务风险的管控尚处在初步阶段;各类业务流程依然面临着来自内部和外部的各种业务风险;例如内部业务风险主要来自于员工和服务商对信息系统的不当应用,如非授权等;对应用系统进行业务监控,能够及时识别业务风险,有效进行相应的主动规避操作,避免成损失;2.3管理业务系统容量各资源使用状况等,通过对系统资源瓶颈的分析,可以降低或提高业务系统容量;3平台架构控,对各类设备进行全面集中的统一管理,及时发现各类异下图所示:平台进行全方位的配置管理;3.1.1采集层集信息系统的性能数据和故障数据,通过在信息系统服务器上部署AgentSNMP层台服务器发出的采集指令,执行相关的信息采集插件,将采集到的数据放人数据库中,便于后续的分析和数据挖掘;3.1.2处理层据不同监控对象的自身特点和运维管理需要,灵活定制相应的性能指标集,定义所述性能指标集中每个指标的监测范围、数据来源,计算方法、预警阈值、测量照由自动化运维工具处理;3.1.3展现层息系统全局视图、系统健康度巡检报表、检测数据査询三个部分;全局视管理员可以分析系统性能状况,并记录过业务视图、逻辑拓扑、重要设备、告警统计各个不同序、实时、全面地呈现出信息系统资源和业务系统IT灵活部访问门即可对所有的平台功能进行操作,针对不同的登录用户,可以提供专门的辅助工具;性能,流量,报表,拓扑等系统管理所关心的信息在不同样集中体现出来;IT实现设备维修、值班的管理;台能够提供统一的企业级网络事件管理;通过从各种网络设备和管理信息,并进行必要的分析和自动化处理工作;据网管系统,提供数据网管标准接口以供信息交互,完成事件的统一管理,使网资源得到更加高效的利用和综合管理;系统管理提供对服务器、存储设备、操作系统、数据库、中间件、综合管理,实现系统故障告警管理、系统性能管理、拓扑与配置管理;接收来自防火墙、人侵检测、端口扫描等安全系统的告警,并将这些告警实时呈现给信息网络安全部门,以采取进一步的响应动作,保障网络系统的正常运行,并对网络流量进行监听和分析;4对新核心系统建设的要求在文件中进行输出,给运维监控分析排查问题带来较大的困难,建议在新系统的建设过程中,统一规范日志的输出:(1)规范日志信息级别致命Fatal严重的错误,系统无法正常运行,如硬盘空间满等;这个级别很少被用,错误Error系统可以继续运行,但最好要尽快修复的错误;这个级别用的较多,常or警告Warn系统可以正常运行,但需要引起注意的警告信息;这个级别预示较小户输入了不符合条件的参数;信息Info系统运行的主要关键时点的操作信息,一般用于记录业务日志;但同时,信息以保证可以记录再现缺陷的路径;这个级别记录了系统日常运转中有调试Debug系统运行中的调试信息,便于开发人员进行错误分析和修正,一般用心程序操作细粒度,不太关心业务操作粗粒度;系统出现问题时,必须抛出异FatalErrorWarning(2)日志中除包含错误信息外,还需包含如下信息:URL的实地址,交互报文,报文的检查结果,接口响应时常;c)在日志中,记录关键程序和数据库交易的处理时长,并根据事先预定的阈值,在日SQL以便分析,排查性能隐患;4.2预留应用系统监控接口,便于监控系统采集相关指标程中,需预留监控接口,应用监控系统通过调用核心系统的监控接口,来采集包括但不限于以下指标:“Error500””Error404”b)对用户访问质量的监控,页面加载时常;c)对程序主逻辑进行监控,判断主逻辑是否正常;能进行判断;柄的使用情况,网络句柄的使用情况,文件状态的进程数;f)服务的监控指标,数据加载的情况,模块的处理能力平均耗时,队列长度,线程池的使用率,模块间通讯的状态平均连接时间,读、写错误数,模块运行时间;g)系统用户的操作习惯,完成功能模块操作的时长;4.3提供服务持续可用性监控方法是应用系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论