版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、混合云环境下基于 Zabbix 的监控系统解决方案目录混合云环境下基于 Zabbix 的监控系统解决方案 .1.背景和原因 .项目范围.问题与挑战.优势与必要性 .项目实施的预期应用效果.业务价值.企业 IT 系统价值 .运维人员价值 .风险管理.面临的风险.风险定级.应对措施.预算评估.成本分类.设备构成.成本估算.时机选择.策略原则.项目启动建议 .关键技术路线选型 .选型标准.技术对比.结束语.【摘要】当前在很长一段时间内,企业将历经混合云时代,对于企业 IT人员来说,如何更好的发现问题和解决混合云内的系统问题,就成了首要考虑因素。本文主要介绍如何选型适合混合云环境下的监控系统,既符合传
2、统模式的监控要求,又满足云环境的弹性、按需分配的原则。文章主要介绍选型的标准、依据及相关风险管理。具体的软件实施,不在本文做详细说明。背景和原因随着集团业务大战略的发展需要,不断在全球范围内收购与之相关的公司。为了对业务更好的支撑,集团 IT信息化也在不断的扩张和改革。随着应用的不断增加,传统的监控模式已经不能很好的满足要求,满足针对云的监控。为了适应 IT长期发展需要,需要尽快选择一款适应公司未来五年 IT发展需要的监控软件,对现有传统环境和云环境进行监控。项目范围公司隶属制造业,属于传统的制造企业,IT架构也是按照传统架构设计。随着 IT业务发展,引入了私有云及公有云业务。不同的应用按照其
3、特性,分布在不同的 IT环境中。现有的监控软件只能满足传统 IT需求,无法更好的支撑云环境下的自定义及自动化监控。本项目主要对以下环境的系统进行监控。图 1 :监控系统拓扑图 2 监控指标从底层硬件到操作系统、中间件、应用软件、数据库、网络设备、用户行为等,均作为监控范围。问题与挑战监控系统作为系统管理员的眼睛是最先发现问题的途径,一个完整的监控系统可以大幅降低系统发生概率的几率,及时通知管理员处理。以下是 IT管理工作人员所面临的传统行业 IT 常见的五种挑战。用户体验的监控针对应用提供的各项功能,从应用系统使用者的用户体验角度,监测应用提供的各项功能的系统响应,典型的为端到端响应监控。比如
4、 Web 应用的响应时间、系统的反应速度、数据库连接数量等。自定义监控传统的监控系统,很多功能往往是设定的,管理员无法跟踪新的需求自己定义,导致很多指标无法被监控,增加了管理员的工作量,同时也无法保障系统的问题被及时发现与处理。自动化处理自动化方面,传统的监控系统几乎全军覆没。很多都是由厂商集成的现成功能,无法与现有的触发器形成自动化处理。网络监控随着私有云和公有云的对接,网络的监控变得尤为重要。目前的传统监控方式很难直接与公有云对接,对于监控云主机存在不少的问题。日志监控目前的传统监控系统在日志监控方面属于弱项,往往需要借助其它产品,形成双控制台,对于日志类型也有较为严格的规定,毕竟属于成型
5、商业产品。优势与必要性本次项目目标要求重新选型监控系统,使之适应传统 IT系统的监控前提下,必须可以对混合云环境中的系统指标进行监控。本次项目最终采用开源的网络监控系统 Zabbix 作为整个环境的监控平台。主要是由于其具备以下好处:1. All-In-OneNagios 和 Cacti的功能全部涵盖,报警规则强大详细(Email/IM/SMS),画图也比较美观,可以与多种画图工具集成,如 Grafana ;2. 开放 API开放 API,支持多种接口调用,可以与现有的大数据平台直接对接,实现数据联动;3. 数据采集可用性和性能检测,自动发现,支持 agent 、snmp 、JMX 、teln
6、et等多种采集方式,支持主动和被动模式数据传输、支持用户自定义插件,自定义间隔收集数据;4. 图形化展示允许自定义创建多监控项视图,网络拓扑,自定义面板展示,自定义 IT服务可用性;5. 安全审计具备安全的用户审计日志,权限认证,用户可以限制允许维护的列表;6. 历史数据历史数据查询可配置,内置数据清理机制,按照管理员预设,定期进行历史数据清理;7. 自定义监控可以针对特殊需求,进行自定义监控,如用户连接数、数据库连接数、Web的访问效率等;8. 自动化针对预定的警报触发响应的动作,可以在无管理员接入的情况下,自动进行系统修复与动作编排;Zabbix 已经在很多行业进行部署,开源市场占有率颇高
7、,在各行各业都扮演着关键的因素。比如金融业、保险业和制造业等。项目实施的预期应用效果通过此次项目实施,最终实现集团数百套应用的监控,从用户端到存储后端。关键指标被监控,当出现问题,管理员可以在第一时间得到告警通知,警报可以通过短信、邮件、微信三种方式发出给管理员,确保消息被及时有效的发送。业务价值以前的监控仅仅是为基础设施服务,监控基础设施是否有问题,是否发出警报,管理员是否处理等。而在当今业务驱动的时代,监控系统必须站在业务的角度去监控整个系统,提供有效的业务价值,比如:分析应用的可用性数据 体现应用系统的运行状态显示应用系统响应时间和加载速度新能信息列表显示应用系统最新告警信息企业IT 系
8、统价值集团 IT系统众多,体量超过 800 。在开源与商业产品的选择中,满足实际功能是第一任务。之后就是要考虑其购买成本。Zabbix 本身属于开源软件,不用考虑额外的license费用问题,无论 IT系统数量多少,只需要按照比例对 Zabbix 服务器本身进行负载即可。开源工具,不产生额外授权及使用费用支持多种传统 IT设备以及其它流行数据平台的特殊监控要求,如大数据、车联网等自定义监控指标,充分发挥管理员的脚本能力,按需监控,满足企业不同 IT系统的不同监控需求对现有 IT系统的改动最小,对于某些系统指标而言,甚至无需安装客户端软件运维人员价值开源软件的运维对管理员的技能要求高,需要管理员
9、数量掌握 Linux 操作系统知识,具备简单的脚本编写能力。但是其给管理员带来的益处远大于弊处。可以批量处理监控对象,降低管理员重复工作量充分发挥自动化的优势,免去警报的手动关闭,同时提升系统的联动性简化配置操作,可以通过自动发现功能,自动发现并添加同网段甚至不同网段的主机多种触发机制叠加,避免误报。管理员可以将多种条件进行组合,符合最终条件的警报,作为触发条件。增加管理员与应用的粘度,相互配合完成特殊监控需求风险管理尽管如此,还是有必要对项目中可能发生的风险进行梳理。不过,在开始对风险评估之前, IT部门首先需要了解为什么会提出这样的问题以及有哪些风险需要进行评估。其中尤为重要的是,每一个人
10、都要明白,IT面临的风险最终都会波及到企业的正常经营。面临的风险监控系统对于整个 IT系统而言不仅仅是看门狗,更是救命稻草。但是如果部署和配置不妥,反而会事倍功半。一般而言,这些风险可以分为以下四种,它们都有对应的风险控制措施。业务风险在整个项目进行的过程中,有些监控需要使用 C/S 结构进行部署,此时客户端软件可以对现有的业务系统产生影响,例如某些组件不兼容,如果升级,将将影响现有系统。如果冒然升级,可以造成业务的中断,甚至更糟糕的结果。技术风险开源软件虽然免费,但是也增加了问题发生后的处理难度。针对疑难问题,无法得到官方的支持,容易操作技术壁垒,使项目受阻。运维风险项目使得监控系统可以顺利
11、监控各种 IT系统的同时,也可以针对管理员的配置,对特定的警报进行指定的操作,例如,自动重启服务或者扩容硬盘。自动化程度越高,越要求管理员对编写的每个脚本进行自检,否则可能造成无法挽回的业务损失,甚至造成系统停止服务。项目风险对于经过批准的或者是已经在开发中的项目,其风险点通常落在项目是否能在预算内、按期、高质量地交付。风险定级针对可能的风险,在项目的初始阶段可以定义出风险的级别,便于分析和启动应对措施,避免风险的发生,将问题尽快解决。本项目采用 1-3 级的方式,对风险进行划分。高风险:影响业务正常访问,造成严重系统异常中风险:造成严重系统异常,不影响业务使用 低风险:未造成业务中断,造成轻
12、微系统异常应对措施预算评估集团 IT系统粗略估算有 800 多套,立项之初,费用为 100 万,考虑到项目的进度与跨年预算,建议分成两期执行,每期预算 50 万。不同的企业可以根据自身的设备类型和系统数量进行增减,按照常规软件选型来看,一般都在 150 万到 200 万之间。成本分类整体成本一共分为三部分,开发费用、外包费用和软件实施费用。由于开源软件安装较为灵活,但是现有功能及界面不能满足企业的定制要求,所以需要额外的费用进行开发定制,以适应企业需要。设备构成整个监控系统分为软件和硬件两个部分。以下为具体的设备信息(仅供参考)成本估算整体采用开源产品搭建,免去了 license费用的成本,比
13、购买商业产品成本低于行业标准。时机选择监控系统的整体变更与选择往往是随着企业整体 IT系统的变化而变化。IT技术的发展,推动业务的需求增加,新技术的应用,催动行业标准变更。云计算、大数据、AI 的兴起,挑战了传统监控系统的功能和架构,所以这个时候往往也是 IT管理员要考虑监控变更的时候了。策略原则在做监控系统取舍时机选择的时候,建议参考以下几点: 1 、现有监控系统无法满足业务的 30% 以上需求;2 、现有监控系统与新业务的兼容性出现严重问题;3 、新兴技术的普及与业务发展战略的调整;4 、现有监控系统周期性问题,比如 license、费用等问题的变化;目前 Zabbix 监控系统已经作为流
14、行的开源软件在各行各业的企业内大范围部署。因为其软件开源、成本低、开发简单、兼容大环境等优势,被 IT人员青睐。项目启动建议基于如上策略原则和目前开源市场的占有率,项目启动的时机有以下建议: 1 、根据业务系统和 IT系统的需求周期而定,考虑全局策略;2 、根据现有系统的承载能力和扩展情况而定,考虑系统负荷性;3 、根据公司预算要求,考虑整体项目的预算需求;4 、制定未来五年的监控计划,考虑项目组成和延续性;关键技术路线选型目前市场上的监控系统很多,监控类型丰富,各具特性。作为 IT管理员在对监控系统的选型上就要结合企业的实际需求去匹配,挑选符合要求的系统进行实施。选型标准本项目因为费用和具体
15、的业务需求,需要符合以下指标: 1 、 具备开放的 API 接口,便于后期大数据系统的数据采集2 、 监控内容丰富,从硬件、OS 、数据库、应用到业务层3 、 支持自定义开发,比如报表、界面等4 、 支持脚本的自定义,满足不同场景需求5 、 客户端接入和监控采集无技术限制,避免特殊问题发生6 、 具有一定市场占有率,产品成熟技术对比不同的监控系统具备不同的使用场景,各有所长,也各有劣势。在进行技术选型时,应该根 据业务的不同需求进行匹配,而不是仅仅看产品的占有率和功能性,最适合的才是最好的。在本项目中,我们对三种产品进行了比对,最终选择开源的 Zabbix 作为企业级的监控系统。技术建议各种产品的诞生都有其存在和扩展的原因,由于技术的普及与推广,越来越多的监控系统被IT人员发现和使用。每个产品都有其不可代替的优势和无法躲避的劣势。企业在进行产品选型时建议
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 暨南大学《篮球》2023-2024学年第一学期期末试卷
- 汽车改装技术 课件 1.3汽车线路改装
- 眼科护理个案护理
- 2024年学年总务处工作总结
- 艾滋病的预防与中暑防范
- 跌倒的评估预防应急流程
- 腹腔输液港的护理
- 远程医疗流程
- 重度颅脑损伤护理
- 如何撰写游戏活动案例
- 药学类之药学(中级)题库大全包过题库及参考答案
- 烟花爆竹零售店点安全技术规范课件
- 2023年北京城市副中心投资建设集团有限公司校园招聘笔试题库及答案解析
- 公司事故原因调查取证笔录文书模板
- 中医师承拜师合同公证书(通用)
- 2019年上海闵行区初三英语二模卷(高清版-附听力文稿、答案)
- 解剖学 第七章 生殖系统课件
- 2022江苏开放大学江苏红色文化大作业江苏红色文化中所蕴含的红色精神有哪些
- 2021年商丘师范学院辅导员招聘试题及答案解析
- 个人工作居住证明模板(通用5篇)
- 高速公路机电施工方案
评论
0/150
提交评论