智能IT运维管理经验分享_第1页
智能IT运维管理经验分享_第2页
智能IT运维管理经验分享_第3页
智能IT运维管理经验分享_第4页
智能IT运维管理经验分享_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 智能IT运维管理经验及分享IT运维咨询顾问胡雨晴 Page2运维现状与困难信息化迅猛发展的同时,给IT部门带来了更大的压力ITIT部门面临的部门面临的“技术技术”难题难题 各种业务系统越来越多,系统对IT资源的依赖性高,系统一旦出现任何问题,需要逐个排查,故障定位难。1 业务运行环境越来越复杂,故障定位慢 运维人员每天面临大量的重复性、手工性的故障排查工作,不仅费时费力,而且容易出错,亟需自动化的手段帮助提升效率。2 运维工作繁重,缺少自动化工具和手段信息化迅猛发展的同时,给IT部门带来了更大的压力ITIT部门面临的部门面临的“管理管理”难题难题 信息化投入了巨大资金,到底都花到哪了?花的钱

2、建设成了什么效果?对单位的信息化提升起到了什么帮助?4 信息化建设投入巨大,难以展现效果 日常运维工作流程混乱,或者没有标准流程,造成工作效率低下,同时客户抱怨、投诉不减 员工干好干坏一个样,员工绩效无法体现3 运维工作没有流程化、规范化、电子化IT部门运维管理解决思路面对困难,如何找到解决办法?1 业务运行环境越来越复杂,故障定位慢2 运维工作繁重,缺少自动化工具和手段4 信息化建设投入巨大,难以展现效果3 运维工作没有流程化、规范化、电子化 资源统一监控 问题高效解决 运维水平提升 业务系统掌控IP承载网支撑资源 建设成果可视化Page6资源统一监控IT基础管理网络管理网络管理网络管理主机

3、系统管理主机系统管理中间件管理中间件管理应用系统管理应用系统管理数据库管理数据库管理1.网络自动发现 360度雷达扫描视图多协议多算法自动调整自动发现详情多协议并发发现,效率高自动发现与建模2.网络设备性能管理全局性能监测设备负荷TOPN排名实时性能监控3.网络拓扑管理全局拓扑视图、拓扑分层视图拓扑试图可自定义编辑分布式拓扑模式拓扑发现深入,2、3层拓扑4.网络流量管理全局流量监测链路流量TOPN排名重要链路流量信息应用流量分析5.网络故障管理网络管理网络管理:通过多种协议的主动管理方式,实时监控网络设备性能参数,快速发现故障,及时发出告警自动发现设备性能管理网络故障管理机房监控管理机房监控管

4、理网络拓扑管理IT基础管应用管理网络管理网络管理服务器管理服务器管理中间件管理中间件管理基础服务管理基础服务管理数据库管理数据库管理机房监控管理机房监控管理1. 业务视图(以业务角度管理IT)2.非代理监控方式3.实时性能分析 网络实时性能分析 主机性能实时分析4.关键进程监控管理5.应用指标TOP10总结应用系统管理:应用系统管理:对网络内的主机、操作系统、数据库、中间件等应用系统的故障检测和性能管理。1.事件关联分析2.根源性告警设置3.智能化告警处理 告警通知 智能告警处理,避免告 警风暴4.告警详细信息展示5.经验知识库维护管理告警事件管理:告警事件管理:将IT环境中的事件统一搜集,经

5、过智能分析与过滤,形成告警事件,并予以通知和展示。应用监控管理告警设置平台统一告警平台性能状态IT基础管理机房管理网络管理网络管理主机系统管理主机系统管理中间件管理中间件管理应用系统管理应用系统管理数据库管理数据库管理机房监控管理机房监控管理机房监控管理:机房监控管理:全面的机房动力环境元素的监控,形成多维汇总报表数据,通过Portal统一展现,1.温湿度、UPS、市电等统一显示2.告警数据集成显示3.机房管理系统页面集成4.统一事件管理5.统一机房监控对比6.实时机房性能数据展示Page10IT生存环境无线管理Page11可视化无线热图,真实反映无线热点覆盖情况,直观体现无线设备下用户连接数

6、量;智能的无线障碍物信号衰减算法,真实体现无线信号覆盖情况,为规划无线解决解决方案提供依据;无线AC、AP、Radio、在线用户、WLAN服务的统一资源管理,可清晰地建立各资源的关联关系,降低管理员的管理难度;向导式配置管理,使无线方案的落地变得轻松、简单; 多维度的无线资源统计报表,直观展示无线设备总体健康状况和利用情况。Page12业务系统掌控Page13掌控的基础,是很清晰的知道IT资源支撑了哪些业务,哪些服务Page14IT需要全局掌控Page15IT需要全局掌控哪个业务出现了问题Page16IT管理需要全局掌控具体发生了什么Page17IT管理需要全局掌控从整体到局部,从宏观到微观P

7、age18问题高效解决异常事件即时告警,定位故障Page19万一出了事要能快速定位,解决看看设备之间的关联关系,追查故障,排除影响查看维护记录,寻求相关知识帮助排除问题,恢复业务IPAD移动终端,随身携带的IT管家Page20IPAD客户端-资源一览IPAD客户端-资源详情1.系统全面支持IOS平台移动终端iPad,通过移动终端随时随地了解IT资源运行情况;2.终端支持事件、告警、资源一览,实现关键设备运行状态查询、告警处理等功能。Page21运维水平提升主动巡防能力,及早发现隐患Page22手工化的设备健康检查耗时费力,依赖命令检查技术门槛高,缺乏有效监督和提醒,问题发现不及时,巡检记录难以

8、统计、分析。1.自定义设定自动巡检范围、指标、频度以及巡检报告表单;2.自动、手动两种方式对设备的运行状况进行巡检;3.自动生成巡检报告;4.支持巡检报告自动发送功能。自动巡检设置巡检报告掌控所有配置项信息,实现资产全生命周期管理Page23这台设备是谁负责?什么时候采购的?什么时候过保?如果对这台设备进行变更,会对其他设备及业务造成什么影响?1.向导方式完成配置导入、自动发现、权限配置、关联关系设定等系列CMDB的构建工作; 2.可自定义扩展配置项属性;3.图形化设置并展示配置项间关系;4.可定义配置项审计任务,并进行自动化审计操作,生成审计报告; 5.实现CMDB与资源管理的双向关联。配置

9、关系视图配置项定义技术储备,全面提升组织能力Page24人员的经验和技能该如何进行复制?如何形成知识库,达成经验积累?同类事件再次发生时,如何找出历史的解决方法供参考?1.实现知识在事件处理过程中积累,一步勾选添加知识库;2.实现知识生命周期管理,包括新建、审批、发布等; 3.按照个人需要可自定义知识查询视图;4.支持知识评级管理,价值排名,且与绩效挂钩。 知识一览及详情添加知识Page25建设成果可视化Page26管理需要可视化Page27管理需要可视化Page28管理需要可视化Page29建设思路集简约、高效、自动化IT运维体系建立的思路知识库管理事件管理问题管理计划任务科技工作管理自助服

10、务台变更管理配置管理服务级别CMDB数据库存储服务器网络中间件机房业务系统报障请求获得反馈登记、自助知识库、跟跟进度快速响应和恢复故障根源分析和解决知识积累与共享变更风险管控IT资源全生命周期管理周期性工作值班与巡检项目进度、资源管理达成IT交付与业务需求的平衡IT资源的集中管理用户IT基础设施流程业务资源业务需求服务承诺网络监控业务应用监控应用服务资源监控服务器数据库中间件存储业务卡片健康繁忙层级管理业务关联网络拓扑网络故障网络性能自动发现第一步:建立自动化监控和管理平台,并展现信息化建设成果第二步:建立故障与流程的自动触发,结合SLA提升人员服务效率第三步:建立可量化的IT部门考核体系,呈

11、现IT部门业绩和价值IT部门工作的未来蓝图服务器网络数据库存储应用中间件异常告警通知自动生成事件单事件管理快速响应、解决突发故障及请求,在最短时间内恢复业务IP呼叫中心电话受理,自动识别来电用户身份服务台座席创建事件单自助服务台用户WEB登录,提报服务或故障请求生成事件单技术人员受理并尝试解决分派查询知识解决,通知用户获得满意度反馈升级问题管理根源分析,找出根本原因,避免故障再次发生知识库服务级别管理跟踪事件处理时效,达成与客户的服务约定申请变更变更管理控制变更可能产生的风险问题小组分析并根源解决解决方案入知识库申请变更变更评审委员会评估、制定变更计划受理指派技术人员变更实施及发布CMDB资产配置管理员更新配置信息通知配置管理资产配置全生命周期管理更新发现 同步客户与IT主管计划任务管理周期性任务提醒、执行、监督项目管理开发及重大实施项目周期管理长周期变更任务KPI与报表管理报

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论