基于大数据的IT运维方案_第1页
基于大数据的IT运维方案_第2页
基于大数据的IT运维方案_第3页
基于大数据的IT运维方案_第4页
基于大数据的IT运维方案_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于大数据的IT运维方案面向数据的IT运维交流基于大数据的IT运维方案面向数据的IT运维交流1今天IT运维面临的挑战2面向未来IT运维“新四化”之路3优锘IT运维“新四化”解决方案4优锘IT运维“新四化”成功案例目录 CONTENTS1今天IT运维面临的挑战2面向未来IT运维“新四化”之路3优今天IT运维面临的挑战 今天的业务环境和技术环境下,企业的IT运维普遍面临如下挑战:结构复杂化 业务发展迅速-涉及多个业务领域、各种业务流程域、众多的业务系统相互关联,内部逻辑复杂多变技术更新换代较快-从标准化的软硬件体系到Iass资源池实现虚拟化以及PasS和应用资源池化实现集群级弹性伸缩,导致技术的复

2、杂度在快速增加运维工具的多样化和相互割裂,造成日常操作不便和学习成本增高数据碎片化 各个业务流程域、应用系统间、运维工具间的数据孤岛,在跨领域协作时,由于信息不对称,导致大量的理解偏差和额外的沟通成本缺乏从业务至应用、服务器、网络的端到端分析的全景视图,导致对系统整体的理解存在一定偏差,不利日常的故障处理与分析变化常态化 业务和新技术的迅速发展和诞生,导致了系统版本需要频繁变更管理成本增大机制板结化 IT运维工具的升级,需要经历漫长的需求调用、概要设计、详细设计、开发、测试、实施、试运行的过程,导致上线周期长,资源开销大,市场响应速度慢, IT运维产品失去活性,难以发展和适变由于IT运维标准、

3、规则一刀切,IT运维人员的个体运维经验难以融合为组织知识资产,失去活性,专业能力难以发展和适变今天IT运维面临的挑战 今天的业务环境和技术环ApplicationDatabaseSystemServerStorageNetwork应用管理系统管理网路管理存储管理数据库管理环境管理统一接口专业管理工具统一数据处理可视化管理基于统一数据的可视化运维管理ApplicationDatabaseSystemServe1今天IT运维面临的挑战2面向未来IT运维“新四化”之路3优锘IT运维“新四化”解决方案4优锘IT运维“新四化”成功案例目录 CONTENTS1今天IT运维面临的挑战2面向未来IT运维“新四

4、化”之路3优面向未来IT运维的“新四化”转型之路可视化架构配置管理集中化监控管理场景化运维管理众创化平台TitleTitleTitleTitle1234面向未来IT运维的“新四化”转型之路可视化架构配置管理集中化可视化架构配置管理目标:构筑IT运维的“百度”地图1可视化架构配置管理目标:构筑IT运维的“百度”地图1机房动力环境SAN网络服务器应用系统数据库中间件操作系统接入渠道外部系统用户终端负载均衡防火墙企业IT传统的IT管理视角是分散的,以技术专业为单位划分成管理孤岛,相互之间没有关联。应用管理系统管理环控网络管理机房动力环境SAN网络服务器应用系统数据库中间件操作系统接入机房动力环境SA

5、N网络服务器应用系统数据库中间件操作系统?接入渠道外部系统用户终端负载均衡防火墙企业IT ? ?划分过程缺乏从业务出发的整体视角,甚至可能忽略某些部分,形成管理盲区。应用管理系统管理环控网络管理机房动力环境SAN网络服务器应用系统数据库中间件操作系统?接机房动力环境SAN网络服务器应用系统数据库中间件操作系统?接入渠道外部系统用户终端负载均衡防火墙企业IT ? ?IT可视化首先会打破各个专业领域和工具平台的壁垒,提取出各个专业领域有价值的管理数据。应用管理系统管理环控网络管理机房动力环境SAN网络服务器应用系统数据库中间件操作系统?接机房动力环境SAN网络服务器应用系统数据库中间件操作系统?接

6、入渠道外部系统用户终端负载均衡防火墙企业IT ? ?建立整合的可视化运维管理数据库,通过统一的集成接口,将多维度多专业的数据整合。机房动力环境SAN网络服务器应用系统数据库中间件操作系统?接机房动力环境SAN网络服务器应用系统数据库中间件操作系统?接入渠道外部系统用户终端负载均衡防火墙企业IT ? ?通过整合的数据平台,发掘IT系统的全貌,建立端到端的可视化数据管理模型。机房动力环境SAN网络服务器应用系统数据库中间件操作系统?接机房动力环境SAN网络服务器应用系统数据库中间件操作系统加密机接入渠道外部系统用户终端负载均衡防火墙企业ITNAS随机数发生器业务交易业务交易机房动力环境SAN网络服

7、务器应用系统数据库中间件操作系统加密可视化架构配置管理(续)Web服务器前置机网关服务器应用服务器数据库服务器存储网络数据中心系统平台IT基础设施机房动环数据中心数据中心接口平台外部接口用户终端外部系统接入渠道防火墙负载均衡加密机应用系统业务交易业务交易可视化架构配置管理(续)Web服务器前置机网关服务器应用服务集中化监控管理目标:构筑IT运维的“路况”地图2集中化监控管理目标:构筑IT运维的“路况”地图2集中化监控管理(续)Web服务器前置机网关服务器应用服务器数据库服务器存储网络数据中心系统平台IT基础设施机房动环数据中心数据中心接口平台外部接口用户终端外部系统接入渠道防火墙负载均衡加密机

8、应用系统业务交易业务交易端到端可视化监控CPU使用率内存使用率磁盘空间6583秒50%监控信息交易处理系统0交易量响应时间成功率6583秒40%监控信息交易处理系统2级别Critical报警信息交易处理系统发生时间信息08-15 12:00系统成功率异常集中化监控管理(续)Web服务器前置机网关服务器应用服务器数CIConfigMonitorsChange/incident historyLogsScriptalarmsCiCi1,通过管理对象,整合多维度管理信息和管理接口CiCiRELRELRELRELRELCiCiCiCiCiCiCiCi2,通过管理场景,整合相关联的管理对象CiCiCiC

9、iCiCiCiCiConfigMonitorsChangeIncident historyLogsScriptAlarms3,通过管理场景,使用关联的信息和接口CIConfigMonitorsChange/inciden故障诊断-端到端监控外汇交易量下降服务器无告警网络无告警其他监控指标均正常可能不是外汇系统问题故障诊断-端到端监控外汇交易量下降服务器无告警网络无告警其他可能是“二代支付”服务器问题,做进步一诊断故障诊断-端到端监控发现上游“二代支付”系统存在“大额支付交易量”异常查看“二代支付”业务交易图,发现服务器告警查看“二代支付”系统部署架构图,亦发现服务器告警查看“二代支付”网络拓扑

10、图,无设备告警可能是“二代支付”服务器问题,做进步一诊断故障诊断-端到端监场景化运维运维管理目标:构筑IT运维的“场景化路况”地图和“场景化应急预案”3场景化运维运维管理目标:构筑IT运维的“场景化路况”地图和“场景化运维管理(续)带宽利用率30%告警带宽利用率60%告警带宽利用率15%告警网络管理安全管理BeforeAfter 场景化运维管理(续)带宽利用率30%告警带宽利用率60%场景化运维管理(续)20%80%日常短信业务量节假日短信业务量上基线60%下基线10%20%80%上基线50%下基线5%上基线90%下基线20%日常短信业务监控节假日短信业务监控传统一刀切的管理面向场景的管理场景

11、化运维管理(续)20%80%日常短信业务量节假日短信业务故障诊断-一键巡检noactive发现“大额支付程序”进程异常检测所有服务器的进程状态故障诊断-一键巡检noactive发现“大额支付程序”进程异场景化运维管理(续)场景化运维管理(续)监控CMDB场景封装动态数据 创作Design Steps从架构图梳理入手建立配置数据定义并从监控中获取性能数据设置个性化阈值,生成预警关联自动化操作工具,封装场景发布可视化管理场景订阅、分享、持续标准化Benefits降低可视化的交付成本,提升交付速度自服务,释放一线技术人员创造力场景化封装,减少工具切换频率订阅专家成果,促进经验分享静态数据 上基线下基

12、线中心线自动化数据+图+操作场景化运维监控CMDB场景封装动 创作Design StepsB众创化运维平台画主机!画什么?画网络!画交易!画存储!众创,让每个需求的提出者,同时也成为需求的实现者上基线下基线中心线4众创化运维平台画主机!画什么?画网络!画交易!画存储!众创,流程平台监控系统配置管理自动化系统配置信息监控信息报警事件操控信息流程信息全景监控运维分析阈值预警故障应急变更控制运维社区创建 协作 发布 订阅统一接口运维数据仓库DCIMSMSAPMNMS处理引擎可视化管理平台可视化运维平台场景场景场景场景场景场景 平台化 整合分散的数据源和接口提供统一的数据和处理平台 众包 下放生产能力

13、给最终用户以可视化为手段,降低生产门槛权威发布和社区化共存 容器化 共享原始数据和通用处理能力互相隔离、互不影响的处理容器自定义处理场景和处理规则 系统解耦 将接口、处理、呈现分离抽象处理功能端到端可视化能力监控系统配置管理自动化系统配置信息监控信息报警事件操控信息流“新四化”需要以大数据平台作为支撑和保障海量运维数据的分布式采集海量运维数据的分布式存储海量运维数据基于个性化规则的实时性分布式计算海量运维数据基于个性化门户的高性能应用呈现海量运维数据深度挖掘分析“新四化”需要以大数据平台作为支撑和保障海量运维数据的分布式1今天IT运维面临的挑战2面向未来IT运维“新四化”之路3优锘IT运维“新

14、四化”解决方案4优锘IT运维“新四化”成功案例目录 CONTENTS1今天IT运维面临的挑战2面向未来IT运维“新四化”之路3优配置数据监控数据事件告警操控数据流程数据图数据集数据处理层数据存储层JDBCWeb ServiceMQSocket数据接口层性能处理引擎事件处理引擎RESTful3D可视化编辑引擎2D可视化编辑引擎1D可视化编辑引擎配置管理视图管理场景管理诊断管理恢复管理自动化控制应用画像基础管理可视赋能层应用功能层操作调度引擎运维数据仓库运营门户层个人工作台大屏门户掌上门户优锘IT运维“新四化”解决方案整体架构配置数据监控数据事件告警操控数据流程数据图数据集数据处理层数可视化IT架

15、构配置管理 业务视图可视化业务交易从业务处理的视角,梳理业务的端到端处理过程,实现交易路径和功能处理模块的可视化管理可视化元素最终用户,业务交易,交易路径,功能组件,应用系统管理功能为业务部门和IT管理人员提供统一的业务运行实时信息提供交易监控可视化、业务指标可视化、交易路径及交易拓扑可视化运行异常时的业务影响范围可视化分析和故障组件定位等功能1可视化IT架构配置管理 业务视图可视化业务交易1应用视图可视化应用关系从应用系统的视角,梳理展示应用系统之间及应用组件之间的交互关系,形成应用系统全景视图可视化元素应用系统,应用组件,交互关系管理功能为IT管理人员提供应用系统的全景视图管理系统间的交互

16、和上下游关系信息整合监控信息,实时监控应用运行状态可视化IT架构配置管理(续) 应用视图可视化应用关系可视化IT架构配置管理(续) 资源视图可视化应用组件从系统组件的视角,构建应用系统逻辑架构和物理部署架构可视化元素软件实例,操作系统实例,虚拟机,服务器,数据交互关系管理功能提供以应用系统为单位的清晰管理视图支撑应用系统运行架构可视化,及运行环境中的中间件、数据库、应用程序等组件实例可视化管理提供系统逻辑架构和部署架构管理,实时监控,报警关联及可视化分析等功能可视化IT架构配置管理(续) 资源视图可视化应用组件可视化IT架构配置管理(续) 网络视图可视化网络视图从网络的视角,构建支撑应用和业务

17、的网络拓扑架构可视化元素网络设备、逻辑网络、物理网络,数据交互关系管理功能提供以网络结构为单位的清晰管理视图提供虚拟网络和物理网络的管理,实时监控,报警关联及可视化分析等功能可视化IT架构配置管理(续) 网络视图可视化网络视图可视化IT架构配置管理(续) 可视化IT架构配置管理(续)组合视图可视化从支撑业务的网络设备、服务器、应用系统、业务渠道各层次的视图进行组合,实现IT架构端到端的可视化,更加直观的展现业务的支撑和影响关系。可视化元素业务渠道、交易量、应用系统、服务器、存储、网络设备,交互关系管理功能为IT管理人员提供端到端的全景视图管理系统间的交互和上下游关系信息整合监控信息,实时监控应

18、用运行状态辅助故障定位和影响分析可视化IT架构配置管理(续)组合视图可视化从支撑业务的网络设集中化监控管理Before 分散在各监控系统中的性能/告警列表After 应用端到端监控视图网管监控应用监控主机监控2集中化监控管理Before 分散在各监控系统中的性能/告警列场景化运维管理 场景管理针针对日常运维场景进行汇总,在各类场景视图上,运维人员可清楚了解,运维所需要各个步骤,并调出相关系统的各类监控相关信息可视化元素业务渠道、交易量、应用系统、服务器、存储、网络设备,交互关系管理功能整合监控信息,实时监控应用运行状态自定义指标、监控阀值,提高告警准确率对不同的角色或者业务,可设计不同的管理场

19、景,来满足运维不同层次的需求3场景化运维管理 场景管理针针对日常运维场景进行汇总,在各类场场景化运维管理(续) 自动化诊断与恢复在故障发生时,可根据预先定义自动匹配恢复方案,并通过任务引擎调用故障处理脚本,对故障进行自动恢复操作。管理功能减少故障排查和处理时间节约人力成本,提高RTO场景化运维管理(续) 自动化诊断与恢复在故障发生时,可根据预场景化运维管理(续) 自动化接口适配器根据场景中预定义的规则、阈值,通过任务引擎自动调用执行相关自动化脚本。场景化运维管理(续) 自动化接口适配器根据场景中预定义的规则众创化运维平台 场景发布/订阅自助创建可视化管理场景领域专家/运维人员订阅订阅订阅4众创

20、化运维平台 场景发布/订阅自助创建可视化管理场景领域专家众创化运维平台(续) 社区管理用户空间验证创建发布订阅社区分析我的管理场景我订阅的管理场景最热门的管理场景最新的管理场景最勤劳的*运维社区众创化运维平台(续) 社区管理用户空间验证创建发布订阅社区分1今天IT运维面临的挑战2面向未来IT运维“新四化”之路3优锘IT运维“新四化”解决方案4优锘IT运维“新四化”成功案例目录 CONTENTS1今天IT运维面临的挑战2面向未来IT运维“新四化”之路3优领域产品应用设备资源配置项Ci指标项KPI运维数据数量12100+2000+10500+主机/应用60+项/17亿条/日1.7TB/日示例LTC

21、IPDITRFINHRiSalesPRMCIRCPPeSee主机类指标:20,BPPM原生进程应用类指标:20,BPPM原生IO及业务类指标:20,eSee原生长期看所有CI所有指标数据都将接入eSee统一管大多数应用占用主机资源数在10台左右像iSales这样的单个应用占用主机资源即超过500每应用10台主机,60个指标,每分钟1次采集,每条性能数据1K每应用单日性能数据条数86.4万条,864MB2000个应用每日17.28亿条性能数据,1.7TB数据量当前已经接入每日性能数据2000万条约6GB成功案例:华为eSee项目37万网络设备约10万存储网络设备3万+X86物理主机约5万X86虚

22、拟机约3.6万领域产品应用设备资源配置项Ci指标项KPI运维数据数量121成功案例:华为eSee项目(续)eSee门户后台管理(对象、指标集成)在线编辑业务流业务流运营可视详情/历史业务流Dashboard用户订阅01234578业务流IT运营邮件提醒6IT基础设施可视/诊断自动化成功案例:华为eSee项目(续)eSee门户后台管理(对象、IT运营对象运营应用层数据管道层运营微服务池存储分析层结构化实时结构化定时按需触发非/半结构化对象控制数据可视化服务核心配置大数据分析组件用户业务产品运维/运营数据仓库业务流监控服务DCIM微服务智能BI 服务诊断自动化微服务大数据应用微服务订阅提醒微服务I

23、T场景化监控智能BI分析DCIM大数据应用Your APP+DataBankApplicationServicePlatformP + A + S 构建eSee平台:IT智能运营可视平台-eSee(Platform),根植于SOA架构设计理念,拉通IT运营各维度数据,打破&互联各信息孤岛。提供数字化、可视化、智能化等平台微服务(Service),通过服务级组装形成业务流IT可视、智能BI、DCIM、数据洞察等应用(Application),实现华为IT“业务、产品、用户”的数字化运营.IT运营对象运营应用层数据管道层运营微服务池存储分析层结构化关键业务流IT运行状态可视系统、存储、硬件诊断一键

24、自动化提供系统、存储、硬件的“一键式”批量自动化诊断/健康检查工具,故障定位效率提升67%(周期30分钟减少到10min)。事件平均解决周期减少50% (2小时减少到1小时);固化专家管理员日常故障诊断定位经验实现LTC/财经/ISC/WEB/IPD领域关键30个业务流IT监控可视化、覆盖50个关键级应用纵向监控可视化。在半年度、第三季度业务冲刺和财报月结期间总共预警提前发现60+个隐患。三季度业务高峰保障期间,提前预警iTrigger二级问题。先于用户26min、先于项目组50min。5大领域、60+共有业务流、6976个CI、25300+关键指标监控可视化EIP集成管道可视化、每月减少50

25、+事件、定位效率提升24倍“1键式”自动化诊断,故障定位效率提升67%、解决周期减少50% 业务流IT运营可视化成功案例:华为eSee项目(续)关键业务流IT运行状态可视系统、存储、硬件诊断一键自动化提供1)应用监控风险预警 2015-04-25:cfs应用在szxap687-in节点上出现高cpu占用异常,可能影响用户访问响应性能。2)登录应用服务器查看,其cpu利用率一直大于200%+3)有两个用户线程,一直占用100%cpu资源成功案例:华为eSee项目(续)1)应用监控风险预警 2015-04-25:cfs应用在sz4)从javacore中可以看到,上述两个用户线程。5)其对应java代码堆栈如下:成功案例:华为eSee项目(续)4)从javacore中可以看到,上述两个用户线程。5)其对6)堆栈中没有跟cfs业务强相关的类,根据框架相关的类分析,应该是调用某个下载服务时执行生成图像的代码时挂起。7)此问题隐患通常情况下不会影响应用的可用性,但是极端情况下当服务器节点所有cpu资源都被占满会导致应用响应缓慢,或不可访问。临时解决方案为当出现大量此类线程时,手工重启该节点应用。成功案例:华为eSee项目(续)6)堆栈中没有跟cfs业务强相关的类,根据框架相关的类分析,更多成功案例更多成功案例招行云图项目客户挑战架构图分散存放,难以获取。架构图与实时管理数据脱节

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论