智能化综合运维平台方案_第1页
智能化综合运维平台方案_第2页
智能化综合运维平台方案_第3页
智能化综合运维平台方案_第4页
智能化综合运维平台方案_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、智能化综合运维平台方案1内容提要2财务智能综合运维解决方案介绍实施经验和实施方案介绍案例介绍和项目收益现场答疑内容提要3财务智能综合运维解决方案介绍实施经验和实施方案介绍案例介绍和项目收益现场答疑集中监控运维流程统一门户集中监控解决方案整体架构方案技术特点方案行业优势案例4BSM一体化业务服务管理5应用数据库物理/虚拟系统网络中间件用户集中监控平台统一展现平台中间件监控业务影响管理统一事件平台统一性能平台网络监控主机监控数据库监控虚拟监控应用监控自动化管理平台作业调度自动化操作平台操作任务管理操作权限管理补丁管理配置操作人工巡检系统装载版本规范合规审计流程管理平台事件管理问题管理变更管理发布管

2、理配置管理知识管理服务目录服务水平服务请求运行管理CMDB业务模型服务目录自动发现调和联邦关键IT指标业务系统运行状况业务影响报表分析一体化运维中的故障处理闭环场景基础架构、应用触发告警集中监控平台告警生成短信通知邮件通知告警清单告警面板监控与流程的双向集成运维流程平台业务影响分析事件管理流程事件处理完成故障处理经验生成知识库告警恢复大屏实时展示系统健康状况告警统计分析报表工单统计分析报表问题管理变更管理其他流程自动化工具流程运转7集中监控-博思树7监控集成网络管理集中事件处理业务影响分析系统管理应用管理存储管理虚拟管理其它集中监控数据库基础架构监控范围8服务器数据库应用中间件网络其它Unix

3、OracleSAP R/3MQSeriesFirewall存储LinuxSybasePeopleSoftMSMQRouter其它可基于SNMP管理的设备Win-NT/2000/2003/2008SQL ServerOracle AppsMQSISwitchNetwareInformixSiebelWeblogic其它可基于SNMP管理的网络设备OpenVMSDB2 UDBBaanTuxedoAS400CA-IngresExchangeTXSeriesTru64ProgressJD EdwardsWebsphereOS Hardware MointorRDBTomcatMysqlApache/I

4、IS主机监控支持平台广泛CPUFilesystemDiskSwapLogProcessNetworkNFSADServicesHAErrpt(AIX)集成Windows性能计数器主机监控 服务监控(Windows)服务停止的时候产生告警事件服务停止的时候自动重启该服务监控该服务消耗的资源主机监控进程监控(Unix)在出现的界面上配置要监控的进程属性定义进程名字(标识符)定义进程关键字符串,该字符串必须是可以通过ps ef 命令检索得到的定义该进程数目的最小最大值,如果该进程名字是唯一的,都设为1定义告警状态主机监控日志监控日志监控配置属性界面日志监控Advance日志没更新告警设置监控日志大小

5、日志权限改变监控日志更新时间监控Web Application监控支持WeblogicWebsphereTomcatMQ通过JMX、PMI、Byte-Code Instrumentation 、JVM Profile等接口实现JVM的性能状况垃圾回收的情况吞吐量管理任务执行队列监控日志监控与管理EJB的监控Servlet、JSP、WebApp的调用信息JDBCJCAJMS的监控与管理JTA的监控与管理JMX日志的注册与通知机制Cluster环境下服务器属性的监控“Top N”的WebApp、EJB、Servlet和JSP以及SQLJVM操作系统进程资源的使用信息和服务器的网络活动信息数据库监控

6、集中管理各种数据库(Oracle、Sybase、Informix、DB2、SQL Server等)管理数据库可用性。支持双机模式预警式监控内置专家经验配置简单,自动发现数据库架构监控重要参数数据库状态实例状态表空间/数据库利用率性能参数(缓冲池,Buffer命中率等等)死锁检测日志监控连接数用户实时捕捉SQL语句设备硬件和存储备份的监控。与硬件和存储备份的管理软件做集成接口。16基础架构监控存储和硬件对虚拟环境的监控。VmwarePower-vmhyper-v等17基础架构监控虚拟机管理类shell的PSL语言,方便扩展,技术门槛不高。示例一:时间同步需求开发需求所有业务机器都要定时与时间服务

7、器进行时间同步,如果时间差距超出阀值则告警实现通过Patrol的PSL语言开发知识模块实现。Windows服务器使用命令:w32tm /stripchart /computer:10.8.28.62Linux服务器使用命令:ntpdate -d 10.8.28.6218基础架构监控开发扩展19网络监控19资源自动纳管、分组操作主动发现被管理网络资源与配置信息,内部结构分级、分组呈现,审计报告让资源变更尽在掌握中支持批量导入手段,丰富资源纳管途径网络监控2020设备级性能监视网络监控-续2121丰富的设备背板监视支持设备背板仿真,直观监视端口状态、端口I/O(流量、误码、丢包、溢出包等)、SDH

8、、光端口功率。系统已内置大量设备背板图,并且支持快速扩展网络监控-续2222配置文件管理_变更追踪启动-运行配置对比消除忘记保存配置的风险即时发现与基线配置的差异性保证配置文件变更历史可追溯模板配置对比不同时间点配置对比区别处自动红色突出显示23网络监控续LOG管理备份和告警筛查 LOG日志实时接收自动分析:根据定义的告警筛选规则,自动筛选LOG,直观呈现所有规则集检查结果,标志出告警内容。 手动分析:为事后分析而提供。从某段历史的日志中快速找到需要内容,为故障判断提供途径将LOG应用从被动转向主动通过关键字进行手动分析详情查看后续处理通过预置规则进行自动分析,将大大减少维护人员日志阅读工作量

9、! 应用监控日趋重要常规的监控手段难以监控到真正的应用故障。基础架构监控日趋稳定,运维管理水平提高,基础架构故障对应用的影响日趋减少。应用管理越发重要。现在的用户更关心整体的服务性和可用性,而非单点故障。如何知道哪些应用慢?如何知道慢在什么环节?是什么导致应用如此长的响应时间?业界常见的应用监控手段应用基础架构监控基础架构监控数据库监控中间件监控用户体验监控主动式被动式应用监控应用代码诊断和优化应用平台监控套装软件监控防火墙ApacheWebSphereWebLogicCICS数据库主机WEBWEB中间件通过业务监控可以更加有效了解业务服务质量,结合系统监控提高服务的稳定性主动模拟仿真用户业务

10、交易主动式应用监控-模拟用户应用操作场景27国内某大型旅行社使用BMC主动式应用监控解决方案,实现对业务的主动性监控在本项目中,主动式业务监控秉承的原则有以下几点1) 以最终用户在视角进行关注2) 关注应用的整体服务能力,节点的故障并不影响整体的服务能力; 不关心单点系统的性能或故障,而关心最终用户的实际访问指标(可用性、准确性、响应时间等)3) 提前 在实际用户感知应用交易出现问题前能够发现症状,并通知技术人员及时关注与处理4) 统计分析应用交易的性能趋势,提供业务忙闲数据和性能优化参考。主动式应用监控-国内某大型旅行社28主动性监控场景设计举例:1)在互联网位置模拟真实用户查看旅游信息(验

11、证信息服务的有效性和响应时间)2)在互联网位置模拟真实用户进行机票、车票和酒店的查询和预定(验证交易服务的有效性和响应时间)3)在互联网位置模拟真实用户的客服、投诉、订单跟踪(验证客户服务系统的有效性和响应时间)9029主动性监控网站访问可用性及性能监控30主动性监控网上订单交易响应时间监控31客服系统响应时间提醒fpzx主动性监控集中事件管理 BMC Event ManagerEvent Processor对来自平台、应用等的事件进行统一集中处理对事件进行分类、分级、过滤、丰富、关联、自动升级、响应自动产生故障工单,启动故障处理流程支持高可用性架构NetworksServerApplicat

12、ionsDatabasesNT & Unix Log filesevents sourcesSNMP traps010010111011Plus ModulesPATROLOtherEvent Processors开放集成接口通用数据采集接口(性能)Web Services APIMonitor WizardsScript wizardSQL Query wizardJMX wizardWindows Perfmon/WMI wizardSNMP wizardData Views第三方产品接口(性能)CA UniCenter TNGHP Business Availability Center

13、 (BAC) HP Operations Manager (OVO)IBM Tivoli Monitoring (ITM)Microsoft MOM/SCOMVMware (vCenter, ESX, ESXi)Gomez Performance Network (GPN) serviceKeynote Website Perspective Keynote Transaction Perspective数据采集接口(事件)SNMPLogfilesTCP/UDP client/serverTelnet adapterWindows Event LogCommand lineC API (iiS

14、DK) - Client and server APIWeb Services API - Client and server API第三方产品接口(事件)CA UniCenter TNGHP-OpenView Network Node ManagerHP-OpenView OperationsIBM NetCool OmnibusMicrosoft MOM/SCOM Tivoli TECTL/1第三方产品接口(事件外发)CA UniCenter TNGMicrosoft MOM/SCOM HP Service ManagerHP OpenView Network Node ManagerHP

15、 OpenView OperationsTivoli TECDatabases与流程平台的双向集成预警和智能过滤35业务有忙有闲,我如何设定一个合适的阈值, 反映业务的“正常”状态 太低, 业务忙时频繁报警,烦 太高, 告警的时候已经很严重了,有风险智能动态基线自学习,“理解”业务的潮涨潮落,直接利用性能历史数据,动态调整阈值“异常模式”识辨 可自定义的”学习粒度” (小时,天,星期)13:25:00 5:50:2012am 2am 4am 6am 8am 10am 12pm 2pm 4pm95%50%25%5%75%AbnormalityDetectionDynamic Baselines

16、警告严重36动态基线和智能阀值动态基线针对运行有固定规律的性能指标,收集特定时间段的被监控属性值,计算得出的一个低基线值和高基线值组成上下基线,并随时间的推进进行加权平均,基线的准确度随着时间的前进会逐步提高。37Typical Static Thresholds95%50%25%5%75%Abnormality DetectionDynamic Baselines MinorMajor智能动态阀值,提前预警动态基线和智能阀值38动态基线和智能阀值消除告警风暴、提高事件命中率!Upper BaselineLower BaselineNormal Behavior39动态阀值效果示例深圳BEA的

17、基线实例基础架构和业务应用的关联影响服务模型ApplicationDatabaseSystem NodeSystem NodeIT or Business ServiceBusiness Process 1Business Process 3Business Process 2User group1IT部件逻辑部件企业管理技术事件2. 业务故障的根源是什么?21b. 故障的优先级如何?11a. IT故障会影响哪些业务?“模型设计”三要素 对象+影响关系+事件CMDB服务影响模型事件影响关系对象42具体IT架构的告警会反映到业务系统,显示影响关系和影响程度业务影响BMC行业优势比较项BMC 产品

18、线完整性以及产品更新速度产品线完整,能够支持几乎所有操作系统、数据库、中间件和主流商用软件(如Siebel、PeopleSoft、SAP、WebMethod.) ,此外对操作系统、数据库、中间件等产品的新版本支持速度 最快,基本在相关厂商推出新版本后半年内就能支持Agent占用系统资源情况及Agent自管理能力、稳定性及维护工作量采用了单一Agent技术,所有监控功能通过加载相应KM实现,系统资源占用最少,且还可以根据实际监控要求灵活裁剪监控指标,进一步节省系统资源占用。 Agent具备自管理能力,且运行稳定,由于是单一Agent,维护工作少交易管理提供完整的交易端对端响应管理,测量用户业务响

19、应事件,支持B/S和C/S架构的脚本录制系统可扩展性和快速开发能力采用KM和PSL技术,具备极强的可扩展性,且容易学习、掌握,能够实现快速开发,动态基线和智能阀值可以将收集到的数据进行智能分析,根据系统运行的业务特点自动生成基于小时、每日、每周的监控趋势,并可根据该监控趋势设定按照业务规律的性能阀值。性能数据是否提供补采机制性能数据能够在被管设备上存放,提供补采机制,保证数据不断点安全和稳定性44基础架构监控安全和稳定主机代理知识模块主机代理t知识模块主机代理知识模块每个被管系统,仅有一个Agent。Agent采用代理+知识模块的结构单一进程,方便管理。极低的系统消耗、易于扩展。Remedy解

20、决方案451、整体介绍2、主要模块功能特点3、新特性4、优势逻辑架构服务目录、自助服务、KPI展现、公告信息、报表与DashBoard服务请求管理事件管理问题管理知识管理变更管理配置管理服务水平管理配置管理数据库 CMDB基础配置信息(组织、人员、角色、权限、流程策略)接口适配器(数据管理工具、AIE、Web Service、API、Plug-In)数据库监控平台邮件系统短信平台LDAP / ADOA门户服务平台基础架构外围接口资产管理发布管理服务台物理部署架构广泛的集成方式所见即所得的开发工具Developer Studio基于单一工作流引擎平台所见即所得的开发方式,无须编码同时支持B/S和

21、C/S展示可定制ITIL和非ITIL的流程可视化的流程引擎50统一的审批引擎审批 通过审批引擎配置实现统一的审批管理控制台LicenseEngineOther APPTaskEngineAssignmentEngineApprovalServerChange& RequestServiceRequestIncident& ProblemAsset& ConfigurationBMC Remedy Action Request SystemData Base任务引擎可作用于ARS上面的任何应用,如此这些应用上的具体表单可调用任务引擎来直接创建任务,或者调用任务模版来引入任务。任务引擎与分派引擎相

22、配合后,可以大大简化原来冗长的流程,因为许多流程的细节均为一些具体任务的处理,如此让流程阶段更加清晰可控。任务管理可以创建任务模版,也可以创建群组任务模版,即任务组合,这些任务组合还可以进行逻辑组织,进行先后及串并行的排程,同时任务模版还可以与单据中模版相嵌套,大大减少流程的操作,并提高智能与自动化。独立的任务引擎通知引擎53通知消息短信消息邮件IM发布流程变更流程配置管理事件流程派单提醒告警会议通知报表平台54实时的服务支持情况“Billing”服务的服务影响情况问题管理视图不同业务部门的变更(与事件相关联)Remedy解决方案552、主要模块功能特点3、新特性4、优势1、整体介绍BMC A

23、trium CMDBBMC自动发现或其他数据源BMC Atrium CMDB 不可或缺的”沙盒”2先调和后入库1CMDB误区只要联邦的CMDB4企业级的导入导出3配置管理 - CMDB可扩展的通用数据模型业务模型展示59事件管理快速记录简单、高效的事件记录界面丰富的事件模板,以帮助快速填写事件快速处理根据事件分类/产品分类/位置/支持人员情况自动分派事件匹配,知识查询辅助能力事件概况图形展示/公告/SLA结合用户故障现象自动捕获能力事件、变更、问题、CI管关联监控系统事件集成能力关键技术点:简单、高效的用户界面5 次鼠标点击提交一个内容丰富的事件单最佳实践的事件请求视图 Service Awa

24、reness业务服务意识在事件请求,问题诊断和已知错误表单上增加了受影响的服务和引起故障的CI域最佳实践的事件请求视图 事件模版事件模板最佳实践的事件模板功能,按照事件分类配置事件管理控制台 Incident Counts事件管理控制台 Defined Searches事件管理控制台 Watch List (cont.)变更管理流程的灵活性变更路径可配置审批引擎技术,实现复杂审批规则变更影响管理模拟影响-提供“what-if”CI和服务影响分析冲突检测管理和解决变更请求的潜在的有害冲突图形化变更日历审计关键技术点变更路径的灵活配置关键技术点变更影响分析需要进行影响分析的CI图形化视图描述变更影

25、响范围切换到表格视图模拟影响按钮关键技术点变更影响模拟冲突检查确定在同一时间是否存在同一CI项被不同变更请求处理基于变更请求计划的开始/结束日期及与变更请求直接关联的CI项关键技术点变更冲突检查导致冲突的变更请求ID关键技术点图形化变更日历服务请求服务目录浏览服务搜索后台服务定义可配置的服务请求 通过后台配置实现各种业务的服务请求单,以供End User通过Web界面进行提交请求Remedy解决方案753、新特性4、优势1、整体介绍2、主要模块功能特点无缝对接知识库整合的自助服务功能:自定义请求目录添加用户自己喜爱的第三方工具链接,切换更便捷新特性:更注重细节与整合 一站式服务BMC Blad

26、eLogic Service Automationconfiguration changes detected / deployedBMC Remedy ITSMincidents, changes completed, .BMC ProactiveNetavailabilityBMC Atrium Service Context Federated Data从各个系统抽取与该服务CI相关的所有信息,集中展示BMC AtriumCIs新特性:更注重细节与整合 一站式信息使用内置的即时沟通工具,实现更高效沟通。例:即时询问处理组内其他同事关于事件的解决方案;服务台通过事先沟通,免去错误分派产生的

27、浪费;与用户即时的沟通,自动列出关联的用户,自动保存聊天内容到相关请求中新特性:更注重细节与整合 一站式沟通新特性:增强的移动终端支持系统支持android、ios、blackberry常用功能创建事件单、流转事件流程和进行审批IT Manager2 level SupportRemedy解决方案824、优势1、整体介绍2、主要模块功能特点3、新特性ITSM软件市场情况34%多Remedy永争第一Gartner, “Magic Quadrant for the IT Service Desk, 2006”, KrisBrittain, DavidM.Coyle, 18 May 2006 在全球

28、服务管理平台软件市场,BMC的Remedy一直持续领先More than 12,000 customer sites,79% of the Fortune 100 and 60% of the Global 500,Over 10 million end-users in 80 countries主流评测机构对IT运维厂商的整体比较85Remedy定位流程固化应用改造费用高维护困难企业适应软件标准套件模式开发周期长维护困难可扩展性差应用功能单一全新定制开发模式1、ARS平台提供了比普通开发环境更高效、更灵活的方式实现业务需求与企业变革2、ARS释放了工程师在程序编码层的繁重,将IT人员的精力专

29、注于业务的逻辑及规划设计上。3、ARS的定制开发可基于标准套件,无须从零开始构建你的工程,这使得只需要对基本构件进行组装与更造即可。1、符合全球的最新服务管理标准(ITIL V3、ISO20000),引入不仅仅是一个工具。2、每年的根据全球各企业最新的服务平台需求,不断进化标准套件的功能,REMEYD让你与全球最领先的公司并肩齐驱。3、Remedy灵活的配置功能让用户根据企业环境设定自己的服务管理特性,极大减少对系统底层的变更。BMC Remedy的优势87落实ITIL框架、第一个通过OGC认证的产品单一架构、数据库,所有模块集中在一个平台运行没有数据重复或同步问题、低维护和培训成本有能力实现

30、跨流程的业务规则单一架构以及单一的可扩展的工作流引擎保证数据的唯一性单一CMDB更加容易维护通过ITIL V3认证,符合标准单一,天然统一的CMDB单一工作流平台及免费的二次开发工具,所见即所得单一工作流平台提供统一的开放接口,接口非常丰富无需C或JAVA的开发,表和字段扩展性好二次开发及扩展能力采用可视化,一步步指导实施ITIL服务支持最佳实践,降低部署周期达50%交互式流程模型支持流程与配置库的关联支持事件的自动分派与手动分派支持变更日历排程及变更模拟影响分析、CI项冲突检测主动事件和问题管理,变更和配置自动化等等产品优点平台级产品高扩展性,可定制开发ITIL流程与非ITIL流程很强的扩展性资产生命周期管理应用Service Desk(服务台) 变更 & 资产管理应用与HP, CA, IBM相比较资产库CMDBService Desk(服务台) 变更管理CMDB复杂的多个集成点 =分离的ITSM流程和数据过高的总体拥有成本天然浑成的 ITSM/ITIL 集成 =BSM and ITIL-统一集成的 ITSM更低的总体拥有成本集成(集成)集成统一门户需求报表系统业务运营系统资源管理系统XX运营系统应用监控灾备系统网络监控环境监控主机监控

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论