应用性能管理解决方案_第1页
应用性能管理解决方案_第2页
应用性能管理解决方案_第3页
应用性能管理解决方案_第4页
应用性能管理解决方案_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、应用性能管理解决方案Riverbed SteelCentral整体解决方案2IT 基础架构Programmable InfrastructureRiverbed 性能平台SteelCentralNPMSteelFusionSteelhead性能加速性能管理SteelCentralAPMGartner 对于NPM和APM解决方案的竞争报告- 唯一在NPM和APM都处领导象限的公司3Network Performance Monitoring & Diagnostics (NPMD)Application Performance Monitoring (APM)NPM/APM的方法论SteelCe

2、ntral端到端交易应用的完整性能监控(NPM+APM).NET Worker ProcessIIS Native PipelineTCP/IP 协议栈Web服务器客户端浏览器广域网WAS JVMApacheTCP/IP StackWAS Thread PoolApp服务器局域网起始处理排队代码执行网络、带宽、延迟处理排队处理排队代码执行远程调用Web服务,数据库网络传输性能指标代码执行代码执行网络传输性能指标网络传输EUE代码执行网络、带宽、延迟代码执行结束网页渲染时间服务响应网络、带宽、延迟、丢包服务请求网络、带宽、延迟、丢包NPM的主要技术手段重点区域(如数据中心)监控,探针技术:通过抓

3、取网络数据包进行分析。全网流量监控,Flow 技术: 采集网络设备统计的NetFlow, sFlow, J-Flow, NetStreamAPM的主要技术手段端到端(用户端)监控,Web页面JavaScript脚本嵌入技术(针对Web类应用)。端到端(服务器端)监控, JVM/CLR Agent的代码植入技术(针对JAVA/.Net应用)。主要的技术手段探针的工作原理汇总应用流的KPI指标,得到该应用的KPI;并进行智能预警通过镜像或TAP抓取数据包,建立索引并保存数据自下而上应用的KPIFlowsPackets快速定位故障故障定位精细原始的证据获取故障数据包证据 故障预警,揭示潜在问题早期预

4、警分析自上而下7分析数据包里每个应用流的KPI指标:包括流量,网络传输时间,服务器延时,重传DATAACKREQUEST服务器响应时间Round Trip Time (Outbound) *数据传输时间Time连接建立时间SYNSYN/ACKACKREQUESTDATAACKDATAACK服务器客户端交互 1交互 2Round Trip Time (Inbound)* 数据传输时间 = Payload 传输时间 + 重传导致的延时*Round Trip Time 的计算针对每个 DATA/ACK对。用户响应时间详尽的延时参数计算ARXWeb响应时间WEB ServerAPPS ServerWE

5、BAPPSDBDatabase ServerService ProviderAPP响应时间DB响应时间探针部署示意图端到端的性能监控功能实现/home.aspxRPM应用层时间1.3sec应用层时间6.7sec数据库层时间24sec前端延时7.2sec广域网性能局域网性能1.0秒 code abc0.3秒 code xyz应用代码(classes/methods)6.3秒 code def0.4秒 code ghi后端延时: 82%前端延时: 18% 20sec SELECT x FROM y 4sec INSERT a INTO bSQL 语句网络 134 重传 1.3 请求MBs 17 连

6、接重置 1.2 响应MBs6.8秒 图片, .js, .css0.4秒 页面渲染时间客户端URL: /home.aspx用户: XXX 终端用户性能: 40.9secAPM应用性能管理最终用户体验NPM网络性能管理Steelcentral APM 解决方案NetShark AppInternals AppResponseSteelCentral 端到端、全面的应用性能管理NetSensorNetProfiler集中的应用可视化特定领域的监控, 分析与数据聚合全面的数据捕获Portal SteelFusionSteelHeadNetShark-VNetShark-VSteelCentral 解决

7、方案部署示意图13Primary Data Center Internet UsersBranch OfficesAppServersAppServersWAN or Internet AppResponseNetProfilerDeep Packet AnalysisAppInternalsAppInternalsNetFlowsBrowserMetrixBrowserMetrixNetSensorSNMPWMITesting整体解决方案-Cascade Packets from switches(span, mirror)CascadeProfilerIntelligently De-du

8、plicate and Coalesce the dataStore flow data based upon end to end conversationsDe-duplicate volumes, track the differentials, track the path如何工作CascadeGatewayPacketeer FDRIPFIXNetFlowsFlowJ-FlowCascade FlowCascade FlowCascadeSensorNetStreamNetFlowCASCADE SHARKpacket analyticspacketcaptureCASCADE PR

9、OFILERflowconsoleflow analyticsCascade ArchitectureCASCADE PILOTpacketconsoleINTEGRATIONWIRESHARKCASCADE GATEWAYflowcollectormacroflowflowmicroflowpackets 2009 Riverbed Technology. Confidential. IMPORTANT NOTE: The roadmap is for information purposes only and is not a commitment, promise or legal ob

10、ligation to deliver any new products, features or functionality. The development, release, and timing of any features or functionality described remains at Riverbeds sole discretion. 网络诊断1. TCP错误包分析2. TCP重传数据包分析1.发现应用服务器之间的关联性拓扑图2.应用拓扑图自动拓扑SSL Web服务器性能告警事件TCP重传超出容忍度范围,触发事件告警。SteelCentral 整体解决方案之AppR

11、esponse用户响应时间性能曲线(外延曲线) 度量每次应用访问的平均客户响应时间客户响应时间的详细性能分解:服务器响应的时间,服务器响应请求发送信息的时间用户响应时间性能分解 Connection Setup TimeServer Response TimePayload Transfer TimeRetransmission Delay网络延迟性能分解 Round Trip Time (Inbound)Round Trip Time (Outbound) 主要用法定义性能基线识别异常流量问题隔离与定位通过延时分布图对问题精确定位21全公司网段流量及性能列表注意存在较高丢包率(超过10%)的

12、分公司注意较高RTT(超过100ms)的分公司都在山东;拥塞导致?分公司广域网线路流量详情23可定制展现内容、形式全公司应用协议流量排行及性能应用协议排行选定协议的性能指标选定协议的IP通讯对全公司应用协议流量排行及性能应用协议排行选定协议的性能指标选定协议的响应时间构成图针对特定应用的详情列表 通讯IP对、性能指标AppResponse Xpert自身特性支持实时的SSL解密自动发现所有的URL,网页族,终端用户行为基于每个网页显示响应时间 网页性能指标: 网页错误,网页的响应时间,网页速率,慢网页的数量,等Web 网页交易性能分析(WTA)Riverbed WTA 的Web页面元素加载瀑布

13、图监控实时进行的呼叫,提供报表被动式通话质量分析 (MOS) 丰富的 RTP 监控指标,针对每个呼叫,每个通道独立于设备厂商(Cisco, Avaya, Microsoft Lync)支持视频质量监控 包括视频会议呼叫统一管理语音、视频与数据业务级别视图,反映总体网络监控状况与VoIP性能统一通信监控: VoIP全天候持续监控数据库会话具体到查询, 表, 列数据库调用的吞吐率,交易, 行, 字节, 活动会话支持主流数据库管理系统Oracle, SQL Server, DB2/UDB, Teradata, Sybase ASE, Informix数据库性能分析定位特定的 SQL 语句导致应用性能

14、差页面时间走势图 最高90sDB响应时间走势图, 峰值最高响应时间才80ms,响应速度快对于关键业务的内部故障定位和排查 前台App服务器与后台DB的应用响应时间对比分析,决定故障点。DB业务响应时间走势图DB SQL语句响应延时分布图DB服务器里的实例对于关键业务的内部故障定位和排查DB分析细化到每个实例和SQL语句。对于关键业务对外服务质量的综合监控SteelCentral 整体解决方案-Portal 面向业务管理的工作流程监控和告警视图及动态门限最终用户体验报告覆盖所有用户,所有交易分析定位定位问题到用户/交易识别时延组成部分深入到特定区域故障排错利用丰富的数据信息深入到单个交易高层视图

15、业务级可视化所有数据汇总呈现到一个集中的Web面板.管理、应用、网络团队有各自的视图钻取分析方式查找故障根源根据客户需求,定制方便统一监控面板用户访问来自哪里?用户在进行什么操作?用户的操作体验如何?应用的瓶颈在哪里?应用表现和基础架构有没有关系?场景举例-对于关键业务对外服务质量的综合监控慢页面百分比为84%,同比增长836%。页面响应时间为30秒,同比增长1634%。页面访问量为401页/分钟,同比增长62%。监控时间段最终用户体验KPI业务的MAP图,红黄线表示出现问题的应用。HTTP 返回代码F5前页面响应时间F5后页面响应时间具体相关应用的KPI指标HTTP 返回代码正常:大部分为2

16、00,400和500错误代码很少。F5前后页面响应时间有增加(最大接近4秒),但不是故障的主因。故障主因来源于ERP服务器(特别是ERP1,最长为1分钟); 同时发现后端到OA的响应时间较长(特别是响应ERP1的时间最长为4秒)。场景举例- NPM对于关键业务的内部故障定位和排查场景举例- 对于关键业务的内部故障定位和排查 追溯到单个服务器的关键KPI指标。场景举例-对于关键业务的内部故障定位和排查 追溯到该业务有问题的具体URL。最慢的客户最慢的服务器慢页面簇 页面时间趋势图 平均页面时间均5s以上场景举例-对于关键业务的内部故障定位和排查 追溯到有问题URL的详细故障信息。民生银行案例介绍

17、面临的挑战全行1100个业务系统分布在分散的IDC机房(西三旗、数字北京、798、安外),每年诸多业务系统的大、小问题不能有效的定位与排除,为业务运行带来巨大隐患。解决方案在多个数据中心部署多套性能监控设备,实现对核心银行系统关键部位的专项监控。民生银行数据中心业务流可视化监控项目通过基于网页(WEB)的性能视图展示平台,实现:对1100个系统实现分层次的实时大屏幕监控(整体、网银、柜面、NPS交易平台)渠道业务系统端到端监控平台(网银、手机银行、柜面、ATM、自助终端)后台交易系统性能监控平台(交易平台、外联、新核心BPP系统)与既有的Netcool与神州泰岳网管系统实现有效的集成。系统部署

18、之后,每次业务系统问题都通过该系统进行定位与排查,已成功处理了20多起,提高了处理疑难问题的能力,赢得了网络运维,应用开发、系统维护部门的信任,成为各部门公信的性能监控与问题排查的标准手段。应用场景与使用效果使用 SteelCentral Portal,实现业务全景面临的挑战各省行运维团队在省网、柜面系统、外联系统的运行维护方面面临巨大压力,却缺乏有效的问题隔离与定位手段。 新系统即将上线,在性能监控与维护上却面临极大的不确定性。解决方案在各省行配备性能监控设备,实现对网络、柜面及外联业务的性能监控。民生银行各省分行网络流量及业务性能监控自动生成满足监控需求的定制化性能日报省内网点访问各项应用

19、系统的性能报告广域网链路利用率与协议占比统计报告异常流量动向报告 与新系统同步先发部署,为新系统上线保驾护航 收益 大幅提升省行运维保障效率,实现对性能问题的实时监测、早期发现、及时定位与排查、快速恢复。 及时了解应用程序及网络的运行情况和性能趋势,增加IT团队之间就应用性能问题定位时的相互协作。应用场景与使用效果分行性能监控界面截图48“获得了网络和应用同时信任的性能管理平台,极大地缩短了问题发现和修复的时间.”Riverbed 性能管理Riverbed融合性能管理平台-SteelCentral端到端的全程关联(APM和NPM的关联)分析和监控。真正的aa-NPM(网络部的第二次新生:被动转

20、化为全盘掌控),大网管串联整合的思路。Dashboard直观展现关键业务流的KPI帮助用户梳理业务应用的逻辑,统计业务应用的信息;实时更新业务拓扑。针对BS业务,提供 Web交易分析 WTA(Web Transaction Analysis), 例如:自动统计URL并汇总KPI指标、Web页面元素加载瀑布图、用户会话跟踪针对CS业务,客户端和服务器网络传输时间的计算,是针对每个Round Trip 而非只是基于TCP三次握手的数据包。这样的指标更加细致和准确。针对BS和CS业务,提供丰富的KPI 指标 ,帮助用户快速的发现和定位问题;例如: TCP连接失败的次数和比例,数据传输时间, 重传导致延时针对网络核心层,汇聚层和接入层的流量分析,具有业界领先的Flow collection解决方案 。针对数据包,有智能的专家分析系统。跨节点单笔交易追踪分析。全景存储所以交易数据,大数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论