




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、HP-UX11i知识库:我们的实验室为您提供的最佳性能优化实践部署人员系列HP-UX11iv3性能和可扩展性-网络讲座录音稿大家好!我叫CurtThiem,是HP-UX性能和可扩展性研发经理。今天与我一同主持讲座的还有SantoshRao。Santosh是HP-UX11iv3海量存储堆栈架构师。很高兴今天能有机会与大家讨论HP-UX11iv3版本的性能和可扩展性。下一张幻灯片本次讲座包括以下主题。我讲解前两个主题,Santosh讲解第三个主题,然后由我进行总结。本次讲座涵盖了迄今为止的最精确信息。11iv3会定期进行更新和改进,因此,这些信息也会随之发生更改。下一张幻灯片每次推出HP-UX新版
2、本时,都要求其在相同硬件上比前一版本性能更佳。与前一版本,即第2版HP-UX11i相比,11iv3可使操作系统性能平均提高30%。30%是内部用于度量低端、中端和高端Integrity系统中的操作系统性能的多个工作负载的平均值。虽然对于不同的工作负载,性能提升的程度大为不同,但是HP-UX11iv3确实能使性能大幅提升;这是因为在HP-UX11iv3的整个研发过程中,我们针对性能工程在操作系统的许多部分都投入了巨大努力。此处所讲的是操作系统性能,因为在HP-UX11iv3的性能方面,我们关注的是操作系统本身的性能,所以与大部分客户应用程序相比,我们使用的工作负载在操作系统中所花的时间更长。客户
3、的性能提升取决于几个因素,包括工作负载、系统和体系结构(不论是Itanium体系结构还是PA-RISC体系结构),以及在操作系统中所花的时间与在应用程序软件中所花的时间。尽管如此,对于许多工作负载和Integrity产品系列的各种产品来说,HP-UX11iv3仍能使其性能大幅提升。此外,由于系统和应用程序都日趋增大,HP-UX11iv3还提供了充分的扩展功能。之前版本中的许多限制都大为减少,甚至得到有效消除。下一张幻灯片HP-UX的性能在相继发布的每个版本中都有持续改进。这张幻灯片显示了在32位处理器系统中,HP-UX系统性能比过去七年改善了11倍。这是硬件和操作系统软件性能共同改进的结果,包
4、括最近的11iv3带来的35%性能提升。让我们先看看左侧的一对柱形条。红色柱形条显示的是32位处理器V2600下HP-UX11.0的性能。黄色柱形条显示了在同一系统中,HP-UX11iv1的性能是11.0的两倍还多。硬件速度的提高(即从使用PA8600处理器的V2600到rp8420及PA-8800处理器)造成两个黄色柱形条的性能差异。中间一对柱形条显示了从HP-UX11iv1升级至11iv2后,仅操作系统性能提升就可达25%。再看右侧的一对柱形条,这两个绿色柱形条显示了从使用PA-8800到使用基于双核Itanium的Integrityrx8640所产生的硬件性能增益。右侧一对柱形条显示了1
5、1iv3所带来的性能提升。对于此工作负载,从第2版升级至11iv3可使性能提升35%。总之,七年以来,总性能提升了11倍,其中很大一部分源自HP-UX11i各版本软件性能的改进,包括11iv3。此处的工作负载是SDET基准的变量。SDET,S-D-E-T是指SoftwareDevelopmentEnvironmentThroughputBenchmark(软件开发环境吞吐量基准)。它是一个可高度扩展的多进程基准,除网络外可使用大部分内核。该基准本身即是一个用户空间程序。SDET最初起源于贝尔实验室,用于评估UNIX操作系统是否可扩展为大型主框架平台。我们在使用SDET的过程中发现,如果SDET
6、扩展效果良好,内核就不会引起客户应用程序的扩展性问题。有关SDET的更多信息,请访问。下一张幻灯片这张图表显示了HP-UX各版本的可扩展性逐渐得到改善,并且涵盖了越来越多的处理器。显然,处理器越多的系统性能越佳,并且大量处理器也有助于扩大吞吐量。随着系统日趋增大,操作系统要管理更多的处理器和更多的内存等项目,因此对于每一代系统,HP-UX都会针对性能进行再工程处理,以便能更有效地管理硬件资源,使性能切实得到良好扩展。此处水平轴代表系统中的处理器数,垂直轴代表工作负载吞吐量。我们先从这组曲线中间部分的黄色曲线开始,它显示了11iv2在基于sx1000的Superdomes和HPm
7、x2Itanium处理器条件下的性能。再看黄色曲线上面的紫色曲线,它代表了从基于sx2000的Superdome到双核Itanium处理器的硬件改进所产生的性能提升,由于同样使用HP-UX11iv2,因此这属于硬件性能增益。从紫色线再向上来到红色线,紫色线与红色线之间所呈现的可扩展性和性能差异是由于HP-UX11iv3所带来的性能提升,另外,此工作负载使用的64位内核从11iv2升级到11iv3,也使性能提升达45%。此处数据是使用相同工作负载得出的,即我们在上一张幻灯片中所讨论的SDET变量。我们确保SDET在新版HP-UX中扩展性良好,实现了这个目标后,我们发现许多或者说大部分客户应用程序
8、的扩展性都更好。下一张幻灯片现在我们稍稍深入讲解一下,向大家展示HP-UX11iv3在操作系统中实现的几个重要性能增益。我们的11iv3在Pthread-POSIX线程方面有重大改进,其中在VolanoMark和“新线程互斥体”微基准方面有大幅改进,这些改进是通过创建度量和破坏线程互斥体而获得的。我们现在展示的是172%的磁盘I/O增益。这是在rx8640上可持续的磁盘I/O数量度量,这很大程度上归功于内核中的内存延迟的减少,以及Santosh马上将要讲到的新的海量存储堆栈。在文件系统方面,此处的150%显示的是IOzonemmap性能增益,是通过内存映射接口实现的文件系统性能,这项增益应归功
9、于11iv3中新的统一文件缓存,以及新版VxFS文件系统,即VxFS4.1。文件系统装载和卸载性能也得到提升,这同样是由文件系统的性能提升所致。在文件服务器方面,我们改进了NFS性能及VxFS或文件系统性能,从而实现增益,此处显示的是根据SPECsfs基准(即SPEC共享文件系统基准)进行度量的结果。占用内核资源较多的应用程序实现了SDET增益,我们在前两张幻灯片中对此进行了讨论。11iv3的启动时间也得到改善。此外,我们在其他方面也度量到性能增益。我们在三层企业资源规划应用程序中度量到性能增益,包括网络传输堆栈中CPU利用率减少30%,流中CPU利用率减少70%,以及10GB以太网驱动程序中
10、CPU利用率减少30%。这些度量都在四核系统中进行。因此,借助在11iv3操作系统中进行的性能工程,范围广泛的一系列工作负载和系统配置都可实现大幅性能增益。下一张幻灯片刚才说到了磁盘I/O增益,我认为这部分应归功于11iv3,是它减少了内存延迟。11iv3专为基于单元的大型系统而设计,这些系统的特点是具有不一致的内存访问延迟,也称为缓存一致的不一致内存访问系统,或ccNUMA系统。某些内存距离较近,处理器使用起来也较为迅速,但有些内存则位于系统较远的位置。HP-UX11iv3进行了100多处内核更改,从而使延迟降至最低。这可减少伪缓存行共享的实例,消除缓存缺失,使用单元本地内存来减少缓存缺失延
11、迟,使用预取和后取减少感知延迟。许多此类增益可以即开即用方式实现,另外,通过诸如“parmodify”之类的可调项来配置单元本地内存,还可获得更多优势。可通过“scsimanager”可调项对海量存储堆栈进行基于位置的调度,以及通过名为“numa_policy”的新内核可调项分配单元内存,而无需更改任何源代码。这些减少内存延迟的更改结果显示在右侧的条形图中。这里比较了11iv2和11iv3在基于单元的Integrity系统rx8640中的1KBI/O的I/O速率,大家可看到11iv3的性能提高了172%。下一张幻灯片在文件系统方面,我在摘要幻灯片中曾提到装载和卸载性能的提升。这张幻灯片比较了装
12、载和卸载时间,时间越短越好;大家可以看到,从使用VxFS3.5版本文件系统的11iv2到使用VxFS4的11iv3,装载和卸载时间都大大减少。这是在64位处理器Superdome上获取的数据。数据是在SDET运行的设置和拆解期间收集的。每张磁盘都有其自己的文件系统。每个文件系统大约36GB大小。卸载在SDET使用文件系统作为暂存空间后立即进行,因此当时文件系统缓存和缓冲区都是脏的。下一张幻灯片这张幻灯片显示了其他文件系统性能的提升。在这张幻灯片上,我们显示的是数据速率-因此,柱形条越大或越高,性能越好;大家可以看到红色柱形条代表的11iv3在各方面都大大优于蓝色柱形条代表的11iv2。这些数据
13、使用IOzone基准。有关IOzone的更多信息,请访问。这些数据也是从我们的64位CPUSuperdome上获取的。其硬盘为JBOD,最大I/O吞吐量为每秒2.8GB。对于写入程序的性能提升,请看最左侧的柱形条,之前我们受到I/O速率限制,现在则达到每秒约15GB的更快速率,这仅在内存中才有可能。两种情况下的缓冲区缓存都约为250GB,持有全部64个1GB文件已十分足够。因此,这显示适合缓冲区缓存的读写性能,有趣的是,在过去的版本中,写入性能受到I/O带宽的限制。写入性能的提升源于11iv3中的一处行为更改。之前,如果文件大小大于256KB,VxFS就会执行写通操作。这样
14、可能会影响性能,经过调查,我们决定使用可调项来禁用该行为,因为性能的提升与否关键不在此处。虚拟内存系统使用syncer守护进程定期刷新所有脏页面。可能在少数情况下,客户仍想使用写通行为,这时可通过可调项进行设置。单个文件情况下的读取性能提升增益与锁定性能提升有关。文件总是适合缓冲区缓存,但是由于锁定意图减少,因而吞吐量得以改进。请看右下方的条形图,其中显示的是IOzonemmap性能。它度量的是使用内存映射地址写入文件的性能,而不是写系统调用。这里的增益主要源于11iv3中新添加的统一文件缓存。测试首先使用写系统调用创建文件,然后对文件进行内存映射,并使用内存映射地址度量写入文件的时间。在11
15、iv2中,因为我们有两个缓存,虚拟内存系统在修改内存内容之前,需要先刷新缓冲区缓存,并从硬盘读回内容。在11iv3中,我们只需使用同一页面,因为缓存是统一的。这就是为什么11iv3能提供巨大增益的原因;这些数据来自有12个硬盘的四CPU系统。下一张幻灯片我们在HP-UX11iv3中对POSIX线程(或Pthreads)实施进行了重大改进。针对性能所做的更改达15处之多。互斥体吞吐量得到改善。互斥体CPU循环利用曾经在超过八个线程时会大幅上升,但现在它却不受线程数量的影响。此处数据来自16路Itanium机箱。使用“新线程互斥体”基准来度量吞吐量,并显示线程数量与处理器数量相等时的吞吐量峰值。这
16、就是为什么我们看到线程数量为16时,吞吐量大约为2.2万的原因。下一张幻灯片谈到容量扩展,11iv3的文件系统经过重新架构,可有效消除文件大小限制。体系结构文件大小限制现为8EB,即大约为80亿GB。HP-UX11iv3通过了大小高达16TB的文件系统测试,这张11iv3幻灯片中粗体部分显示的内容即是。Santosh稍后将介绍容量扩展方面的更多内容。下面我们将讨论11iv3中的一些重要功能,正是有了这些功能,才使这些性能、可扩展性和容量有大幅提升。下一张幻灯片在下一组幻灯片中,我们将讨论这四种功能。HP-UX11iv3支持Intel双核Itanium处理器的超线程功能。我们将详细介绍新的统一缓
17、冲区缓存,它取代了之前HP-UX版本中分散的页面缓存和文件系统缓冲区缓存。我们将讨论11iv3中的创新功能,它以罗马众神的信使墨丘利(Mercury)的名字命名。随后,Santosh将讨论11iv3中的新海量存储堆栈。下一张幻灯片Intel双核Itanium处理器为每个插槽提供两个处理器核心,每个处理器核心提供两个硬件执行线程。超线程可通过在内存停滞时使用闲置的CPU周期及闲置的功能单元来增加指令吞吐量。Intel双核Itanium处理器中的超线程实施既包括同步多线程,也包括时序多线程。核心资源通过使用时序多线程进行共享,内存层次结构资源则通过使用同步多线程进行共享。有多种事件可导致核心在超线
18、程之间切换-长延迟事件,如L3缓存缺失,线程切换超时,执行hintpause指令,或对固件执行特定调用,如PAL_HALT_LIGHT。在超线程之间共享的资源包括管道。超线程切换可导致管道刷新。在超线程之间共享缓存和TLB条目。分支预测结构进行共享,机器特有的寄存器也进行共享。超线程的性能优势根据应用程序而有所不同,它并非总是有益的,但通常情况下都有优势。一些应用程序将从中受益,另外一些则不会。下一张幻灯片在11iv3中,超线程通过物理分区的固件(或nPAR)开启或关闭,此操作在启动时静态完成。11iv3启动时默认关闭超线程。通过使用逻辑CPU或LCPU,11iv3允许以处理器集的方式(或ps
19、et方式)动态启用和使用超线程。超线程向应用程序显示为CPU,因此,HP-UX可通过新pset属性在pset级别动态启用或禁用逻辑CPU。这为更适合单线程硬件的应用程序(如实时、高性能的技术应用程序等)提供了“安全港”,在节电模式下,禁用的逻辑CPU会归位到固件中。因此,HP-UX超线程配置可包括:在固件中关闭超线程、在固件中开启超线程和启用LCPU,或在固件中开启超线程和在操作系统中禁用LCPU。系统配置操作可同时影响两个超线程。它会影响pset、Parmgr读为“Parmanager”、nPAR、vPAR、ICAP等。CPU对象的现有API现在可识别LCPU或逻辑CPU。有新的API可识别
20、mpctl、pset_ctl读为“PSETcontrol”、pstat等属性中的物理核心。有新的PSET属性可启用/禁用LCPU,并且有一个动态可调项可在默认处理器集上启用或禁用LCPU。由于在11iv3中使用了逻辑CPU的概念,因此可在处理器集上使用或不使用超线程,以尽可能获得最佳性能。下一张幻灯片前面我们曾讨论过,11iv3通过mmap接口在文件系统性能方面有了重大改进。这在很大程度上归功于11iv3中的新统一文件缓存。之前,我们仅有分散的页面缓存和缓冲区缓存,现在,在11iv3中我们有了统一文件缓存。过去由于缺乏一致性而采用替代方案或未移植至HP-UX的应用程序,现在可以利用统一文件缓存
21、了。HP开发的所有文件系统都已移植至统一文件缓存,这包括VxFS4.1、HFS文件系统、NFS、ONC2.3、CDFS和UDF。新的“fadvise”读为“fadvise”系统调用确保了应用程序能够在文件级别指定属性,例如,syncer频率、较大页面、ccNUMA等。下一张幻灯片统一文件缓存提供了多个新的可调项,以控制读写访问的内存大小。dbc_min_pct读为“DBCminpercent”和dbc_max_pct读为“DBCmaxpercent”已替换为filecache_min和filecache_max。新的可调项filecache_min和filecache_max与dbc_min和
22、dbc_max可调项相兼容,并维护相同的语义。可将新的可调项指定为百分比或绝对值。可调项控制读/写访问的内存大小。它们不限制内存映射访问。元数据维持在缓冲区缓存中,并由filecache_min和filecache_max可调项的一小部分控制。可调项bufpages和nbuf已被删除。应用程序可在文件级别指定属性,例如syncer频率、较大页面和ccNUMA。混合模式性能之所以有提升,是因为在读/写与内存映射访问之间切换时无需刷新。下一张幻灯片Mercury是11iv3中的一项新功能,它提供了用户到内核的合作性能提示和信息共享。Mercury(或“hg”系统调用)由API、库和标头文件组成。工
23、程小组在11iv3中对内核进行了更改,以新提供某些之前不可用的信息,更改内核可让内核以我们马上将讨论的方式帮助用户提升性能,它还提供了一个新途径,可将信息快速传输给用户级程序。此信息共享比传统的系统调用接口快许多倍。性能可从内核获得,其速度比传统系统调用快10至30倍,它对于只能通过Mercury获取的信息,即之前通过系统调用无法获取的信息而言同样快速。下一张幻灯片那么,Mercury有哪些功能,应该如何使用它呢?Mercury在获取通过传统方法也可获取的信息方面要快得多,例如当前时间和其它时间信息,以及正在上面运行线程的当前处理器。Mercury可让难以或不可能通过标准系统调用获取的信息变得
24、可用,例如:一些其它合作性线程目前是否正在运行?以及当前线程的上下文切换计数是什么(包括已尝试、非主动及主动上下文切换)?一个主要功能是Mercury允许用户程序影响内核控制的调度行为。Mercury提供一条高速通道供线程告知内核,它暂时不希望被上下文切换出。这在应用程序打算进入临界区域或进入其准备保持锁的区域时非常有用,若其未被切换出而留在临界区域,这对性能而言将是最好的。在内核力所能及的范围内,它将尊重这个要求,不将线程切换出。可使用Mercury的一些样本来度量时间,尤其是极短的间隔时间,而正常“gettimeofday”调用可能太慢。Mercury还在不同处理器上的线程之间提供合作性任
25、务处理。另外,Mercury还用于构建用户空间锁定原语。下一张幻灯片此处是11iv3中的一些其它性能功能。对于11iv3,我们现在为每个线程提供一个线程锁。之前,所有线程只有一个线程锁。这可消除限制扩展的可能争用点。11iv3中的全新功能是一个重新架构的内核同步原语集。原语集包括自旋锁、信号灯、自适应互斥体以及更多原语。新功能提升了性能,从而降低了诸如文件系统和网络连接以及I/O驱动程序等内核组件移植到HP-UX的难度。现在,Santosh将讲述HP-UX11iv3中的新海量存储器及其性能。下一张幻灯片SantoshRao:谢谢,Curt。在这部分演示稿中,我们将讲述11iv3海量存储堆栈及其
26、提供的一些功能,其中重点讲述海量存储堆栈为HP-UX11Iv3带来的性能提升。11iv3的主要新功能之一是下一代海量存储堆栈。它为HP-UX提供了一个全新的现代化海量存储堆栈,使其能够处理新的I/O接口协议、新的存储和服务器技术。存储堆栈的其中一个主要部分是一个内置的、本地、多路径和负载平衡解决方案,可完全集成到HP-UX11iv3中。本地、多路径也被称为零配置多路径。之所以将其称为零配置多路径,是因为系统管理员完全无需做任何额外工作来启用HP-UX11iv3上的多路径。与HP-UX11iv3之前的版本不同(早期版本必须安装附加产品、启用许可证及手动配置和调整多路径),11iv3向HP-UX客
27、户提供一个完全无需配置的多路径解决方案,这意味着多路径现已完全透明,完全自动化。它即开即用,无需系统管理员进行任何额外配置。本地多路径适用于所有类别的存储设备,例如磁盘、磁带和转换器。对于磁带和转换器设备,无需执行任何负载平衡,且所有IO流量仅限于单个路径。对于磁带和转换器设备,故障转移是非透明的,且仅在下次由访问转换器设备磁带的应用程序打开时才会发生。本地多路径适用于所有存储传输,例如光纤通道、并行SCSI、SAS和iSCSI。从本质上来说,它不受底层传输的影响。尽管本地多路径不受传输影响,但却可感知传输,这就是HP-UX11iv3本地多路径的主要优点。由于本地多路径内置于HP-UX操作系统
28、的最底层,加之可感知传输,所以它能够检测SAN中的预先中断,了解中断范围,预先将所有受影响的并行路径组件脱机,从而确保系统能够在SAN组件中断期间以快得多的速度执行故障转移和故障恢复。11iv3本地多路径与其它多路径解决方案的主要不同在于,它能够以传输感知方式检测SAN中断的范围。除本地多路径外,海量存储堆栈的另一个主要增值功能是能够灵活执行寻址。灵活寻址功能能够以虚拟的方式,即以不依赖路径和位置的方式命名海量存储设备,从而允许在不影响设备文件名称的情况下重新配置SAN。这可给HP-UX客户带来巨大便利。当正在HP-UX上运行的应用程序引用和使用数据中心时,它允许客户对数据中心进行灵活修改而不
29、会对设备产生任何影响。海量存储堆栈赋予11iv3的一项关键功能是在未来十年具有十分优越的可扩展性。在企业操作系统对SAN设备的功能限制方面,HP-UX是领先者之一。HP-UX测试的设备数目大大超过其它竞争操作系统,正是有了11iv3,我们才能远超其他竞争对手。正如您在本幻灯片中所看到的,11iv3提供了很多增值功能,如易于使用、可扩展性、性能、可管理性以及灵活性。通过以一种虚拟的、不依赖位置的方式命名设备,灵活寻址可让管理员在不影响应用程序的情况下,重新配置SAN。每次在SAN中添加新设备,均会被HP-UX11iv3自动发现,因而无需手动执行ioscan和insf之类的操作。所有增加和增强的功
30、能均在HP-UX现有命令范围内提供。我们的目标是利用HP-UX系统管理员已有的知识,而不是强迫他们重新学习已经知道的知识。HP工程小组对向后兼容投入了大量精力,花费了大量时间来确保系统能够完全向后兼容。除非使用某些新选件,否则从设备命名和表示法的角度来看,系统似乎与11iv2完全一样。在可管理性方面,我们引入了一个名为scsimgr的新命令和一个使用系统管理主页的相应图形用户界面。scsimgr向HP-UX系统管理员提供了诸多功能。它允许管理员执行预先故障隔离,这样管理员便能准确确定服务器的运行状态,确定数据中心是否存在问题,并向他们提供一套全新工具来识别和隔离数据中心内的问题。例如,借助sc
31、simgr和11iv3的新命令,管理员可通过重启服务器确定他们是否丢失了适配器、目标端口或逻辑单元。如果确实出现类似的SAN中断,他们便可隔离某些特定组件,例如造成访问丢失的适配器或目标端口。此外,它还能让管理员确定哪些设备名称因访问丢失而受到影响,以及哪些应用程序可能会出现中断。我们在HP-UX11iv3中添加了多个新的性能监控功能,系统管理员现在可确定类似以下的问题:存储适配器的利用情况如何?所有逻辑单元的路径是否负载均匀?特定路径上是否存在性能问题?是否存在与读写相关的性能问题?总之,11iv3在以下方面提供了一个全新的范例:即如何管理海量存储,如何将其隔离、如何扩展以及如何提供更多性能
32、。下一张幻灯片在这张幻灯片中,我们将讨论HP-UX11iv3相对于11iv2的扩展性限制。通过浏览这张表格,您可以初步了解HP-UX海量存储大幅增强的扩展性能。例如,每个系统LUN的上限值已从3.2万增至6000万。经测试的限值将根据客户需求从8000增至1.6万。该限值是HP持续测试的受支持限值。每个系统的最多路径数以及每个LUN的最多路径数也有类似增加。HP-UX11iv3每个系统支持多达6.4万条LUN路径,这些是经过HP实际测试而得出的限值。I/O总线上限在11iv2中为256条,现在在11iv3中则可达1600万条。由于设备名称现已虚拟化,且不依赖路径和位置,因此总线实例不再嵌入灵活
33、或永久设备归档中。LUN容量已从最大2TB增至80ZB。此外,I/O大小上限也已经从1MB增至2MB。因此,浏览幻灯片时,您将注意到,HP已在多个方面提高了HP-UX的可扩展性。HP目前在每台服务器上支持更多的LUN,以使能够连接至该系统的总存储容量更大。除此之外,HP还支持更大的LUN容量,每个LUN可支持多达80ZB,从而可将存储配置为更大大小的LUN,而使用的逻辑单元越少,存储管理就越简单。每个LUN和每个系统的路径数量现已显著增加,从而可容纳新范例,例如单元感知负载平衡策略。单元感知负载平衡策略试图按每个单元或每个位置域配置适配器,然后通过调度同一单元或同一位置域上的IO来充分利用单元
34、相关性。这些范例,例如基于单元的循环策略及最近路径负载平衡策略,令基于单元的系统的性能得以提升,同时每个LUN需要使用更多路径。I/O大小上限增加可使顺序和连结IO流量上的IO性能更佳。下一张幻灯片在这一部分,我们将讨论11iv3海量存储堆栈的性能。其中一项关键性能是内置到海量存储堆栈中的IO流量负载平衡。由于内置了负载平衡算法,且可即开即用和完全透明,故可充分利用设备的所有可用路径,IO性能现在是一个可用于所有终端逻辑单元路径的函数。与仅使用故障转移替换路径的旧多路径产品不同,HP-UX11iv3、本地MP或本地多路径将充分利用系统上的所有可用路径。这会令性能大大提升,同时在任一路径脱机的情
35、况下能够进行故障转移。HP-UX提供一组高级负载平衡算法,从默认值(默认值为循环)到其它策略,例如最小命令负载、单元感知循环、最近路径等等。默认值是循环,且如果认为循环对于该特定系统已足够,则无需进行额外系统配置。并行ioscan是另一项主要功能,它可提高系统扫描的性能并缩短系统重启时间。我们将研究重点主要放在识别CPU缓存缺失上,确保数据结构和冷路径与CPU兼容,借此提升系统的性能。我们将要讨论的另一个主题是性能度量的增强以及跟踪系统性能的工具。下一张幻灯片在我们所讨论的性能提升的各个方面中,真正打动读者或用户的是跟踪性能的提升。HP-UX11iv3提供了多个高级性能度量,例如显示HBA端口
36、级别度量的功能。现在,您可以看看HBA端口上的I/OP,以及HBA端口上的吞吐量。此外,显示磁带设备度量可让用户确定磁带备份是否进展顺利。分隔读写I/O度量可将只读或只写的性能问题进行故障隔离。除此之外,若系统曾进行过系统转储,则11iv3提供的并发转储可在系统崩溃前显著加快转储速度,缩短系统停机时间。下一张幻灯片在这张幻灯片上,我们将讲述HP-UX11iv3在启动扫描、系统关闭、重启以及insf方面的改善。蓝色柱形条表示11iv2的性能数据,红色柱形条表示11iv3的性能数据。当我们执行扫描、创建设备文件和重启系统等操作时,总是希望所花时间越短越好。正如您在这两个图中所看到的,红色柱形条远远
37、低于蓝色柱形条,这表明在11iv3上执行这些操作所花的时间较少。让我们看看幻灯片上半部分的第一个图,在系统启动时的初始扫描期间,启动时间的提高是相当显著的。这个系统约有19,200条LUN路径连接到RX8620。在该系统上,每个LUN有约32条路径,系统共有600个LUN,八个光纤通道HP端口。换言之,I/O配置相当密集。您会看到,从11iv2到v3,初始启动期间的扫描时间已从约4分钟降至约44秒,也就是说,扫描设备所花的时间显著减少了。同样,关闭和重启系统所花的时间也从10分钟减至7分钟,该系统配置有600个LUN。请看幻灯片上的第二幅图,此图将11iv2和v3中iocan和insf命令的多
38、个不同变量进行了比较。其中一个最重大的改善是方框右侧的最后一个图,该图表示insf-e的性能提升。在配置有19,200条LUN路径的11iv2中,创建设备文件所花的时间是12.5分钟。在11iv3中,同样的IO配置,进行insf-e操作只需4.3分钟。从幻灯片中可以看到,在服务器上部署和配置新存储时所涉及的系统管理员操作性能在HP-UX11iv3中得到了提升。通过减少发现新存储、重启服务器、为新存储创建设备文件所花的时间,现在,可以更快的速度在11iv3上配置和部署存储。下一张幻灯片此幻灯片主要讲述HP-UX11iv3在IO方面的性能。它将讲述从11iv2到11iv3,每秒IO(即IOPS)和
39、CP利用率的改善情况。幻灯片上方的图对IOPS和CP利用率进行了比较。左下方是11iv2性能,右下方是11iv3性能。蓝色柱形条表示IOPS,或每秒IO,从v2到v3,该柱形条上升即意味着在v3中,系统每秒可执行更多IO。红色柱形条表示CP利用率,该柱形条下降即意味着在11iv3中,系统现在使用较少的CPU提供性能。让我们来看一些数字和配置本身,该系统是4单元RX8640,有八个光纤通道HBA端口连接到数个MSA-1000,每个LUN的每个端口使用八条路径。同样,IO环境相当密集。从11iv2到11iv3,每秒IO提高了2.1倍。在此您可看到这些数字已从21万升至近45万。CPU利用率则从55
40、%降至42%。幻灯片下方的图表表示服务需求,即传输一兆字节数据的CPU利用率。同样,服务需求减少是件好事,这表示每传输一兆字节数据只需较少的CPU。如下方图表所示,从11iv2到11iv3,服务需求提高了2.8倍。因此,本幻灯片讲述的重点是:11iv3不仅提供本地多路径和负载平衡等多项新增功能,而且还令HP-UX服务器上的IO性能得以提升。在11iv3中,每秒IO和CPU利用率均有所改善。这些改善来自何方?这些改善很大一部分来自内核和海量存储堆栈内的位置及位置相关性的改善。HP-UX11iv3的一个工程重点就是确保缓存缺失得以识别并尽可能将其降至最小程度。在海量存储堆栈中,HP曾使用Calip
41、er工具来识别缓存缺失热点以及缓存线共享,并采取措施减少缓存缺失的数量及将缓存线共享降至最小。除此之外,本地多路径和负载平衡还提供单元感知负载平衡策略。这些策略能够将所有IO调度保留在同一位置域,如启动IO所在的CPU。通过使用这些创新的位置改善,海量存储堆栈现已能够使IO性能更具效率,同时传输等量数据消耗的CPU要少得多。下一张幻灯片我们之前在性能报表中提到过改善。这些改善可用SAR和iostat等工具以及GLANCE等图形工具查看。改善的主要方面是能够查看每个HBA端口上的度量,从而了解目前正在使用的适配器的利用状态。它可让您确定是否需要部署和配置其它适配器或当前适配器是否足以管理系统上的
42、IO负载。它按逻辑单元和通往逻辑单元的路径来分析性能度量,从而让您检查和深入查看每条路径,并确保每条路径都正按预期执行。通过提供关于磁带设备的性能数据,您可以监控磁带备份,查看磁带设备如何正按其应有的方式执行操作。HP深入考虑了可能遇到的各种性能问题,例如,提供读写性能数据的分类功能。通常,I/O性能问题可能只限于读取情况或写入情况。若将度量集组合在一起,通常很难查明问题是只与读取有关还是只与写入有关。在HP-UX11iv3中,sar等工具可让您分别分析读取性能和写入性能数据,由此便可隔离只影响读取或写入的任一类型的路径或逻辑问题。除所有性能度量外,scsimgr命令还提供海量存储堆栈各个级别
43、的统计数据。这些统计数据可暴露系统的内部结构,使管理员能够通过检查所有统计数据来确定何处可能出错。同样,11iv3中也体现了HP理念,即真正简化配置和部署存储所需的操作,以及在出错时故障隔离存储所采取的操作。可用于I/O性能的诸多可调项类似于escsi_maxphys和max_q_depth设置。escsi_maxphys控制I/O大小上限,且已从11iv2的1MB增至11iv3的2MB。使用更高的I/O大小上限可使连结和顺序IO的I/O性能更具效率。max_q_depth设置是一个主要的scsimgr属性,可判断每条路径上增加的并发I/O数是否成为问题。默认max_q_depth值设为8,随着容量更大的LUN的使用,或者甚至相反情况下,系统管理员可能想查看max_q_depth设置,看看他们的环境是否可通过增加max_q_depth获得性能增益。下一张幻灯片这张幻灯片着重讨论HP-UX11iv3整体性能的提升。它显示了启动过程中初始扫描时间以及关闭和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年五一商家促销活动方案策划
- 医疗医学项目汇报与总结计划
- 2025年防汛应急处置方案
- 织袜机工作原理及维修分析
- 2025年湖北省枣阳市白水高中9校联考高三物理试题含解析
- 2025年江苏省吴江市青云中学初三下学期五校联盟考试英语试题含答案
- 沈阳工程学院《英语阅读(4)》2023-2024学年第二学期期末试卷
- 2025届重庆市七校联考高三第四次模拟综合试卷含解析
- 广东科学技术职业学院《电子电路基础实验(下)》2023-2024学年第二学期期末试卷
- 北京政法职业学院《食品安全进展》2023-2024学年第二学期期末试卷
- 精神障碍社区康复服务流程图
- 2024年天津开放大学《机械制图》阶段性考核参考试题库(含答案)
- 结构设计合理性分析
- PICC相关静脉血栓护理查房案例
- (正式版)JBT 5300-2024 工业用阀门材料 选用指南
- 中外政治思想史-形成性测试四-国开(HB)-参考资料
- 2011年10月自考00567马列文论选读试题及答案含解析
- 2024年山东省济南市莱芜区中考一模化学试题
- 膜萃取技术及其应用研究进展
- 六年级语文下册第四单元综合性学习:开展阅读分享会课件
- 瓶盖自动封装机的设计
评论
0/150
提交评论