市场营销HPsuperdome服务器WhitePaper_第1页
市场营销HPsuperdome服务器WhitePaper_第2页
市场营销HPsuperdome服务器WhitePaper_第3页
市场营销HPsuperdome服务器WhitePaper_第4页
市场营销HPsuperdome服务器WhitePaper_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、PAGE 58HP 9000 superdome 服务器技术白皮书仅在NDA 之下共享限于HP 使用版本白皮书阐述了HP 9000 superdome 服务器的设计目标和系统架构,并给出了系统当前具备的技术细节。本文的目标读者是HP 现场人员,用以帮助他们更为清晰有效地向客户介绍superdome 的功能。1. HP 9000 企业服务器产品线运行HP-UX 的HP 9000 企业服务器产品线满足了当今客户在线事务处理(OLTP)、企业资源规划(ERP)、业务智能性、Internet 和科学技术应用等方面的大多数计算需要。HP 9000 企业服务器产品线包括A、R、D、K、L、N 和V 类平台

2、。这一产品线的最新成员即是图1 中所示的superdome 平台。通过HP-UX 和HP PA-RISC 处理器等通用元件的使用,HP 9000 平台实现了应用兼容性和可移植性。该系统可完美地适用于现有环境,为关键任务OLTP、ERP、业务智能性和服务器合并应用提供计算和文件服务。HP 9000 企业服务器产品线堪称当今最具扩展性的计算产品系列。这些系统拥有:全面的应用兼容性,允许用户无需考虑应用可用性即能以合适的价位选择合适的平台。业界最高的单处理器性能,在所有环境中通过并行性缩短了解决问题的时间,通过多处理提高了吞吐量。无与伦比的可扩展性,对整个产品系列提供了一致的性价比,保护了客户对软硬

3、件的投资。一致编程模式,无论系统性能水平如何,均提供了相同应用编程环境,大大增加了可用“现成”第三方应用的数目,减少了移植和开发成本。两种定价模型,为客户提供了利用superdome 处理资源的最大灵活性。这两种定价模型为瞬时按需容量(iCOD)和基于使用量定价。基于使用量的定价机制可能未包含在第一版中。本文介绍了高级HP 9000 superdome 企业服务器系列的体系结构、系统软件和工具。HP 9000 企业服务器系列实现电子化服务高端中型入门级A 类“piranha”L 类N 类superdome除非另外标出,否则在CPL 上使用R、D 、K和V 类 A 类 A180 自 2001 年

4、 2 月起作废图1. HP 9000 企业服务器系列1.1 HP 9000 superdome 企业服务器系列简介superdome 是HP 9000 HP-UX 企业服务器系列的最新成员。它也是第一款可升级至IA-64 处理器的高端服务器系列。superdome 为面向e-ServiceCenter 的高端平台,可满足每位客户不断变化的特定需求,这一功能是独一无二的。此功能以服务水平协议(SLA)特性、分区和可扩展至高达64个业界领先处理器和多个操作环境(OE)的可扩展性为基础。superdome 服务器系列中最大的服务器极大地拓展了V 类产品的性能、可扩展性和可用性,包括:高性能RISC

5、处理器(PA-8600)522MHz、4 路超级标量(2.2 GFLOPS)56 路指令重排序缓存10 个功能单元大型单片高速缓存器更高内存子系统性能将峰值内存带宽提高至每64 路系统51.2GB/s更高密度的系统包提供每64 路系统256GB每机柜双倍处理器容量配置可从2 到64 个CPU双倍I/O 接口性能;高于双倍I/O 带宽64 位33MHz(2x) 业界标准PCI64 位66MHz(4x) 业界标准PCI16 个1.2GB/s I/O 通道( 每64 路系统19.2GB/s)PCI 插槽数目增加(多达192 个)系统可靠性和性提高,正常运行时间至少为99.99改进了系统质量、弹性和故

6、障管理在superdome 集群器中支持MC/ServiceGuard 和MC/LockManagersuperdome 运行业界领先的HP-UX 11i 操作环境。这一大型机类、64 位操作系统享有来自独立软件厂商的业界最出色支持,允许您从15000 多个应用,包括所有主要数据库和领先ERP 应用的本机64 位版本中进行选择。采用64 位HP-UX 操作系统,在V 类上执行的应用与未来基于HP-UX 11i 的平台实现了二进制兼容。2. superdome 系统概述图2a 和2b 显示了superdome 系统的主要元件以及它的机械和架构特性。superdome 32 路机柜的前面视图给出了

7、机柜到达客户现场后可热插拨的主浏览器将要安装的位置。在主浏览器下,有8 个单元板,上面驻留着处理器和内存DIMM。单元板凭借高于11.11 的HP-UX 版本来支持热插拨功能。主送风口位于单元板下、I/O 插件箱上。有两个I/O 机箱外壳(ICE),每个ICE 容纳两个可热插拨的I/O 插件箱。最后是前端电源,它位于机柜底部。superdome 系列不支持电气插头。电源是硬连线至系统的,有两个冗余电源输入端,以便系统可经由两个不同电网供电。superdome 32 路机柜的前面视图主鼓风箱(未显示)单元插件箱主送风口IO 插件箱(未显示)前端电源图2a. superdome 32 路机柜的前面

8、视图superdome 32 路机柜的背面视图给出了系统背板的位置。在右边,有一个通道,可将两台superdome 32 路机柜连接起来组成一个superdome 64 路机柜。机柜底部驻留有一条48VDC 电源总线。superdome 32 路机柜的背面视图背板用于机柜间连接的通道48 VDC 电源总线图26. superdome 32 路机柜的背面视图2.1 superdome 特性一览16 路32 路64 路I/O 扩展4CPU 单元板(由HP-UX 11i 提供的热插拨功能)2-44-88-16CPU2-164-328-64内存(带512MB DIMM)2-64GB4-128GB16-

9、256GB12 插槽I/O 插件箱44/88/166热插拨PCI I/O 插槽48 个插槽(32 个33MHz 插槽,16 个66MHz 插槽)48/96个插槽(64 个33 MHz 插槽,32 个66 MHz 插槽)96/192个插槽(128 个33MHz 插槽,64 个66MHz 插槽)72热插拨冗余电源(包括N1 个)46122I/O 风扇6612热插拨冗余浏览器或风扇(包括N1 个)448分区44/88/16交叉带宽(峰值)12.8GB/s25.6GB/s51.2GB/s2X PCI I/O 母线带宽265MB/s265MB/s265MB/s4X PCI I/O 母线带宽530MB/s

10、530MB/s530MB/s单元控制器到I/O 子系统带宽(峰值)1.2GB/s1.2GB/s1.2GB/sI/O 带宽(峰值)4.8GB/s9.6GB/s19.2GB/s单元控制器到内存子系统带宽(峰值)3.2GB/s3.2GB/s3.2GB/s内存带宽(峰值)12.8GB/s25.6GB/s51.2GB/s平均内存使用负载延迟:4CPU8CPU16CPU32CPU64CPU260ns320ns350nsN/AN/A260ns320ns350ns395nsN/A260ns320ns350ns395ns415ns操作系统HP-UX 11iHP-UX 11iHP-UX 11i面世版本第一版第一版

11、第一版面世后3个月内第一版面世后4 个月内机柜数目1个(左)1个(左)2个(1左,1右)1个Rack System EExpansion尺寸:高宽深1.96m(77.2in)762mm(30in)1220mm(48in)1.96m(77.2in)762mm(30in)1220mm(48in)1.96m(77.2in)1524mm(60in)1220mm(48in)1.96m(77.2in)1.60mm(63.0in)610mm(24in)1220mm(48in)注1:当支持I/O 扩展机柜时(3-4 个月后第一版)支持图中黑体数字注2:对于高达168 个插槽的I/O 扩展,需一个扩展机柜(6

12、个I/O 插件箱)。对于高达192个插槽的I/O 扩展,需两个扩展机柜(2 个I/O 插件箱)。I/O 扩展机柜中的剩余空间可用来存储外设。I/O 扩展机柜有1.96m 和1.6m 高两种。2.2. superdome 包superdome 系统拥有四种不同的机柜组合:superdome 16W 和superdome 32W 系统为带一个superdome 左机柜的单机柜配置。superdome 机柜包含系统中所有的处理器、内存和核心设备,同时还将包含48 个PCI I/O 卡或4 个I/O 机箱。系统可以包括左右两个机柜组合,它们分别包含左右两个背板。superdome 64W 系统是双机柜

13、配置,带一个superdome 左机柜和一个superdome 右机柜。双机箱包含所有处理器、内存和系统核心设备。它将内置高达96 个PCI I/O 卡或8 个I/O 机箱。如果所需PCI I/O 卡数超过机柜中所容纳PCI I/O 卡数,则可选I/O 扩展机柜。一或多个Rack System E 机柜。这些19机架机柜可用来放置磁盘驱动器等系统外设。superdome 机柜的维护将仅在机柜的前部和后部进行。这样客户可以采用多数计算机房使用的传统纵列形式安排其superdome 系统的机柜。机柜的宽度适中,完全可以通过美国和欧洲的普通房门。进入到主(单元)插件箱的空气将受到过滤。过滤器可在系统

14、处于完全运行状态时卸下清洗或更换。每个机柜前门和后门朝外的一面有一个状态显示屏。这样客户和现场工程师无需打开任何一个机柜门即可确定每个机柜的基本状态。3. superdome 系统体系结构3.1 系统概述superdome 的基础是一套可用来在PA-8600 处理器基础上构建多种服务器类计算机产品的模块化元件。高于PA-8600 的处理器的升级需要新版单元控制器芯片和一个新的单元板版本。该平台支持从2 到64 个处理器的多种系统配置。该系统基于单元层次交叉架构,它可作为一个大型对称式多处理器或几个独立分区配置。superdome 服务器系列通过三种模型提供,其中最大的一种是带可扩展内存和I/O

15、 子系统的2-64 处理器系统。该服务器系列实际上是一个这样的系统:其中任意分区上的任意处理器可通过处理器发出的负载或存储命令直接访问任意分区上的任意字节内存。superdome 操作环境是业界标准64 位HP-UX UNIX 操作系统11.11 版。此版本提供了全面的64 位环境,包括64 位地址空间、64 位文件规模和文件系统规模,以及64 位数据类型等。superdome 系统架构中有三个基本构建块:单元、交叉背板和基于PCI 的I/O 子系统。图3 为此架构的具体演示。架构层次型交叉结构延迟时间1:本地(单元板)接入的极小内存延迟时间延迟时间2:用于极大配置(64 路)的真正SMP 内

16、存接入内存延迟时间 4 路32 路64 路256 路 HyperPlane 2:8 单元双向端口(大约4x V类b/w) I/O:8 个双向接口(大约10 x V类b/w)机柜1 机柜2背板远程链路远程链路背板单元板单元板单元板单元板远程链路远程链路背板背板图3. superdome 架构3.2 单元单元或单元板是superdome 系统的基本构建块。它是一个对称式多处理器(SMP),包括多达4 个处理器和使用128Mb SDRAM 的16GB 主内存。每个单元的峰值带宽为3.2GB/s 。每个单元都可选择连接至一个12 插槽PCI 插件箱。单元控制器到I/O 子系统带宽( 峰值) 为1.2G

17、B/s 。单元板包括:电源转换器数据总线处理器(多达4 个)内存(至多16GB RAM,增量为2GB)一个单元控制器(CC)在将来,一个单元可使用256Mb SDRAM 支持多达32GB 内存。处理器superdome 的最初版本使用以552MHz 核心频率运行的PA-8600。单元控制器芯片单元控制器芯片属于superdome 系统芯片集。它对单元板的主要元件间的内存进行协调,并确定某一请求是否需与另一单元或I/O 子系统通信。单元控制器芯片有5 个主要接口:2 个到内存控制器(DIMM)的端口4 个到处理器的端口( 可实现最高性能的每处理器专用端口)1 个到交叉结构的端口,通过它进行所有到

18、其它单元的通信处理器相关硬件(PDH)1 个到I/O 总线的端口,将单元连至I/O 子系统除接口逻辑外,单元控制器芯片保持系统中的高速缓存连贯性。单元控制器芯片支持PA-8600 处理器,并可支持未来的PA-RISC 处理器。然而,它不支持McKinley 等IA-64 处理器。处理器相关硬件,即PDH 是一个模块,可提供复位一个单元并使其能与其它单元连接且启动OS所需的本地单元资源。PDH 包括系统启动固件,它也可在运行时间使用。图4a 和4b 显示了单元的内容。单元控制器芯片驻留在单元板上。CPU 单元控制器内存DIMM 电源块图4a. superdome 单元单元板体系结构superdo

19、me 是一个基于单元的层次型交叉结构系统。一个单元包括:4 个CPU216GB 内存,带128 Mb DRAM一条到12 个PCI I/O 插槽的链路(可选)单元板内存内存 8 个PCI 2x 插槽单元控制器可选 I/O 控制器交叉结构 4 个PCI 4x 插槽全面ECC奇偶校验保护图4b superdome 单元体系结构内存控制器芯片内存控制器芯片属于superdome 系统芯片集,其基本功能是在单元控制器芯片和内存子系统的SDRAM 部件间进行数据的多路传送/ 取消多路传送。单元控制器芯片在内存接口命令总线上提出事务。内存控制器芯片将单元控制器提出的读事务进行缓存并在数据可用后立即将其返回

20、。注意只有内存子系统的数据部分通过内存控制器芯片。所有地址和到DIMM 的控制信号均由单元控制器芯片生成,并经由内存接口地址总线直接发送至DIMM。3.3 交叉背板每个交叉背板包含两套双交叉芯片,它们在8 个单元及其相关内存和I/O 间提供了非堵塞连接。每个背板机箱呆支持至多8 个单元或32 个处理器(superdome 32 路)。两个背板可用一条弯曲电缆连接,生成一个至多可支持16 个单元或64 个处理器(superdome 64 路)的机箱。交叉芯片上的每个端口均为6.4GB/s(峰值)。这些端口按以下方式使用:4 个端口与驻留在交叉芯片上的4 个单元相连(每单元1 个端口)3 个端口与

21、其余3 个交叉芯片相连(在superdome 64 路中)其余端口可连接至另一系统,以形成当前还不支持的多节点配置(可扩展计算体系结构)每个superdome 型号的总交叉结构带宽如下计算:单元数* 每单元峰值交叉结构带宽)/2 个端口对于superdome 16W 来说,交叉结构带宽为12.8GB/s。对于superdome 32W 来说,交叉结构带宽为25.6GB/s。对于superdome 64W 来说,交叉结构带宽为51.2GB/s。与交叉结构背板相关的内存延迟以下是superdome 系统中的3 类内存延迟:单元内的内存延迟指应用在由一个单元组成的分区上运行时的情况。单一交叉结构上单

22、元间的内存延迟指分区由位于同一交叉结构上的两个单元组成的情况。此时50的地址分配给请求处理器所在单元的内存,而另50的地址分配给另一单元的内存。不同交叉结构上单元间的内存延迟指分区由位于不同交叉结构上的单元组成的情况。此时如果分区中有16 个单元,则1/16 的请求给予此处理器所在单元的内存。3/16 的请求给予同一交叉结构中其它3 个单元的内存。剩余的12/16 的请求则这两个交叉结构间传输。superdome 内存延迟取决于CPU 数目及各自单元板的位置。假定到所有内存控制器的接入是平均分布的,单元板的安装方式也旨在最大限度减少延迟,平均内存延迟(负载使用)如下:CPU 数目平均内存延迟4

23、260ns8320ns16350ns32395ns64415ns交叉芯片交叉芯片属于superdome 系统芯片集。它采用了高性能8 端口非堵塞交叉结构和400MHz 交叉链路协议( 未来版本将支持500MHz)。所有端口在功能和电气上都是一致的。实现这些性能的交叉芯片属性有:支持到256 路相关共享内存系统的扩展200MHz 运作(未来处理器的250MHz 运作)400MT/s 链路速度(最大长度30)支持链路协议上的2 个互交通道支持IA-64 模式的双长度数据包性能计数器,实现软件调整3.4 I/O 子系统每个I/O 模块可提供12 个PCI 连接,这些连接由8 个2X 和4 个 4X

24、PCI 插槽与1 个I/O 控制器芯片和电源分享。每个PCI 插槽都有自己的PCI 母线。2X PCI 插槽有265MB/s 带宽而4X PCI 插槽则有530MB/s 带宽。任何I/O 模块均支持一个核心 I/O 卡( 每个独立分区均要求使用一个核心 I/O 卡)。superdome 16 路、32 路和64 路产品可分别容纳4 个、4 个和8 个I/O 模块(分别用于48 个,48 个和96 个PCI 插槽)。也可增加一个I/O 扩展机柜,为superdome 32 路增加48 个PCI 插槽(达到最高连通性:用于8 个单元的96 个PCI 插槽),也为 superdome 64 路增加9

25、6 个PCI 插槽(达到最高连通性:用于16 个单元的192 个PCI 插槽)。配有16 个单元且每个单元有自己的I/O 模块和核心I/O 卡的系统可支持16 个独立分区。注意单元在配置时可以不带I/O 模块,但I/O 模块在系统中配置时必须与单元相连。I/O 子系统带宽为每单元1.2GB/s。因此superdome 16W、superdome 32W 和superdome 64W 各自的I/O 子系统总带宽分别为4.8GB/s、9.6GB/s 和19.2GB/s。性能与可扩展性速度与反馈superdome16 路superdome16 路superdome64 路superdomeI/O 扩

26、展(见注2)交叉结构带宽(峰值)12.8GB/s25.6GB/s51.2GB/s单元控制器到I/O 子系统的带宽(峰值)1.2GB/s1.2GB/s1.2GB/sI/O 带宽(峰值)4.8GB/s9.6GB/s19.2GB/s存储母线带宽12.8GB/s25.6GB/s51.2GB/s可扩展性Superdome16 路superdome32superdome64 路superdomeI/O 扩展(见注2)4CPU 单元板(HP-UX 后11i 版配备的热插拔功能)2448816N/ACPU216432864N/A内存(配备512MB DIMM)464GB8128GB16256GBN/A12 插

27、槽I/O 插件箱44/88/168热插拔PCI I/O 插槽48 个插槽(32 个33-MHz 插槽、16 个66-MHz 插槽)48/96 个插槽(64 个33-MHz 插槽、32 个66-MHz 插槽)96/192 个插槽(128 个33-MHz 插槽、64 个66-MHz 插槽)96分区44/88/16性能标准superdome 将在OLTP、商务智能和技术市场上提供居领先地位、颇具竞争实力的性能。性能相关问题2/ 配置规则规则应用一个单元应配置多组8DIMMS需将8DIMMS(4GB)用于这两条母线,可能会有额外交叉或带宽效益,从而占用更多列(8GB 和16GB 配置),临时的2GB

28、存储可提供一半带宽。单元(存储)分区应拥有偶数个单元(2、4、8 或16)构建不具备偶数个单元的分区可能会导致生成的存储区交叉不理想。那些内存页位于仅一个单元交叉存储的应用与内存页位于所有单元交叉存储的应用相比,带宽节省可高达32 倍。分区分区的所有单元应具有数量等同的内存(对称内存加载)非对称分布式存储可影响单元间高速缓存线的交叉,所生成的存储区交叉不理想。那些内存页位于仅一个单元交叉存储的应用与内存页位于所有单元交叉存储的应用相比,带宽节省可高达32 倍。单元(内存)在含有4 个或不足4 个单元的分区,所有单元都必须链接至同一交叉结构,以去除瓶颈以及和其他分区共享带宽单元分区在单元多于4

29、个的分区,单元可在4 组交叉结构间进行分配,以去除瓶颈(例如,每4 组交叉结构采用2 个单元的32CPU 分区所拥有的带宽为每2 组交叉结构采用4 个单元的相同分区的两倍。)单元分区在合并分区前,应执行下列计算以确定链路负载,以防止性能出现瓶颈:N在给定4 插槽交叉结构连接上的单元数量,该交叉结构可与另一交叉结构对话P流入另一单元的存储信息百分比R在其余交叉结构的存储上的单元数量L两交叉结构间的链路数量链路负载N*P*R/L如果链路负载开始接近2,可能会产生性能瓶颈分区其他信息请参阅superdome 性能白皮书,其中对superdome 系统的性能与可扩展性进行了详细探讨。高可用性super

30、dome 在下列领域中为您提供了无与伦比的可用性:系统可靠性支持能力修复能力单系统高可用性多系统高可用性系统可靠性下面列举了superdome 产品系列内一系列系统可靠性的改进:内存DRAM 容错能力CPU 高速缓存ECC 和分配取消所有链路上的全面单一位错误检测/ 纠正I/O 错误恢复及针对I/O 卡故障的系统弹性HP-UX 11i的动态OS 特性(核心调整、驱动器在线添加、单元的在线添加/ 替换)ASIC 全面老化和“高质量”过程,使ASIC 故障率降低了10 倍所有重要的superdome 部件均经过全面的“故障测试”和加速后的使用期测试对多分区“单点故障”质量尤为重视支持能力下面列举了

31、superdome 产品的一系列支持功能。事件监控系统(EMS)该工具可为用户监控下列系统中的所有硬件提供支持:规模存储内存光纤通道部件(MUX、交换机、卡、光纤等)、I/O 卡主要系统母线上的ECC 错误CPU 高速缓存上的ECC 错误系统温度处理器故障支持处理器专用硬件问题、处理器专用硬件机柜风扇电池不足机柜电源机箱代码记录错误处理器专用代码(固件)问题系统硬件配置及选定核心参数也将进行监控,当发现过多处理器高速缓存错误时,处理器将自动退出使用,直至更换完毕。当硬件监控器发现问题时,将生成一个事件,通过DMI、SNMP、OPC(OpenView)、电子邮件、寻呼机、系统日志、控制台或一个选

32、定的文本日志文件通知用户。每一事件包含有对问题的全面描述、严重程度分类(信息、警告、严重和关键),以及原因/ 采取措施文本等。支持工具管理器中的强化硬件存储库支持工具管理器(STM)通过改进,可提供系统的详尽信息。superdome 在设计上为每个现场可更换元件 (FRLL) 配备了包括系列号、产品号、修订水平等信息的报告功能。该信息可从STM 中“Miscellaneous”信息工具中获得。此外,所有的硬件存储库信息均可通过DMI 访问。支持管理站请参阅8.2高可用性观察器高可用性观察器 (HAO) 是一种旨在维持客户关键任务环境正常运作的支持解决方案。HAO 可通过惠普的关键任务支持中心减

33、少所包括系统的断电次数、时间及影响。HAO 解决方案的基本功能如下:完成客户关键任务环境频繁、自动化的数据收集操作。为惠普支持人员远程访问客户环境提供安全的高带宽链路,进行诊断测试,预先解决的报告问题。为惠普的关键任务客户提供应答支持和主动支持。HAO 包括客户工作场所的所支持系统、可帮助维持客户系统正常运作的HA 支持工程师 (HASE),以及可提供内部企业配置显示和主动分析功能的关键任务支持中心 (MCSC)。这三部分可通过旨在确保客户系统安全性和所存储数据完整性的一系列设备链路连接在一起。HAO 技术涵盖了运行HP-UX 10.20、11.0、11i 的HP-UX 服务器,运行NT 4.

34、0(配备Service Pack 3 或更高版本)或Windows 2000 的HP、Dell 和Compaq 服务器,这是因为这些系统在客户关键任务支持协议中已确认使用。网络互联设备(如由HP和Cisco 生产的集线器、交换机、桥连及路由器)也囊括于HAO 工具中。 HAO 远程连通性解决方案也可支持至HP-UX 11.04 服务器的连接。HAO 由一套先进的工具、流程及支持人员组成,可为惠普支持合同的某些内容所覆盖的系统提供强大的支持功能。通过更活跃地观察客户系统及网络,惠普可为客户提供更理想的主动支持和应答支持。HAO 的三大主要体系结构部件为惠普支持节点、高带宽安全链路和关键任务支持中

35、心 (MCSC)。惠普支持节点是由惠普研发和运营的700 系列 HP-UX 系统,驻留于客户环境内。其职能是作为各种可获取客户系统配置和网络拓扑、供惠普支持人员使用的工具库。驻留于惠普支持节点上的HAO 工具可收集配置信息,并将其发送至惠普的某个关键任务支持中心。惠普支持节点也可作为惠普管理资源,用于分析核心及为其他应答支持提供帮助。惠普支持节点是惠普支持工程技术人员访问客户关键任务系统的门径。高带宽安全链路或ISDN 链路,用于连接惠普和关键任务客户。当应答支持要求访问客户系统以帮助解决问题时,该链路可为惠普提供快速反应功能。它也是一种路径,用于从惠普支持节点向MCSC 传输数据,进行主动分

36、析。MCSC 驻留于惠普内,其职能是作为基本支持中心,收集和跟踪客户信息,执行问题主动分析。MCSC 为HAO 远程支持体系结构提供了一个控制点,允许授权的HA 支持技术员访问隔离的LAN,以维护客户环境的安全。它还可容纳安置于隔离LAN 内的远程支持资源 (RSR)。RSR 还为授权HA 支持技术员访问客户网站提供了一种安全模式。驻留于MCSC 内的Configuration Analyzer 服务器还可获取从所有惠普支持节点收集的配置信息,分析数据,并在一旦例外情况发生后,打开支持中心工作流管理系统中的案例。MCSC 还提供了一种工具MCSC Monitor,可显示夜间从每个惠普支持节点传

37、输的客户企业配置数据。惠普支持工程师在提供应答支持时可首先检查MCSC Monitor 以发现配置变化情况,在提供主动支持时,可浏览修补综合信息。除此以外,为构成完善的惠普关键任务支持环境,还需部署路由器及其他连接设备、策略和防火墙、其他应用于支持中心的生产系统,以及各种类型的支持技术员。5)可预测性修复能力下面列出了superdome 产品的一系列修复功能:热插拔风扇、电源和背板DC/DC 转换器在线PCI I/O 卡更换在线单元板(HP-UX 11i 的随后版本)更换单系统可用性下面列出了superdome 产品的一系列单系统可用性功能:由iCOD 实现的N1 CPU 概念 N1 风扇、电

38、源和背板DC/DC 转换器双电源 PCI I/O 卡在线添加单元板(HP-UX 11i版)在线添加PCI I/O 卡联机添加与更换PCI Card OLAR 支持在HP-UX 系统(专门支持这一特性)上联机添加或更换PCI I/O 卡。借助每插槽电源控制特性以及操作系统对PCI Card OLAR 特性的支持,系统硬件允许在不影响其它组件或无需重新启动的情况下添加新卡并替换现有卡。这一特性为客户改进了高可用性解决方案,因为系统可在添加或更换I/O 适配器时保持持续运行。如果与其它高可用性产品(如MC/ServiceGuard)共用,系统可用性将得到大幅度提高。PCI OLAR 何时推出?联机检

39、测(OLD)即拆除卡并解除与软件驱动器相关的操作系统资源被占用的状态。这一特性将于HP-UX 11i 以后的一个操作系统版本中推出。HP-UX 11i 将具有在线添加(OLA)和更换(OLR)功能。更换操作是如何进行的?虽然有命令行界面,但与PCI Card OLAR 的主要连接是通过System Administration Manager 实现的。系统管理员可以查看系统上的当前I/O 适配器列表,确定哪个I/O 驱动器支持PCI Card OLAR 特性并选择需要更换的适配器。在SAM 中对PCI Card OLAR 操作的访问是通过外设设备的Cards 子区实现的。在支持PCI Card

40、 OLAR 的系统上的用户界面中有两个额外的列和五个额外的操作。额外的列专门显示每个卡的联机运行状态以及具有OLAR 功能的PCI 插槽的数字插槽识别码。新的操作允许更换卡,通过点亮系统底板上的淡黄色指示LED 找到插槽,分析重要资源,使停用卡或新卡联机并查看关于卡和插槽的详细信息。此外,Cards 屏幕上的卡列表经过改进后又增加了分级视图。即使大规模存储界面卡不具有OLAR 功能,你也可以打开它来查看与其连接的设备的列表。该视图与通过Devices 子区打开的视图相同,但它只包括与所选卡相连的设备。客户的反馈意见对界面和SAM 中的PCI Card DLAR 程序有很大影响。最初的设计是通过

41、可使用性测试以及与SAM 客户的沟通而形成的。最后的产品具有最佳的易用性和完整性以及针对这一新的复杂功能的故障保护特性。使用这一特性有何限制?如前所述,联机检测功能将在HP-UX 11i以后的版本中推出。在向系统中添加卡时,必须将合适的软件驱动器连入核心,以便确保连接成功。如果驱动器不是一个可动态加载的核心模块,那么必须建立一个新的核心并重新启动系统才能使新增加的卡投入运行。更换操作只限于相同组件的更换,即新卡与被更换的卡属于同一种产品。例如,不能用一个4 端口100BT 卡更换一个单端口100BT 卡。5.5 单一系统可用性相关问题/ 配置规则规则应用1. I/O 机箱所有权必须尽可能实现当

42、地化,一种方式是向分区分配I/O 机箱,次序是从单机柜内部开始,然后向外至由单机柜所拥有的I/O 扩展机柜。I/O2. I/O 机箱包含在单机柜内的分区比那些I/O 机箱分布于机柜间的分区要具有更高的可用性。I/O 分区3. I/O 扩展机柜只能用于主系统机柜配备有最大数量I/O 插件箱的情况。因此,在采用I/O 扩展机柜前,机柜必须首先装入I/O 插件箱I/O4. 由单机柜连接构成的双机柜(采用弯曲电缆)应尽可能使用单I/O 扩展机柜I/O 5. 作为缺省项,每分区至少分配2 个I/O 机箱,这意味着所有分区在规模上至少有2 个单元。每I/O 机箱单元数量最低的为“根”单元,分区中稍高于它的

43、称为“备份根”单元I/O 分区6. 根据成为I/O 机箱“冗余”所需数量,在多个I/O 机箱间扩展连接。换句话说,如果一个I/O 机箱故障,剩余机箱将拥有充足的连接,以维持系统的正常运转。或者,在最严重的情况下,借助与外设和网络的连接,可重新引导系统。I/O7. 用于扩展机柜或交叉结构链路的分区最多不超过一个。当交叉结构链路共享时,分区更有可能受到来自交叉结构故障的威胁,结果有可能导致所有连接单元陷入瘫痪分区5.6 多系统可用性相关问题/ 配置规则以下章节主要讨论与superdome 平台相关的MC/ServiceGuard 配置问题。HP 9000 企业服务器配置指南第六章规定的现有配置方法

44、仍旧适用,下面将着重解决superdome 环境的配置问题。5.6.1 MC/ServiceGuard 概述为了理解以下配置指南的理论基础,首先必须了解ServiceGuard 的运作原理(至少从一个集群成员的角度)。已对ServiceGuard 较为熟悉的读者可跳过这一章节。 重建所需的集群数量用于集群重建的算法通常要求集群数量达到以前运行的节点的50以上。然而,以前运行的节点的50也可重新形成一个新的集群,条件是另外50的节点不会重新形成集群。在这种情况下需要使用连接中断器。例如,如果一个2 节点集群中的两个节点间发生通信故障,而且每个节点均试图重建集群,那么MC/ServiceGuard

45、 只允许一个节点建立新的集群。通过使用集群锁即可保证这一点。 集群锁的使用集群锁是一个位于卷组的磁盘区,该锁由集群中所有的节点共享。集群锁仅在运行中的集群发生故障时才用作连接中断器,由于MC/ServiceGuard 试图建立一个新的集群,集群将被分成两个大小相同的子集群。每个子集群均想获得集群锁。获得集群锁的子集群将建立新的集群,从而可以防止两个子集群同时运行。如果两个子集群大小不相同,那么拥有50以上节点的子集群将建立新的集群,此时将不使用集群锁。如果你有一个2 节点集群,你必须配置集群锁。如果这两个节点间的通信中断,带有集群锁的节点将接管集群,另一个节点将关闭。如果没有集群锁,那么集群中

46、任一节点发生故障都将导致另一个节点以及整个集群停运。必须保证在一个节点失效时集群锁磁盘可以使用。因此,锁配置的选择部分取决于可用电路的数量。不管你作何选择,集群中的所有节点均必须能够访问集群锁,以保持较高的可用性。5.6.2 机柜内的集群”配置MC/ServiceGuard 支持“机柜内的集群”配置,在这种配置中,集群中所有的节点均由单一机柜内的分区组成。但必须认识到这种配置易发生单点故障(SPOF),从而使整个集群停运。单机箱内可至多支持一个8节点集群器2节点配置要求具备集群器锁定装置集群器锁定装置的电源必须独立于机柜独立电源电路要求配备双电源根卷镜像必须位于独立电源电路上双机柜系统SPOF

47、 要差于单机柜。与两个单机柜相比,在一个双机柜内配置一个集群器并没有HA 优势。结果,MC/ServiceGuard 只能将双机柜视为单集群器内的单节点予以支持。5.6.3 传统多系统配置要配置无单点故障的集群,节点成员资格必须扩展到单个机柜之外:必须在配置集群时使单个机柜的故障不会引起集群中多数节点发生故障。集群锁设备必须与包含集群节点的机柜使用不同的电源。必须对完全包含在两个superdome 机柜中的集群配置进行特别考虑,因为一个机柜停运有可能导致50的集群资源丢失。在“2 机柜”配置中需考虑的问题包括:两个superdome 机柜仅支持2 节点和4 节点集群。为满足上述“多数丢失”规则

48、的要求,节点必须在两个机柜间对称分布。3 节点集群无法得到支持,因为节点不能在两个机柜间对称分布。由于ServiceGuards 现有的4 节点集群锁限制,因此多于4 个节点的集群目前得不到支持。必须为完全包含在两个机柜中的4 节点和2 节点集群配置一个集群锁。通常只有2 节点配置要求集群锁,但由于机柜的一次故障在4 节点配置中也会导致50设施失效,因此2 机柜配置也要求集群锁。集群配置中可同时包含superdome 与非superdome 节点,但如果节点由一个机柜中的多个分区组成,在设计包含这类节点的集群时必须多加考虑。例如,考虑一下由两个N 类服务器和一个superdome 机柜(包含两

49、个分区)组成的4 节点集群,从HA 的角度来看,这是一个合法的集群配置。但如果在集群运作过程中一个N 类服务器关闭,那么由此产生的3 节点集群就会遭受单点故障(即superdome 机柜),从而导致整个集群停运。在由flex 电缆相连时superdome 双机柜比superdome 单机柜的单故障点要多。因此,从HA 角度看,与使用两个独立的单机柜相比,用双机柜配置集群并无任何优势。因此,MC/ServiceGuard 将只在单个集群中将superdome 双机柜作为单个节点予以支持。5.6.4 I/O 相关问题集群heartbeat(心跳)将在分区间的LAN 连接上完成,这一过程要求冗余的h

50、eartbeat 路径,执行这一过程可使用多个heartbeat 子网也可使用备用接口卡。在这两种情况下,必须在独立的I/O 机箱中配置冗余路径。在进行大规模存储时必须采取某种形式的故障保护,故障保护可通过磁盘镜像或阵列进行。如果选择磁盘阵列,需要有通往阵列的冗余路径。在这两种情况下,必须在独立的I/O 机箱中配置通往磁盘设备的路径。5.6.5电源相关问题电源规划对消除 MC/ServiceGuard 集群中的单点故障非常关键。在设计电路时必须确保某个电路断电不会造成集群停运。请参阅MC/ServiceGuard 管理手册,该文件对这一问题作了详细阐述。 MC/ServiceGuard 集群的

51、一般电源规划规则如下:供电时必须确保集群中50的节点不会同时失效。为实现最高的可用性,每个节点应拥有自己的电路。集群锁磁盘应位于与为集群节点供电的电路不同的电路上。镜像磁盘对的双方应位于不同的电路上。对superdome 来说,如果客户数据中心支持superdome,则应使用双AC 电源。其他信息请参阅superdome 高可用性白皮书,从系统准备和安装、系统设置和配置,直至持续的客户服务和解决方案维护,对整个高可用性价值链进行检验。6. 投资保护SuperDome 拥有专为进行多代处理器升级而设计的系统基础设施,提供了出色客户投资保护和持续价值。PA-8600 和PA-8700 中除单元板和

52、电源转换板以外的所有主要系统元件都应相同,这其中也包括相同的内存DIMM。这样客户即可删除所有单元和单元中内存来对现有系统升级。该内存可转移至新的处理器单元,而新处理器单元则安装于机柜之中。SuperDome 还将升级至PA-8800 处理器和IA-64 McKinley 处理器,PA-8800 处理器将使用与IA-64 McKinley 相同的单元,但因为指令集不同,故需不同固件。将会针对PA-8800 和IA-64 McKinley 设计新的单元板、电源转换板和单元外壳。处理器升级在单元板基础上进行并可一次一个分区地执行,从而减少整个SuperDome 的停运时间。现在还不支持一个系统中

53、PA-RISC 与IA-64 处理器的混合。下表描述了不同的升级情况:升级情况在单一分区内在系统内(目标分区正离线进行升级)单一SuperDome 的不同版本HP-UX不可行(每个分区只有一个核心)支持HP-UX 升级不可行支持实用程序固件升级不可行PDC 固件升级要求受影响机柜重启相同处理器的不同频率(注:目前没有在PA-8600 或PA-8700 处理器系列中支持多个频率的计划)不支持SuperDome PA-8600 将配备200MHz 芯片集。SuperDome PA-8700 将配备250MHz 芯片集。实用程序子系统、背板和I/O 机箱可能不得不升级,且所有单元都必须为PA-860

54、0 或PA-8700。分区基础上的处理器频率升级同上同上单一SuperDome 上的不同PA-RISC不支持不支持从PA-8600/PA-9700 升级至HP-UX 11.i 1.5分区中所有单元控制器芯片必须同时升级交叉芯片/ 背板有可能需要升级,意味着系统将不得不关闭单一SuperDome 上的HP-UX 和NT不可行支持NT 安装和升级不可行支持单一SuperDome 上的IA-64 和PA-RISC不可行不支持内存升级至256Mb SDRAM相信可行相信可行今天的SuperDome 为下一代处理器领先于未来性能需求做好了准备。无论是PA-RISC 还是IA-64 后续处理器,Super

55、Dome 提供了机箱内升级提供的投资保护。6.1 未来的处理器发展图5 中的CPU 发展表明了HP 对处理器和体系结构长期革新的承诺,使HP 提供了可满足未来计算需求的大量资源。适合于未来发展HP 9000 微处理器发展图5. HP 的微处理器发展客户可继续依靠PA-RISC 系列的二进制兼容性,实现与HP 系统上传统应用的完美互操作性。二进制兼容性保护了客户投资,实现了新技术基础设施的迅速发展和采用。此外,客户可使用带高级处理器技术的现有应用和操作系统,从而极大地提高了性能。HP 将通过推出基于IA-64 的系统继续支持二进制兼容性。通过HP 与Intel 在IA-64 的技术基础EPIC(

56、显式并行指令计算)方面的协同开发计划,当今的HP-UX、Windows 2000 (NT 5.0) 和Linux 应用无需改动即可在IA-64 上运行。对MPE/ix 应用的支持现正在调查之中。为获得最高性能,客户无需改变源程序即可重新编辑应用。处理器的发展不仅显示了RISC 处理器的领先地位,而且表明了二进制兼容型IA-64 处理器的推出。然而,HP 在推出IA-64 后正在多项PA-RISC 改进方面投资。这允许客户在准备好时、而非其厂商逼迫他们时迁移至新体系结构。这真正使SuperDome 服务器成为市场上最安全、最快速的高端服务器。7. 配置灵活性n 分区superdome 向HP-U

57、X 环境添加了大型机式分区功能,采用了n 分区 允许单一superdome 系统在同一服务器被逻辑划分成多个独立系统,这是独一无二的。 n分区提供了一定程度的隔离,可用来有效地在单一服务器上合并应用、灵活地进行资源管理,并提高可用性和可扩展性。在其核心,n 分区支持资源的用户定义灵活分区,并可隔离软硬件错误。概述一个分区由一或多个单元组成,它们在高带宽、低延迟交叉结构上相互通信。单元被分组成称为机柜或节点的物理结构。单元中的特殊可编程硬件以隔离在其它分区行动上实施的方式定义分区边界。每个分区运行自己的独立操作系统。不同分区可以执行操作系统的相同或不同版本,它们也可在superdome IA-6

58、4 系统中执行不同的操作系统(如HP-UX 和NT)。每个分区都有自己独立的CPU、内存和由构成分区的单元资源组成的I/O 资源。资源可从一个分区删除并添加至另一分区,这其中无需物理操作硬件,只需使用属于系统管理界面的命令即可。而且使用动态重新配置的相关功能(如在线添加、在线删除),可向分区添加新资源,而且可在分区持续运作的同时删除和更换故障模块。n分区的价值优势资源划分今天,企业要求运行在相同服务器上的多个应用提供全面性能,且不会互相冲突或影响。关键是一个应用的行动不会造成负面影响或导致对其它应用的服务拒绝。而且,操作系统或支持应用集的服务器上硬件中的单一故障不会导致那一服务器上运行的多个应

59、用的丢失。为了在单一服务器上有效合并应用,必须禁止应用使用其它应用所需的系统资源,而且硬件故障不应导致多应用服务的丢失。当这些问题的解决方案可通过在一个站点提供多个服务器而实现,这样一种方法在面临需求改变时会不够灵活、较为昂贵且需要更多数据中心空间。实际上IS 部门需要的是一种灵活配置,从而以动态方式提供调整计算资源且同时仍保留SMP 编程模型。采用superdome n 分区,每个分区都用特殊动态可配置硬件与其它分区相隔离,这些硬件在应用间建立了有效的防火墙,这样分区间就不会产生干扰。使用n 分区,系统管理员就拥有必要的控制权力来优化向竞争工作负载的资源分配。事实上,随着工作负载在一天中不断

60、变化,可以部署系统资源来优化正常营业期间的交互式性能应用。当交互行为达到顶峰,就添加资源来处理负载。随着交互负载减少,资源可返回至优先批文件或其它工作负载。在任意时刻管理员均可选择单元并将它们从一个分区移至另一分区,从而支持特定分区的资源需求。此外,资源的移动还可通过控制命令的使用自动完成。多个环境企业需求和竞争压力需要大量新旧应用。通常应用会需要不同版本或修订版的操作系统、不同系统参数设置甚至不同修补程序水平。应用间交互的不兼容可能会影响性能。采用分区后,一部分计算和I/O 资源即可配置来运行操作系统旧版本,而机器其余部分则可升级运行较新软件。此种机制可用来设置这样一种测试环境:在使生产应用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论