




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
NiXXX大学高性能运算方案建议书ProposalInsert文档说明本文内容来源于IBM提供给某个实际客户的方案建议书的部分章节,经SalesTransactionHubPCoETeam整理为可重复利用的方案建议书插件,供IBM内部人员使用。版本号方案整理方案提供与确认联系方式完成日期计划更新日期名称1.0XuKeJin-GCGPCoEHaoChangJieChangJieHao/China/IBM2010/9/302011/9/30XXX大学高性能运算方案建议书描述:随着“211工程”建设的进一步深入,各高等院校教育信息化形成一定规模,教育形式和学习方式都发生了垂大变革。为了应对日益扩大的教育资源需求和满足高校对学科研究的强大计算需求,国内许多高校纷纷建立了高性能计算系统平台。本文从高校的实际需求出发,为用户设计了HPC解决方案:选用IBMiDataPlex服务器集群方案搭建高性能计算中心平台。详细介绍了方案设计思路、方案构成、特性及优势。请删除此介绍性页面怎样使用这些模板模板中有[红色字体]显示的“提示文字”。请您确保在仔细通读本文档说明后再删除这些内容。[蓝色字体]的章节标题用于帮助您组织文档。■更新顶端蓝色的标题以反映项目或RFP标题。双击“页眉或页脚”〉转至“页眉和页脚”编辑状态。要更新页眉或页脚中的文本,请选中要替换的文本,然后输入正确的内容。关闭页眉和页脚-参照“提示”一您会发现在有些页面中均有红色的提示,它们将帮助您设计每个章节的内容。■当提案完成后,请更新目录(TOC)中的页码和章节名:-右键单击“目录”页>“更新域”》更新整个目录。-这样便可更新章节标题和页码。重要提示:请删除所有介绍性页面、指示信息、未使用的图表和红色的“提示”内容。直看整个文档,以确保您没有无意中遗留无关的信息。仔细检查目录,以确保页码、章节标题和副标题正确无误。目录TOC\o"1-5"\h\z\o"CurrentDocument"第1章摘要 1\o"CurrentDocument"我们对您的目标的理解 1\o"CurrentDocument"我们如何帮您实现目标 2\o"CurrentDocument"方案建设思路 2\o"CurrentDocument"方案产品选择要点 2\o"CurrentDocument"方案简述 3\o"CurrentDocument"第2章 方案介绍 5\o"CurrentDocument"方案构成组件 5\o"CurrentDocument"方案结构图 6\o"CurrentDocument"PC集群方案网络设计 7\o"CurrentDocument"硬件管理网络 8\o"CurrentDocument"软件分发网络 8\o"CurrentDocument"数据管理网络 8\o"CurrentDocument"高速计算网络 8\o"CurrentDocument"IBM4036高性能交换机简介 9\o"CurrentDocument"UFM管理软件 12\o"CurrentDocument"UFM核心特点 13\o"CurrentDocument"UFM网络状况发现与控制 13\o"CurrentDocument"网络拓扑结构自动发现,网络瓶颈实时显示 14
\o"CurrentDocument"络分区优化与路由通讯优化 15\o"CurrentDocument"全网络通讯H志收集与保存 16\o"CurrentDocument"UFM支持的InfiniBand网络设备以及主机平台 17\o"CurrentDocument"2.3.5 显示切换系统(KVM) 17\o"CurrentDocument"2.4 PC集群之软件环境 18\o"CurrentDocument"集群管理软件CSM/xCAT简介 19\o"CurrentDocument"IBM并行文件系统(GPFS)方案介绍 21\o"CurrentDocument"系统管理方案设计与实现介绍(IBMSystemsDirector) 26\o"CurrentDocument"IBMSystemsDirector发现和资产管理器 26\o"CurrentDocument"2 IBMSystemsDirector状态管理器和自动任务 29\o"CurrentDocument"3 IBMSystemsDirector配置管理器 34\o"CurrentDocument"4 IBMSystemsDirector虚拟化管理器 38\o"CurrentDocument".5 IBMSystemsDirector更新管理器 43\o"CurrentDocument"6 IBMSystemsDirector的扩展插件 47\o"CurrentDocument"存储系统方案建议 50\o"CurrentDocument"胖节点系统方案建议 51\o"CurrentDocument"计算节点 53\o"CurrentDocument"管理节点/登录节点/调度节点和I/O节点 54\o"CurrentDocument"第3章 IBM解决方案特点和优势 55\o"CurrentDocument"IBM【Dataplex集群技术的特点有优势 55\o"CurrentDocument"IBM绿色解决方案优势 57
\o"CurrentDocument"IBM智能系统管理优势 61\o"CurrentDocument"IBM丰富的系统管理工具 62\o"CurrentDocument"第4章项目实施 64\o"CurrentDocument"第5章 产品配置及报价 65\o"CurrentDocument"第6章 为什么选择IBM 66\o"CurrentDocument"IBM丰富的高性能计算方面的经验 66\o"CurrentDocument"IBMPowerSystem高性能计算技术发展前景 66第1章摘要我们对您的目标的理解为落实科教兴国战略、迎接世界新技术革命的挑战而实施的“211工程”是我国推进高等教育发展所采取的重要举措,这项跄世纪的战略工程目前已进入第三期建设阶段。要实施科教兴国,就必须加强科技创新和教育创新。随着信息技术的飞速发展和“211工程”建设的进步深入,各高等院校教育信息化形成一定规模,教育形式和学习方式都发生了重大变革。目前,为了应对日益扩大的教育资源需求和满足高校对学科研究的强大计算需求,国内许多高校纷纷建立了高性能计算系统平台。这样,一方面可以满足院校自身在科研、学科以及重要课题研究等方面的计算资源需求,另一方面将能够进•步扩大院校的科研水平和研究能力,提升院校在教育行业的影响力和行业竞争力。XXX大学……请补充实际客户的具体需求我们认为,新一代的高性能计算中心不应该仅仅是提供传统的高性能计算,更不是一个单纯的高性能计算设备方案。建设新一代的高性能计算中心,除了要考虑软硬件设备选型,更需要全面考虑中心运作、应用效率、技术合作与创新等多方面因素:需要增加资源管理,用户管理,虚拟化管理,动态产生和回收资源等功能,即基于云计算模型的高性能计算中心。从而实现总体架构的合理性和资源管理的高效性,提供长远的高性能运算科研和供应能力,确保高性能计算中心能够发挥更大的效益。我们理解您需要一个运行稳定、技术先进、性能优异、易于扩充和管理的高性能计算环境来满足计算需求。因此,所搭建的计算平台应该具备如下特性:先进性:计算平分不仅能够满足高性能计算中心目前业务的需要,还能适应未来技术发展的趋势和需要。灵活性:优化系统资源配置比例,实现最大的应用灵活性,满足在解决大问题的同时运行多个中小型任务的综合需求。可扩展性:在设计上充分考虑到可扩展性需求,提供具有最高可伸缩性的系统,并保护现有的投资。稳定性:能够确保系统稳定、高效、持续运营,支持全天24小时的连续运行需求。开放性:采用开放标准、开放结构、开放系统组件和开放用户接口。充分满足用户投资保护和业务扩展、系统维护等方面的需求。高管理性:对所有计算机系统资源集中进行统•监控与管理,建立统一高效的资源管理系统,高效率、反应灵敏的技术服务机制,标准化、自动化的管理流程,达到提供优质的资源管理服务,更好的为中心的业务发展服务。高能效:采用绿色节能设备和技术,使系统在保障正常运行的情况下消耗较少的能源。我们如何帮您实现目标方案建设思路基于对您的目标和需求的理解,我们推荐采用以下建设思路:应用为先:根据调研结果和应用的需求来选择最合适的软硬件平台,让应用决定平台,而不是山平台限制应用。依据高性能计算中心的服务内容、最终用户的应用需求,我们的方案将确保其跨硬件平台、跨操作系统平台,能够满足各种应用的不同需求。创新为体:高性能计算技术发展日新月异,在架构设计时,应充分考虑技术发展趋势,采用先进的产品和创新的思路,最大化利用现有投入,并考虑到今后扩展的需求。基于对高性能计算中心的平台建设目标的理解,我们认为本次高性能计算中心的建设,绝不仅仅是一个高性能设备的建设,而是一个多功能、多应用、多客户的服务平台,所以我们采用了目前最先进的高性能计算技术架构来满足中心的建设需求。效率为要:不仅仅以峰值运算能力或单一的Linpack测试指标作为设备选型的依据,而是充分考虑总体架构的合理性和资源管理等要素,实现一个高效率计算(HighProductivityComputing)的平台。在多用户、多应用的使用场景下,我们不单单要考虑到整体设备的高性能,还需要考虑到系统在使用过程中,如何通过虚拟化、资源共享、自动化等手段来协调整个计算平台的计算资源利用,提高整体利用率,实现一个绿色、高效的计算环境。方案产品选择要点■选用尽可能高性能的处理器作为计算资源的基础国际商业机器(中国)有限公司 第2页\\\(不3忤说运口力案化设廿 j'高性能处理器是缩短任务完成周期的必要条件,尤其是当前很多计算任务由于程序本身扩展性和数据规模的限制还不能做到在大量处理器上高效率地并行运算,所以高性能处理器往往是唯•能够真正缩短作业运行时间的技术手段。即便是能够在较大数量处理器上运行的应用,在100个高性能处理器和在100个低性能处理器上的运行效率也是不可同日而语的。■选择提供更高能效的设备根据IBM多年高性能计算中心建设和运行的经验,在大型高性能计算机中心的运行中,能源消耗将是最大的开销,因此我们不仅在方案中推荐选用功耗较低的硬件设备,而且配置先进的管理工具来合理的监视和控制设备的使用情况,例如监测CPU的温度状况,动态控制风扇转速以减少所需要的能量,从而降低能源的消耗。■选择具有更高散热效率的设备由于刀片服务器等高密度设备的部署,加上本高性能计算机系统的规模巨大,仅依靠空调制冷的传统方式容易导致机房“局部过热”,产生热点或热区,影响设备的正常运行和使用。因此要着重考虑如何解决数据中心散热问题。IBMiDataPlex服务器和机箱能够凭借高能效的设计将能源要求最多降低40%1»其次,可选的水冷IBMRearDoorHeatexchanger安装在机柜后端,能够将机柜内部生成的热量100%散掉,令数据中心丝毫不受影响。事实上,它甚至能够帮助冷却数据中心,从而降低对计算机房空调量(CRAC)的需求,还允许您进一步拉近机柜之间的距离,切实避免了在一排满配机柜之间建立“热通道”的需求。iDataPlex服务器的设计使空气从前到后全程只需穿行18英寸,而不是企业级服务器的30英寸。路径的缩短源于iDataPlex服务器超高的冷却效力一距离越短、气流效果越好。1.3方案简述IBMiDataPlex提供了更高的计算密度、更高效的数据中心空间利用以及更加可控制的电源和散热成本,最适合于高性能计算及Web2.0应用。40台iDataPlex2U的两路6核心iDataPlex可提供每秒大约10万亿次的浮点计算能力,能够满足各种用户和应用的计算需求。同时,配置IBMSystemStorageDS3500磁盘存储来存放相关的数据;配置通用并行文件系统GPFS,以便将数据共享给用户使用。另外,为了解决数据中心高热密度问题,我们建议采用IBM创新的后门热交换器(水冷门),提高散热效率、降低能源消耗,达到节省电力成本的目的。水冷门安装于机柜后门处,既不占用机房地板空间,对机房层高也无额外要求。根据招标文件要求的各项技术指标,我们建议选用IBMiDataPlex服务器集群方案搭建高性能计算中心平台。\\\ 忤能运算/.案让以15第2章方案介绍方案构成组件如前所述,我们建议选用IBMiDataPlex服务器集群方案搭建高性能计算中心平台。鉴于PC服务器芯片技术飞速发展,我们提供的iDataPlex集群系统的方案,充分考虑了未来的发展状况,为将来系统的完善和扩充留有足够的接口。配置80台主频为2.93GHZ的IBMDX360M3双路刀片服务器为计算节点,其峰值处理能力大于10万亿次。本方案建议的iDataPlex集群系统中主要包含以下组成部分:,硬件主要组成:名称组成数量计算节点iDataPlexdx360M3server8042U标准机柜IBM42UEnterpriseRack4管理节点/登录节点/调度节点x3650M34存储节点(I/O节点)x3650M36+2核心Infiniband交换机IBMOEMInfiniBand交换机40366千兆以太网交换机满足整个集群系统需要1>软件主要组成:功能组成配置简要说明操作系统满足应用需要的Linux版本集群操作系统集群管理系统CSM/xCAT集群管理系统,集群上/下电,软件安装等集群硬件监控管理系统IBMDirector硬件状态监控,信息收集并行文件系统IBMGPFS集群并行文件系统,完成用户应用数据交换,存储作业调度系统MOAB用户作业调度系统,包括用户作业排队,挂起,查询,断点等功能并行环境MPICH提供MPI并行库编译环境Gnu或商用的C/C++及Fortran编译器提供C/C++和Fortran语言的编译
XXX大学高性能运算方案建议书方案结构图刀片计算集群80台IDataPIx高性能运算拓扑结构图机柜放置示意图刀片计算集群80台IDataPIx高性能运算拓扑结构图机柜放置示意图PC集群方案网络设计本方案共配置如下5套网络:Infiniband网络交换系统,作为计算网络;硬件管理网络(AMM);r软件管理分发网络(Softwarenetwork);, 数据管理网络(Datanetwork):,显示切换系统(KVM);网络配置简表功能组成配置简要功能说明数量计算网络Infiniband交换系统■ 6*36端口Infinband交换机■计算网络■数据传输网络1硬件管理网络以太网络交换系统■PC服务器管理网络・连接所有的刀片中心管理模块■连接所有服务器(含管理、登录、I/O节点)1软件分发管理网络/数据管理网络以太网络交换系统■集群管理网络通道/GPFS数据管理网络通道■连接到刀片中心的以太网络模块■连接所有服务器1显示切换系统(KVM)IBMACT显示切换系统(KVM)・连接所有服务器,刀片中心的显示,健盘和鼠标。1
卜,表是集群硬件系统网络连接的详细说明:各PC服务器与网络的关系表服藕、KVMInfiniband硬件管理网络软件分发管理网络数据管理网络管理节点连接—连接连接连接登录节点连接一连接连接连接存储节点连接连接连接连接连接计算节点连接连接连接连接连接硬件管理网络为了实现刀片服务器的管理,刀片中心的管理模块通过AMM网络互联(iDataPlex节点,有一个管理以太网口)。软件分发网络软件的分发和管理通过软件管理分发网络实现,在本方案中,软件分发通过以太网络进行。数据管理网络通过千兆以太网,配合以IBM管理软件实现。高速计算网络为了实现并行计算的高速数据交换,采用Inflniband网络互联所有的计算节点和I/O节点,本方案共配置6台36端口infiniband交换机做为核心交换系统,如下图所示:IBMiDataPlex-80ServersInfiniBand架构匡4X0DR40GBIB4*8条4XQDR40GB4X0DR40GBIB4*8条4XQDR40GB旧线缆80Ui8台凯架式看盘、6台外置具有管暧功能拓场口机।一Voltaire2036364XQDRPORTSINTIRNAUYMANAGED.DUALPS-24FRLIIBM4036高性能交换机简介IBMOEMVoltaire4036交换机为高性能计算集群和网格提供了水平空前的性能和扩展性。Voltaire4036能使高性能应用运行在分布式的服务器、存储和网络资源上。对单个机箱中的36个节点精心设计了10/20/40Gb自适应全双向带宽,多台Voltaire4036以及配合Voltaire更大的交换机ISR2004/ISR2012/ISR4700也可以互联组成更大规模的集群。能够配置的节点范围从十几个到儿千个,优良的扩展性能使你能随所需节点。无与伦比的的性能Voltaire4036以最大的交换容量在InfiniBand业界处于领先地位。每个端口提供全双向带宽。Voltaire4036支持36个InfiniBandQDR端口,单向速率达到40Gb/s,双向速率达到80Gb/so线速无阻塞交换能力结合小于100纳秒的低延时使Voltaire4036成为可用的性能最高的交换机。大型集群和网格成本效益高的解决方案
巨大的交换容量,使用一台或儿台即可组建大型集群,显著地降低集群的总成本。Voltaire4036的完整的组网能力和与存储设备的连通性使得组网需要较少的设备,因此使集群的组建变得简。32EdgeSwitches全面的管理Voltaire4036内置了硬件设备管理软件以及SM子网管理器,提供了全面的和强大的管理能力。管理软件安装在交换机上,不依赖任何外部管理软件即可访问管理软件。可以提供整个网络的诊断、路由算法设定及调整、通讯流量监控等功能。高可用性为了达到最高的可用性,Voltaire4036绝大多数部件都是可热插拔的。电源模块以及风扇都为系统提供了高可用性和易服务性。
VoltaireGridDirector4036可安装于19”机架的机箱,高1U。交换机技术规格数据吞吐量:2880Gbps(QDR),1440Gbps(DDR)端口到端口延迟:100纳秒(最大值)数据虚拟通道:8管理虚拟通道:1MTU:4096Bytes(最大值)InfiniBand4X/12X主机连接模块-36个QDR端口或36个4XDDR端口。互连选项:铜缆和/或光纤,支持介质转换器。指示器:每端口的物理连通和逻辑连通LED指示灯,电源指示灯和信息指示灯-所有端口都位于后面板上。管理模块嵌入的管理套件包括:-SM子网管理,机箱和设备管理。符合InfiniBand1.2标准支持的管理协议:SNMPv2c,Telnet,SSH,HTTP,FTP,IBTA,SMI/GSI-连接器:RS232DB9-M,I2CDB9-F指示器:电源,子网管理器活动,机箱管理器活动,信息和热插拔LED指示器。后部控制模块- 连接器:EIA/TIA-232ConsoleDB-9,10/100EthernetRJ45- 管理/设备reset按钮供电需求1个或2个厂内已安装的电源模块电源输入:100-240VAC,50/60HZ自动感知物理尺寸可安装在19”机架上尺寸(高x宽x深):1.69in.(43mm)x16.93in.(430mm)x15.7in.(400mm)使用选项的支脚可安全的堆叠可选择前面或后面安装于机架重量:171b(7.7Kg),包括机架安装件环境要求工作-环境温度:32oF-113oF(OoC-45oC)-湿度:15%-80%,无凝结
海拔高度:0-9843ft(3000m)储存环境温度:T3oF-158oF(-25oC-70oC)湿度:5%-90%,无凝结海拔高度:0T5000ft(4570m)安全-UL60950-CBIEC60950认证-CSA-C22.2No.60950-00电磁兼容-47CFRFCCpart15-EN55022:98/EN55024:98/EN61000-3-2:00/EN61000-3-3:95-VCCI23.4.2UFM管理软件随着科学计算在众多领域的普及与发展,高性能计算系统正在被广泛应用于科研、制造、勘探、气象、金融、电信等诸多领域,CPU以及内存技术的不断进步使得计算机个体的计算能力大大提高,由此也带来了并行计算系统环境中交换网络通讯带宽、延迟以及优化管理的诸多迫切需求。InfiniBand技术在10余年的发展过程中历经起伏,凭借其低延迟、高带宽、开放架构的多种\\\♦'-匕WCT案佳议/ 一,优势逐步被用户所接受并广泛使用。在大规模集群系统的部署与管理过程中,对于InfiniBand网络的监控ij优化的需求变得日益迫切。针对广大用户的需求并结合Voltaire在InfiniBand领域多年来的技术沉淀于积累,Voltaire在2009年7月正式发布了面向InfiniBand网络的统一管理软件一UnifiedFabricManager,VoltaireUnifiedFabricManager(UFM)是•个功能强大的网络管理平台,在针对Scale-Out(横向扩展)架构的集群计算环境中,借助VohaireUFM管理软件,InfiniBand网络不再是个神秘的黑盒子,整个网络的监控与管理将变得透明化、系统化。2.3.43UFM核心特点以应用软件为中心的网络管理;无限可扩展性提供对应用软件、数据库以及存储系统的无缝支持:内观的展现网络交通以及设备运行状况,确保用户清晰并深度掌握网络工作状况;先进的网络阻塞状况发现与分析优化处理功能;基于应用软件工作流以及网络拓扑结构的通讯路由优化功能;可设定与调节的故障预警机制,使用户对网络通讯状况了如指掌;提供网络分区以及多服务等级的分区功能,方便用户设定与调整;提供在一个共享的网络中实现多个基于应用软件的独立通讯区域设定;集中化的InfiniBand网络设备管理使得大型网络中设备管理更为便捷;安全可靠的HA架构设计确保UFM管理系统的高可用性;提供API接口,方便用户将UFM管理纳入现有的综合管理系统中。UFM网络状况发现与控制UFM集成了先进的网络监控引擎,对InfiniBand网络交换机以及连接到InfiniBand网络的主机提供实时的监控。UFM提供了一个可自行设定的公告牌界面,可以提供网络健康状况以及主机CPU、内存、磁盘等资源的使用状况,通过公告牌界面,我们可以方便的看到服务器中网络通讯带宽开销最大的ToplO(数量可以自行设定),网络中阻塞最多的ToplO,网络中故障报警的实时列表,网络中阻塞问题的热点出现在哪里等等。网络拓扑结构自动发现,网络瓶颈实时显示UFM能够自动监测网络拓扑结构并自动绘制出相应的拓扑结构图,同时,通过实时的通讯链路监控,UFM能够自动发现网路拥塞的热点区域并通过图表方式显示给用户,此功能可以帮助用户精确的定位网络通讯的阻塞状况,为下一步性能优化提供参考数据。CongestionMap
CongestionMap络分区优化与路由通讯优化UFM提供先进的网络通讯优化功能,针对不同需求的计算群组(低延迟、高带宽等等)可以创建相应的逻辑计算机资源组,在同一个组内的计算节点之间通讯会自动根据所设定的网络需求类型进行优化,确保网络通讯能够分层进行,大大提高网络通讯效率;HighThroughput
NetworkSL1(LowPriorityVL)・C•A”MM,•MM*LowLatencyNetworkSLO(HighPriorityVL)Application(eg.MPI)同时,UFM还提供了独有的TrafficOptimizedRouting(TOR)路由算法,经过优化后,网络中的阻塞热点会自动被均衡再分配,大大降低网络带宽资源争抢所造成的整体计算效率下降的问题。・C•A”MM,•MM*LowLatencyNetworkSLO(HighPriorityVL)Application(eg.MPI)二f力UnifiedFabncManagerCongestionMap二f力UnifiedFabncManagerCongestionMap全网络通讯日志收集与保存UFM会自动收集并保存整个网络(包括交换机端、计算节点I/O节点端)的通讯日志,为系统通讯状况分析以及故障排查提供强有力的资源支持。
回“。回“。码,,)::"工《<,):・::桁必伍仙?(仙!»«<«*刈S.y”)、,・・)3WH.6”. (l,)改UFM支持的InfiniBand网络设备以及主机平台UFM支持的硬件交换机平台:/VoltaireISR9024系列/VoltaireISR2004/2012系列/Voltaire2036/4036系列/Voltaire4700系列VoltaireUFM支持的主机平台:/Redhat5.1/5.2/5.3/Centos5.1/5.2/5.3/Windows2.3.5显示切换系统(KVM)
IBM先进连接技术(ACT),采用小巧、灵活的CAT5线缆代替庞大、笨重的KVM线缆,可以极大地简化集群系统的安装,同时减少线缆数量,提高系统可靠性。CAT5转换选件可以馈入到用于本地管理(LCM)的便宜的CAT5控制台交换机或面向大型配置或远程管理的远程控制台管理(RCM),并和传统产品向后兼容,提供无限的可扩展性,通过级联能够支持多达2048台服务器端口连接。如下图所示:2.4PC集群之软件环境本方案中,操作系统选择适合应用的Linux,集群管理软件选择CSM/xCAT,作业调度软件选择IBMLoadLeveler或LSF或者MOAB,并行文件系统选择IBMGPFS,硬件监控管理选择IBMDirector,编译环境推荐采用Intel编译环境,这些软件在集群中的逻辑关系,见下图。群的软件下面详细介绍这些软件和实现方式。集群管理软件CSM/xCAT简介本系统集群管理软件采用CSM/xCAT完成集群管理功能,本方案建议主管理节点作为CSM/xCAT的管理节点,安装CSM/xCAT服务器端软件,CSM/xCAT服务器端软件通过AMM网络和刀片中心的管理模块通讯,得到刀片的状态信息,抓去部署操作系统的刀片网卡MAC地址等功能,通过软件分发网络,与存储节点和登陆节点通讯进行硬件管理;CSM/xCAT管理操作,可以通过软件分发网络,与计算节点,存储节点,登陆节点通讯。副管理节点做为主管理节点的备份。CSM/xCAT工作逻辑如下图所示:CSM/XCATpSeressystemswthLPARscontroBedbyanHMCe326withBMCprocessorxSenesnodescarackwithhardwarecontrolserviceprocessorBiadeCenterwthManagementModulepSeressystemswthLPARscontroBedbyanHMCe326withBMCprocessorxSenesnodescarackwithhardwarecontrolserviceprocessorBiadeCenterwthManagementModule一。Mana^n<MkprimaryManagemxWMavrCha««ittn«whwh.onelink1 Rackedirrverk>awildi| |CSM/xCAT(liemi -1CSM/xCATSvrvuiIBM提供的跨平台集群系统管理软件CSM,允许通过一个单点控制和管理整个集群系统。它来源于IBM多年来的PSSP技术,可以实现集群的组成,管理和控制。CSM软件是一个客户/服务器模式的集群软件。在服务节点上安装CSMServer,在所有计算节点、I/O节点和登录节点上安装CSMClient,经过配置即可构成集群。通过CSM可以完成节点软件远程安装和更新、集群内所有节点运行状态的持续监控、节点故障侦测和自动响应、文件的单点修改和分发或同步、节点上电/关机/重启动等功能。CSM的管理界面已经与smit和WSM集成,管理员可以通过字符或图形方式使用CSM管理整个集群。CSM同时支持运行Linux的IBMxSeries服务器和运行AIX的IBMpSeries服务器,为系统今后扩展打下了良好基础。
通过为集群提供一个单控制点,管理软件可以极大地简化系统总体管理,从而为服务器整合解决方案提供了一种经济高效的方式。该软件可以提供预警分析报告,帮助用户防患于未然,最大限度地保证系统的生产运行时间。同时,即使在硬件出现故障时,服务器也能提供快捷、方便的诊断工具,帮助快速查处问题所在,及时解决问题。具体来讲,IBM的集群系统管理软件可以实现如下的功能:•实现系统的并行安装和配置;•管理和同步节点的配置文件;•提供系统远程运行命令操作,允许以命令或脚本方式运行在集群中的所有节点上;支持用户帐户统一管理;提供远程硬件控制,如:节点的远程开机、关机和重新启动:动态监视系统资源使用情况;提供管理节点和节点组信息,进行组管理监视系统的硬件状况,如CPU、风扇、电源、内存、硬盘、稳压模块等的运行情况。2.4.2IBM并行文件系统(GPFS)方案介绍共享SAN式集群存储与分散式并行集群存储系统的最大差别,在于二者的存取方式不同。FCSAN系采用区块层级(block-level)的传输方式,分散式并行集群存储系统pNAS虽然部分采用并行方式但是仍然以文件级(file-level)的传输方式,一般来说,存取方式不同,适用的应用层面也不同;举例来说,电子邮件(E-Mail)、小型Web服务、文档共享、0A办公系统等适用于NAS的储存架构。数据库、高性能计算等关键应用,则采用SAN的架构。共享SAN式集群存储系统•般采用单一SAN文件系统,比如IBM的集群文件系统GPFS,GPFS是IBM公司第一个共享文件系统,起源于IBMSP系统上使用的虚拟共享磁盘技术(VSD).作为这项技术的核心,GPFS是一个并行的磁盘文件系统,它保证在资源组内的所有节点可以并行访问整个文件系统:而且针对此文件系统的服务操作,可以同时安全地在使用此文件系统的多个节点上实现。GPFS允许客户共享文件,而这些文件可能分布在不同节点的不同硬盘±;它提供了许多标转的UNIX文件系统接口,允许应用不需修改或者更新编辑就可以在其上运行。GPFS也支持UNIX文件系统的工具,即:用户可以像使用普通文件系统一样使用基于GPFS的文件系统,唯一不同的在于管理GPFS文件系统的命令。GPFS提供的文件系统操作服务可以支持并行应用和串行应用,它允许任何节点(这些节点属于同一个节点组)上的并行应用同时访问同一个文件或者不同的文件。\\\—:/卜也达口力案化设廿 j'一个GPFS文件系统可以横跨在集群内的所有主机上,分布在所有磁盘上。GPFS文件系统在读写文件时采用条带化技术,将数据分成条带并行写入到该GPFS下的所有NSD中。读写文件时可以通过主机的光纤通道访问所有的磁盘,I/O条带化性能无可比拟。GPFS的条带化原理保证同一个GPFS下所有磁盘的I/O负载是均衡的,没有一块磁盘会比其它磁盘更繁忙。GPFS支持超大文件系统。GPFS2.3版本对GPFS文件系统的大小已经没有限制,IBM实验室测试过的GPFS文件系统大小超过200ToGPFS支持对文件的并发访问。它允许任何节点上的并行应用同时访问同•个文件或者不同的文件。GPFS是•种日志文件系统,为不同节点建立各自独立的日志。日志记录Metadata的分布,一旦节点发生故障后,可以保证快速恢复数据。,GPFSFail-over功能通过规划,将数据分布到不同FailureGroup内达到高可用性,减少单点故障的影响。为了保证数据可用性,GPFS可以在多个FailureGroup内为每个数据实例做备份,即使创建文件系统时没有要求复制,GPFS也会自动在不同的FailureGroup内复制恢复日志。GPFS对NSD的访问可用通过多路径进行,可用为每个NSD定义一个PrimaryNSDServer和一个SecondaryNSDServer.在SAN环境下,对NSD的访问,首先通过SAN进行,如果SAN不可访问,则通过网络访问PrimaryNSDServer,PrimaryNSDServer再访问NSD。如果PrimaryNSDServer不可用,则由SecondaryNSDServer完成对NSD的访问。GPFS分区化管理存储本身而言是逻辑化的,而不是物理化的,这种方式使得存储的内容可以根据业务流程的需要进行转移,但是这种转移并非物理转移,而是应用本身指示的转移;如此一来与以往的数据物理迁移模式相比效率大大提高了。GPFS安全管理GPFS在文件结构表上对于存储数据本身和文件系统本身是共存的结构。这一特点是访问和锁定对于节点永远是可用的,所以单点故障的在这里成为历史,其安全性和可靠性在文件系统级别上已经能够得到保证。缓存管理每一个GPFS的节点都有独立的缓存管理空间,使得不同客户端通过不同的节点访问时,都有自己的缓存空间,令访问速度大大提高。设备支持整个设备存储系统非常灵活,可以是本地的SCSI,也可以是SAN结构下的存储设备,也可以是iSCSI的结构,或者是在客户端也可以支持NFS等等。
\\\(不3忤说运口力案化设廿 j'目前国内外的高性能集群系统在需要更具扩展性的存储系统时,大多均选择存储区域网(SAN,Storage-AreaNetworks),SAN是一种类似于局域网的高速存储网络,通常由光纤通道磁盘阵列连接组成。而分散式集群存储pNAS在面对大型集群计算应用系统的高并发性和单节点高吞吐需求,就显的力不从心,并且所谓并行集群存储系统其实就是软件加硬件的紧密耦合,这种方式对于小型HPC系统有一定优势,扩充方便,但是一旦达到儿十TB上百TB的容量从性能上就不是一个线性上升的比例了,还是受制于控制刀片的处理能力,存储刀片虽然可以增加容量但性能会出现下降的趋势,并且相应的核心交换机端口数也要增加,并且这种软件加硬件的紧密耦合方式很容易被淘汰,不如SAN单一文件系统可以方便升级,无关硬件,并且紧密耦合方式的升级成本很高,必须升级一个完整的存储刀片,随着硬盘技术的快速发展SAN系统可以方便的升级,而存储刀片会有很大的兼容问题。IBMGPFS文件系统作为一种专门为集群环境设计的高性能、可扩展的并行文件系统。GPFS可以在集群中的多个节点间实现对共享文件系统中文件的快速存取操作,并提供稳定的故障恢复和容错机制。被业界超大规模高性能计算机系统所广泛使用GPFS文件系统被广泛应用于世界上超大规模的高性能计算机系统中,在当前TOP500计算机排名中的232套IBM计算机系统大都采用了并行文件系统方案。在中国也有大量的高性能计算系统使用GPFS作为并行文件系统,这其中包括运行关健业务的气象部门、石油行业和超级计算中心。这些项目成功实施和顺利运行充分证明了GPFS能够为超大规模的计算机系统提供均衡的负载和卓越的数据访问性能。高可扩展性GPFS具有无可比拟的扩展性,如下表所示:项目最大限制Linux集群中经过验证的值集群中的节点数81922441单个文件系统容量2A99Byte2PB集群中并行文件系统个数25632单个文件系统中文件个数2/47,483,648N/A单个文件系统能用到的逻辑卷个数(LUN数)268millionN/A每个逻辑卷容量取决于磁盘阵列系统支持的能力2TBI/O带宽取决于系统硬件配置134GB/S可扩展性还表现在:a)最大可支持数千个节点的集群规模和数百GB每秒的10吞吐量b)在不停止服务的情况下向集群添加和删除节点0在不停止服务的情况下向文件系统加入和删除磁盘d)在不停止服务的情况下修改文件系统inode数目高性能IBMGPFS并行文件系统软件在设计上不存在任何性能瓶颈,因此GPFS并行文件系统可以充分发挥硬件系统的性能。换句话说,GPFS并行文件系统的性能完全取决于硬件配置的好坏,而文件系统软件本身对性能的影响微乎其微。IBMGPFS并行文件系统与其它并行文件系统之间最大的区别在于GPFS不需要专用的元数据(MetaData)管理服务器,所有元数据分散在磁盘阵列中,并可以由任何I/O节点管理。这样的设计避免了并行文件系统中最可能产生性能瓶颈的因素——MetaDataServer。大规模高性能计算机系统的设计都会采用专用的I/O节点。I/O节点配置光纤通道卡连接外部磁盘阵列,而计算节点及登录节点对磁盘阵列的访问则是利用网络与I/O节点进行数据通讯。在系统规模非常大的时候,用来交换数据的网络通常会成为性能的瓶颈。出MGPFS文件系统可以充分利用高速网络的特性,提升计算节点与I/O节点间的数据通讯性能,同时最大程度地降低因I/O处理带来的对CPU资源的消耗。在Linux集群系统中,当使用了InfiniBand作为高速网络时,GPFS并行文件系统可以充分利用InfinBand网络的RDMA(RemoteDirectMemoryAccess)特性进行数据通讯。与TCPsocket协议不同,RDMA可以实现计算节点与I/O节点间内存的直接通讯,而最小化CPU的参与。这样在
提升I/O带宽性能的同时,降低计算节点CPU资源的消耗,从而保证计算节点内的资源可以更专注于数据计算。IBMGPFS的先进设计保证了GPFS是目前性能最高的并行文件系统,保持着在实际测试中得到的带宽134GB/S世界纪录。高可用性IBMGPFS文件系统本身提供了丰富的高可用性功能,所有的GPFS相关的管理服务器都能做到冗余配置,并可以由I/O节点中的任意节点担任。具体从GPFS集群(节点)、逻辑卷(磁盘)及文件系统的管理与维护三个层面得以体现。可以将所有服务器划到一个GPFS集群(GPFS集群是并行文件系统的专用概念,是所有要访问并行文件系统的服务器的集合)中,或分成多个GPFS集群。每个GPFS集群设置主、备2个管理服务器,可以选择I/O节点中的任何服务器承担。GPFS集群管理服务器负责管理和维护集群配置信息,如增加或减少节点、改变集群中服务器的属性等。同时,在一个GPFS集群中还可以指定若干个服务器作为“仲裁委员会”的成员(quorumnode),只要该仲裁委员会中一半以上的成员正常运行,就可以保证GPFS正常使用。在磁盘阵列划分好逻辑卷(LUN)并映射到相应服务器后,GPFS将每个LUN转换成网络共享磁盘(NSD),同时为每个NSD指定多个(最多8个)管理服务器,可以由任何I/O节点承担。这样可以充分保证任何I/O节点宕机都不会导致逻辑卷的不可用。在文件系统层面,每个GPFS集群中可以创建最多256个文件系统,每个文件系统都对应多个管理服务器(可以由任何I/O节点承担)。当任何一个文件系统管理服务器宕机时,都会有另外一个服务器自动接替其工作,保证并行文件系统的高可用性。另外,GPFS支持分布式的元数据服务器,支持元数据自动日志功能,实现用户数据和元数据的备份和自动恢复,当-台服务器宕机时,其管理功能可以有另外的服务器接管,不存在单点故障。GPFS支持多路径磁盘访问,一条路径访问失败,GPFS可以自动尝试其它路径,并同时支持节点和磁盘两级故障切换,对上层应用透明,确保应用的继续执行。GPFS支持分布式的块级锁管理,通过令牌机制来避免并发读写冲突。GPFS还支持rollingupdate功能,可以在线升级文件系统。丰富的功能GPFS还具有其它丰富的功能,如信息生命周期管理(ILM)、多集群间交叉mount、集群化NFS(CNFS)、磁盘限额管理、NFS和SAMBA客户端支持等。这些功能保证了GPFS配置和使\\\7"/卜诜达疗力案让议廿 一,用的灵活性,可以针对用户业务特点对GPFS进行设计与配置,满足用户业务对并行文件系统的复杂福求。多操作系统的支持GPFS不但支持传统的IBMAIX操作系统,IBMBlueGene,还支持Linux和Solaris。同时IBMGPFS还是目前唯一能够支持WindowsServerNSD的并行文件系统。管理简单用户接口简单,与常用文件系统类似,方便用户使用单点管理,可以集群内任何一个节点上完成对GPFS的管理任务,命令将在所有节点上生效自动在各个节点间同步配置文件和系统信息支持友好的基于Web的界面2.4.3系统管理方案设计与实现介绍(IBMSystemsDirector)IT基础设施正在日益多样化和复杂化,而复杂程度的增加导致IT基础设施的管理(部署、调整、安装和防护)成本居高不下,目前管理1T环境所增加的成本远远大于价格降低和性能提高所节约的成本。IBM智能系统管理是通过硬件、固件和一套高级系统管理工具实现的。IBMSystemsDirector发现和资产管理器随着企业的发展,IT设备逐渐增多,IT环境也变得越来越复杂。如今,对于IT系统管理员来说,如何快速、准确地了解企业IT环境中每台设备的资产信息并不是一件很容易的事情。通常情况下,这可能需要管理员登录每台机器去杳看操作系统是Windows还是Linux(是Redhat还是SLES),物理机和虚拟机、MM和刀片服务器的对应关系,以及机器上安装的硬件和软件的相关信息。可以想象,这是一项多么困难的工作。而IBMSystemsDirector发现和资产管理器提供的发现和资产收集功能,使这项工作变得简单、方便。IBMSystemsDirector发现和资产管理器是所有发现系统和网络设备以及收集库存功能的集合。管理员可以使用系统发现功能来进行一些基本的系统和网络发现工作;也可以使用高级系统发现功能,通过易于使用的向导来进行系统的发现。通过IBMSystemsDirector的发现管理器可以实现以下功能。发现复杂环境中各种物理的、虚拟的服务器、存储设备和网络设备。通过一个集中的视图来查看已发现的系统以及系统之间的关系。通过资源浏览器方便地查看,所管理的系统和资源。通过收集库存来查看一些系统数据,例如物理的、逻辑的或者虚拟的硬件、软件、操作系统、中间件、固件、BIOS以及网络的信息。可以通过管理概要文件来设置发现库存的标准。1)系统发现功能IBMSystemsDirector6.1的发现管理器提供了简单和高级的系统发现功能,以满足管理员的不同使用需求。•简单系统发现功能用户无需了解每个系统的具体属性,只需要简单输入系统的机器名、IP地址或者IP地址的范围,即可进行相应的操作。在发现的执行过程中,发现管理器会实时显示进度以及己经发现的系统,用户可以查看这些系统并进行相应的操作。•高级系统发现功能用户需要通过易用的向导来对不同类型的系统发现进行设置。用户可以创建一个完整的系统发现任务,包括发现系统、获取访问权与搜集系统库存。2)资产信息的收集和管理任何已经被IBMSystemsDirector发现的资源都会以组的方式被组织,并显示在浏览资源页面中。用户通过单击组中的具体资源的属性,可以了解资源的基本信息,如操作系统的类型和版本信息、机器名和IP地址、机型和序列号信息。而对系统管理员来说,除了这些基本信息之外,可能还想了解更多的信息,例如系统的硬件和驱动信息、系统上安装的软件及其版本信息等。这些资产信息的收集就需要用到IBMSystemsDirector的库存收集功能。3)用户案例和解决方案用户案例:系统管理员想要管理•个网段中的所有机器,那么他应该如何获知该网段内都有哪些机器,这些机器都安装了何种操作系统?对于其中一台装有Windows操作系统()的机器,系统管理员希望知道它上面安装的软件和硬件信息。
以上案例的解决方案如下:(1)通过IBMSystemsDirector的简单系统发现功能的多个系统发现功能得到•个网段中的所有系统列表及其操作系统信息。单击IBMSystemsDirector页面左侧的“系统发现”项,在界面中输入起始IP地址和结束IP地址,单击“发现”按钮,即可看到本网段机器的操作系统信息了,如图所示。系坡发现• =点宵O♦个《城(P地址)个不姨o-个毛线(:生机房)起始S电址,9 -]125 53 1结果IP或批,9 ;IX]琳|*5二速降费■美奥,H ~~B西己堂观的小姨[UfF名片QdtHOcmcom0g107ctitcctnC^dtx62csstcomddts161cMtcetnxl20csstcanG如>97cmconQ&xl85"ac«<nQdteM[UfF名片QdtHOcmcom0g107ctitcctnC^dtx62csstcomddts161cMtcetnxl20csstcanG如>97cmconQ&xl85"ac«<nQdteMcsacomQdtx60cmcom0db2O5cfftcccn偿作S统操作星线操作毛岐收作军线操作犀嫉操作¥统操作帛姨操作不筑博作年扶操作串线01WWS■I无坊向收・无访自收・无访问杈♦无访用权・无访问权6无访自权・无访问权■无询问权笔无访问权・无助同权M零M索M虺正正正正正刊■■■■■常常常常常
正正正正正已正正正正正正正正正正IPA4drets<091255340912353107912553629053161912553120912553%9125531s59125534491255360912553205崖作*,都0慢1Wg>iow»exp51L«uxWplowseSa52WndowteSu52LcmxADC<1Wnd^eSa52LsmxWudc^wteS«i52W«>d.ywf<S«52■・第1页(共5JO•«1tSit.48图全网段系统发现(2)从系统列表中找到想要查询的系统(例如“"),在获得访问权限后使用查看和收集库存功能得到系统的硬件和软件信息列表,如图所示。
■■■线M烫方箝■力.aiHK9支件,***•*1*".■依・■♦立修1*0.•・叁”C••弗口棘■■ 件dhHcMtcam♦;「前1,所..用 皿|Kmujc*j[■KlCtMMWI上/R・时■. «t3”图系统资产信息的收集2.43.2IBMSystemsDirector状态管理器和自动任务1)硬件监控和性能监控IT系统管理员需要及时了解所有被管系统的硬件和操作系统的资源运行状态,准确认定问题的根源,并且要对这些问题进行迅速的处理,尽量避免对日常生产和操作生产影响。但管理员的精力有限,面对众多的机器和不同类型的问题,如何从现有问题中发现更多的细节线索,如何及时应对这些硬件和系统资源的异常,已经成为困扰管理员的难题。IBMSystemsDirector状态管理器的实时监控功能和自动化管理器的自动化响应功能可以帮助管理员很好地解决上述困难。a)状态管理器IBMSystemsDirector状态管理器可以提供被管系统的监控状况(包括硬件、操作系统、应用程序和安全)。管理员可以方便地使用IBMSystemsDirector状态管理器,通过自定义的层次查看系统的健康状况。IBMSystemsDirector状态管理器发现的系统状态会被自动接收并显示,而且,用户可以通过多种方式来自定义显示方式,例如使用与某一系统状态和运行状况相关的任务、导航至特定的资源或者使用命令行。使用IBMSystemsDirector状态管理器,用户可以进行如下操作:\\\—“忤诜送口力案让议廿 一j使用状态管理器的欢迎页面来查看被发现系统的重要状态,并获得可以帮助用户系统管理状况、问题和时间的任务摘要。使用运行状况总结、记分板和仪表板功能,确定环境中被管理资源的运行状况和性能。使用运行状况总结功能可视化被管理资源的总体健康状况。查看问题和事件日志,以识别问题并确定故障根源。通过定义监视器和阀值来监控被管理系统的动态属性。通过定义监视器和阀值来监控一个特定系统上的进程和设备服务。b)运行状况总结视图在很多情况下,能快速地总览系统的健康状况是很有必要的。IBMSystemsDirector的状态管理器包含了一个可以自定义的运行状况总结任务以洞察系统状况。这个统一的视图整合了记分板、运行状况总结以及仪表板。通过此界面,用户可以快速查看环境中重要区域的状态、监控重要的资源,以及查看自定义资源组的运行状况总结,如图所示。名临 e|OOSIM6O-M6&-OOIO-BMCM^4bI1*cmIc«ba4bLMmtcomW^dhMewlcaBflm\lIMQCIE99ATYELamMSS4OJCJ99R*fl9•sN^YKniripiuttSN«YKIMOtIRISH9|»<•I2<♦125♦I2*9I2SQ::名临 e|OOSIM6O-M6&-OOIO-BMCM^4bI1*cmIc«ba4bLMmtcomW^dhMewlcaBflm\lIMQCIE99ATYELamMSS4OJCJ99R*fl9•sN^YKniripiuttSN«YKIMOtIRISH9|»<•I2<♦125♦I2*9I2SQ::«91259US;的”«125[04kps4ntfccai*cMLeomI9A16IcutcanflBM4I92A2A99AOM}BBM*W*DA"ASM9BMIsnUAMHO^&S0YJU68S413“一M■正常•正孝■正常・正厚美R :6何e1•信可妖 •正常!t信写蝶 ■正掌HI信星蛾 •正常置务・ Hil需■正常KMI •正第BtadtCcnta机・•正常^9999999
EO*零零案零案索
正正正正正正正
一・■■■0■・
:索・肯索索索多
■正汽警Z正正T一.:二运行状况总结视图主要由以卜3部分组成。/记分板:对发现的所有系统的运行状况进行分类概括,给出当前处于不同级别和状态(紧急、警告或者信息)的异常数目。/仪表板:对于已监控的系统资源(包括CPU使用率、硬盘使用率、内存使用率、网络流量等)给出实时的、图形化的视图显示。/运行状况总结面板:显示用户选择的系统的运行状况,以快速查看、监控并且追踪更多细节。2)根据状态变化制定自动计划对于系统管理员来说,为了保证一些重要的机器正常运转,有时需要付出大量的时间和精力来监控这些机器,以便在机器发生异常时迅速、及时地作出反应。任何疏忽都有可能导致异常处理上的延误,影响企业的管理和生产。但由于系统管理员精力有限等种种因素,人工监控异常和处理异常有时难免出现疏忽或延误。IBMSystemsDirector的自动化管理器提供了迅速、准确的应急处理机制。它能够实时地监控系统,并能在系统中发生硬件或者资源异常时(比如风扇损坏停转、CPU温度过高、内存使用率过高等)自动启动预先定制的相应操作(比如发送SMTP邮件、启动程序、重启系统等).IBMSystemsDirector的自动化管理器提供了以下功能。/创建事件操作:提供了近20种不同类型的操作,以满足不同用户的实际需求。,创建事件过滤器:预定义了几十种在用户环境中常见的硬件和软件事件。同时,用户还可以按照实际环境定制自己所关心的事件。,创建自动化计划:提供自动化计划向导以便用户能够方便地生成自动化计划。,计划任务:提供调度任务的功能,可单次执行或循环执行。3)用户案例和解决方案以下将对IBMSystemsDirector的几个常见用户案例进行分析,并给出相应的解决方案。用户案例1:用户案例:系统管理员想要知道当前管理的环境中有多少系统存在着硬件或资源问题。
解决方案:把所有系统加入IBMSystemsDirector服务器,在获取访问权后,单击导航栏里相应的选项查看系统状态和处于运行状态时的运行状况总结,获得有问题的系统列表,如图所示,单击相应的问题名称可以看到每个系统问题的详细情况。-j-V1JI(«-j-V1JI(«1JD1 - 己通修,0fi.it•9已过婚.9噂M常常常常常常MM正正正正正正正正正IPE-慢信军统9n<irWindows・Sen慢保不蜕9125n53fef S«n操作军蜕9I255J6SWindm*Sen底普修912$95249I255J2OBUdeCestn佃91”S363BhdeCcotc*91299141BbdeCota9\2SS3DI图有问题的系统用户案例2:用户案例:某公司有很多台服务器,且已经使用了几年,有些机器的硬件已经老化,在日常工作中容易出现故障,系统管理员想要在下次采购时多买些硬件及配件来更新机器。但服务器这么多,怎样才能把这些硬件已经老化的服务器找出来呢?解决方案:系统管理员可以通过IBMSystemsDirector的事件自动化计划对硬件预测性故障警报事件进行过滤,如图所示。然后,通过创建事件操作功能自动把这些服务器加入一个静态组中,如图所示。enienenien・仲。“生计・,邛(1〉量田・。•,武玄山-蠡・《■焉周口|1,?£,FFA,••B.堞■dll・友¥叫・、・7・,1图高级事件过漉器己界・帆己界・帆•冷慢体的安夕.[慢体・]w*表TOC\o"1-5"\h\z心声名柞 3<»I••七,1式外上《泣空位0 而・O 公布金臂闻曜(NMTP) ■线O 将SNMP陌府町■危重也受Nf/m生机 MV9.,,“,企也口 41验蝇 龄石男.法刘旭去发生事件的■发 *0O *SNMP侑,/5•藜P史矶 XAO'SNMPFuWYeX犷生帆o・旧■件并发走谩•件含动钳序WEEO”•件里蜿爻・O在指定耳或上g任务O里成•件的辽野警报O荏生或谖•件的事蛾上总总任务.O记梁到日忠文件。度也为宇彩耳-**11(M2K>匕-1图创建事件操作国际商业机器(中国)有限公司 第33页\\\人丁周忤谎达口力案化议152.43.3IBMSystemsDirector配置管理器很多时候,IT系统管理人员需要对现有的和新添加的硬件进行配置。但对于现代企业而言,动辄数以千计的设备使得这项重复性的工作变得异常艰巨而乏味。IBMSystemsDirector中的配置管理器或许不能让这项工作变得有乐趣,但其统一的配置界面却可以使用户的配置工作变得方便、简单,让用户在使用配置管理器的同时就能体会到自动化过程带来的便捷。什么是配置管理器?从一个虚拟化基础设施上取得最佳商业价值的过程包含许多重要的任务,定制的系统配置就是其中之一。在IBMSystemsDirector中,用户可以通过配置管理器来将新的硬件设备集成到管理环境中,进行安装后的系统配置,或者为某些特殊要求进行•次性配置。通过一系列精心设计的、适用于各种系统的模板,IBMSystemsDirector配置管理器提供了统一的用户体验来配置服务器、存储、网络资源,而且所配置的资源甚至可以基于完全不同的技术。使用配置管理器,用户可以进行如卜操作。/通过配置管理器的欢迎页面集中浏览系统配置状态、查看配置任务概要。/为一个或多个系统(各种硬件或者操作系统)的部署、分配和使用执行初始化配置。/使用配置计划的自动部署功能,自动配置新发现的系统。,重新配置系统,以重新部署、分配或者指派。,实时修改配置并保存配置信息至配置模板中,或者将一系列的配置信息保存至一个配置计划中。/管理配置模板和配置计划。一个配置模板是系统的配置及其设置值的集合;/而一个配置计划则是一组配置模板的组合,并可以按照一定的顺序将其中各个模板的配置信息应用到一个或者多个系统中。■配置管理器的功能本节将介绍IBMSystemsDirector配置管理器的主要功能。.欢迎页面配置模板最近244配置模板最近244画0个新配置模板。个由配置模板配置的资源、Director管理的所有配置计划和配置模板的小结。在IBMSystemsDirector配置管理器的欢迎页面中,用户可以方便地查看所有配置计划和配置模板的信息,以及自动部署功能的情况,还可以通过超链接方便地进入相关的配置管理任务中,根据需要进行系统配置,如图所示。配置管理器配置管理器使用配置计划和模板来管理系统的配置。配置计:量近24小时0个新配置计划0个由配置计划配置的资源最近30天1个料配置计划。个由配置计划配置的资源最近30天1个新配置模板自动部居功旎小结。0个由配置模板配置的自动部居功旎小结。动部署Director服务器中已安装所有的配置模板,按照配置目标进行分类,方便搜索。检测到新系统时,将自动部署下列配置计划。机架:未对机架设备设置自动配置计划服务谯:未对服务器设备设置自动配置计划存储器:未对存储设备设置自动配置计划[如络:未对网络设备设置自动配置计划Director服务器中已安装所有的配置模板,按照配置目标进行分类,方便搜索。配置笈置下列配置设设可用干配置置源。要配置设置,清查找资源并选择其“配置”选项卡。32个机架配置设置13个服务器配置设置。个存储器配置设置C个网络配置设置图配置管理器的欢迎页面■任务导航区域的系统配置任务组在IBMSystemsDirector的任务导航区域中,用户可以方便地通过系统配置任务组进入不同的系统配置任务,如图所示。
□系统配置当前配置配置模板配置计划创建虚拟服务器存储管理外部存储器应用程序远程访问图系统配置任务组■资源属性页面用户可以通过不同的入口方便地进入IBMSystemsDirector的系统配置功能页面。例如,在浏览资源的时候,用户可以在所选资源属性页面中的“配置”标签页中浏览该系统的当前配置,还可以修改当前资源的配置信息,并将这些修改保存成配置模板或者配置计划,以方便地应用到其他的资源配置中,如图所示。从列表中出撵系统政单击览”以宣技并选修不统.然后,单击以显示所选系统的配置设置。奘浙IBM7977B2A99B8O81将睨有的配置另
存为配置模板或奘浙IBM7977B2A99B8O813 搜索表...i靖钻IL另存为配置假板H另存为配置计划D[慑作照号处逼姬口配.配置鹿务处理■的端口值息□用务处理H瞽将接收方配置屋务处理<1的警报接收方□服务处理H安全蛾则配置配置般务处理已的安全级别设置□用号处理d国给IP配置配置用务处理H的网经IP设置□服务处理HSNMP配置配置服务处理日的SNMP设置□用务处理叁警抿设置配置服务处理誉的瞽报设置□CIM-tndicataon刊i订的全局配置为PlatfonnAgent配置全层CTM-mdicaiion覆订设置.□服务处理B登录配置配置用务处理4S的登录信息□网塔配置配置服务处理H的圉络设置□贷产标识配置费产标炽配置□SHMP代理配置任畀配置股分线的SNMP代理谀量1a系统修户配置配置用户政用户姐的系小户信息[一当■置■的折,配置值息配置“改的肩式■现给用三回目第15((共1页):?ja己选的1总计,12已过海12图资源属性页面中的配置标签\\\―忤临与疗力案让议廿 一,■管理配置模板和配置计划通过上述对IBMSystemsDirector配置管理器的介绍可以了解到:配置模板是系统的配置及其设置值的集合;而一个配置计划则是一组配置模板的组合,并可以按照一定的顺序将其中的各个模板的配置信息应用到一个或者多个系统上。系统管理员可以通过配置管理器所提供的配置管理功能,利用被管系统和资源的配置模板和配置计划,自动地把需要的配置应用到一个或一组服务器、存储器或网络资源上去。■用户案例和解决方案用户案例:某公司有数千台Systemx系列的服务器,并配有远程管理卡(RSA、RSAII),但最近该公司的安全部门要求对这些服务器系统和管理卡上的管理账户及密码进行统一修改。一次一次地登录每台逐一修改,简直是不可能完成的任务。此时,系统管理员该怎么办呢?解决方案:系统管理员可以通过创建两种针对独立服务器的配置模板、服务处理器登录配置和系统账号配置模板,分别完成对RSA登录账号的修改和对系统管理员账号的修改。然后,把这两个模板组合到一个配置计划中,再集中应用到所有被管理的Systemx服务器系统中。这种不同的配置模板类型如图所示。5IPSNVKKKKKKJHS;悔AF5IPSNVKKKKKKJHS;悔AFKPRfMM.也■11疆“S3■旭s>安1**(鼠用4-0年通?128•理尼・不E自妁*■IBMSystemsDirector虚拟化管理器虚拟化技术已经开始广泛应用于企业领域,基于虚拟化技
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 签订技术合同重点在哪(2025版)
- 女方出轨离婚协议书范文2025年
- 免责协议合同(2025版)
- 融创文旅培训试题及答案
- 企业合同管理规章制度2025年
- 门卫劳动协议(2025版)
- Unit 4 第4课时(Part B Let's talk )教学设计
- 2025生物制药专利独占许可协议涵盖抗癌新药研发
- 2025年云端服务器租赁及定制化系统维护解决方案合同
- 2025年商业地产项目中层管理团队承包合同模板
- 乐乎培训师评级管理制度
- 保温材料仓库管理制度
- 2025至2030年中国汉麻行业市场调研分析及发展规模预测报告
- 公司停业股东协议书
- 银行背债协议书
- 【课件】有理数的加法法则 课件华东师大版数学七年级上册
- 慢阻肺护理新进展
- 受伤赔偿协议书范本
- 设计变更流程讲解
- 2025年青年发展类面试题及答案
- 2024-2025学年广东省佛山市南海区七年级(上)期末语文试卷(含答案解析)
评论
0/150
提交评论