数值模拟平台需求说明_第1页
数值模拟平台需求说明_第2页
数值模拟平台需求说明_第3页
数值模拟平台需求说明_第4页
数值模拟平台需求说明_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数值模拟平台需求说明一、需求清单1数值模拟平台主系统2套2数值模拟平台计算节点14台3管理登录节点1台4计算网络1台5管理网络1台6数据存储节点1台7集群管理与作业调度系统1套二、主要技术指标1.数值模拟平台主系统(2套)指标项技术要求系统形态高度≥4U;内置节点类型系统支持≥8个双路计算节点;IO网络交换模块每个系统可支持独立的网络交换模块,支持内部千兆互联;对外提供不少于4个RJ45千兆端口与2个SFP+万兆端口;PCIe扩展整机支持8个PCIe4.0扩展,可对应前置每个节点一个PCIe;IB端口配置8个200GHDRIB端口,保证单节点带宽不低于200G;电源模块配置≥4个热插拔电源模块,可实现电源模块的2+2/3+1冗余(根据实际功耗);风扇模块配置≥5组冗余热插拔风扇模块;管理功能多种管理方式:提供本地BMC(IPMI接口)、系统整体管理模块管理、集群管理平台三重管理方式;系统管理模块实现对单个节点、电源模块,风扇模块,网络模块的实时状态进行监控、故障预警,资源配给、功耗和散热工作策略设置;管理模块配置≥1个热插拔管理模块,支持前维护和后维护,可实现远程虚拟介质、KVMOVERIP、刀片状态、故障定位、开关机等全方位管理控制监视功能,监控系统可实时测内部主要部件的状态,能够提供准确的状态指示和错误告警;服务3年原厂整机质保和上门服务;工作温度支持5℃-40℃环温正常工作;噪音控制依据GB/T3768-2017测试标准,产品在各工况下噪音小于90dB的。2.数值模拟平台计算节点(14台)指标项技术要求外形和密度双路计算节点,同一个系统机箱可支持≥8个计算节点,节点支持前维护;处理器配置≥2颗处理器,CPU核心数≥32,主频≥2.0G,高速缓存≥60MB,TDP≤270W;内存配置≥512GBDDR43200MHzECCRDIMM内存,支持≥16个内存插槽,支持内存ECC保护、内存镜像、内存热备;硬盘配置≥1块480G2.5SATA6GbRSSD;M.2SSD支持≥2个板载的M.2SSD;硬盘控制器集成SATA控制器;可选支持LSI9560RAID控制器4GBCache,支持RAID0/1/10;板载网卡板载双口千兆,节点前出1个RJ45业务端口,后出1个RJ45业务端口(搭配交换模块使用);后置PCIe扩展和机箱互相搭配使用,可支持HDR200GInfiniBand直通网络模块;扩展插槽提供≥1个全高半长的PCIe5.0x16标准外置式的插槽(前置);前维护1个前置VGA、2个USB3.0,1个RJ45千兆业务端口,1个TypeCDebug端口;服务3年原厂整机质保和上门服务;3.管理登录节点(1台)指标项技术要求机型2U双路机架式;处理器配置≥2颗处理器,,CPU核心数≥12核,主频≥2.0GHz,高速缓存≥30MB,TDP≤150W;内存配置≥256GBDDR54800MHzECCRDIMM内存,支持≥32个内存插槽,最大可支持4TB内存容量,支持内存ECC保护、内存镜像、内存热备;支持通过CXL额外扩展16个内存槽位;硬盘配置≥2块480G2.5SATA6GbRSSD;硬盘控制器配置4GBCache、12GbRAID控制器,支持RAID0/1/5/10/50,支持电容掉电保护;支持板载直出16个SATA硬盘,无需外接控制器;网卡配置≥1块双口千兆网卡,≥1单端口200GHDRHCA卡;扩展插槽至少支持8个PCIe5.0槽位,其中至少6个PCIe5.0x16;管理存储主板实配不低于14GB空间以用于故障日志及故障录像存储,支持BMCLinuxkerneldump日志下载用于故障诊断;风扇配置≥6个热插拔系统风扇,支持N+2冗余;电源配置≥2个1300WCRPS标准电源,支持1+1冗余;管理芯片集成系统管理芯片,提供iKVM和KVMOverIP高级管理功能,本地固件更新、错误日志,提供系统状况的可视显示;配置独立的远程管理控制端口,支持远程监控图形界面、支持H5虚拟键盘、支持VNC功能,可实现与操作系统无关的远程对节点的完全控制,包括远程的开机、关机、重启、虚拟设备挂载等操作;可实现监控节点内部主要部件的状态,包括CPU、内存、硬盘、风扇、电源;支持带外获取OS版本、OS下CPU内存使用率、网口状态、系统磁盘分区等;支持带外获取所有板卡的SN号;支持RAID卡配置带外导入导出;提供国产管理芯片证明材料,供货时提供设备品牌相关软件的软件著作权登记证书。数据同步模块配置同品牌或能兼容使用的数据同步功能模块;服务3年原厂整机质保和上门服务;4.计算网络(1台)指标项技术要求类型InfiniBandHDR交换机;端口≥40个200G端口;电源配备冗余热插拔电源;配套线缆配备满足全线速IB组网所需全部IB线缆;服务3年原厂整机质保和上门服务;5.管理网络(1套)指标项技术要求类型以太网交换机;端口≥48个10/100/1000M自适应电口,实配≥4个1G/10GSFP+光口;服务3年原厂整机质保和上门服务;6.数据存储节点(1台)指标项技术要求机型4U36盘位机型,非计算和存储节点(JBOD)分离架构;处理器配置≥2颗处理器,,CPU核心数≥12核,主频≥2.1GHz,高速缓存≥18MB,TDP≤120W;内存配置≥128GBDDR43200MHzRDIMM内存,支持≥32个内存插槽,支持RDIMM或LRDIMM;硬盘本次配置≥2块480G2.5SATA6GbRSSD,≥16块16T3.5吋7.2KSATA6Gb硬盘;硬盘控制器配置4GBCache、12GbRAID控制器,支持RAID0/1/5/10/50,支持电容掉电保护;网卡配置≥2个千兆电口,≥1个单端口200GHDRHCA卡;扩展插槽最大支持10个PCIe插槽;风扇配置≥4个热插拔高速系统风扇,支持动态智能风扇调速的散热系统,风扇支持N+1冗余及热插拔功能;电源配置≥2个1200WCRPS标准电源,支持1+1冗余;管理芯片集成系统管理芯片,提供iKVM和KVMOverIP高级管理功能,本地固件更新、错误日志,提供系统状况的可视显示;配置独立的远程管理控制端口,支持远程监控图形界面、支持H5虚拟键盘、支持VNC功能,可实现与操作系统无关的远程对节点的完全控制,包括远程的开机、关机、重启、虚拟设备挂载等操作;可实现监控节点内部主要部件的状态,包括CPU、内存、硬盘、风扇、电源;支持带外获取OS版本、OS下CPU内存使用率、网口状态、系统磁盘分区等,支持RAID卡配置带外导入导出;数据同步模块配置同品牌或能兼容使用的数据同步功能模块;服务3年原厂整机质保和上门服务;7.集群管理与作业调度系统(1套)指标项技术要求管理调度监控软件架构采用最新版本商业版作业调度软件,与计算节点统一品牌或可兼用使用;提供≥20个节点授权,实现全系统的统一管理和高效调度使用;监控热图提供热图方式集中展现集群中所有节点的关键指标,如CPU利用率、内存利用率、网络可用性、电源状态、温度等,支持指标快速切换;应用软件集成提供本地软件仓库,集成HPC集群常用的各种开源和免费软件,包括集群基础软件(如编译器、MPI数学库、Infiniband驱动)和硬件诊断工具(如hpl、stream、iozone),允许管理员或普通用户通过Web页面进行查询、安装或卸载软件;应用Portal支持常见高性能应用的作业提交Portal,整合文件管理、VNC等功能;作业提交核查提供串行、OpenMP、MPI作业的Web提交界面,能够实时检查用户输入的合法性(比如申请资源超出权限等),支持2D交互式可视化作业的集成,支持作业Checkpoint/Restart功能;调度引擎集群调度系统同时支持PBS和Slurm调度系统;交互式作业功能支持批处理作业、命令行交互式作业以及GUI图形交互作业,支持通过浏览器打开VNC会话进行操作;支持设置多个专门的VNC服务节点,统一VNC会话的管理;支持作业VNC会话在不同VNC服务节点上的负载均衡;分组视图支持按预定义或自定义的角色分组展现节点状态信息,以及相关联的告警信息;集群性能测评提供针对集群整体(或者部分)进行各项指标(如CPU、磁盘、内存等)的性能测评功能,图形化的结果展示测试结果;负载均衡调度支持将作业均衡的分配到所有计算节点上,避免任务堆积在个别节点,因争抢CPU、内存等资源导致计算变慢;随机调度策略支持随机选择作业的计算节点,解决特定场景和固定调度算法下某些计算节点被频繁使用的问题;一键配置集群提供灵活强大的集群配置能力,可以一键完成对整个集群的检测和配置,如检测网络可用性、配置ssh/rsh无密码登陆、停止系统冗余服务、配置NFS、同步集群时间、同步集群用户等;节点分区支持对节点进行分区,不同的分区进行不同的访问控制和调度策略;容错处理作业资源限额控制支持对资源占用量超过自身资源请求的作业进行自动清除,如运行时间超时、内存使用量超过限额;作业异常自动重启支持对于因为系统临时错误导致的异常作业进行自动重新入队和调度;支持当作业返回特定退出码时进行自动重新调度;残留进程和非法进程清理支持对作业残留进程和非法作业(即未提交调度系统、手动运行的作业)进程的自动清理。支持基于节点、用户、进程等不同维度的白名单和黑名单设置,支持多维复合过滤条件设置,支持对残留作业进程、非法作业进程的自动清理;队列功能队列管理支持基于Web的队列管理,各队列可设置不同的资源配额、访问策略和调度策略;用户管理支持NIS和本地passwd用户管理(包括认证和增删改查),支持LDAP、AD,NIS,Local用户认证。多认证服务可以同时使用;节点管理支持基于Web的节点管理,监控计算节点的状态,支持节点的启用和禁用,支持节点服务的重启;作业管理支持基于Web的作业管理,支持对运行作业的输出进行实时监控,支持输出文件的下载,对VNC图形作业提供基于浏览器的远程访问功能;统计和计费预付费支持支持计费账号管理,允许多个用户使用一个计费账号;支持通过“先充值后扣费”方式使用集群资源,只有账号余额充足时才能运行作业;多视角统计支持从用户、队列、节点、应用、账号、作业规模等不同角度进行统计计费;计费详表支持导出作业粒度的计费详表,供用户核对;报表导出支持PDF和EXCEL格式导出;HPC软件自动部署工具提供常用MPI、数学函数库、HPC基准测试程序的一键部署工具,可选择性或一键安装配置;编译器支持最新版的IntelC/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论