高性能多核EDA服务器集群建设需求_第1页
高性能多核EDA服务器集群建设需求_第2页
高性能多核EDA服务器集群建设需求_第3页
高性能多核EDA服务器集群建设需求_第4页
高性能多核EDA服务器集群建设需求_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高性能多核EDA服务器集群建设需求1、采购清单序号设备名称数量计量单位1计算节点9台2AI计算节点11台3AI计算节点21台4IB交换机1台5集群调度软件1套6服务器负载均衡1套7集成方案、系统架构及运维服务1项2、技术要求序号设备名称技术指标及性能说明数量单位1计算节点1.产品规格1.1CPU规格:1.1.1CPU:配置不低于2颗X86处理器,铂金处理器核数≥36核,主频≥2.7GHz;1.1.2主板规格:1.1.3主板支持内存容量不低于16/32个DDR4内存插槽,最高3200MT/s;1.1.4主板内存槽数量:不少于32个;1.1.5主板存储接口:SAS/SATA/SSD;1.1.6主板PCIe插槽数量:不少于14个PCIe4.0扩展插槽,支持多种应用;1.1.7主板OCP插槽数量:支持多种网络扩展能力支持OCP3.0网卡-2个FLEXIO插卡槽位分别支持2个OCP3.0网卡,支持按需选配;支持热插拔;1.2内存规格:1.2.1内存数量:不小于16条32GGBDDR4-3200内存;1.2.2内存规格:配置512GBDDR4-3200内存;1.2.3内存通道:支持多个内存接口通道;1.3存储规格:1.3.1硬盘类型:配置2块480GSSD;1.3.2硬盘接口类型:提供PCIe,SATA至少一种;1.3.3支持多种不同的硬盘配置,硬盘支持热插拔:最大支持45个2.5英寸硬盘,或支持34个全NVMeSSD可配置2个M.2SSD硬盘;RAID卡规:1.3.4RAID卡支持的SAS接口数:不小于1块,2G缓存RAID阵列卡;1.4网络规格:1.4.1独立网卡接口类型:2端口万兆以太网接口卡(含光模块),1张单口HDR100GIB网卡;1.5电源规格:1.5.1电源冗余模式:电源模块按1+1冗余;1.5.2电源模块数量:2个;1.5.3电源功率:单块1500W;2.功能要求2.1内存功能:2.1.1故障DIMM标识隔离(FailedDIMMIsolation)单颗粒数据纠错(SDDC);内存巡检(MemoryDemandandPatrolScrubbing);内存地址奇偶检测保护(MemoryAddressParityProtection);内存过热调节(MemoryThermalThrottling);内存Rank冗余热备(MemorySparing);内存镜像(MemoryMirroring);设备标记(DeviceTagging);数据加扰(DataScrambling);2.2设备安全2.2.1功能:支持支持基于Kerberos协议的用户认证管理机制,基于芯片可信根实现固件启动前的完整性校验,支持TLS1.2、TLS1.3版本,支持SNMP功能及SHA256/SHA384/SHA512鉴权和AES256加密算法,2.3存储功能:2.3.1支持2*M.2SATASSD,支持硬RAID1,支持免开箱热插拔;2.4管理功能:2.4.1支持PCIe标卡UCE故障精准告警功能;2.4.2支持中文BIOS界面,支持鼠标操作;2.5配套系统功能:2.5.1配置一套操作系统,与服务器兼容;2.5.2产品为自研操作系统或基于国内开源社区衍生的商业发行版,内核版本为5.10或以上版本,提供操作系统软件著作权登记证书扫描件并加盖投标人公章操作系统功能:支持访问控制、安全审计、网络介入鉴别等功能;2.5.3支持RAF、CESM、ROMS等软件;2.5.4提供内核内存泄漏分析工具,包括PAGE、SLAB、LRU内存等的跟踪分析;2.5.5支持进程句柄监控、进程退出(sigkill)信号监控和进程自愈等功能;支持D状态进程监控自愈处理能力及信号量死锁信息导出;2.5.6兼容以下编译器、数学库、并行环境:GNU编译器,支持C/C++、Fortran77/90;Intel编译器,支持C/C++、Fortran77/90;MKL、ACML、BLAS、LAPACK、ScaLAPACK、FFTW等;OpenMP并行环境:OpenMPI、MPICH2、MVPAICH2等MPI并行环境(支持IB/OPA/以太网);9台2AI计算节点11.产品规格1.1CPU规格:1.1.1CPU:配置不低于2颗至强铂金8468V(2.4GHz/48-core/97.5MB/330W);1.2GPU规格:1.2.1GPU:配置不低于8块HGXH20GPU;1.3主板规格:1.3.1主板支持的最大内存容量:32个DDR4内存插槽,最高支持5600MT/s;1.3.2主板内存槽数量:不少于32个;1.3.3主板PCIe插槽数量:最多支持13个PCIe扩展槽位,12个PCIe5.0x16标准扩展插槽、1个OCP3.0网卡;1.3.4网络接口:多种网络扩展能力,最多支持1张OCP3.0网卡,按需选配,支持通知式热插拔;1.4内存规格:1.4.1内存数量:不小于8条;1.4.2内存规格:配置不低于512GBDDR4-3200内存;1.4.3内存通道:支持多个内存接口通道;1.5存储规格:1.5.1硬盘类型:配置2块960GSSD;1.5.2硬盘实配容量:配置不低于2块固态盘960G;1.5.3硬盘接口类型:提供PCIe,SATA至少一种;1.6RAID卡规:1.6.1RAID卡支持的SAS接口数:不小于1块,4G缓存RAID阵列卡;1.7网络规格:1.7.1独立网卡接口类型:2端口万兆以太网接口卡(含光模块),1张单口HDR100GIB网卡;1.7.2板载网卡接口类型:SFP;1.8外部接口规格:1.8.1接口:iBMC芯片集成1个专用管理GE网口,提供全面的故障诊断、自动化运维、硬件安全加固等管理特性;1.9电源规格:1.9.1电源冗余模式:可配置6个热插拔电源模块,支持柜级N+N冗余备份,根据负载可选2+2,3+1,3+3,4+2,5+1配置,可选3000W钛金电源;1.9.2电源模块数量:不低于2+2块3000W钛金电源模块;1.9.3电源功率:3000W;1.9.4电源指示灯:配有电源指示灯;2.功能要求2.1管理功能:2.1.1支持内存UCENon-Fatal/PCIe标卡UCE故障精准告警功能;3.安全要求3.1支持加电密码、管理员密码、TPM2.0、安全启动等安全特性;4.配套系统功能:4.1产品为自研国产操作系统或基于国内开源社区衍生的商业发行版,内核版本为5.10或以上版本;系统功能:支持访问控制、安全审计、网络介入鉴别等功能;4.2支持RAF、CESM、ROMS等软件;4.3提供内核内存泄漏分析工具,包括PAGE、SLAB、LRU内存等的跟踪分析;提供产品官网相应功能截图或产品制造商官网产品技术白皮书该功能证明截图,同时提供官网链接地址;4.4支持进程句柄监控、进程退出(sigkill)信号监控和进程自愈等功能;支持D状态进程监控自愈处理能力及信号量死锁信息导出;4.5兼容以下编译器、数学库、并行环境:GNU编译器,支持C/C++、Fortran77/90;Intel编译器,支持C/C++、Fortran77/90;MKL、ACML、BLAS、LAPACK、ScaLAPACK、FFTW等;OpenMP并行环境:OpenMPI、MPICH2、MVPAICH2等MPI并行环境(支持IB/OPA/以太网);1台3AI计算节点21.产品规格1.1CPU规格:1.1.1CPU:配置不低于2颗至强银牌4310(2.1GHz/12-Core/18MB/120W);1.2GPU规格:1.2.1GPU:配置2块RTX4090;1.3主板规格:1.3.1主板支持的最大内存容量:16/32个DDR4内存插槽,最高3200MT/s;1.3.2主板内存槽数量:不少于32个;1.3.3主板PCIe插槽数量:支持多种网络扩展能力支持OCP3.0网卡-2个FLEXIO插卡槽位分别支持2个OCP3.0网卡,支持按需选配;支持热插拔;1.4内存规格:1.4.1内存数量:不小于16个;1.4.2内存规格:配置不低于512GBDDR4-3200内存;1.4.3内存通道:支持多个内存接口通道;1.5存储规格:1.5.1硬盘类型:配置2块480GSSD;1.5.2硬盘实配容量:配置不低于2块固态盘480G;1.5.3硬盘接口类型:支持多种不同的硬盘配置,硬盘支持热插拔:最大支持45个2.5英寸硬盘,或支持34个全NVMeSSD可配置2个M.2SSD硬盘;1.6RAID卡规:1.6.1RAID卡支持的SAS接口数:不小于1块,2G缓存RAID阵列卡;1.7网络规格:1.7.1独立网卡接口类型:配置不低于1块2端口万兆以太网光接口卡(含光模块),1张单端口HDR100GIB网卡;1.8电源规格:1.8.1电源冗余模式:电源模块按1+1冗余;1.8.2电源模块数量:2块;1.8.3电源功率:单块1500W;2.功能要求:2.1.1故障DIMM标识隔离(FailedDIMMIsolation)单颗粒数据纠错(SDDC);内存巡检(MemoryDemandandPatrolScrubbing);内存地址奇偶检测保护(MemoryAddressParityProtection);内存过热调节(MemoryThermalThrottling);内存Rank冗余热备(MemorySparing);内存镜像(MemoryMirroring);设备标记(DeviceTagging);数据加扰(DataScrambling);2.2安全功能2.2.1功能:支持支持基于Kerberos协议的用户认证管理机制,基于芯片可信根实现固件启动前的完整性校验,支持TLS1.2、TLS1.3版本,支持SNMP功能及SHA256/SHA384/SHA512鉴权和AES256加密算法;2.3存储功能:2.3.1支持2*M.2SATASSD,支持硬RAID1,支持免开箱热插拔;2.4管理功能:2.4.1支持PCIe标卡UCE故障精准告警功能;2.4.2支持中文BIOS界面;2.5操作系统功能:2.5.3支持RAF、CESM、ROMS等软件;2.5.4提供内核内存泄漏分析工具,包括PAGE、SLAB、LRU内存等的跟踪分析;2.5.5支持进程句柄监控、进程退出(sigkill)信号监控和进程自愈等功能;支持D状态进程监控自愈处理能力及信号量死锁信息导出;2.5.6兼容以下编译器、数学库、并行环境:GNU编译器,支持C/C++、Fortran77/90;Intel编译器,支持C/C++、Fortran77/90;MKL、ACML、BLAS、LAPACK、ScaLAPACK、FFTW等;OpenMP并行环境:OpenMPI、MPICH2、MVPAICH2等MPI并行环境(支持IB/OPA/以太网);2.6安全特性:2.6.1支持加电密码、管理员密码、TPM2.0、安全面板、安全启动、开盖检测等安全特性;1台4IB交换机1、配置≥40个200GIB接口;2、支持冗余电源;3、提供配套所需100GIB线缆;1台5集群调度软件1.1与计算节点同一品牌1.2同时提供B/S和C/S架构功能,可以通过浏览器访问,也可以通过客户端访问;支持中文图形化界面,提供统一的访问登录门户;1.3支持通内部集成webSSH登录或者使用第三方登录软件putty,Xshell登录集群;1.4智能管理系统需具有集群管理功能,实现对集群节点的统一监控管理、作业调度及应用特征分析功能,提供Web和cmd界面;1.5提供基于应用门户的文件上传、下载功能,并支持同时上传和下载多个文件和文件夹;支持拖拽式操作;支持通过界面对个人文件夹数据文件进行复制、移动、删除、重命名、压缩、解压缩等操作;1.6可以实时查看并发会话数量,用户长时间不在线时可以自动断开会话;用户可以重新进入断开的会话,可以注销/终止正在连接的会话;1.7支持集成Slurm、OpenPBS调度器,支持多架构CPU、GPU等计算资源的调度功能,支持CXL内存扩充资源调度;系统支持通过裸金属及Docker镜像运行HPC容器作业;1.8支持对HPC和AI作业的混合调度,提供主流AI框架镜像,包括Tensorflow、Caffe、pytorch等的支持,兼容开源镜像和用户自定义镜像;1.9提供应用模板功能,集成常用应用的作业模板,支持用户动态集成应用模板,允许用户自定义应用参数;1.10可以对计算任务查看结果、删除、重新提交、取消作业等操作;提供可视化查看作业输出功能,查看作业输出结果,查看作业工作目录及数据文件;1.11支持监控集群CPU、GPU、内存、存储等资源的利用状态;支持服务器CPU、功耗、温度TOP显示;支持作业状态、节点状态显示;1.12支持调度器的节点、队列、作业等信息的实时监控;支持GPU的型号、利用率、显存、功耗、温度等信息的实时监控;支持用户按需调整采集指标及显示格式;1.13支持用户自定义告警策略,屏蔽规则、事件转告警、告警次数及告警时间间隔;提供邮件、钉钉等告警方式;1.14提供查询所有告警的总览和详细信息,包括告警统计、告警源TOP10和告警TOP10等信息;并为您提供针对告警的操作接口,包括自动刷新、设置屏蔽规则、清除、导出、定制查询项;1.15支持以热图形式展示集群各节点的CPU利用率、GPU利用率、内存利用率、网络利用率、作业运行数量等指标的展示;1.16支持硬盘、内存的故障预测及告警;支持故障预测联动集群管理软件进行故障节点隔离,故障解除后恢复;可设置每日执行时间、最大下电节点数量;1.17管理员可进行集群用户/用户组的创建,显示,修改和删除;进行账户的管理,包括账户的创建,显示,修改和删除;1.18提供直观的物理视图,如实展现机柜、服务器、液冷等设备的物理分布和相对位置关系,可以直接依据监控视图查找物理设备;支持按预定义或自定义的角色分组展现服务器状态信息,以及相关联的告警信息;支持按数据中心维度显示3D模型图;1.19支持预置应用优化模板参数,支持调度该应用作业时,自动生效模板参数,作业完成后,恢复参数;支持用户选择是否启用应用加速;支持管理员自定义应用优化参数模板、批量删除操作;1.20支持无需指定队列提交作业,调度器自动匹配最短排队时间队列,功能开关可配置;支持长时间排队作业重新自动选择队列,排队时间可配置;1.21实时采集和显示实际浮点计算性能、实时内存带宽、代码执行效率、向量化比例、最后一级缓存失效比率等微架构级性能数据;能够集成PBSPro、LSF、SLURM、SGE等作业调度系统,后台自动收集相应作业对应节点的应用特征数据,以作业为单位存储成独立的特征文件,特征文件采用非明文格式,保证数据安全;1.22采用C/S架构保证系统性能,关键性能指标(CPU、内存、磁盘、网络)采集间隔可设置,要求达到1秒,且整机负载低于0.1%;1套6服务器负载均衡1.1基本规格:1.1.1标准1U设备,配置单电源;1.1.2配置≥6个千兆电接口,≥1个网络扩展插槽(可额外扩展千兆电口/光口、万兆光口);1.1.3配置≥64GBSSD硬盘存储;1.1.4具备服务器负载、链路负载、全局负载、内容交换、应用加速、四层防火墙、七层安全防护等功能;1.1.5提供三年系统升级服务和三年原厂标准硬件维保服务;1.1.6在同时开启应用交付、链路负载策略的情况下,整机吞吐量≥5.6Gbps,最大并发连接数≥350万;1.2功能要求1.2.1单一设备即可同时具备包括链路负载均衡、服务器负载均衡,全局负载,应用加速,智能DNS,单边加速、SSLVPN、IPSECVPN、虚拟化等功能,无需额外购买相应授权;1.2.2支持轮询、加权轮询、最小连接数、加权最小连接数、源ip哈希、源ip+端口哈希、目的IP哈希、动态就近性、最小流量、最小延时、最小抖动、最小丢包率、带宽比例、带宽剩余率等链路负载均衡算法;1.3链路负载1.3.1支持业务的带宽保障:在链路拥塞时,支持对指定业务分配优先级,高优先级的业务优先处理,可以实现对指定业务的带宽保证,链路空闲时,所有业务可以任意使用带宽,链路拥塞时,可保障指定业务使用带宽;1.3.2支持DNS透明代理功能,可基于负载均衡算法代理内网用户进行DNS请求转发,避免单运营商DNS解析出现单一链路流量过载,平衡多条运营商线路的带宽利用率;DNS透明代理策略支持域名本地解析,可将发布的域名解析成真实服务器地址,实现本地快速访问;1.3.3支持根据用户实时访问情况,动态探测每条链路到用户访问服务的的目标可达性,及延迟信息;并计算出最佳访问链路;并且随着链路质量的变化,可自动调整重新选择最佳发送链路;1.3.4支持应用路由,在线视频,P2P下载,电子商务,视频会议等应用的检测识别,可将相应流量分配到期望的目标链路;1.4服务器负载1.4.1支持源IP、目的IP、Cookie、HTTP自定义头域、SSLSessionID、SIPCall-id、、Radius、HTTPURL、源IP+源端口等多种会话保持机制;支持跨服务、跨虚拟服务、跨服务池的会话保持;1.4.2支持自定义方式进行服务器智能恢复,包括但不限于服务器进程重启、服务器重启等,支持基于业务的状态检查,允许用户自定义检查数据流使之贯穿整个业务系统,允许用户设置GET\POST方法模拟客户提交内容,并自定义服务器返回数据检查点来判断业务系统是否工作正常;1.5应用加速1.5.1支持TCP连接复用,减少服务器侧的TCP新建压力,支持HTTP高速缓存,将频繁访问的页面元素缓存在设备本地,由负载均衡器代服务器应答;1.5.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论