大规模数值计算与模拟平台建设需求_第1页
大规模数值计算与模拟平台建设需求_第2页
大规模数值计算与模拟平台建设需求_第3页
大规模数值计算与模拟平台建设需求_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大规模数值计算与模拟平台建设需求1.货物名称:大规模数值计算与模拟平台数量(单位):1套。2.采购标的需实现的功能或者目标,以及为落实采购政策需满足的要求:设备将用于解决工业与工程中遇到大规模数值计算、数学建模与数据分析。3.采购标的需满足的质量、安全、技术规格、物理特性等要求(技术指标要求):一、通用计算节点1.核心处理器:配置≥2颗高性能计算可扩展处理器,核心数≥192,线程≥384;2.内存要求:32GBECC4800内存≥32根;3.存储要求:2块480GB企业级SSD启动盘,960GSSD数据缓存硬盘≥2块,16TBSATAHDD数据盘≥6;4.接口要求:千兆网络接口≥4个,万兆光网口≥1(含光模块);5.电源:冗余满配,1600W及以上。6.二级缓存≥96MB流处理单元≥9000,DLSS3技术,单精度浮点性能≥60T,在4K分辨率的视频分析中能持续以100FPS运行。二、非线性计算节点1.核心处理器:配置≥2颗IntelXeon第三代Gold或Platnium可扩展处理器,单颗CPU核心数≥24,主频≥2.1GHz;2.内存要求:32GBECC4800内存≥16根,最大支持≥32根;3.存储要求:2块480GB企业级SSD启动盘,960GSSD数据缓存硬盘≥2块,8TBSATAHDD硬盘≥3块,支持不少于12块3.5寸硬盘或24块2.5寸硬盘;RAID卡高速缓存不低于2GB,支持RAID0/1/5/6;4.接口要求:千兆网络接口≥4个,万兆光网口≥1(含光模块);双宽PCIe4.0x16插槽≥8个,单宽PCIe4.0x16插槽≥4个;5.GPU卡:NVIDIAA4048GPCIeGPU卡或更高等级卡配置≥4块;6.管理特性:集成BMC管理模块,支持IPMI、KVMoverIP、虚拟媒体等功能,支持一键拓扑切换满足不同AI应用需求;7.电源管理模块支持本地+远程管控,自带状态显示屏;支持网络远程控制。支持广域网与局域网使用,远程监控端口电流、电压、功率、温度,能够支持总量监测超限预警;支持日志记录,支持定时开关,延时开关,时序开关设置和防雷设置;8.电源:冗余满配,1600W及以上;9.管理功能(1)支持3D数据中心设备详细信息展示,支持3D视图固定视角,3D视图、2D视图自由切换,支持数据中心缩略图功能;(2)支持对机房进行制冷分析及提高制冷优化建议(支持ASHRAE推荐温度、ASHRAE一级许可和ASHERAE二级许可三种规范进行分析。列出高温热点设备,并给出建议和提供优化方案);(3)7x24小时不间断基线监控,对于自有品牌偏离基线的设备能够分类告警(BMC版本告警、BIOS版本告警、BMC配置告警、BIOS配置告警);(4)支持基于无代理的OS自动化系统,支持文件分发、脚本执行、软件部署功能;10.虚拟化:预装虚拟化软件,用户可根据需要生成虚拟机,自主分配虚拟机的硬件资源;虚拟机系统包括WindowsServer、Windows10、Linux等。11.安全管理(1)具备统一漏洞修复、网络流量管理、终端软件管理、硬件资产管理以及各种报表和查询等功能;(2)支持基于源安全域、目的安全域、源用户、源地址、源地区、目的地址、目的地区、服务、应用、隧道、时间、VLAN等多种方式进行访问控制;(3)支持基于IP、用户、应用、时间的带宽管理规则;支持设置每IP最大、最小带宽及带宽配额管理,可通过优先级实现多应用的差分服务,并支持对剩余带宽进行基于优先级的动态分配;(4)支持禁用安全模式或者设置安全模式,具备集中修复,强制修复,自动修复功能。三、作业调度系统1、支持提供集群系统快速部署和管理,支持各个节点状态可视化监控,能够对节点运行进行动态监控和历史数据分析,包括上电时间、平均负载、CPU利用率、可用物理内存、磁盘空间,可直观的看到用户每个节点的使用情况;占用率以及网络通讯状态等信息通过web界面实时更新;集群用户账号统一管理统一建立,实现整体集群的概念。2、支持定义作业的优先级,提供先来先服务、优先级抢占、公平共享、节点资源独占等多种调度策略;作业调度支持多队列管理,各个队列可设置不同管理策略、根据用户作业的运行情况动态调整用户优先级;提供资源管理和作业调度的编程接口,支持批量作业的快速上传下载。3、具有作业调度可视化界面和普通HPC作业混合调度,需要提供license;能够在页面上对于现有节点进行相关管理,包括创建、更新、销毁等功能,支持作业的暂停、恢复、杀死、置顶/置底、断点续算、重新运行等操作。4、支持跨节点并行作业的动态安全设置,并行作业计算相关的节点ssh等安全设置仅在作业运行期间,对该作业生效。以增强系统的安全性。5、支持多级容错,包含系统级容错、作业级容错,即系统发生故障或作业因为偶然故障引起的作业失败时,该作业能被重新调度到其它机器上执行。6、实现门户与用户现有的身份认证系统集成,实现统一身份认证。7、用户作业数据在作业运行完成后默认存储,支持过期数据自动删除功能,以保证存储的有效利用,并具有在删除之前的自动提醒用户对重要数据进行备份功能。四、集群实验基础平台1.科学计算库:BLAS,ATLAS,LAPAC,KFFTW;2.并行计算环境:支持MPI1.2/2.0、MPIoverInfiniband、PVM并行环境,支持OpenMP,LAM,支持MPI与OpenMP的混合编程;3.并行文件系统:提供数据共享访问,统一账户空间,支持海量小文件读写,对大文件读写进行特殊优化,实现对所以计算节点和管理节点的文件统一映像;4.通用计算:Scilab包含有1700多个用于工程和科学应用的数学函数。有一个高级的编程语言允许访问高级数据结构,可以完全兼容MatLab,其内含的代码转换器能够方便的把Matlab代码转换为其专用代码;5.提供科学数据分析和2D/3D绘图工具,可以对数据进行平滑、各种曲线的拟合、绘图等操作,支持多种图形输出格式,交互式图形用户界;6.AI计算Portal,包含CAFFE1.0/2.0,TensorFlow,CuDNN,Pytorch,Keras;7.专用计算:JMP、SAS和Matlab,并发授权≥30;8.支持授权集中管理,管理员能够在网络选择一台或多台设备进行授权,并对其进行盘点,需能盘点设备上所有的硬件信息与安装的软件信息。以RTF、TXT格式导出。若某节点信息发送变化,能自动弹出变动提示,提醒管理员查看。能支持管理员多路监看,并设置切换监看及轮流监看的时间间隔。五、部署要求本次部署通用计算节点/非线性计算节点≥2/1。配套集所需全部光纤、其他辅材,柜内UPS配电,温湿度管控一体化,8KV接地防雷;满负荷运转下柜内温度能稳定控制在30度下;配电包含UPS输入、UPS输出、UPS维修旁路开关、防雷保护开关;IT输出回路数≥14;标配配电单元rPDU,规格≥32A输入,20路C13+4路C19输出;UPS输入电压范围为三相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论