版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
校园决策分析平台计算资源建设需求一、设备清单序号设备名称建设内容数量(台)1※高性能服务器采购一批高密度高性能服务器用于扩容校园决策分析平台的计算资源池;用于大学校园各项数字化应用系统的应用计算资源保障;服务器需配置虚拟化软件和新购一套校园虚拟化资源管理平台。182一卡通数据库服务器采购2台服务器用于平行替换已经过期的一卡通数据库服务器,确保大学校园决策分析平台中一卡通数据库服务运营通畅和保障。23一卡通应用虚拟化服务器采购两台虚拟化服务器,专门用于大学校园决策分析平台中的一卡通系统所涉及的各项应用支撑。24GPU算力服务器采购2台高性能服GPU算力服务器,用来支撑大学校园决策分析平台中设计相关视频及行为分析等AI辅助计算资源。25数据中心交换机采购2台48口万兆光口、8口40G/100G的数据中心接入交换机用于大学校园决策分析平台中各服务器的网络及数据访问互联互通要求。2二、设备技术参数序号设备名称技术参数1高性能服务器1、规格:不低于2U机架式服务器,要求本次投标机型硬件需要支持vLCM功能,便于管理员都可以通过vLCM来管理主机。2、芯片组:IntelC621A芯片组,支持Intel至强可扩展处理器。3、主要指标:配置2颗InteLIceLakeXeonSilver系列20C2.3GHzCPU或更高,最大可支持至40核270W处理器;配置20*32GBTruDDR43200MHz内存或更高,主机实配32条内存插槽;配置双OCP3.0网卡插槽,配置2块万兆OCP网卡含光模块,配置1块4口千兆电PCIe网卡。配置2块单口不低于16GbHBA卡。实配2个输出功率大于等于700W电源,支持1+1冗余热插拔,支持336V高压直流。4、硬盘:配置2*480GBSSD热插拔固态硬盘,最大可支持28个硬盘扩展,支持前置直连8个U.2NVMeSSD硬盘,支持内置两个M.2且支持RAID0/1。5、配置1块12GbSASRaid卡,支持1/5RAID级别。6、I/O扩展:最大可支持10个PCIe插槽,包括两个专用的OCP插槽和8个PCIe4.0标准插槽。
7、冷却系统:冗余热插拔系统风扇。
8、可靠性:由于系统的关键性,避免硬件引起的重大停机,投标服务器型号产品具备较高可靠性。投标产品应通过国家标准GB/T9813.3-2017的振动检验测试和国家标准GB/T9254-2008的辐射骚扰检验测试。9、虚拟化软件:要求配置适用于本服务器同的正版VMwarevSphere标准版许可三年技术支持服务虚拟化软件授权,授权数量应适用于本次投标的服务器产品,禁止使用盗版、试用版、部分正版等行为;能与学校原有的虚拟化平台向下兼容,可转移至其他虚拟化集群。同时本次系统集成共计需要提供一套正版的VMwarevCenter8.0来集中管理VMwarevSphere主机;提供2-4人次的VMwarevSphere认证培训服务。
10、安全认证:要求符合IT产品信息安全认证,要求投标产品带外管理组件通过EAL4级认证,提供IT产品信息安全认证EAL4级认证证书;投标产品应通过国家标准GB16796-2009的高温和低温工作检验测试和国家标准GB16796-2009的盐雾检验测试。11、配置5年7x24x2小时保修服务。大市范围内2小时上门服务,原厂上架安装、系统安装服务,原厂3年故障硬盘免回收服务,原厂硬盘数据丢失拯救服务;为保证设备的可靠性服务,签合同时要求提供原厂针对本项目的售后服务承诺函原件(含以上服务内容),在国内拥有备件库。2一卡通数据库服务器1、规格:不低于2U机架式服务器,和高性能服务器同品牌。2、芯片组:Intel专用服务器芯片组,支持Intel至强第三代或者第四代产品,最大可支持单机扩展4路处理器。3、主要指标:配置至少2颗IntelXeon第3或4代可扩展处理器,每处理器要求核心数18C或更高,基础主频2.5GHz或更高,最大可扩展4个处理器。配置8*32GBTruDDR43200MHz内存或更高,主机实配48条内存插槽。配置1个OCP3.0网卡插槽,配置1块2口万兆OCP网卡含光模块,配置1块4口千兆电PCIe网卡。配置2块单口不低于16GbHBA卡。配置4个或以上输出功率大于等于1100W的模块化自适应白金级电源,支持N+N冗余热插拔。4、硬盘:配置2*480GBSSD热插拔固态硬盘;4块6T3.5寸NL-SAS盘,盘速不低于7.2Krpm。支持前置直连8个U.2NVMeSSD硬盘,支持内置两个M.2且支持RAID0/1;提供ANYBAY技术可切换,SAS/SATA/U.2等硬盘不用更换背板最大可支持28个NVMe硬盘及VROC阵列;5、配置1块12GbSASRaid卡,支持1/5RAID级别。6、I/O扩展:最大可支持15个PCIe插槽,包括一个专用的OCP插槽和14个PCIe3.0标准插槽。7、冷却系统:冗余热插拔系统风扇。8、可靠性:由于系统的关键性,避免硬件引起的重大停机,投标服务器型号产品具备较高可靠性;投标产品应符合国家标准GB/T17626.2-2006的静电抗扰度检验测试和国家标准GB/T17626.5-2008的浪涌防雷检验测试。9、安全认证:通过噪声A级测试。10、配置5年7x24x2小时保修服务。大市范围内2小时上门服务,原厂上架安装、系统安装服务,原厂3年故障硬盘免回收服务,原厂硬盘数据丢失拯救服务;为保证设备的可靠性服务,签合同时要求提供原厂针对本项目的售后服务承诺函原件(含以上服务内容),在国内拥有备件库。3一卡通应用虚拟化服务器1、规格:不低于2U机架式服务器,要求本次投标机型硬件需要支持vLCM功能,便于管理员都可以通过vLCM来管理主机。和高性能服务器同品牌。2、芯片组:IntelC621A芯片组,支持Intel至强可扩展处理器。3、主要指标:配置2颗IntelXeonsliver4310(12核,2.1GHz,18MBL3Cache)或更高CPU。配置12*32GBTruDDR43200MHz内存或更高,主机实配32条内存插槽。配置双OCP3.0网卡插槽,配置2块万兆OCP网卡含光模块,配置1块4口千兆电PCIe网卡。配置2块单口不低于16GbHBA卡。配置2个输出功率大于等于700W80+电源,支持1+1冗余热插拔,支持336V高压直流。4、硬盘:配置2*240GBSSD热插拔固态硬盘,最大可支持28个硬盘扩展,支持前置直连8个U.2NVMeSSD硬盘,支持内置两个M.2且支持RAID0/1。5、配置1块12GbSASRaid卡,支持1/5RAID级别。6、I/O扩展:最大可支持10个PCIe插槽,包括两个专用的OCP插槽和8个PCIe4.0标准插槽。7、冷却系统:冗余热插拔系统风扇。8、可靠性:由于系统的关键性,避免硬件引起的重大停机,投标服务器型号产品具备较高可靠性;投标产品应通过国家标准GB/T9813.3-2017的振动检验测试和国家标准GB/T9254-2008的辐射骚扰检验测试。9、虚拟化软件:要求配置适用于本服务器同的正版VMwarevSphere标准版许可三年技术支持服务虚拟化软件授权,授权数量应适用于本次投标的服务器产品,禁止使用盗版、试用版、部分正版等行为;能与学校原有的虚拟化平台向下兼容,可转移至其他虚拟化集群。10、安全认证:要求符合IT产品信息安全认证,要求投标产品带外管理组件通过EAL4级认证,提供IT产品信息安全认证EAL4级认证证书;投标产品应通过国家标准GB16796-2009的高温和低温工作检验测试和国家标准GB16796-2009的盐雾检验测试。11、配置5年7x24x2小时保修服务。大市范围内2小时上门服务,原厂上架安装、系统安装服务,原厂3年故障硬盘免回收服务,原厂硬盘数据丢失拯救服务;为保证设备的可靠性服务,签合同时要求提供原厂针对本项目的售后服务承诺函原件(含以上服务内容),在国内拥有备件库。4GPU算力服务器一:硬件规格,每台服务器的硬件技术要求如下:1、规格:不高于3U机架式服务器,和高性能服务器同品牌。2、芯片组:IntelC621A芯片组,支持第三代Intel至强可扩展处理器。3、主要指标:配置2颗IntelIceLakeCPU,XeonGold系列CPU16核,标称主频2.9GHz或更高。配置16*32GBTruDDR43200MHz内存或更高,支持32根内存插槽;支持IntelOptane内存。配置8个双宽GPU安装槽位,接口对应PCIe4.0x16带宽;要求支持4个SXMA100NVLinkGPU;配置4块NvidiaA4048GBGPU卡。配置1块双口10/25GEOCP网卡含10Gb光模块,2个1G网卡。配置1块双口16GbHBA卡。配置不少于4个输出功率大于等于2000W80+电源,支持N+N冗余热插拔。4、能支持配置2.5寸硬盘托架、3.5寸硬盘托架、7mm硬盘托架,并且支持不少于6个NVMeSSD,配置4块960GBSSD。5、阵列卡:配置1块4GB缓存Raid卡。6、冷却系统:要求GPU散热优先设计,避免GPU温度过高;要求GPU散热位置位于CPU、内存之前,冷空气首先经过GPU进行散热,提供投标对应产品图片;支持通过内循环水冷系统冷却GPU卡,以支持更高功耗GPU环境,提供水冷散热模块图片;双转子风扇,N+1冗余。7、I/O扩展:最大可支持4个用于非GPU的PCIe插槽;要求包括一个专用的OCP插槽,支持配置为前部PCIe插槽方便线缆管理。8、故障定位:支持针对处理器,内存,内部存储,风扇,电源,阵列卡等关键部件的故障预告警机制;支持针对风扇,电源的LED故障告警指示灯。9、服务器稳定性:由于系统的关键性,避免硬件引起的重大停机,投标服务器型号产品具备较高可靠性10、稳定性认证:抗干扰性,正常工作承受的浪涌(冲击)抗扰度≥4kV(线线/线地);正常工作所承受的连续波辐射骚扰抗扰度≥10V/m;正常工作所承受的工频磁场抗扰度≥10A/m。11、可靠性认证:所投服务器产品平均无故障时间MTBF值不低于150000小时。12、安全数据擦除:为保证数据安全,服务器原厂商需提供可兼容带有托架的服务器和存储设备硬盘的数据擦除服务。提供电压监控、场强监控、增压补偿三种监控措施,确保消磁的可靠性和安全性。可通过消磁设备日志进行消磁记录和查看擦除信息,提供相关证明材料并安排培训。13、服务要求:配置5年7x24x2小时保修服务。大市范围内2小时上门服务,原厂上架安装、系统安装服务,原厂3年故障硬盘免回收服务,原厂硬盘数据丢失拯救服务;为保证设备的可靠性服务,签合同时要求提供原厂针对本项目的售后服务承诺函原件(含以上服务内容),在国内拥有备件库;提供2-4人次GPU操作和管理软件使用的培训服务。二、配置GPU作业集群管理调度系统一套,要求具备以下功能:1、系统基础要求:集群软件包括集群管理软件,集群监控软件,作业调度软件,分布式文件系统软件等功能。2、提供一个统一的图形界面来简化高性能或AI计算的操作:图形化界面分为管理员界面,用户界面和操作员界面;提供对应界面截图并加盖公章。3、集群管理提供了集群硬件系统发现,硬件配置和控制,远程开机/关机,远程登录,远程查看硬件警告信息;提供并行shell和并行拷贝,支持查看集群操作日志。4、系统主页提供集群状态的监控和查看:集群cpu使用率,内存使用率,硬盘使用率,网络吞吐,集群节点开关机和忙闲状态,集群队列状态,集群作业状态等。5、系统支持服务器各种监控指标:load,cpu使用率,内存使用率,硬盘使用率,网络吞吐,温度,能耗等。6、支持GPU监控:实时显示集群中节点GPU的使用率、GPU内存使用率、GPU温度等;提供对应界面截图。7、系统提供各种监控视图:系统提供了物理机架视图,视图以机架物理视图的方式显示机架中的节点。视图形象的以节点颜色的深浅表示监控指标数值的高低,点击视图的一个节点,可以查看节点详情。系统提供热力图,直观地通过颜色深浅表示节点组中所有节点监控指标的实时值的大小,系统支持在热力图上根据值区间进行节点的过滤。节点详情视图,节点详细列出了节点的静态配置信息(cpu,内存,硬盘,节点名等);节点详情显示节点各个监控指标的历史趋势图;节点详细列出了节点正在运行的作业列表;节点详细列出了节点的当前告警记录。8、系统提供了作业监控页面,可以直观查看集群中正在运行,等待以及结束的作业。作业详细信息包括:作业名,提交时间,结束时间,CPU数,CPU使用时间,GPU数,GPU使用时间,用户名,作业状态,队列等。9、系统支持自定义各种的告警策略,通过对监控指标(load,cpu使用率,内存使用率,硬盘使用率,网络吞吐,温度,能耗)的监测来触发告警,生成告警记录。告警记录包括告警事件,告警时间,告警节点,告警等级,状态等;灵活的告警触发机制,支持多种告警通知方式(邮件、短信、微信);提供实时和历史告警记录的查询,确认,解决,删除等操作,支持批量的操作。10、作业调度:支持Slurm调度器;队列管理:包括队列创建,显示,修改,移除;队列资源管理:包括添加新节点到队列,设置节点在队列中属性,显示队列中节点状态,节点的健康状态检查等;调度策略:支持先进先出,公平共享,回填,抢占,资源预留,节点访问限制等多种策略,并支持自定义策略。11、用户和账户管理功能:支持搭建LDAP用户管理系统,提供web界面进行用户/组管理,包括集群用户/用户组的创建,显示,修改和删除;支持与现有用户系统的集成,将现有LDAP账号导入软件;支持通过web界面进行账户的管理,包括账户的创建,显示,修改和删除;提供对应界面截图。12、AI作业:在同一个集群中通过统一的资源调度,可以同时运行HPC作业和AI作业。平台支持多种AI计算框架,平台支持TensorFlow、Caffe、MXNet、IntelCaffe、PyTorch等AI框架。13、平台支持集群资源统一调度,支持多用户,多作业同时运行,通过调度器来给作业动态分配资源,支持单节点单GPU,单节点多GPU,多节点多GPU以及多节点GPU,以及CPU/GPU混合等多种调度方式;提供对应界面截图。14、支持分布式训练,针对平台支持的各种AI框架(TensorFlow,Caffe,MXNet,Intel-Caffe、PyTorch等),支持AI模型的多机分布式训练。软件提供的多机分布式的模板可以方便地提交分布式训练的作业。15、基于容器实现对多种框架和一个框架多种版本的支持。比如支持TensorFlow,Caffe,MXNet、PyTorch等多种AI框架,支持TensorFlow1.9,1.10等多个版本。用户在平台上能创建和使用自定义镜像。16、基于Jupyter的模型开发:系统自带Jupyter镜像,镜像里面除了Jupyter还自带常用的AI框架和库。通过平台可以创建Jupyter运行实例,并访问和使用Jupyter。Jupyter实例可以使用CPU资源也可以使用GPU资源。平台支持JupyterPython2,Python3和R等。平台支持Jupyter实例的持久化,实例可以操作共享存储上的文件和程序,在Jupyter实例中安装的软件包在下次启动后可以继续使用。17、作业监控和管理:AI平台支持实时查看AI作业运行状态和作业输出等,支持停止正在运行的作业,支持通过平台的web文件管理系统上传作业程序和下载作业运行结果。18、AIStudio支持端到端的模型训练:AIStudio提供了数据集管理,模型训练,模型发布端到端的支持,数据集管理:支持图片分类,物体识别,物体分割三种类型数据集的管理,提供在线标注工具,支持这三种类型数据集的在线标注。模型训练:AIStudio内置了图片分类、物体识别、物体分割用到的模型,用户不需要写程序,使用AIStudio内置的模型,发起一个模型训练。一个模型训练会发起多个并行作业,每一个作业对应一组超参,这样可以加快找到最好的一组超参。一个模型训练的不同作业的训练结果可以实时展示和比较。模型发布:从模型训练的结果中选择要发布的模型,模型发布在软件平台上,发布
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工作合同范例封面
- 网店授权品牌合同范例
- 预收款合同范例
- 夫妻双方婚后购房合同范例
- 学手艺合同范例
- 三年级上册数学教案-8.1 两、三位数乘一位数的复习丨苏教版
- 商店买卖合同范例
- 空调购销表格合同范例
- 全册教案(教案)北师大版四年级下册数学
- 第六章 第三节 弹力与弹簧测力计-(教案)2022秋八年级上册初二物理沪科版(安徽)
- 电影作品解读-世界科幻电影智慧树知到期末考试答案章节答案2024年成都锦城学院
- NB-T47003.1-2009钢制焊接常压容器(同JB-T4735.1-2009)
- 聚焦高质量+探索新高度+-2025届高考政治复习备考策略
- 惠州市惠城区2022-2023学年七年级上学期期末教学质量检测数学试卷
- 北京市西城区2022-2023学年七年级上学期期末英语试题【带答案】
- ISO45001-2018职业健康安全管理体系之5-4:“5 领导作用和工作人员参与-5.4 工作人员的协商和参与”解读和应用指导材料(2024A0-雷泽佳)
- 看图猜成语共876道题目动画版
- 小学二年级上册数学-数角的个数专项练习
- 曲式与作品分析智慧树知到期末考试答案章节答案2024年兰州文理学院
- 园林设施维护方案
- 特种设备使用单位日管控、周排查、月调度示范表
评论
0/150
提交评论