智能计算 超算互联网 参考架构 征求意见稿_第1页
智能计算 超算互联网 参考架构 征求意见稿_第2页
智能计算 超算互联网 参考架构 征求意见稿_第3页
智能计算 超算互联网 参考架构 征求意见稿_第4页
智能计算 超算互联网 参考架构 征求意见稿_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1智能计算超算互联网参考架构GB/T37988—2019信息安全技术数据安全能力成熟度3.13.23.3超算中心sumpercomputingc具有超算资源的算力中心,可以接入到超算互联服务3.43.5在超算互联网平台上注册并购买资源的组织3.623.7在超算互联网平台开发应用软件并对外提供服务的组织或个3.84缩略语API:应用编程接口(ApplicationProgrammingInterface)BPMN:业务流程建模标注(BusinessProcessMoCPU:中央处理器(CentralProcessingDCU:深度计算处理器(Deep-learningComputingUFPGA:现场可编程门阵列(FieldProgrammGPU:图形处理器(GraphicsProcessingULDAP:轻量级目录访问协议(LightweightDirectoMLU:机器学习处理器(MachineLearningUnit)MPI:并行程序通讯协议(MessagePaNIS:网络信息服务(NetworkInformationServicNPU:神经网络处理器(NeuralProcessingUnit)SaaS:软件即服务(SoftwareasaSLURM:简易Linux资源管理工具(SimpleLinuxUtilityforResourceManagTOSCA:云应用拓扑与编排规范(TopologyandOrchestrationSpecificationforCApplications)5参考架构超算互联网依托超算互联平台,通过角色-活动-功能的三层组织为生态系统中的各类参与者提供按需服务与统一管理,实现各超算中心独立资源的高效共享为构建超算互联网生态(见附录A),超算互联网以资源层、核心层、服务层、应用5.2总体架构3超算互联网的总体架构如图1所示,以应用层、服务层、核心层、资源层、跨层为功能架构核心内行中的角色/子角色,通过执行具体活动来体现具体功能,其功能取决于超算互联网的具体实现策略、4度等功能,向上支撑用户的核心服务、交易、管理等功跨层:包括统一的运营服务体系、运维服务体系以及支撑超算互联网的安全体系等内容。6.2功能描述软件资源指部署于超算互联网的各类支持MPI的并行软件、应用软件、推理训练框架、模型、工具5b)提供多种资源接入方式,如代理、API方式c)应支持任务执行过程的跟踪,包括异常监测a)计算资源的基本管理能力,包括计算资源创建、分配、b)存储资源的基本管理能力,包括存储资源创建、分配、配置等;c)网络资源的基本管理能力,包括网络创建、d)应用软件资源的基本管理能力,包括软件资源打包、e)数据资源的基本管理能力,包括数据共享6a)具备针对算力、应用、软件、存储、数据、模型、服务等多种类型资源的计量计费能b)支持根据运营策略定义各类产品及服务的计费模型;c)支持按照资源规格计费、按量计费、按需计费等a)支持命令行、批处理、交互式等多种方式c)支持作业运行状态查询,包括但不限于运行、排队、挂起b)应支持用户账号管理功能,包括创建、应用封装支持用户根据不同的体系架构选择合适的算力中心,根据封装规范将应用软件封装为用统一认证负责平台与算力中心间的用户认证,统一c)宜具备单点登录能力,实现平台与多中心系统之7b)主机服务,以虚拟节点形式提供服务;8b)提供人工智能和容器服务,如文本语音分析、大模型、自动驾驶等;a)支持模型开发,提供相关的开发与测试环境,实现模型的快速开发、测试、上线与部社区服务为用户提供技术交流、供需对接等服务能力,应符合下b)具备社区用户上传内容、数据、文件、模型等功能;a)提供线上开发环境,包括开发框架、9接口服务提供对超算互联服务各类服务的封装以及对外服务接口,要求如b)应支持以API的形式,对用户提供超算互联网平台各类服务能力;c)宜支持用户在混合云场景下,远程弹性接入用户究、地震预测等应用提供强大的算力支持和高效的数据处理与分析其他c)支持多种编排模型,如TOSCA模f)支持基于角色的访问控制,确保不同用户角色只能访问其权限范围内的数c)建立用户投诉渠道,并对用户的投b)应支持定义和管理服务级别协议;a)定义各类资源、数据、软件、模型等的产品化标准及流程,如规格、b)支持对算力资源、网络资源、存储资源、数据资源等实时监控和可视化管理;c)支持通过调配等手段平衡各算力中心的资源使用率,确保整体e)支持对应用和作业占用资源情况进行监控,包括CPU负载、内存使用率、存储利用率、网络流a)建立支撑程序开发与运行的环境,及时扩充环境所c)支持敏感数据传输和存储加密,防止数据泄a)应对超算互联网平台各类服务进行性能监测,并保留性能监b)应及时针对性能监测情况,发现平台服务性能瓶颈,提出优化方案;b)通过冗余设计和数据备份等措施,确保系统在问题发生时能够继续运行;c)支持日志查询功能,包括用户行为日志、系统运行日志、网络运行日志、资资源监测支持通过多种途径收集算力中心的资源运行情况,实现异常告a)各中心应监测设备、应用、服务的运行状态,包括计算/网络/存储等资源占用信a)支持网络边界访问控制,并对超算互联网的业务流量检查,防止未授权的恶意访b)支持网络边界入侵检测和防御,并对计算节点和业务进行攻击监控;c)支持定义用户访问应用策略,仅授予管理用户所b)商户的子角色包括资源提供者、资源代理者、应用开发者;c)协作者的子角色包括运维服务者、运营服务者、平台监管者。7.2客户者提出定制化需求,反馈资源的使用问题及跟踪解决,并对超算资源质量进行评价。b)按销量、评分等对超算互联服务平台商品排序;b)商品提交购买,形成订单;b)所购买超算资源的运行状态监控及问题处理对接窗口;c)所购买超算资源用户与商户之间的沟通b)针对所购买的资源交付时效性、故障率、c)对违约资源及服务的赔偿方案与商户进行沟通。a)搜索及下载平台上应用的安装包;任务运行是指使用超算互联网平台上提供的应用、支持MPI的并行程序、工具软件等,准备好软件b)反馈商户的服务质量;a)评价应用程序的质量;7.3商户包括资源管理、资源定价、订单管理、超算互联网服务反馈、超算互联网问题投诉。a)在商店进行资源上架;b)订单收费模式的确定;a)对平台的稳定性及服务质量进行反馈;a)对平台提出投诉;应用开发是指利用超算互联平台和各中心提供的开发环境、支持MPI的并行程序、工具软件等,进e)将开发成果在测试环境进行测试运存储、网络资源及其他资源的限额,如果超过了资b)配置应用使用资源的参数及限额;应用服务反馈是指对超算应用开发过程中平台的服务效果进行反馈的活动,有利于规范超算互联a)反馈运营服务者的服务质量问题;),a)从资源提供者处购买资源;资源管理是指资源代理者根据自己的定义,经过资源整合得到的技术产品和技术服务通过超算互超算互联网服务反馈是指资源代理者对超算互联网平台提供的服务质量及其他参与者的行为进行a)对平台的稳定性及服务质量进行反馈;7,4协作者运营服务者负责确保超算中心的资源开发、管理、配置和支持服务的高效运作。运营服务者相关角色活动包含资源注册、资源配置、资源注销、算力中心升级管理、资源a)在平台上填写注册信息和配置文件(主动);c)查看平台收到的中心发起的资源注册请求;b)配置资源池和节点,包括规模、权限、队列等信息。a)在平台上填写注销信息和原因(主动);c)查看平台收到的中心发起的资源注册请e)检查待注销算力资源池是否有任务在运超算中心软件升级管理是指接收超算互联服务平台发送的升级请求,超算中心升级管理者验证升超算资源服务支持旨在为超算中心的用户提供技术支持,并通过收集用户反馈,持续提升超算中b)协助用户移植和部署应用程序,提高应用性能;c)收集并分析用户反馈,向开发团队提供改进建a)监控平台运行状态,及时发现并处理异常情况;b)监控平台系统的页面和各接口响应情况,及时发现性能问题并处理异常情况;a)监控平台计算、存储、网络各项资源使用情况;c)动态调整资源分配,优化任务调度和资源调度;故障管理与处理是指快速响应和解决平台运行过程中的各类故障,保障系统的高可用性和任务的a)迅速发现并定位系统故障的根源;b)执行故障修复操作,确保系统恢复正常运行;b)实时监控平台的安全性,检测潜在的安全威胁和攻击行为;c)定期扫描和修复平台软件和系统中的安全漏洞;d)制定和执行安全事件响应计划,快速应对安全事件;c)提供实时支持,确保用户正常使用平台d)收集用户和商户反馈,持续改进和优化运维流平台监管者是超算互联网平台的监理者,其以独立的第三方身份对超算互联网平台各方的行为进b)对上述日志中的信息进行标准化处理,发现安全漏洞、异常事件等问题;a)获取商户收到的服务评价及评价来源数据;问题投诉仲裁是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论