版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能计算平台与存储器研究报告在物联网、大数据和人工智能的推动下,从交通运输、医疗保健到零售和娱乐等众多行业将走上转型之路,我们将其统称为Al计算时代。在以前的计算时代,大型机/小型机、PC/服务器和智能手机/平板电脑均受益于摩尔定律的进步,随着着2D微缩,产品的性能、功耗和面积/成本(也称为PPAC)得以同时提高。即使Al时代的各类应用正在蓬勃发展,但摩尔定律却放缓了脚步;因此,行业需要在2D微缩以外获得突破,以全新方式推动PPAC的提高。具体而言,我们需要新的计算架构、新材料、新构造(特别是节省面积的3D构造),以及用于芯片堆叠和异构设计的高级封装。人工智能时代的架构变化正在对逻辑和存储器产生影响,下图为人工智能时代推动半导体存储器发展的进程。我通过对现在常见的人工智能计算平台:阿里云的AI开发平台-机器学习PAI,华为云的AI开发平台-ModelArts,百度云的飞桨,科大讯飞的AIUUI。通过对4个平台的人工智能先进代表的平台进行配备和特点的理解,其中仅有华为云对云计算服务器设备有明确配备参数,因此我将着重对华为云鲲鹏、昇腾等的云存储器的配备进行查询,理解其特点,并对现在存储器将来发展做出叙述。4个平台各有其优势,华为云依靠华为强劲的科研能力,如今作为市场黑马,异军突起;而阿里云作为人工智能平台中其中布局较早,市场占有率较高;百度云的飞浆平台在自动驾驶等应用方面有较多经验,并且在多方面都有扩展应用;科大讯飞的AIUI是深耕的强劲智能语音开发平台,是国内乃至世界人工智能语音领域的领导。1、人工智能计算平台一、阿里云的AI发开平台以下图所示,阿里云的PAI的业务架构分为五层:基础设施层:涉及CPU、GPU、FPGA及NPU。计算引擎和容器服务层:涉及MaxCompute、EMR、实时计算等计算引擎及容器服务ACK。计算框架层:涉及Alink、TensorFlow、PyTorch、Caffe、MapReduce、SQL及MPI等计算框架,用于执行分布式计算任务。数据准备:PAI提供了智能标注,支持在多个场景下进行数据标注和数据集管理。模型开发和训练:PAI提供了可视化建模PAI-Studio、交互式编程建模PAI-DSW、云原生深度学习训练平台PAI-DLC及端到端自动学习PAI-AutoLearning,满足不同的建模需求。模型布署:PAI提供了云原生在线推理服务平台PAI-EAS和模型推理加速工具PAI-Blade,协助您快速地将模型布署为服务。同时,PAI提供了智能生态市场,您能够获取业务解决方案和模型算法,实现有关业务和技术的高效对接。阿里云的AI发开平台特点:1、丰富的机器学习算法PAI的算法都通过阿里巴巴集团大规模业务的沉淀,不仅支持基础的聚类和回归类算法,同时也支持文本分析和特性解决等复杂算法。2、支持对接阿里云其它产品PAI训练的模型直接存储在MaxCompute中,能够配合阿里云的其它产品使用。3、一站式的机器学习体验PAI支持从数据上传、数据预解决、特性工程、模型训练、模型评定到模型公布的机器学习全流程。4、支持主流深度学习框架PAI支持TensorFlow、Caffe及MXNet等主流的机器学习框架。5、可视化的建模方式PAI封装了典型的机器学习算法,含有下列优势:支持使用拖拽的方式搭建机器学习实验;支持使用内置的PAI-AutoML进行调参,实现模型参数自动探索、模型效果自动评定、模型自动向下传导及模型自动优化。6、一键式的模型布署服务PAI支持将PAI-Studio、PAI-DSW及PAI-Autolearning生成的训练模型一键式公布为RestfulAPI接口,实现模型到业务的无缝衔接。二、华为云的AI开发平台ModelArtsModelArts是一种一站式的开发平台,能够支撑开发者从数据到AI应用的全流程开发过程。包含数据解决、模型训练、模型管理、模型布署等操作,并且提供AI市场功效,能够在市场内与其它开发者分享模型。ModelArts支持应用到图像分类、物体检测、视频分析、语音识别、产品推荐、异常检测等多个AI应用场景,下图是ModelArts架构华为云的AI开发平台-ModelArts特点1、一站式开“箱”即用,涵盖AI开发全流程,包含数据解决、模型开发、训练、管理、布署功效,可灵活使用其中一种或多个功效。2、易上手提供多个预置模型,开源模型想用就用;模型超参自动优化,简朴快速;零代码开发,简朴操作训练出自己的模型;支持模型一键布署到云、边、端。3、高性能自研MoXing深度学习框架,提高算法开发效率和训练速度;优化深度模型推理中GPU的运用率,加速云端在线推理;可生成在Ascend芯片上运行的模型,实现高效端边推理。4、灵活支持多个主流开源框架(TensorFlow、Spark_MLlib、MXNet、Caffe、PyTorch、XGBoost-Sklearn、MindSpore);支持主流GPU和自研Ascend芯片;支持专属资源独享使用;支持自定义镜像满足自定义框架及算子需求。三、百度云的飞浆飞桨(PaddlePaddle)以百度数年的深度学习技术研究和业务应用为基础,集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体,年正式开源,是全方面开源开放、技术领先、功效完备的产业级深度学习平台。飞桨源于产业实践,始终致力于与产业进一步融合。现在飞桨已广泛应用于工业、农业、服务业等,服务210多万开发者,与合作伙伴一起协助越来越多的行业完毕AI赋能,下图为其使用场景概览百度云飞浆的优势:1、开发便捷提高效率飞桨深度学习框架采用基于编程逻辑的组网范式,对于普通开发者而言更容易上手,符合他们的开发习惯。同时支持声明式和命令式编程,兼具开发的灵活性和高性能。网络构造自动设计,模型效果超越人类专家。2、超大规模深度学习模型训练技术飞桨突破了超大规模深度学习模型训练技术,实现了支持千亿特性、万亿参数、数百节点的开源大规模训练平台,攻克了超大规模深度学习模型的在线学习难题,实现了万亿规模参数模型的实时更新。3、多端多平台布署的高性能推理引擎飞桨不仅兼容其它开源框架训练的模型,还能够轻松地布署到不同架构的平台设备上。同时,飞桨的推理速度也是全方面领先的。特别通过了跟华为麒麟NPU的软硬一体优化,使得飞桨在NPU上的推理速度进一步突破4、产业级开源模型库飞桨官方支持100多个通过产业实践长久打磨的主流模型,其中涉及在国际竞赛中夺得冠军的模型;同时开源开放200多个预训练模型,助力快速的产业应用四、科大讯飞的AIUIAIUI开放平台重要包含了语义技能(Skill)、问答库(Q&A)编辑以及AIUI应用(硬件)云端配备的能力,并为不同形态产品提供了不同的接入方式。现在有以下接入方式有,Android、iOS、Windows、LinuxSDK,基于HTTP合同的WebAPI,以及软硬一体的AIUI评定板(量产板)、讯飞魔飞智能麦克风,下图为AIUI产品框架。科大讯飞的AIUI特点:1、语音唤醒语音唤醒是指通过4-6个音节的唤醒词,将设备从不对外部声音进行识别的休眠状态唤醒为接受并识别外部声音的交互状态。讯飞的语音唤醒含有小尺寸,低功耗,高唤醒的特点。并且顾客可自定义唤醒词,单个设备最高支持8个唤醒词同时使用2、语音识别语音识别(ASR)是一种将人的语音转换为文本的技术。科大讯飞同时拥有中文、粤语、英语等21种语言/方言的识别引擎。3、语音降噪、回声消除、全双工交互语音降噪指减少环境噪音,提高人声辨识度,基于讯飞多麦克风阵列,AIUI在实现降噪的同时能够拟定唤醒的方向,并克制其它方向的人声。回声消除指产品扬声器发声(TTS或播放音频)时,能够不关闭产品麦克风的拾音功效,扬声器的回声能够通过讯飞的降噪算法消除,不送入语音识别引擎。全双工交互指在设备扬声器发声时,且不关闭麦克风的状况下,顾客能够打断设备的播放,进行语音识别和语义理解。4、语义理解语义理解(NLP)指将一句自然语言转化为计算机可读的构造化数据。语义理解也是AIUI的核心功效。5、语音合成语音合成(TTS)是指将文字信息转化为声音信息,给产品配上“嘴巴”。讯飞提供了众多极具特色的发音人(音库)供您选择。其合成音在音色、自然度等方面的体现均靠近甚至超出了人声。拥有中英粤多语种、川豫多方言、男女声多风格的选择,音量、语速、音高等参数也支持动态调节,同时提供定制专属讲话人。6、内容(信源)内容(信源)指语义理解后对客户真实有用的数据,例如天气具体状态,音乐的播放链接。AIUI技能商店中多数技能含有相对应的信源,在最后的构造化数据Json中体现为data字段。我们诚邀各类内容提供商与我们合作,涉及但不限于音视频资源、流媒体、新闻、自媒体、小朋友故事与游戏、股票违章查询等功效类资源,讯飞提供了多个合作方案,和内容提供商共享AI时代的流量红利。2、存储器配备与技术特点一、科大讯飞的AIUI配备MT8516开发套件是一款基于MTK平台MT8516解决器和科大讯飞环形6麦阵列构造的语音整体解决方案。另外还提供红外、串口、ZigBee等多个接口,小巧易扩展,搭载iFLYOS生态,提供海量内容服务与定制化接口,满足多个远、近场语音交互场景,下图为MT8516芯片框图与芯片信息。产品特性:1、远/近场拾音方案前端采用科大讯飞6麦克风阵列,能够实现家居场景5-10m左右的顾客指令音频拾取,通过新一代神经网络降噪算法对拾取音频进行解决,提供高品质降噪后音频给到后端,以保障唤醒、识别效果。2、噪声克制该功效基于科大讯飞6麦克风阵列中的声源定位和波束增强等算法特性,通过采集指令声源(控制设备的发音人)所在波束范畴内的声音,克制或者不解决其它波束所接受的声音,以提高采集声音的效果,为后续唤醒和命令词识别效果提供保障。3、回声消除支持顾客交互过程中,实现一次唤醒,多轮交互的控制方式,即顾客能够中断播报进程进行下一轮交互,让交互更加自然,流畅。二、华为云昇腾Atlas800推理服务器Atlas800推理服务器是基于华为昇腾310解决器+Arm/x86架构解决器的AI推理服务器,提供强大的实时推理能力,广泛应用于AI推理场景。下图为Atlas800推理服务器,型号:3000。特点:•支持8张Atlas300I推理卡,满足多场景推理需求;整机可提供640路高清视频实时分析(1080P25FPS)•搭载64核架构、含有超强算力的鲲鹏920解决器,高效加速应用•发挥鲲鹏架构多核、低功耗优势,为推理场景构建高效能、低功耗的AI计算平台•Atlas300I单卡功耗仅67W,为AI服务器算力加速同时提供更优的能效比三、华为云昇腾Atlas800训练服务器Atlas800训练服务器(型号:9000)是基于华为鲲鹏920+昇腾910解决器的AI训练服务器,含有最强算力密度、超高能效与高速网络带宽等特点。该服务器广泛应用于深度学习模型开发和训练,合用于智慧都市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。特点:•4U高度提供2.24PFLOPSFP16超强算力•算力密度达成业界1.36倍•单机支持风冷和液冷两种散热方式•提供2.24PFLOPS/5.6kW超高能效比,达成业界1.21•8*100GRoCEv2高速接口•芯片间跨服务器互联时延缩短10~70%四、华为云昇腾Atlas900PoDAtlas900PoD(型号:9000)是基于华为昇腾910+鲲鹏920解决器的AI训练集群基础单元,含有超强AI算力、更优AI能效、最佳AI拓展等特点。该基础单元广泛应用于深度学习模型开发和训练,合用于智慧都市、智慧医疗、天文探索、石油勘探等需要大AI算力的领域。特点:•47U高度提供最高20.48PFLOPSFP16超强AI算力•提供20.48PFLOPS/43kW超高能效比•支持机柜单元扩展,最大可拓展至4096颗昇腾910芯片集群,总算力达1EFLOPSFP16五、华为云鲲鹏裸金属服务器裸金属服务器(BareMetalServer)提供专属的云上物理服务器,为数据库、大数据、容器、高性能计算、AI等公司核心业务提供高性能、高安全性、灵活性和弹性,加速公司核心业务上云进程。特点:1、极速型SSD云硬盘采用了结合全新低时延拥塞控制算法的RDMA技术,合用于需要超大带宽和超低时延的应用场景;单盘最大128,000IOPS、1000MB/s吞吐量,200μs时延2、超高IO云硬盘低时延、高性能,合用于高性能,高读写速率规定,读写密集型应用场景;单盘最大33,000IOPS、350MB/s吞吐量,1ms时延3、通用型SSD云硬盘高性价比SSD,合用于多个主流的高性能、低延迟交互应用场景,如典型的公司办公、IO密集型应用、大中型开发测试、高性能系统盘等;单盘最大20,000IOPS、250MB/s吞吐量,1ms时延4、高IO云硬盘高性能、高扩展、高可靠,合用于性能相对较高,读写速率规定高,有实时数据存储需求应用场景;单盘最大5,000IOPS、150MB/s吞吐量,1ms~3ms时延六、华为云TaiShan200服务器(5290存储型)5290存储型是基于华为鲲鹏920解决器的4U2路存储服务器,系统能够提供128核、2.6GHz主频的计算能力和最高1PB本地存储容量。5290存储型含有海量存储、高性能、低功耗以及易扩展的特点,适合为数据归档应用场景提供高可靠和高性价比的存储解决方案。七、华为云TaiShan服务器TaiShan服务器是基于华为鲲鹏解决器的数据中心服务器,含有高效能计算、安全可靠、开放生态优势,适合为公司应用提供高并发的多核算力。TaiShan服务器家族包含基于鲲鹏916解决器的TaiShan100服务器和基于鲲鹏920解决器的TaiShan200服务器,提供均衡型、存储型、高密型、高性能型和边沿型等不同规格形态的产品。3、存储器总结与将来发展存储器总结其中内存是服务器中重要的部件之一,它是与CPU进行沟通的桥梁。服务器中全部程序的运行都是在内存中进行的,因此内存的性能对服务器的作用非常大。能够看到在内存方面,多数服务器的内存控制器为DDR4,DDR4SDRAM全称DoubleDataRateFourthSynchronousDynamicRandomAccessMemory,即第四代双倍数据率同时动态随机存取存储器,并且在服务器中大量使用,数量大概为16~32个。同时有的CUP支持RDIMM,RegisteredDIMM(RDIMM)也是常见的内存模块类型。RDIMM使用寄存器,从电力上将内存模块从剩余主板中隔离出来,其优点是,只需更少的电力负载支持,系统能够填充更多RDIMM,支撑内存容量。缺点是的是缓冲组件增加了对内存转换的延迟,稍微减少了性能并增加了能耗需求。在内地储存硬盘方面,使用SAS(SerialAttachedSCSI)即串行连接SCSI,是新一代的SCSI技术,和现在流行的SerialATA(SATA)硬盘相似,都是采用串行技术以获得更高的传输速度,并通过缩短连结线改善内部空间等。SAS是并行SCSI接口之后开发出的全新接口。此接口的设计是为了改善存储系统的效能、可用性和扩充性,并且提供与SATA硬盘的兼容性,SAS的接口技术是能够向下兼容SATA。SATA,即SerialATA(串行ATA),全称是SerialAdvancedTechnologyAttachme-nt,是由Intel、IBM、Maxtor和Seagate等公司共同提出的硬盘接口新规范。由于采用串行连接方式,因此使用SATA接口的硬盘又叫串口硬盘。SATA规范将硬盘的外部传输速率理论值提高到了150MB/s,比UltraATA/100高出50%,比UltraATA/133也要高出约13%。最初的SAS原则提供了300MB/s或者3Gb/s的数据传输速度,而SATA原则的速度则最高只能达成150MB/s。同时硬盘尚有SSD与HDD之区别,固态硬盘(SolidStateDrives),简称固盘,固态硬盘(SolidStateDrive)用固态电子存储芯片阵列而制成的硬盘,由控制单元和存储单元(FLASH芯片、DRAM芯片)构成。新一代的固态硬盘普遍采用SATA-2接口、SATA-3接口、SAS接口、MSATA接口、PCI-E接口、NGFF接口、CFast接口和SFF-8639接口。HDD(HardDiskDrive)即硬盘驱动器的英文名,是最基本的电脑存储器,现在硬盘普通常见的磁盘容量为80G、128G、160G、256G、320G、500G、750G、1TB、2TB等等。硬盘按体积大小可分为3.5寸、2.5寸、1.8寸等;按接口可分为PATA、SATA、SCSI等。PATA、SATA普通为桌面级应用,容量大,价格相对较低,适合家用;而SCSI普通为服务器、工作站等高端应用,容量相对较小,价格较贵,但是性能较好,稳定性也较高。在硬件配备中尚有一种支持新型的合同的硬盘,NVMe全称Non-VolatileMemoryExpress,非易失性存储器原则,是使用PCI-E通道的SSD一种规范,NVMe的设计之初就有充足运用到PCI-ESSD的低延时以及并行性,尚有当代解决器、平台与应用的并行性。NVMe原则对比AHCI原则的优势,其中之一就是低延时,在软件层方面,NVMe原则的延时只有AHCI的二分之一不到,NVMe精简了调用方式,执行命令时不需要读取寄存器;而AHCI每条命令则需要读取4次寄存器,一共会消耗8000次
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 代理合同:2024年度产品代理销售合同(地区独家)
- 二零二四年度工程承包合同标的与工程范围说明
- 正规家政服务合同样本
- 2024年硝基化合物项目提案报告
- 2024年井控设备装置项目提案报告
- 2024年医疗社会保障服务项目申请报告
- 2024年电动客车项目申请报告模板
- 2024年溶剂型色浆项目规划申请报告
- 二零二四年度二手住宅交易服务合同
- 三棵树牌外墙涂料2024年度供货维护合同3篇
- 12植物的养分教学设计2024-2025学年六年级上册科学冀人版
- 污水处理运营维护方案
- 昆明市食品安全管理制度
- 2024年基金应知应会考试试题及答案
- (新版)中级管道工职业鉴定考试题库-上(单选题)
- 英语如何命制考查核心素养的英语试题P义务教育课程方案和课程标准国家级示范培训课件
- 《电子政务》复习题及答案(分题型)
- CTD申报资料:创新药IND模块一-行政文件和药品信息
- 2024年广东省河源市选调生考试(公共基础知识)综合能力测试题各版本
- 中国看世界之加拿大篇 知到智慧树网课答案
- (高清版)JTGT 3331-2024 采空区公路设计与施工技术规范
评论
0/150
提交评论