




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Q1盘古大模型为何能在AI领域中脱颖而出?生态建设与合作伙伴华为云的全栈AI能力盘古大模型盘古大模型集成了华为云团队在AI领域数十项研究成果,并且受益于华为的全栈式AI解决方案,与昇腾(Ascend)芯片、昇思(MindSpore)语言、ModelArts平台深度结合。技术创新与突破 计算能力与应用场景盘古大模型在处理复杂、不均匀的3D
气象数据时,创造性地提出了适应地球坐标系统的三维神经网络(3DEarth-Specific
Transformer),并使用了层次化时域聚合策略来减少预报迭代次数,从而减少迭代误差。这一创新使得盘古大模型在气象预报领域取得了显著成果,并在《Nature》正刊上发表了相关研究成果。基于华为自研达芬奇架构广泛的应用场景三维神经网络与层次化时域聚合策略全系列、多模态、强思维与鸿蒙系统的协同ISV生态建设华为云在
to
B
和to
G
领域有着深厚积累,同时多年来致力于ISV(独立软件提供商)的生态建设。中软动力、软通动力、南威软件等深耕各行业的软件服务商都是华为云的合作伙伴,共同推动了盘古大模型的行业落地和应用。华为云构建了包括AI原生的云基础设施、数据湖和数据治理、算子库、算法框架以及AI开发平台和大模型的全栈工业AI能力。其云基础设施架构
CloudMatrix
将CPU、NPU、DPU、存储和内存等资源进行了全面互联和池化,为AI应用提供了强大的算力支持。鸿蒙系统作为华为面向万物互联时代的原生操作系统,与盘古大模型形成了良好的协同效应。资料来源:华为官网、Nature、凤凰网、中国基金报、网易、CSDN134盘古矿山大模型、盘古政务大模型、盘古气象大模型、盘古汽车大模型、盘古医学大模型、盘古数字人大模型、盘古研发大模型盘古自然语言大模型、盘古多模态大模型、盘古视觉大模型、盘古预测大模型、盘古科学计算大模型L2层是盘古大模型的最上层,包含了可以让用户自主训练的更多细化场景模型。这些模型是基于L1层行业通用大模型进一步细化和定制化的结果。L1层是基于L0层基础大模型进一步开发的行业2 通用大模型。这些模型针对特定行业进行了优化和微调,以适应不同行业的特定需求。L0层是盘古大模型的基石,包含了五个基础大模型,这些模型是构建更高级别模型的基础。解决行业难题,释放AI生产力L0、L1、L2三层架构重塑行业技术扎根开放同飞传送带异物检测、重介选煤洗选、政务热线、城市事件处理、台风路径预测、自动驾驶研发、车辆辅助设计、辅助医疗、数字人直播、智能运维等资料来源:每日经济新闻L2
场景模型L0
基础大模型盘古大模型L1
行业大模型根据OpenAI自己发布的最新测试结果,从这个评测看,数学 例方面,GPT-4-turbo-2024-04-09版本的模都有不同程度的提高,最高可以提升
19%主要优势抓住机遇启示GPT-4-Turbo的优势GPT-4-Turbo的优势包括:增强的上下文处理能力(可处理高达128K个token),更新的知识库(包含至2023年12月的信息),更低的成本效益,以及新功能集(如JSON模式、可复现输出等),这些使其
处理复杂任务时更准确、高效,并吸引更多开发者使用。启示抓住机遇主要优势上下文处理能力模 规模知识库成本效益新功能集AI技术快速发展市 需求OpenAI品牌影响力资料来源:OpenAI、数据学习、网易、电子技术设计对盘古大模 的启示华为盘古大模 可从GPT-4-Turbo的成功中汲取经验,注重技术创新与升级,紧密贴合市
需求,加强品牌建设,并积极推动应用落
。Q2盘古大模型推出的背景和发展如何?行业应用广泛定制化需求增加新兴应用场景不断涌现技术融合与创新AI技术逐渐成熟市场需求多元化小数据与优质数据应用、人机对齐技术、可解释性模型增强、大规模预训练模型优化、全模态大模型发展、具身智能与实体AI系统、以及量子计算与AI的结合等,这些创新正引领AI技术迈向新高度。竞争格局多元化技术创新与突破数字化转型趋势资料来源:人民网、前瞻网、CSDN、《瞭望》(郭方达)、澎湃新闻、中国科学技术协会、网易国内市场:大模型发展势头尤为迅猛。大型语言模型可分为四大竞争派系:互联网公司(如百度、阿里、腾讯、华为等)、AI公司(如澜舟科技、昆仑万维等)、学术及科研机构(如清华、北大、中科院等)以及行业专家团队初创公司。目前国内已经有300多个AI大模型,同台竞技。2024年10月,世界经济论坛
(WEF)
公布我国有72家入选“灯塔工厂”,占全球“灯塔工厂”总数的42%,位居全球首位。截至2023年,我国AI大模型行业规模已达到147亿元,且近三年复合增速高达114%。金融、政府、影视游戏和教育领域是大模型渗透率最高的四大行业,渗透率均超过50%。预计到2028年,我国AI大模型行业的市场规模将突破千亿元,五年复合增速将超过50%。产业生态构建华为基于鲲鹏与昇腾两大基础芯片族,构建了包括欧拉、鸿蒙等基础软硬件在内的开源开放生态。其中,鲲鹏面向通用计算,昇腾面向人工智能计算。20232020202120222023立项与研发华为开始在华为云内部立项盘古大模型项目。首次发布盘古大模型正式对外发布。盘古大模型2.0版本发布。华为与能源集团等合作伙伴开始将大模型初步应用于企业、工业和科学研究。技术深化与领域拓展面向行业的全面升级华为云盘古大模型3.0正式发布。盘古大模型3.0是完全面向行业的大模型,采用了“5+N+X”的三层架构包含L0基础大模型、L1行业大模型及L2场景模型三层架构。持续优化华为云以昇腾AI云服务为算力底座,以盘古大模型联合创新为基础,以模型社区和全面升级的云学堂为双引擎,携手伙伴、开发者合作共建“百模千态”。持续创新与突破2024年6月21日,盘古大模型5.0正式发布。该版本在全系列、多模态、强思维三个方面进行了全面升级。盘古大模型是由华为公司开发的一款基于深度学习和自然语言处理技术的中文AI模型,涵盖了自然语言处理(NLP)、计算机视觉(CV)和科学计算等多个领域,拥有超过1.7万亿个参数,是目前世界上最大的中文AI模型之一。盘古大模型采用完全的分层解耦设计,包括L0层的5个基础大模型、L1层的N个行业通用大模型、以及L2层可以让用户自主训练的更多细化场景模型。2024资料来源:华为官网、环球科技网、百度百科、CSDNQ3盘古大模型5.0有什么优势?华为自研盘古大模型,跳级迭代:
Pangu3.0Pangu5.0包含了不同参数规格的模型,以适配不同的业务场景。从十亿级参数的Pangu
E系列到万亿级参数的Pangu
S系列,分别适用于手机、PC端侧智能应用、低时延推理场景、复杂任务处理及跨领域多任务处理,满足多样化的业务需求。
不仅支持文本、图片、视频等常见模态,还新增了对雷达、红外、遥感等模态的支持,且在多模态理解和生成能力上均有显著提升,尤其在自动驾驶、工业制造等领域有广泛应用前景。复杂任务及调用各种工具和资源,从而成为更高效的行业助手。华为云已经从盘古3.0时代的3T
Tokens的数据,演进到了盘古5.0的10T
Tokens的高质量数据,其中合成数据占比超过了30%。盘古大模型5.0采用了优质的、面向高阶能力的数
据
合
成
方
法
。
这
种
方
法
以
弱
模
型
辅
助
强
模
型
的weak2strong方式,通过迭代式合成高质量数据,确保数据的完整性、相关性和知识性不弱于真实数据。数据高效参
盘古大模型5.0提出了基于Transformer架构的新型大语言模数
型架构盘古π。这一新架构通过增广残差连接和改造激活函高
数等方式,解决了Transformer架构中的特征坍塌问题,提效
升了模型的精度。华为云通过优化昇腾AI云服务,显著提升了模型训练的稳定性和效率,如万亿参数模型训练可40天无中断,集群故障恢复时间缩短至10分钟。此外,华为云创新推出CloudMatrix云基础设施,实现多元算力对等全互联,将AI算力从单体提升至矩阵级别。为解决“内存墙”问题,华为云还发布了EMS弹性内存存储服务,利用显存扩展等技术释放极致算力。算力高效全系列升级多模态升级强思维升级在数学能力、复杂任务规划能力和工具调用能力上均有所增强,能够更好地处理数学问题、规划盘古大模型5.0的训练过程Pangu5.0资料来源:华为云、新华网、腾讯网、观察者网、中国日报网、中国发展改革百家号、东兴证券研究所PanguEmbeded十亿级手机/PC/车PanguProfessional百亿级单卡可推PanguUltra千亿级复杂推理PanguSuper万亿级跨领域多任务盘古自然语言大模型盘古多模态大模型盘古视觉大模型盘古预测大模型盘古科学计算大模型5.0版本不再局限于单一模型,而是推出了不同参数规格的模型,以适配不同的业务场景。包括PG-Alpha、PG-Beta、PG-Gamma、PG-Delta等不同规格的模型,以适配不同的业务场景。结合物理世界:盘古大模型5.0在全系列升级中,更加注重与物理世界的结合。例如,推出了PG-Radar系列模型,将AI与物理世界更好地结合起来,实现智能的万物互联。这一技术创新不仅提升了模型对物理世界的理解能力,也为边缘智能等特定场景提供了更好的解决方案。资料来源:华为开发者大会2024、华为官网精准理解可控生成在内容生成方面,盘古大模型5.0采用了业界首创的STCG(SpatioTemporalControllableGeneration,可控时空生成)技术,能够生成更加符合物理规律的多模态内容。这一技术使得盘古大模型在自动驾驶、工业制造、建筑等多个行业场景中都有广泛的应用前景。5.0
版本不仅支持文本、图片、视频等常见模态,还新增了对雷达、红外、遥感等模态的支持,且在多模态理解和生成能力上均有显著提升,尤其在自动驾驶、工业制造等领域有广泛应用前景。大规模生成和实际场景相一致的内容大模型+行业知识理解物理规律除文本、图片、视频外,5.0版本还增加了雷达、红外、遥感等更多模态。盘古大模型5.0版本演进了模型架构,提出了基于Transformer
架构的新型大语言模型架构盘古π(PanGu-π),通过增广残差连接和新的级数激活函数等方式,大幅提升了模型的精度。资料来源:华为、腾讯网、机器之心华为云提出基于多步生成和策略搜索的MindStar方法。该方法首先把复杂推理任务分解成多个子问题,每个子问题都会生成多个候选方案,通过搜索和过程反馈的奖励模型,来选择最优多步回答的路径。在华为自建的难例评测集中,MindStar方法使模型的平均能力提升了30分,使用了MindStar的百亿模型达到业界主流千亿模型的推理能力,这相当于使用慢思考能带来10倍以上的参数量的加成。目前在单步任务和文本记忆类任务,例如知识问答和考试上,大模型已经展现出超过人类的卓越表现。而在多步推理和复杂任务的处理上,AI还没有达到人类的平均水平,这一方面涉及到的任务包括代码生成、数学运算、逻辑推理等。这体现了人类在知识的抽象和推理上的能力难以替代。技术挑战关键结果关键技术 MindStar资料来源:华为官网、腾讯网90%任务成功率加速模型开发10分钟快恢:集群故障恢复时长40天长稳:千亿模型训练中无中断时长使能百模千态目前昇腾AI云服务已全面适配行业主流的100多个大模型,以云服务的方式协助客户开发,训练,托管和应用模型,打造百模千态的“黑土地”。100+全面适配主流大模型服务优势高效的迁移工具链AIgallery生态繁荣极致的资源利用生态兼容与易用性领先的昇腾达芬奇架构资料来源:华为云、观察者网、网易Q
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商丘学院《建筑信息建模(BM)》2023-2024学年第二学期期末试卷
- 九江理工职业学院《动物病毒与人类健康》2023-2024学年第二学期期末试卷
- 湖南工程学院《数据结构与算法分析课程设计》2023-2024学年第二学期期末试卷
- 《活动二 安全网上行》(教学设计)-2023-2024学年六年级上册综合实践活动蒙沪版
- 辽宁现代服务职业技术学院《美术表现一中国画》2023-2024学年第二学期期末试卷
- 海南外国语职业学院《自然地理基础》2023-2024学年第二学期期末试卷
- 地震数据采集系统项目效益评估报告
- 山东商务职业学院《工程技术基础》2023-2024学年第二学期期末试卷
- 郑州商贸旅游职业学院《跨境电商平台操作》2023-2024学年第二学期期末试卷
- 武汉商学院《文献检索与学术训练》2023-2024学年第二学期期末试卷
- 化工原理传质导论
- 环境与可持续发展ppt课件(完整版)
- Linux操作系统课件(完整版)
- 跨境电商亚马逊运营实务完整版ppt课件-整套课件-最全教学教程
- 中国传媒大学《当代电视播音主持教程》课件
- 浙美版小学六年级美术下册全册精品必备教学课件
- DB32∕T 4245-2022 城镇供水厂生物活性炭失效判别和更换标准
- 建设工程围挡标准化管理图集(2022年版)
- 人教版七年级上册历史课程纲要
- 湿法冶金简介
- 2022新教科版六年级科学下册全一册全部教案(共28节)
评论
0/150
提交评论