版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
体系化人工智能(HolisticAI)技术探索中国移动研究院张世磊2023.11.24GPT-3大模型训练成本费用成本时间成本GPT-3大模型训练成本费用成本时间成本典型AI商用定制化项目成本构成定制化研发售后运维售前解决方案数据采集合同验收18009000日趋泛在的智能化需求和智能化技术赋能成本高之间的矛盾日趋泛在的智能化需求智能化技术赋能成本高20192022人工智能的应用弱人工智能强人工智能需求复杂、迭代优化、运营成本数据成本、算法成本算力成本、人才成本提供技术基础性能降成本自动化提高定制化任务性能神经网络架构搜索LLM使能的自主智能体自动机器学习LLM使能的自主智能体自动机器学习ASurveyonLargeLanguageModelbasedAutonomousAgents单模型的通用化基于AI任务的自动化选择环境,培育环境共性能力:合理评估AI能力的可达性,构建可达的共性AI能力平台化:平台化:实用便捷的工具,运营运维业务本身是规模化的:客户规模,经济规模规模化应用个10086智能客服-服务10+亿客户-问题一次解决率94.2%大屏数字内容推荐-服务家庭7600+万户-观看率提升42%-单省收入赋能7000+万甘肃智能客服-服务2500万甘肃百姓-6000万关系政务知识图谱智能基站节电-单站节电量提升8%-10%智慧党建-知识检索效率提升90%核心能力自然语言理解通用能力网络智能化能力簇322核心能力自然语言理解通用能力网络智能化能力簇智能语音智能推荐机器视觉智能数据分析预测智能诊断智能决策智能控制智能智能语音智能推荐机器视觉智能数据分析预测智能诊断智能决策智能控制智能CHBN赋能价值57服务外部客户服务内部客户服务外部客户云端能力云端能力调用次数调用次数赋能价值服务客户物联网模型...医疗模型能源模型客服模型...司法模型...物联网模型...医疗模型能源模型客服模型...司法模型...网络模型衍生语言大模型视觉大模型语音大模型结构化数据大模型多模态大模型基础大模型:加快构建适用于泛场景的自主可控通用基础大模型,打造通用智能底座行业大模型:聚焦供给侧,加快构建行业大模型,加速国民经济主体行业的智能化转型升级,促进我国整体生产力跃升L1行业大模型L0基础大模型行业智能化应用行业智能化应用支撑支撑通信特色民生服务通信特色民生服务工业生产交通模型...政务模型治理基于体系化人工基于体系化人工智能的智力运营数据数据评测大小模型网络基础数据基础算力基础性能评测安全评测以九天基础模型为基础,联合通信、能源、航空等行业的骨干企业,共建共享九天·众擎基座大模型航航空九天基础模型人工智能训推技术服务平台测评系统交通运输政务建筑能源通信冶金算力网络算力网络大规模智算中心数据汇聚平台网络问题投诉级联优化网络问题投诉级联优化通常需要在满足计算、传输、安全、可控性等多项约束前提下,组合使用多个模型或能力,包括基础模型、行业模型或面向特定任务的小模型,并能够端到端优化服务于业务目标泛AI算力云/网/边/端/…业务大闭环AI能力大闭环网络原生 可信原子化体系化AIOS泛AI算力云/网/边/端/…业务大闭环AI能力大闭环网络原生 可信原子化体系化AIOS体系化人工智能(HolisticAI,HAI)是中国移动研究院九天团队原创技术的攻关方向,依托泛在的网络和AI算力,在开放环境中实现对AI能力进行灵活且高效的配置、调度、训练和部署,以满足日益丰富的数智化业务需求,同时确保AI业务可信可控安全,其主要特征为AI服务大闭环、AI能力原子化重构、网络原生AI及安全可信AI。泛在网络资源提供方1、“大闭环”(1、“大闭环”(BigLoopAI)“大闭环”AI以业务端到端的大闭环优化为目标,重点攻关多能力级联与并联优化、开放动态环境中AI能力优化的基础理论和技术,从而达到AI产业闭环。2、2、AI技术原子化重构(AtomizedAI)AI能力依据高复用、易调度、自闭环、易适配等原则进行原子化拆解和重构。一个典型的原子化AI能力包含通用智能层、适配层、接口层,通用智能层可多个能力共享。AI原子化重构是体系化人工智能得以实现的基础。3、3、网络原生(NetworkNativeAI)网络原生AI将AI能力与算力通过标准化的方式接入网络、按需调度,重点攻关AI模型自动伸缩的理论和机制,制定AI计算资源、数据、模型、能力、服务的功能、流程、接口和计量的标准,实现AI能力在网云边端弹性部署、计算和迭代。4、安全可信(4、安全可信(TrustedAI)AI数据、模型、能力、业务的安全可信是体系化人工智能服务的重要基础,重点攻关AI服务可追溯、可互信、可审计、抗攻击的基础理论与方法。可追溯、可计量HAIprotocol注册需求动态测量评估模型类1模型类n场景类1场景类n场景类N需求1需求n 需求N功能区原子能力区行业区任务区模型类N 可追溯、可计量HAIprotocol注册需求动态测量评估模型类1模型类n场景类1场景类n场景类N需求1需求n 需求N功能区原子能力区行业区任务区模型类N 服务计量、评估、回收分层次多粒度的原子AI能力市场maxf(D,M,A,P,0,E,S,F,U,T)s.t.c(D,M,P,0,E,S,F,U,T)≤Cf是一个复杂的函数,表示体系化人工智能的内部逻辑和流程。真实场景数据漂移集F={f1,f2,…,fn},每个漂移fi都有一个类型xi∈{0,1,2,…,x},表示协变量漂移、先验漂移和概念漂移等。数据传输的演化更新集U={u1,u2,…,uk},每个更新ui都有一个方法yj∈用户需求服务集T={t1,t2,…,tz},表示用户提出动态的需求和任考虑体系化人工智能的内部流程和逻辑,进一步可以将f分解为以下几个子函数:maxf(g,ℎ,i,j,k,ℓ,o)s.t.c(g,ℎ,i,j,k,ℓ,o)≤C端到端跨模态异构数据建模:g(D,M);模型学习机理的优化建模:ℎ(D,M,P,U);模型的原子化表征和建模:i(M,E);模型的标准规范入库:j(M,S);数据漂移的优化建模:k(D,P,F,;模型数据传输的演化更新:ℓ(M,F,U);应用环境的约束条件。基础模型的功能解耦üAutomaticMaskPruning(AMP):automaticallyidentifytask-specificfilters/nodesfordifferenttasksinthepre-trainedmodel.üapplytheLogExpectedEmpiricalPrediction(LEEP)whichisusedtoevaluatethetransferabilityofrepresentationslearnedbythesourcetasktothetargettask.üScalableMaskSelectionPruning(SMSP):fast-adaptthepre-trainedmodeltodownstreamtasks.One-ShotPruningforFast-adaptingPre-trainedModelsonDevices,HaiyanZhaoandGuodongLong,arXiv:2307.04365v1DecoupleoneModelintoAtomizednetworks•知识分解:包含结构分解和表征分解•每个因子网络包含两部分:通用知识网络(CKN)和特定任务网络(TSN)•一种新的信息衡量指标-InfoMaxBottleneck(IMB),使输入和通用特征间互信息最大(最大限度保留大模型的通用知识使不同特定任务特征间互信息最小(使特定任务网络之间尽可能解耦)。模型蒸馏ℎ2ℎ3ℎ4ℎ1ℎ2ℎ3ℎ1ℎ4ℎ3ℎ2ℎ1ℎ2ℎ3ℎ4ℎ1fGeneratedInputEmbeddingInputEmbeddingFeatureExtractorFeatureExtractorlul⨁WeightedSumℎ2ℎ3ℎ4ℎ1ℎ2ℎ3ℎ1ℎ4ℎ3ℎ2ℎ1ℎ2ℎ3ℎ4ℎ1fGeneratedInputEmbeddingInputEmbeddingFeatureExtractorFeatureExtractorlul⨁WeightedSum基础模型的功能蒸馏PredictedEmbeddingℎ4PredictedEmbeddingℎ4<EOS><EOS>Embeddingfflayerlayer1layer2layer3layer4(a)Distillation(b)Downstream:DistillingPre-trainedLanguageModelsbasedonGenerativeModels,Y.Gao,ShileiZhang,ZihaoCui,ChaoDeng,JunlanFeng*.Archive-2023基础模型的功能蒸馏Two-dimensionalAttentionMechanism:DistillationLoss:DistillingPre-trainedLanguageModelsbasedonGenerativeModels,Y.Gao,ShileiZhang,ZihaoCui,ChaoDeng,JunlanFeng*.Archive-2023搜索空间巨大:层级搜索、免训练(trainingfree)端到端闭环数据稀疏:无监督参数量和内存消耗大:适配器、蒸馏、剪枝接口复杂:维度一致、梯度连续端到端闭环数据稀疏参数量大FuseMultipleModelsintoonetargetmodel•多个神经元网络层形成一个功能块•功能相似网络:输入相似时,输出相似•将一个网络分成多个功能块,相似的功能块形成一个集合,这个集合称为:等同网络块集合"DeepModelReassembly",XingyiYang,etc.NeurIPS2022StitchMultipleBigModelsintoonetargetmodelASRNLUASRNLU网络问题投诉级联优化语音识别+自然语言理解级联优化【12】InterfacesInterfacesFuseMultipleModelsintoonetargetmodel"CascadedMulti-taskAdaptiveLearningBasedonNeuralArchitectureSearch",Y.Gao,ShileiZhang,ZihaoCui,ChaoDeng,JunlanFeng*.Interspeech2023++Cancadethreemodels-speechenhancement,ASR,NLU-withBottleneckAdapterVisionDecodervisionpatchtokensMaskedSelf/Cross-At
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 绿色印刷技术竞争地位
- 第三方控件安全性能评估
- 电缆智能制造技术发展
- 量子引力与弦理论
- 电池管理系统研究
- 港口智能化管理
- 绿色汽车零部件制造技术创新能力研究
- 浙江省丽水市(2024年-2025年小学五年级语文)统编版能力评测((上下)学期)试卷及答案
- 环保咨询行业国际化策略
- 解读药物相互作用机制
- 城轨机电专业职业生涯规划
- 电力电缆及附件基础知识
- 中学生社会实践调查报告:爬山走人生
- 《冲突管理》课件2
- 可再生能源的社会效益与可再生能源
- 风光水多能互补电站建设
- 地中海贫血教学查房课件
- 校园安全敲门行动方案
- 《幼儿园教育活动设计》-07-幼儿园科学教育与活动指导课件
- PLM项目管理系统教程
- 售楼处装修工程施工进度表7.31
评论
0/150
提交评论