版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
云服务新引擎,高效驱动自动驾驶数据闭环发展白皮书亿欧智库/researchCopyrightreservedtoEOIntelligence,September
2023©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)前言《云服务新引擎,高效驱动自动驾驶数据闭环发展白皮书》简介自动驾驶发展已进入“下半场”,高等级自动驾驶将逐步迈进现实,海量数据处理及高效挖掘成为企业必须解决的头等难题,数据闭环因此越来越受到重视,主机厂及
Tier1
纷纷搭建起了自己的数据闭环体系。与此同时,大模型的爆发赋予了自动驾驶更多想象空间,并成为数据闭环发展的充要条件。然而,无论是高效数据闭环构建还是大模型赋能,都仍处在发展初期,技术演进留有空白,竞争格局未有定数。行业内众参与者百舸争流各显其长,纷纷入局。在此洪流中,云服务商因其智能化的基因与强大的数据处理能力,成为了现阶段自动驾驶产业发展的重要力量,以“第三方服务商”的身份与自动驾驶产业“双向奔赴”。通过云底座核心能力和云端大模型深度赋能数据处理全流程,构建全栈式自动驾驶开发平台,为主机厂、Tier1等企业提供更智能、更高效率的数据及AI服务,强化数据驱动能力,加速数据闭环,助力客户实现自动驾驶开发降本增效和量产落地。亿欧智库联合华为云共同发布白皮书,深入洞察自动驾驶数据闭环发展,详细拆解数据闭环各环节,从技术、产品、商业模式等多个角度,分析数据闭环发展现状,同时探索具备专业积累及强大感知、计算、处理、存储等能力的云服务商可赋予各环节的价值。在高速发展的中国汽车产业背景下,车企及相关供应商应进一步开放合作,携手共建盛世繁荣的产业生态。《云服务新引擎,高效驱动自动驾驶数据闭环发展白皮书》核心观点中国智能汽车逐步向高等级自动驾驶发展,数据驱动开发模式下,构建高效数据闭环刻不容缓;自动驾驶数据闭环发展主要面临海量数据处理能力弱、基础设施研发成本高和数据安全合规保障难三大挑战。云服务商凭借高效的计算、存储、训练、网络通信等能力赋能数据闭环,为自动驾驶研发提供完整有效的解决方案;云服务搭载大模型深度赋能数据闭环各个环节,如clip内容理解、自动标注、加速模型训练、生成高质量训练场景库与仿真场景库等;华为云从技术、服务、生态三方面构建自动驾驶数据闭环新范式。通过全面接入大模型、搭建底层AI算力,并提供模块化合作服务模式、助力中国车企出海,未来将进一步通过路端大生态的打通,构建基于云服务更大的数据闭环。2©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)目录CO
N
T
E
N
T
S自动驾驶发展机遇与挑战自动驾驶产业发展洞察自动驾驶产业发展面临新挑战自动驾驶发展需要更加高效的数据闭环01云服务赋能自动驾驶数据闭环自动驾驶数据闭环发展痛点分析自动驾驶数据闭环需要云服务赋能云服务加速数据闭环各环节高效运转自动驾驶数据闭环产业图谱及分析02云服务助力构建自动驾驶数据闭环新范式云服务助力构建自动驾驶数据闭环新范式综述云服务助力构建自动驾驶数据闭环新范式解析03©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)目录CO
N
T
E
N
T
S自动驾驶发展机遇与挑战自动驾驶产业发展洞察自动驾驶产业发展面临新挑战自动驾驶发展需要更加高效的数据闭环01云服务赋能自动驾驶数据闭环自动驾驶数据闭环发展痛点分析自动驾驶数据闭环需要云服务赋能云服务加速数据闭环各环节高效运转自动驾驶数据闭环产业图谱及分析02云服务助力构建自动驾驶数据闭环新范式云服务助力构建自动驾驶数据闭环新范式综述云服务助力构建自动驾驶数据闭环新范式解析03©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)5信息来源:华西证券、中金证券、亿欧智库1.1.1
自动驾驶发展进入下半场,技术逐步向高等级自动化发展20182023自动驾驶产业经过高速发展已进入逐步泛化阶段,高等级自动驾驶正逐步落地,海量数据处理与多元场景应用成为未来产业发展的核心。也正是因为数据量的累积,对算力、算法以及商业模式提出考验,大模型的研发与应用恰逢其时,将从用户体验、技术研发等多个方面赋能自动驾驶产业发展。亿欧智库:自动驾驶产业发展速度示意图领先试水 创新起步 高速发展 逐步泛化 广泛应用,跨越升级2009 2013 2015谷歌启动自动驾驶项目奥迪、宝马、福特等布局无人驾驶百度成立自动驾驶团队图森未来、智行者等公司成立Waymo开始RobotaxiUber无人驾驶汽车上路试验阿里、滴滴设立自动驾驶部门文远知行、小马智行、Momenta等公司成立华为成立智能汽车解决方案业务单元多家自动驾驶企业陆续在北京、广州、深圳、长沙等地开始商业化测试四维图新获国内首个L3以上高精度地图订单华为发布鸿蒙车载OS系统;百度L4巴士量产头部企业开始投放L4Robotaxi运营城市NOA加速规模化应用高等级自动驾驶逐步落地应用自动驾驶从实验室转向商业研发,少数头部开始布局自动驾驶,代表技术包括:ACC(自适应巡航)、AEB(自动紧急制动)等步入平稳发展阶段,逐步转向高速、矿山、港口等封闭/半封闭场景应用,代表技术包括:HWP(高速驾驶引导)、TJP(交通拥堵领航)、NOA
Highway(高速领航驾驶辅助)等进入快速发展阶段,电动化成为行业竞争焦点,代表技术包括:APA(自动泊车辅助)、APO(自动驶出)、HWA(高速驾驶辅助)等智能化成为竞争焦点,大模型等技术发展助推自动驾驶迈向新的阶段,代表技术包括:NOA
City(城区领航驾驶辅助)、AVP(自动代客泊车)等2023年,城区自动驾驶成为主要发力方向,多家Tier1、科技企业发布应用于自动驾驶和智能座舱的大模型,通过深度学习与反复训练,助推高等级自动驾驶。百度商汤毫末智行阿里科大讯飞华为中科创达OpenAI自动驾驶算力增长速度曲线自动驾驶产生数据增长速度曲线2013203010TOPS100TOPS2023<1TOPSTB级亿欧智库:自动驾驶数据及算力增长速度曲线示意图EB级5000TOPS500TOPSPB级……大模型势头正盛,助推自动驾驶向高等级发展自动驾驶发展前期,数据量从TB级增长至PB级,数据增长速度快于算力。中后期随着AI大模型的发展,算力等级将高速提升,远快于数据增长速度。远期,随着AI技术的成熟,数据将创造更多的数据,算力应与AI技术良好结合,才能发挥出最优解。数据与算力互促互进,助推行业智能化发展©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)61.1.2
汽车系统快速迭代,高阶智驾方案量产加速布局近两年,自主品牌已全面以高阶辅助驾驶功能作为其品牌智能化主打特色,并进行相关战略部署,这也意味着市场即将迎来以NOA为主打的高阶智驾功能的量产落地。FSD/AP系统AP
HW1.0AP
HW2.0AP
HW2.5FSD/APHW3.0FSD
HW4.0自主品牌20212022202320242025长安L2L2.5L2.9L4上线时间2014.092016.102017.082019.042023
H2(E)长城L2.5L2.9L4比亚迪L2L2.5L2.9L4处理平台/主芯片MobileyeEye
Q3NvidiaDrive
PX2NvidiaDrive
PX2+Tesla
FSDTesla
FSD
2代一汽L2.5L3L4吉利L2.9L3L4算力(Tops)0.2562020144(双芯片)预计性能将是HW3.0三倍左右广汽L2.9L4功耗(W)25250300220北汽L2.5L2.9L4上汽L2.5L2.9L4图像处理能力(fps)361101102300奇瑞L2L2.5L2.9L4东风L2.9L4亿欧智库:部分自主品牌车企智驾功能量产落地规划亿欧智库:特斯拉自动驾驶系统更新周期及FSD版本迭代周期特斯拉自动驾驶系统经历近十年迭代,软硬件都有大幅提升。2023年5月,FSD
Beta版本更新至11.4.2,对路面检测、切入切出、车道保持等功能进行优化。FSD入华也随着内外部条件的成熟而变得更加有可能性,将进一步刺激中国消费市场对高等级智驾的接受度。信息来源:公开资料、亿欧智库软件定义汽车如今已经成为业内共识,智能汽车软件系统持续快速更新迭代。以特斯拉为例,其智驾系统经历了数次更新迭代,近期FSD升级版也即将面向中国开放。另一方面,在“重感知轻地图”的争议之下,BEV融合方案的出现赋予了不依赖高精地图的更大可能。亿欧智库注意到,国内自主品牌已经纷纷开启L4级自动驾驶量产落地计划,向城市级应用进发。汽车智驾系统快速发展,BEV融合方案助力城市NOA规模化落地近几年,“重感知轻地图”的争议一直未有定论,随着BEV方案的出现,车企看到了不依赖高精地图的可能性,即通过GPS、IMU、轮速计以及导航地图,实现精准定位;通过BEV+Transformer,提升车辆感知和决策能力。摄像头激光雷达毫米波雷达结果输出映射到统一坐标系下融合原始数据特征提取原始数据特征提取原始数据特征提取训练学习轮速传感器IMU提供全局视野:俯视图视角少有遮挡,算法也可以对被遮挡区域进行预测,同时引入时序信息,让感知结果更连续稳定特征级融合:减少层层处理以及先验规则带来的信息丢失,让多模态数据特征在同一空间中融合,信息关联性更强4D数据:静态道路信息与动态道路参与方统一在同一个坐标系下,通过实时感知与转换,在行驶中即可实时生成“活地图”©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)《关于更好发挥数据要素作用进一步加快发展数字经济的实施意见》“建设数据要素创新研究院,支持数据驱动的科学研究。探索打造数据训练基地,促进研发自然语言、多模态、认知等超大规模智能模型。”北京市科委、中关村管委会发布北京市首批人工智能行业大模型应用案例自动驾驶大模型DriveGPT示范应用:毫末智行、长城汽车城市大脑大模型示范应用:科大讯飞、中科大脑公司进一步完善网联基础设施加快C-V2X、路侧感知、边缘计算等基础设施建设,建立基于边缘云、区域云和中心云三级架构的云控基础平台,形成统一接口、数据和通信标准,提升网络感知、云端计算能力深化测试示范应用启动智能网联汽车准入和上路通行试点,组织开展城市级“车路云一体化”示范应用,支持L3及更高级别自动驾驶功能商业化应用支持关键技术攻关支持重点大企业牵头,大中小企业参与,开展跨行业跨领域协同创新。加快关键芯片、高精度传感器、操作系统等新技术新产品的研发和推广应用,提升产业发展内生动力发展新能源汽车同时还具有高度的战略意义。中央及地方多方位立体式引导新能源汽车产业各环节高质量发展,进一步延长新能源汽车车辆购置税减免政策至2027年底,从供需两端推动产业迭代升级。“车-路-云”一体化融合发展也将成为未来产业推进的关键所在,完善的云控基础平台及云端计算能力,能够从多方面推进智能网联以及高等级自动驾驶大规模、高质量发展。具体到城市层面,国内多个城市已开辟路测及试点区域,对道路设备进行装配升级,推动智能网联汽车落地应用。芯片、云基础设施、操作系统、大模型算法等关键技术的研发均受到城市级关注。国外相关政策也积极推动自动驾驶城市级应用的落地推广。7信息来源:公开资料、国务院新闻办、各城市智能网联汽车测试工作小组、亿欧智库1.1.3
政策引导助推自动驾驶产业升级,城市落地验证新兴技术应用发展全国已建成17个测试示范区、16个“双智”试点城市、7个国家车联网示范区完成了7000多公里道路智能化升级改造,装配路侧网联设备7000余台套2022年具备组合辅助驾驶功能的L2级乘用车新车渗透率达到了34.5%2023年6月21日国务院政策例行吹风会:促进新能源汽车产业高质量发展英国允许无人驾驶汽车商用:2023年6月,英国初创公司Imperium
Drive推出无人驾驶汽车租赁项目,该项服务通过操作员远程驾驶将待租车辆交付给用户,这也是英国首次允许无人驾驶汽车商用硅谷Robotaxi不受限运营:2023年8月,加州议会的公共事务委员会宣判,允许谷歌旗下Waymo和通用旗下Cruise的Robotaxi在旧金山不受限制载客。7x24小时、区域不限、全无人、可收费国内外自动驾驶相关落地政策及城市应用最新进展北京开放路网里程:1143.8
km发放牌照:600+个上海开放路网里程:1800.0
km发放牌照:600+个长沙开放路网里程:317.0
km发放牌照:55+个深圳开放路网里程:201.4
km发放牌照:260+个武汉开放路网里程:1500.0
km发放牌照:200+个重庆开放路网里程:1486.8
km发放牌照:60+个广州开放路网里程:1749.8
km发放牌照:220+个©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)8中国车企出海已经不止于面向海外售卖整车及零部件产品,而是进入价值链全球化进程,在云服务的加持下,通过技术出海、服务出海、品牌出海、生产出海等多种方式,中国品牌以产品、服务及投资在全球各区域打造多样化服务生态圈,有望实现汽车生态的落地生根。信息来源:乘联会、中国海关总署、公开资料、亿欧智库1.1.4
国际市场逐年拓展,汽车及相关供应链企业出海大势在即主机厂动力电池车载雷达能源服务智能座舱自动驾驶智能网联云服务软件基础设施后市场……内饰整车出海,带动“全链”,电动化、智能化多领域迈向国际市场亿欧智库:2018-2022中国纯电动、插电混动乘用车出口额及纯电动出口额占比1095561,36313
936
31689317139.6%45.6%61.7%85.7%88.9%2018年2019年2020年2021年2022年纯电动乘用车(亿元)插电式混合动力乘用车(亿元)纯电动乘用车出口额占比随着中国汽车工业的发展,主机厂出海越来越多,以技术、服务、品牌出海等方式,主动“走出去”,成功打响国际化品牌。在主机厂的带动下,多个相关细分领域也向海外市场延伸。自动驾驶、智能座舱、智能网联、动力电池、软件、车载雷达等,作为智能汽车的核心部分,都跟随整车出海,在国际市场上形成了一定的影响力。云服务商在中国汽车企业出海之路上搭建云端“基础设施”,以保证数据快速传输、高效存储,并为中国汽车产业链企业出海提供安全合规保障。亿欧智库:部分自动驾驶企业出海事件百度、SB
Drive、金龙客车三方合力于2018年开发日本版“Apolong”;2022年,百度在美国加州进行自动驾驶出行测试里程已达3986km;比亚迪、极氪、蔚来、小鹏等新势力车企都相继于2020年、2021年布局海外市场,并逐年加码;宁德时代、中创新航等动力电池企业也较早布局海外;速腾聚创等激光雷达企业自2021年就已开始出海;毫末智行成为中国首个AEB算法落地海内外的公司;芯驰、纳芯微等诸多半导体企业都已开启海外业务布局;华为云、腾讯云、阿里云等云厂商通过提供安全合规服务及自动驾驶数据相关服务助力车企出海;盛弘股份、道通科技等能源服务企业稳步发展全球业务;文远知行于2023年7月拿到中东首张国家级牌照……©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)9如前述分析,在技术、商业、政策、出海等多维度的推动下,自动驾驶产业近些年发展迅速,已迈向产业发展阶段的“下半场”,大量的数据收集与应用支撑产业的高速发展,未来很长一段时间,自动驾驶产业的竞争重点将聚焦在基于海量数据之上的智能化及量产落地上。1.1.5
多维因素助推自动驾驶产业迈向高等级发展阶段大模型势头正盛,AI技术加速助跑数据与算力互促互进,助推行业智能化发展技术“奠基”政策“助推”量产“加速”头部企业领军智驾系统快速迭代BEV融合方案助力城市NOA规模化落地,促进自动驾驶城市级应用国内外政策引导高等级自动驾驶发展,助推L3及以上自动驾驶落地国内外城市级应用落地促发展出海“拓展”以主机厂为主整车出海,树立品牌带动自动驾驶全产业链出海,电动化、智能化多领域迈向国际市场自动驾驶迈向高等级发展阶段,大规模城市级落地将成未来重点©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)10随着自动驾驶的级别提高、应用范围扩大,数据量急剧提升,相应的训练、传输、存储成本也大幅提升。海量数据规模以及自动驾驶性能提升,不仅对数据处理的效率提出要求,同样也为安全保障带来巨大挑战。信息来源:《自动驾驶数据安全白皮书》(2020)、亿欧智库1.2
数据处理问题成为高等级自动驾驶需要解决的“头等难题”数据处理挑战数据采集难标注要求高模型训练久传输存储贵标准不一致安全要求高流动性规模性非结构性涉密性包括汽车基础数据、基础设施、交通数据、地理信息数据以及大量车主的身份信息、状态数据、行为数据等融合来自汽车、道路、天气、用户、智能计算系统等多方面海量数据,类型众多,总量大不同来源数据格式不同,数据的非结构性和非标准性对数据聚合或拆分技术以及权限管理和安全存储带来挑战大量数据在用户端、车端、云端等多场景交互,且具有跨行业共享交换特点涉及大量地理信息数据,可能涉及涉密测绘成果,需要依法分级管理高等级自动驾驶数据特点——多样性采集数据需要具备甲级或乙级图商资质并获得审批许可,采集门槛较高,复杂多变的驾驶场景与操作数据对采集的量级和有效性都提出挑战复杂长尾场景不断增加的前提下,高质量数据要求增加了标注及处理数据的难度。传统的人工标注成本高、效率低,无法支撑快速的Conner
case训练算法训练需要有效的数据、丰富的场景、完备的模型,在此基础上需重复训练。但目前很多模型加载慢,训练时间长,由此导致模型迭代慢,市场缺乏成熟高效的训练模型数据去噪、清洗、统一格式、标注、处理等各步骤由不同企业执行,难以通过统一任务需求进行引导,因而口径不一,易造成信息损耗、数据丢失等情况感知、判断、决策、执行等各模块间每秒数据传输量达数GB,车端与云端间同样要求稳定、高效的传输,由此产生的数据存储与流量费用十分可观道路、环境、司机、乘客等数据都有安全要求,未来在城市级铺开后,经过敏感地区所取得的信息若不能脱敏处理与安全托管,就有可能存在遭泄漏或篡改风险,造成安全隐患©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)环节流程完整、数据全程跑通、真值不丢失、反复循环进行训练,实现不断地、持续的数据循环11信息来源:亿欧智库1.3.1
高效挖掘、有效利用是自动驾驶面对海量数据的必选项,数据闭环因此逐步落地采集传输存储处理清洗标注验证部署智能电动汽车 数据集自动驾驶数据闭环云服务器仿真算法模型训练从车端数据采集,到处理后形成有效数据集,再通过云服务器进行存储、运输,经过算法模型训练、验证后,将有效数据成果部署上车,各环节相互连接,形成自动驾驶数据闭环。未来发展成熟的数据闭环能够有效提高数据传输、处理效率,增强可控性,同时数据安全也更有保障。亿欧智库:自动驾驶数据闭环图示 亿欧智库:成熟的自动驾驶数据闭环特征流程自动化完整有循环处理效率高亿欧智库:自动驾驶数据闭环定义通过专业测试车队和社会化量产车辆采集其行驶数据、位置轨迹、路况数据、场景数据等多种数据信息,处理形成数据集,经过清洗、标注等,基于智能云底座进行传输、存储等操作,结合仿真场景,在输入-训练-部署-验证的循环反复中,对自动驾驶算法进行迭代和升级,覆盖更多corner
case,推动自动驾驶解决方案向成熟进阶,提升自动驾驶能力的快速闭环迭代,加速自动驾驶规模化量产落地。海量数据与算法能够双向赋能,以算法处理数据,数据训练算法,有效循环、高速迭代成熟的数据闭环将更多的使用自动化工具和算法对数据进行处理、清洗和转换,以减少人工干预©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)121.3.2
技术发展推进数据闭环不断升级,大数据与多场景逐步落地应用自动驾驶数据闭环建设并非一日之功,从仅限在少部分的测试车上开始,闭环通路1.0就已经初步构建完成,能够实现简单的问题反馈循环机制;随着技术的升级,自动驾驶进入高等级发展阶段,数据闭环的打造也顺势升级进入2.0阶段;未来,将向大规模量产的3.0阶段发展。如今,中国自动驾驶数据闭环已经走过了初步构建的第一阶段,正处于数据高效驱动的第二阶段,未来向搭建生态、催生商业化的第三阶段进发。随着阶段推进,处理数据能力与自动化运转能力大幅提升,产业协同更加高效,云服务商扮演更重要的角色,支撑新的商业生态建设。亿欧智库:自动驾驶数据闭环发展三阶段自动驾驶数据闭环初步建立出现问题上传错误数据分析问题重写代码测试上线1.0阶段:2013-2017闭环通路初步构建自动驾驶发展初期的数据闭环较为简单,只是简单的通路构建,主要在测试车上发现问题并上传,由工程师们分析错误报告,以找出问题原因,进而修改代码并在下次更新后予以解决。这是传统的、简单的数据闭环,但效率不高,多个环节需要人工辅助。2.0阶段:2018-2024数据驱动闭环升级随着技术的进步和自动驾驶等级的发展,传统的数据闭环不能适应快速迭代的产业和指数级增长的数据量。这一阶段,面向更大规模数据的闭环及相应技术和服务被车企及供应商广泛应用。大规模训练大规模仿真大规模标注高频率部署大规模采集测试场景应用3.0阶段:2025-2030场景催化商业落地未来,自动驾驶数据闭环将进一步更新升级,逐步从测试车→小规模量产→大规模量产,面向多样化场景都能够流畅、安全的赋能自动驾驶,从车、路、云多端助力自动驾驶的终极实现。自动驾驶数据闭环生态体系城市级高等级自动驾驶场景量产应用低等级自动驾驶场景量产应用高速场景应用云服务赋能车端闭环z路端闭环2013信息来源:亿欧智库20182025©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)目录CO
N
T
E
N
T
S自动驾驶发展机遇与挑战自动驾驶产业发展洞察自动驾驶产业发展面临新挑战自动驾驶发展需要更加高效的数据闭环01云服务赋能自动驾驶数据闭环自动驾驶数据闭环发展痛点分析自动驾驶数据闭环需要云服务赋能云服务加速数据闭环各环节高效运转自动驾驶数据闭环产业图谱及分析02云服务助力构建自动驾驶数据闭环新范式云服务助力构建自动驾驶数据闭环新范式综述云服务助力构建自动驾驶数据闭环新范式解析03©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)L1L2L3L4L5原始数据:15-20TB/小时所需空间:
3EB+14随着自动驾驶级别不断升高,平均所需配备的传感器数量增加,收集到的异构数据类型与规模都大幅增长。而未来所必须的大规模量产车数据,相比测试车而言数量级更大、类型更多,车端所需存储的数据以及提升自动驾驶功能所需训练的数据随之大幅升高。在数据量增长之外,长尾数据问题也日渐重要。自动驾驶需要尽可能多地涵盖corner
case,算法模型的升级迭代也需要新场景数据的不断投喂,而目前的长尾数据仍有很大一部分尚未覆盖,技术有待提升。信息来源:公开资料、专家访谈、亿欧智库2.1.1
数据闭环随自动驾驶升级挑战剧增,数据量指数级增长、长尾问题仍需突破原始数据:
1-2TB/小时所需空间:
50-100PB亿欧智库:各等级自动驾驶汽车原始数据及所需存储空间示意图数据量原始数据:200-300GB/小时所需空间:4-10PB原始数据:4-5TB/小时所需空间:500PB-1EB环境天气、地理、道路、行政区划、停车场、充电桩……位置及轨迹出租车、乘用车、商用车、手机、共享单车、交通拥堵及事故、热点区域、常驻地点……用户身份信息、应用程序使用历史、驾驶习惯、制动习惯、智舱操作习惯、购买行为及偏好、职业年龄及教育水平、交通事故违规记录、维修保养信息车门状态、车内温度、胎压、雨刮器状态、油量/电池信息、电机速度,车灯/雾灯状态、传感器数据用户数据车辆数据长尾数据问题是高等级自动驾驶的核心问题数据尚未形成完整闭环,成了制约自动驾驶向高等级发展的最大难题。因此采集最后10%“极端工况”的长尾数据,让真正有用的数据被利用起来,才是数据闭环下一步应该具备的能力,也是高等级自动驾驶成败的关键点之一。90%驾驶场景复杂程度驾驶场景出现频率常见行驶场景:路况简单、易应对,出现频率高极端行驶场景:路况复杂、响应要求高,出现频率低当前业内普遍形成共识,自动驾驶的底层架构和大部分技术问题已经被解决,但由于现实道路场景复杂,即使现有技术已经实现绝大部分场景的自动驾驶,剩下的少数长尾场景始终无法覆盖。亿欧智库:自动驾驶长尾数据示意图©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)信息来源:公开资料、亿欧智库2.1.1
数据增长速度与处理能力不匹配,AI平台发展初期仍存“数”“智”割裂难题数据平台AI平台原本应紧密相连的数据平台与AI平台仍处割裂状态AI平台需要大规模准确数据哺育数据资源的优劣极大程度决定了AI应用的落地效果。过去企业自身搭建的传统数据治理体系,多停留在对于结构性数据的治理优化,在数据质量、数据字段丰富度、数据分布和数据实时性等维度尚难满足AI应用对数据的高质量要求大量数据未被利用与托管自动驾驶等级越来越高,量产应用规模越来越大,采集、存储、加工等多个环节均有大量数据未被有效利用及托管,因此无法激活数据要素的潜能,原本应具有极高价值的数据不能完全兑换其价值15数据 算力平台算法平台/AI模型数据的数量和质量算力规模自动驾驶在数据驱动模式下,海量数据、大规模算力与算法平台/模型是最为重要的三大元素,三者相互支撑、紧密相连。技术割裂自动驾驶数据闭环主要由数据管理和算法模型两部分组成,前者基于以大数据技术为核心的数据平台,后者基于以AI机器学习技术为核心的AI平台,两者技术路线并不相同,易产生技术割裂数据孤岛自动驾驶数据类型繁多,数据格式各不相同,存储方式及管理方式亦不相同;多元异构数据使数据仓库、数据湖、AI数据等数据之间形成孤岛不可能三角自动驾驶数据闭环追求更大数据量、更低存储成本、更高计算效率,而这在传统架构中是无可实现的不可能三角问题治理困难从数据采集到模型训练再到仿真测试,数据闭环中数据生命周期漫长,导致数据极具复杂性,管理难度高、资源消耗大,且模型训练前的数据准备工作耗时耗力自动驾驶数据驱动开发模式下,基于大数据技术的数据管理与基于机器学习的模型训练密不可分,数据闭环天然依赖数据与AI相互支撑、相互赋能,共同加速数据闭环,数字化与智能化融合已成为必然趋势。然而产业发展初期数据平台与AI平台仍呈割裂状态,相互赋能的正向循环未能构建起来。自动驾驶在向高等级发展的过程中,极速增长的数据带来了一系列处理难题亿欧智库:自动驾驶技术发展三要素©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)数据采集数据传输数据存储数据处理模型训练场景仿真测试评估部署L2L3L42000+ 10亿公里 10亿+200+ 1亿公里 1000万+10+ 1000万公里 10万+6-10 10万公里 1万+3-5 1万公里 1000+2-3 1千公里 100+16自动驾驶成本既包括解决长尾问题的研发成本,也包括相应的数据成本。在收集长尾数据、训练自动驾驶能力的过程中,硬件设备的改装维修、算法模型的更新迭代、研发人员的雇佣维护以及海量数据带来的传输和存储都形成了数以百万、千万计的成本。而车企在不断冲刺高等级自动驾驶的同时,累积越来越多的里程与测试数据,进一步提高了发展成本。信息来源:专家访谈、亿欧智库2.1.2
数据处理需要大量资源及技术投入,研发与应用成本齐飙亿欧智库:高等级自动驾驶数据闭环各环节资源与成本消耗曲线工程师成本 通信带宽费用 数据挖掘算法 成本 场景仿真搭建算法研发成本
研发人力成本采集车维护 数据压缩加密
存储空间费用
大量标注成本
自建数据中心
地图开发采购
数据集群搭建
系统OTA传输亿欧智库:自动驾驶不同等级预估最小测试数据最小车辆数 最小里程数 测试场景数研发成本人力成本运维成本应用部署成本时间成本业内普遍认为,自动驾驶要到能够量产、足够安全需要积累约110亿km的里程,而拥有世界上最大无人驾驶车队的waymo十年才实现了3500万km;业界普遍认为开发自动驾驶平台理论上需要3个月,采集、标注、训练等环节都需要大量的时间成本高级别工程师:算法模型需要工程师不断维护迭代大量操作人员:标注等尚未完全自动化的环节,需要大量的操作人员雇佣成本(一天标50万张图/千人团队,人工成本3个月接近1000万元)自动驾驶汽车需要高频的更新与运维,包括海量数据存储、软件系统迭代、运维基础设施、硬件设备运维(假设一辆测试车采集到10TB的全部原始数据都存储,一年的成本将超过800万美元)自动驾驶数据驱动研发环节多,需针对性设计开发工具,如数据挖掘工具、建模工具、仿真场景库搭建工具等(自建算力中心的初期投入预算普遍超过亿元,相关AI模型的成本如GPT-3训练费用超过1200万美元)功能开发过程中软件硬件适配、调试工作也需要很大的成本海量数据在车端、云端上下传输,对实时性、带宽、稳定性都有极高要求;例如,L4-L5级自动驾驶汽车的所有数据传输到云端的成本高达数千美元成本主要在模型训练集群其次是仿真集群、数据存储以及数据处理与标注©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)17信息来源:《自动驾驶数据安全白皮书》(2020)、亿欧智库2.1.3
海量数据类型复杂,各层级均存在安全风险隐患恶意节点攻击(传感器节点与云端接口间、通信总线与ECU间缺少认证保护机制)内外传输风险(内部交互易阻塞或被篡改,导致反馈不及时,外部交互易受到窃听或攻击,泄露地理信息、敏感数据等)通信协议风险(多种网络接口的通信协议安全漏洞威胁传输安全,可能遭到破解窃取)通信层平台安全风险(不同类型、不同级别的自动驾驶数据汇聚,数据价值较大,易成为攻击焦点)大数据处理风险(海量数据未经细粒度访问控制,可能被滥用,未经分类隔离、分级防护,数据融合易引发隐私泄露)隐私泄露风险(地理信息、个人隐私、商业化测试数据、仿真场景化数据、高精地图等可能流转外泄)越权访问风险(越权访问或滥用权限,非法获取造成数据破坏,篡改未加密升级包,阻止车辆安全漏洞、风险的修复)系统/软件漏洞(恶意修改平台系统及应用软件,获取用户隐私、驾驶数据甚至车辆控制权,降低车辆安全性、稳定性)平台层决策/控制安全(数据遭窃取或篡改后,可用性和完整性被破坏,造成车辆失窃或失控)测试/仿真安全(遭到篡改导致数据集准确性降低,影响功能的安全性和可靠性)或被非法控制)应用层采集设备安全(测试车辆二次改装易造成组件丢失损坏,改装设备一致性差、性能不稳定)路测基建安全(路端基础设施改造成本巨大,数据安全防护机制设计部署不足)感知数据完整(传感器可能受到干扰而失灵,造成感知数据识别错误或污染,采集过程可能受到阻断)采集层亿欧智库:自动驾驶各层级数据安全风险个人信息安全(越权访问、存储导致数据泄露,可能导致车辆被盗用户隐私数据、测试场景数据、人机交互数据等不泄露给未授权的个人、实体、进程,并保证其不被利用。自动驾驶决策控制数据、动态交通环境数据等未被更改或破坏,保证车辆信息数据的正确生成、存储和传输。已授权的个人、实体一旦需要就可以访问和使用自动驾驶数据和资源。自动驾驶数据量级越大、涉及面越广,其安全隐患就越大。在多层级处理、流动中都暗含大量安全风险,一旦数据被攻击、窃取、篡改,将对企业、公民、社会乃至国家安全造成损害。高等级自动驾驶数据安全要求严格机密性 完整性 可用性©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)云服务从数据出发,综合云底座基础能力,尤其通过赋能大模型,对健全开发工具链提升自动驾驶研发效率,促进自动驾驶功能迭代落地,帮助企业实现降本增效和商业闭环,遵从法律法规保障数据安全合规等多方面,深度赋能数据闭环。信息来源:公开资料、亿欧智库2.2
云服务以数据处理为核心,叠加大模型深度学习能力,赋能数据闭环降本增效云底座计算存储网络云原生数据库云底座基础能力云传输数据闭环挑战“合规难”数据确权模糊数据防护薄弱数据合规困难“数据多”模型训练效率低底层硬软设施迭代慢数据处理效率低“成本高”研发成本高 研发周期长研发成果转化慢量产落地进度慢18云服务赋能安全为重保障数据合规效率为先强化数据处理研发为核提升研发效率全球为局推动商业落地融合为方促进数智融合大模型©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)信息来源:公开资料、华为云、亿欧智库2.2.1
效率为先,计算上云加速海量数据处理19云传输云存储云计算云端大模型助力提升算力、分布式缓存技术提升效率计算集群规模庞大,发挥分布式计算、并行计算能力提升针对海量数据的处理能力分布式存储架构和对象存储技术,具备大容量、高可靠性、高性能、高伸缩性、低成本等优势第三方云存储可以节省成本,客户只需支付服务费用大量数据接入点和网络节点遍布各个地区,支持数据快速上云自动驾驶数据体量庞大、种类庞杂,给数据计算、存储和传输都带来极大压力。云服务能够发挥高效计算、超大存储、迅捷传输等能力,针对性处理自动驾驶数据。云服务商提供高效海量数据处理方案更高算力、更高效率 更大容量、更低成本 更低延时、更快传输数据加载加速DataTurbo利用本机SSD做分布式缓存,降低存储成本数据读取时间缩短50%模型训练加速TrainTurbo数据加载优化,CV部分场景(多图片)加速30%高性能算子和编译优化,训练效率提升40%+通信优化,训练线性加速90%+模型推理加速
InferTurbo通过图编译技术加速模型推理推理效率提升2-5倍多模型多进程复用GPU优化,提升GPU利用率相较于人工与本地AI训练的数据处理能力,云计算的高算力数据处理效率提升10倍以上,成本降低50%传统网络的时延以秒计算,云服务商通过打造数千个边缘节点,就近实现数据传输和计算处理,能够有效降低时延至100毫秒以下公有云存储成本相较于自建数据中心能减少10%-20%;云平台还可以用高压缩态的方式存储,同时进行数据筛选。如某头部云厂商冷数据下沉率可达96%华为云:华为云AI云存储方案能够实现高效训练、精细存储、快速入云AI训练高性能缓存 ModelArts实现数据处理加速语义直通1小时预热2亿条元数据云上云下部署近GPU加速元数据预热速度提升20倍10亿条元数据预热时间从100H降至5H统一数据湖多种存储规格4种规格适配不同热度数据智能数据分级存储自动识别冷数据存储指标看版70+指标,数据精细化管理数据存储成本下降20%冷数据下沉率最高96%数据入云服务全国50+接入点车企就近接入磁盘槽位600+,专线总带宽1000+Gbit/s每天完成10PB数据上云磁盘快递,专线传输完成路采数据24H入云©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)数据管理平台数据处理平台AI模型训练平台仿真评测平台数据上云部署传统自动驾驶开发工具多头建设十分零散,外购与自研并存,流程难以打通,工具链路调试费时费力,严重拖慢研发进程。云服务以数据驱动为指导,覆盖数据闭环关键环节,提供全栈式研发工具链,实现开发入云,提升研发效率。信息来源:公开资料、华为云、亿欧智库2.2.2
研发为核,全流程用云助力构建全栈开发工具链业务割裂数据孤岛传统自动驾驶开发采用分段式开发开发工具呈现离散特征“各管各的,相互分割”开发效率低开发工具链需要数据打通以提高研发效率云服务商提供端到端全栈式连贯工具链20工具连续从数据上云到模型部署,数据闭环各个环节对应开发工具相互打通,业务之间连续性更强数据连通数据统一由云平台管理处理,满足合规要求,解决标准、格式不统一问题,打破数据孤岛,加速数据流通减少调试、时间成本、人力成本,从而降低研发成本缩短模型训练时间,加速算法模型迭代,提升研发效率华为云:华为云坚持开放生态,打造全栈自动驾驶开发平台,满足企业一站式建设方式,也支持按需搭建、灵活组合的模式数据服务训练服务仿真服务自动驾驶云服务平台海量数据存储与处理 可拓展的算力支持 算法模型 虚拟仿真和回放式仿真 开放和易扩展平台场景挖掘难例挖掘数据标注 数据回放感知算法增量数据集模型实车测试 数据上云/存储 数据处理 大屏展示虚拟场景库为车企提供一站式平台:开发
→测试→商用,实现按需使用、即插即用为车企提供模块化解决方案:数据驱动的自动驾驶开发,测试,仿真的闭环方案数据驱动闭环“自研”AI数据标注与挖掘平台精准仿真+评价预期功能安全©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)云服务能够有效打通底层元数据管理模式,构建统一数据治理底座,同时创新存算架构,基于连通共享的数据底座实现数据治理和AI开发的相互融合,打造数据与AI相互赋能、共同加速数据闭环的正向循环。信息来源:公开资料、华为云、亿欧智库2.2.3
融合为方,云服务为数智融合统一搭建底座云服务助力构建数智融合开发平台统一数据共享实现数据资产化,在统一平台中打通元数据管理模式,实现数据统一管理、共享统一权限管控建立健全权限控制能力,明确业务间数据管控权责范围,实现统一权限管控统一开发编排融合端到端大数据和AI模型训练任务,提升整体开发效率打破数据孤岛联结技术割裂华为云:采用存储-缓存-计算三层分离架构,打造数智融合平台,利用盘古大模型深度赋能数据闭环核心场景亿欧智库:华为云数智融合平台架构存储-缓存-计算三层分离三层池化架构(计算池、存储池、缓存池),打破资源边界,性价比提升30%统一元数据管理全局数据地图同一份数据在数据湖、AI间自由共享,实现用数更便捷、权限有保障;百PB级数据可视、可管工作流统一编排DataOps+MLOps无缝协同,在同一平台完成开发、测试、交付,打通技术便捷,提升业务创新效率统一数据底座突破不可能三角效益限制减少治理时间提高业务效率创新存算架构低代码自动化三大核心能力21统一计算服务实时计算引擎批量计算引擎交互处理引擎AI计算引擎数据缓存难例挖掘数据标注数据生成KPI指标分析场景生成大模型场景理解大模型预标注大模型多模态检索大模型统一元数据服务统一元数据数据访问控制数据生命周期管理全局数据地图 数据闭环场景数据预处理 数据回收 场景标签化资产搜索定位全局血缘分析数据资产热度分析盘古大模型深度赋能统一存储服务原始数据脱敏后数据场景数据训练数据仿真数据集标注数据集KPI
数据©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)云服务围绕自动驾驶数据采集、存储、处理、使用等流程设计安全合规方案,实现数据采集操作合规、数据传输保密安全、数据存储安全可靠、数据使用全程监管、资质图商全程管控。信息来源:公开资料、华为云、亿欧智库2.2.4
安全为重,数据入云确保流程安全合规《自然资源部关于促进智能网联汽车发展维护测绘地理信息安全的通知》界定测绘行为、明确测绘资质要求、严控数据外传《中华人民共和国测绘法》测绘合规:采集国家地理信息合规《中华人民共和国个人信息保护法》隐私合规:采集用户隐私相关数据合规数据采集云服务商与图商合作,由具备测绘资质的图商进行合规数据采集。数据使用由云服务商在客户使用数据过程中提供监管、运维数据服务。数据采集之后将被存储到合规云,即图商管理区。云服务商对数据进行脱敏、脱密处理,使之成为非敏测绘成果数据;或通过脱敏、脱密处理使之成为非测绘成果数据,经过图商审查后可存储至其他私有云/公有云以供使用。云服务商提供数据合规方案华为云:建设乌兰察布汽车专区,提供全流程安全合规服务华为云头部图商建设专区联合提供服务方案数据传输自动驾驶研发必须有数据合规方案数据存储 数据传输 数据处理数据传输223分区合规架构 7层安全防护数据处理区双因子
|
专线接入
|
图商专属智驾业务区数据闭环
|
图商监管网络中继区身份认证
|
图商审批认证资质通过120+权威安全合规认证集成16+安全隐私合规模块10000+安全基线600+检测项30+年安全经验积累中国首个TISAX汽车行业认证云厂商51 2 3 4物理 身份 网络
应用安全 认证 防线
防线6 7主机 数据 运维防线 防线 防线安全云脑安全运营智能化实时态势感知日志分析引擎威胁检测&相应处置响应策略管理©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)35.6%25.8%11.9%13.9%6.9%亚洲欧洲南美洲北美洲非洲大洋洲信息来源:公开资料、亿欧智库2.2.5
全球为局,云厂商护航自动驾驶相关企业安心出海数据闭环出海挑战海外本土合规难海外数据管理难跨境沟通协同难云服务能力专业本土团队全球数据中心统一存算网络业务本土化服务数据合规化服务运营精细化服务覆盖多数出海地区提供强力存算服务保障数据安全合规云上数据不分家数据传输低延时沟通协同无障碍数据闭环易断层维护境外数据闭环完整运行智能汽车出海需要在当地有一个符合当地数据隐私、合规安全相关的法规运营合作伙伴,而国际化云服务商可联结其全球安全合规数据中心,不让自动驾驶数据闭环因出境而断层,助力中国车企安心出海。当前汽车出海地区多为东南亚、欧洲、南美洲等地区,各云服务商根据海外数据中心布局情况因地制宜为汽车企业出海护航。云服务商化身车企海外运营伙伴,发挥云服务能力维护境外数据闭环运行,助力车企出海自动驾驶功能继续快速更新迭代亿欧智库:2022年中国整车出口地域销量占比(%)5.9%亿欧智库:中国部分云服务商海外布局情况(单位:个)23302926848870华为云阿里云腾讯云区域 可用区区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储等公共服务。可用区(AZ,Availability
Zone):一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。云服务商在全球布局数据中心数据中心的位置通常用区域和可用区来描述:©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)24大模型的性能和泛化能力相比传统小模型有了显著提高,且深度学习能力让其可以自主加速进行算法迭代。在需要消耗大量人力且效率低下的环节中,大模型都可以起到十分重要的作用,在很大程度上帮助自动驾驶数据闭环解决效率及成本的问题。目前大模型在自动驾驶领域中主要有两种应用方式,分别是:自建通用大模型和通过微调打造垂类大模型。大模型对自动驾驶数据闭环的影响主要体现在感知和规控两方面,具体表现为多模态感知、数据处理、数据生成,以及驾驶过程中的决策和路径规划、实例级的在线建图、城市NOA、车体纵横向控制等任务中。信息来源:亿欧智库2.2.6
大模型加速研发步伐,从多维度推动自动驾驶前行智驾能力大模型模型微调打造垂类大模型恰当的模型微调能够赋予模型在特定领域的能力和与人类“对齐”的能力。模型调整的方法繁多,以ChatGPT的训练过程为例,预训练好的基础模型进一步的训练通常分为三步:采用人工标注好的数据来训练模型;通过人类对模型答案的排序训练一个奖励模型;使用奖励模型通过强化学习的方式训练ChatGPT。自建通用大模型是解决自动驾驶数据问题的首要解决方案,很多车企及头部Tier厂商选择构建自己的多模态通用大模型,但这同时也意味着挑战。如今我国通用大模型仍以追赶ChatGPT为主,未来依靠头部领军企业,将逐步开发出中国自己的ChatGPT,甚至超过GPT4的水平。自建通用大模型感知规控数据处理与利用数据生成视觉感知多模态感知城市NOA车体控制远程安全接管场景脱困大模型经过反复训练,可将完整的驾驶策略分拆为自动驾驶场景的动态识别过程,进而实现可理解的逻辑链条。赋能增强小模型远距离3D视觉感知在图像端和点云端提升感知效果主要体现在突破长尾技术瓶颈、标注、模型训练上,助力成本下降,便于定制化训练模型生成海量数据,助力仿真平台构建大模型泛化能力强,平滑性好,能够更好的应对复杂场景有效识别城市场景,实现城市导航辅助驾驶更好的车体纵横向控制基于安全可靠的AI预测技术,实现一对多接管提升对于障碍物的检测能力两大方面 具体影响 主要部署方式感知大模型通过半监督方式自迭代,增强视觉感知小模型,赋能多模态感知;同时利用图像弱监督预训练的模型挖掘长尾数据提升模型效果。公有云部署公有云训练+推理汽车专区云专属资源池混合云部署HCS私有化部署©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)25大模型对于数据闭环的赋能体现在车端、云端等多个方面。NeRF技术是自动驾驶大模型中近两年被广泛应用的核心技术,通过三维重建,深度赋能自动驾驶数据闭环多个环节。多个头部企业也正通过技术研发,实现NeRF技术与大模型结合在自动驾驶中更广泛的应用,主要表现在自动标注、仿真测试、路采数据扩充、cornercases生成等方面。信息来源:公开资料、华为云、亿欧智库2.2.6
头部企业聚焦大模型+NeRF技术,未来将赋能城市级自动驾驶多场景数据处理NeRF即神经辐射场技术,采用神经网络对隐式重建,利用可微渲染模型,从已有视图中学习如何渲染新视角下的图像,从而实现照片级逼真的图像渲染。NeRF最先应用在新视角合成方向,由于其超强的隐式表达三维毫末智行毫末智行提升了NeRF最终合成的效果,除了重建三维结构,还以高精度恢复路面纹理,以便更准确地了解整个场景、掌控真值,从而根据需要做标注。结合BEV模型训练的带有3D标注的真值数据,场景重建的误差小于10cm,同时还能对场景中的动态物体做出肉眼难辨的重建和渲染。华为云华为云场景生成大模型采用NeRF技术对街景&泊车场景进行三维重建,实现“同一对象只标一次”即可迁移所有相关图像,“同一场景只采一次”即可获得不同视角图像。可按需模拟生成罕见场景和CornerCase,如不同天气,行驶路线、不同光照等,加速数据爬坡进程,降低数据采集成本和难度。同时,华为云也通过NeRF提升仿真数据生成效率,以数据生成替代实车路采,降低仿真成本。大尺度无边界场景重建信息的能力,如今在自动驾驶三维重建领域迅速发展起来。目前NeRF相关的应用大概分成两类:单纯的视觉上进行大尺度无边界场景重建,和场景重建后对场景进行重新编辑,以进行自动驾驶测试。场景重建+重新编辑图像位姿训练NeRF渲染新图像其他应用NeRF技术企业特斯拉特斯拉率先提出将NeRF应用在自动驾驶领域,主要体现在两方面:用NeRF做城市级大规模场景重建和借助体渲染为占用网络提供额外监督。其中城市级大规模场景重建能够生成自动驾驶模拟数据集,可以自定义场景,用以自动驾驶训练。Waymo2022年2月,Waymo构建了
Block-NeRF网格,用
280
万张街景照片重建出整片旧金山市区的
3D
环境。在此前,NeRF的工作往往侧重于小规模和以对象为中心的重建。商汤科技2023年7月,商汤科技与上海AI实验室联合香港中文大学、清华大学等发布升级版“书生通用大模型体系”。其中,书生·天际针对大规模城市级场景的NeRF建模,具备千亿参数,已实现对100平方公里城市实景进行4K高精度建模以及编辑。如今,“书生”大模型正在自动驾驶等领域,助力感知决策一体化,让自动驾驶更智能。位姿偏移自动修正开阔大场景厘米级偏移生成场景可按需编辑盘古大模型NeRF场景生成©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)26信息来源:亿欧智库2.3
云服务助益数据闭环各个环节,加速闭环高效运转数据闭环的流程可以大致分为数据采集、数据标注、模型训练、仿真测试和应用部署五个环节。随着自动驾驶的发展演进,各环节面对海量数据都出现了新的发展瓶颈与痛点,云厂商所提供的服务能够渗透进各个环节,从前端的数据采集到中间的感知训练环节,再到后期的仿真和部署环节,云服务不同程度的帮助自动驾驶流程做到采集用云、数据入云、存算上云、测试进云、部署靠云的全链路支撑。亿欧智库:云服务能力支撑自动驾驶数据闭环发展专业测试车辆数据生成模拟/存储标注、大模型应用压缩/加密/转换重复(下一步)软件仿真模拟处理/采样/筛检输入/快递/存储社会化量产车辆OTA升级优化车端模型部署算法测试 训练 控制逻辑验证...结果生成/分析场景编辑数据采集 数据标注 模型训练 仿真测试应用部署云服务能力加速自动驾驶数据闭环:采集用云、数据入云、存算上云、测试进云、部署靠云云服务可以支撑3D点云、4DClip、NerRF模型等进行更高效的自动标注数据入云、降本提速通过数据分级进行筛选及存储;搭建就近接入点,高效传输采集用云、清晰全面云服务支撑AI大模型进行大量的自主训练和深度学习,推动算法不断迭代升级存算上云、准确高效云服务为仿真场景库提供高弹性的资源空间,同时大模型等技术可以帮助构建高质量的3D城市级仿真场景测试进云,高质保量分布式节点提供更快速、及时的传输服务,助力OTA升级等环节部署靠云,安全便捷传统单测试车采集无法胜任如今量大、类多、挖掘难等问题传统人工标注需要较高时间和人力成本,效率不高,且质量不齐高等级自动驾驶需要大量模型训练算法才能持续运转数据闭环越高等级自动驾驶越需要仿真测试,但同时也面临着测不全、测不快、测不准、不会评等技术难题软件包版本众多、管理难度大;耗时过长,影响用户体验等问题©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)©亿欧智库-韩宇
(181775)百度
文心大模型小马智行
BEV感知算法大模型OpenAI
CLIP模型觉非科技
感知大模型理想
Mind
GPT商汤
UniAD腾讯
混元AI大模型……毫末智行
DriveGPT:通过引入驾驶数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 淮阴师范学院《统计计算与软件》2023-2024学年第一学期期末试卷
- 淮阴师范学院《名师成长案例研究》2022-2023学年第一学期期末试卷
- 淮阴师范学院《灾害地理学》2022-2023学年第一学期期末试卷
- 黑便课件教学课件
- 淮阴师范学院《测量与地图学》2022-2023学年第一学期期末试卷
- 淮阴工学院《制药过程安全与环保》2023-2024学年第一学期期末试卷
- 淮阴工学院《信号与系统》2021-2022学年第一学期期末试卷
- 围术期肺部超声的应用
- 生物识别系统的比较和对比考核试卷
- 仪器仪表制造业企业文化建设考核试卷
- 陕煤集团笔试题库及答案
- 33 《鱼我所欲也》对比阅读-2024-2025中考语文文言文阅读专项训练(含答案)
- (正式版)HGT 22820-2024 化工安全仪表系统工程设计规范
- (高清版)TDT 1075-2023 光伏发电站工程项目用地控制指标
- 《中华民族共同体概论》考试复习题库(含答案)
- 2022-2023学年武汉市江岸区七年级英语上学期期中质量检测卷附答案
- 运用思维导图优化初中数学课堂的实践与探究
- 中考物理专题21 欧姆定律的动态电路计算(原卷版)
- 2022年2022年北京市各区中考英语一模试卷分类汇编完形填空专题
- (完整word版)酒店流水单
- 科技促进经济发展探讨
评论
0/150
提交评论