2023云服务驱动自动驾驶数据闭环发展_第1页
2023云服务驱动自动驾驶数据闭环发展_第2页
2023云服务驱动自动驾驶数据闭环发展_第3页
2023云服务驱动自动驾驶数据闭环发展_第4页
2023云服务驱动自动驾驶数据闭环发展_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

云服务驱动自动驾驶数据闭环发展白皮书2023前言《云服务新引擎,高效驱动自动驾驶数据闭环发展白皮书》简介Tier1赴”。通过云底座核心能力和云端大模型深度赋能数据处理全流程,构建全栈式自动驾驶开发平台,为主机厂、Tier1等企业提供更智能、更高效率的数据及服务,强化数据驱动能力,加速数据闭环,助力客户实现自动驾驶开发降本增效和量产落地。同时探索具备专业积累及强大感知、计算、处理、等能力的云服务商可赋予各环节的价值。在高速发展的中国汽车产业背景下,车企及相关供应商应进一步开放合作,携手共建盛世繁荣的产业生态。《云服务新引擎,高效驱动自动驾驶数据闭环发展白皮书》核心观点中国智能汽车逐步向高等级自动驾驶发展,数据驱动开发模式下,构建高效数据闭环刻不容缓;自动驾驶数据闭环发展主要面临海量数据处理能力弱、基础设施研发成本高和数据安全合规保障难力赋能数据闭环,为自动驾驶研发提供完整有效的解决方案;云服务搭载大模型深度赋能数据闭环各个环节,如clip内容理解、自动标注、加速模型、生成高质量场景库与场景库等;华为云从技术、服务、生态三方面构建自动驾驶数据闭环新范式进一步通过路端大生态的打通,构建基于云服务更大的数据闭环。23.13.13.2目录目录CONTENTS01自动驾驶发展机遇与挑战01自动驾驶产业发展洞察自动驾驶产业发展面临新挑战自动驾驶发展需要更加高效的数据闭环02云服务赋能自动驾驶数据闭环02自动驾驶数据闭环发展痛点分析自动驾驶数据闭环需要云服务赋能云服务加速数据闭环各环节高效运转自动驾驶数据闭环产业图谱及分析03云服务助力构建自动驾驶数据闭环新范式03目录目录CONTENTS01 自动驾驶发展机遇与挑战自动驾驶产业发展洞察01 自动驾驶发展机遇与挑战自动驾驶产业发展洞察自动驾驶产业发展面临新挑战自动驾驶发展需要更加高效的数据闭环02自动驾驶数据闭环发展痛点分析自动驾驶数据闭环需要云服务赋能云服务加速数据闭环各环节高效运转自动驾驶数据闭环产业图谱及分析03云服务助力构建自动驾驶数据闭环新范式03信息来源:华西证券、中金证券、亿欧智库5信息来源:华西证券、中金证券、亿欧智库5自动驾驶发展进入下半场,技术逐步向高等级自动化发展展。亿欧智库:自动驾驶产业发展速度示意图领先试水领先试水谷歌启动项目局无人驾驶百度成立自动驾驶团队司成立Waymo开始RobotaxiUber无人驾驶汽车上路试验阿里、滴滴设立自动驾驶部门Momenta等公司成立华为成立智能汽车解决方案业务单元化测试四维图新获国内首个L3以上高精度地图订单华为发布鸿蒙车载OS系统;百度L4巴士量产头部企业开始投放L4Robotaxi运营城市NOA加速规模化应用高等级自动驾驶逐步落地应用广泛应用,跨越升级逐步泛化高速发展创新起步2009 2013

2015

2018 2023步入平稳发展阶段,逐步转向高速、矿山、港口等封闭/半封闭场景应用,代表技术包括:步入平稳发展阶段,逐步转向高速、矿山、港口等封闭/半封闭场景应用,代表技术包括:HWP(高速驾驶引导)、TJP(交通拥堵领航)、NOAHighway(高速领航驾驶辅助)等进入快速发展阶段,电动化成为行业竞争焦点,代表技术包括:APA(自动泊车辅助)、APO(自动驶出)、HWA(高速驾驶辅助)等智能化成为竞争焦点,大模型等技术发展助推自动驾驶迈向新的阶段,代表技术包括:NOACity(城区领航驾驶辅助)、AVP(自动代客泊车)等自动驾驶从实验室转向商业研发,少数头部开始布局自动驾驶,代表技术包括:ACC(自适应巡航)、AEB(自动紧急制动)等大模型势头正盛,助推自动驾驶向高等级发展

数据与算力互促互进,助推行业智能化发展

亿欧智库:自动驾驶数据及算力增长速度曲线示意图2023年,城区自动驾驶成为主要发力方向,多家Tier1、科技企业发布应用于自动驾驶和智能座舱的大模型,通过深度学习与反复

华为 OpenAI百度科大讯飞商汤中科创达阿里 毫末智行

自动驾驶发展前期,数据量从TB级增长至PB数据增长速度快于算力。远快于数据增长速度。

<1TOPSTB级

10TOPS

500TOPSPB级100TOPS

EB级5000TOPS自动驾驶算力增长速度曲线自动驾驶产生数据训练,助推高等级自动驾驶。

……

2013 2023

增长速度曲线信息来源:公开资料、亿欧智库6信息来源:公开资料、亿欧智库6汽车系统快速迭代,高阶智驾方案量产加速布局软件定义汽车如今已经成为业内共识,智能汽车软件系统持续快速更新迭代。以特斯拉为例,其智驾系统经历了数次更新迭代,近期FSD即将面向中国开放。另一方面,在“重感知轻地图”的争议之下,BEV自主品牌已经纷纷开启L4级自动驾驶量产落地计划,向城市级应用进发。汽车智驾系统快速发展,BEV融合方案助力城市NOA规模化落地激光雷达原始数据 原始数据特征提取 特征提取摄像头毫米波雷达原始数据特征提取激光雷达原始数据 原始数据特征提取 特征提取摄像头毫米波雷达原始数据特征提取轮速传感器IMU提供全局视野:俯视图视角少有遮挡,算法也可以对被遮挡区域进行预测,同时引入时序信息,让感知结果更连续稳定特征级融合:减少层层处理以及先验规则带来的信息丢失,让多模态数据特征在同一空间中融合,信息关联性更强4D数据:静态道路信息与动态道路参与方统一在同一个坐标系下,通过实时感知与转换,在行驶中即可实时生成“活地图”结果输出映射到统一坐标系下融合训练学习结果输出映射到统一坐标系下融合

近几年,“重感知轻地图”的争议一直未有定论,随着BEV方案的出现,车企看到了不依赖高精地图的可能性,即通过GPSIMU、轮速计以及导航地图,实现精准定位;通过BEV+Transformer,提升车辆感知和决策能力。FSD/AP系统APHW1.0FSD/AP系统APHW1.0APHW2.0APHW2.5FSD/APHW3.0FSDHW4.0自主品牌20212022202320242025长安L2L2.5L2.9L4上线时间2014.092016.102017.082019.042023H2(E)长城L2.5L2.9L4比亚迪L2L2.5L2.9L4处理平台/主芯片MobileyeEyeQ3NvidiaDrivePX2NvidiaDrivePX2+TeslaFSDTeslaFSD2代一汽L2.5L3L4吉利L2.9L3L4算力(Tops)0.2562020144(双芯片)预计性能将是HW3.0三倍左右广汽L2.9L4功耗(W)25250300220北汽L2.5L2.9L4上汽L2.5L2.9L4图像处理能力(fps)361101102300奇瑞L2L2.5L2.9L4东风L2.9L4特斯拉自动驾驶系统经历近十年迭代,软硬件都有大幅提升。2023年5月,FSDBeta版本更新至11.4.2,对路面检测、切入切出、车道保持等功能进行优化。FSD入华也随着内外部条件的成熟而变得更加有可能性,将进一步刺激中国消费市场对高等级智驾的接受度。

亿欧智库:部分自主品牌车企智驾功能量产落地规划近两年,自主品牌已全面以高阶辅助驾驶功能作为其品牌智能化主打特色,并进行相关战略,这也意味着市场即将迎来以NOA为主打的高阶智驾功能的量产落地。信息来源:公开资料、国务院新闻办、各城市智能网联汽车测试工作小组7信息来源:公开资料、国务院新闻办、各城市智能网联汽车测试工作小组7政策引导助推自动驾驶产业升级,城市落地验证新兴技术应用发展减免政策至2027年底,从供需两端推动产业迭代升级。“车-路-云”一体化融合发展也将成为未来产业推进的关键所在,完善的云控基础及云端计算能力,能够从多方面推进智能网联以及高等级自动驾驶大规模、高质量发展。大模型算法等关键技术的研发均受到城市级关注。国外相关政策也积极推动自动驾驶城市级应用的落地推广。2023年6月21日国务院政策例行吹风会:促进新能源汽车产业高质量发展深化测试示范应用启动智能网联汽车准入和上路通行试点,组织开展城市级“车路云一体化”示范应用,支持L3及更高级别自动驾驶功能商业化进一步完善网联基础设施加快C-V2X、路侧感知、边缘计算等基础设施建设,建立基于边缘云、区

武汉开放路网里程:1500.0km发放牌照:200+个重庆开放路网里程:1486.8km发放牌照:60+个广州开放路网里程:1749.8发放牌照:220+个

国内外自动驾驶相关落地政策及城市应用最新进展全国已建成17个全国已建成17个测试示范区、16个“双智”试点城市、7个完成了7000多公里道路智能化升级改造,装配路侧网联设备7000余台套2022功能的L2级乘用车新车渗透率达到了34.5%开放路网里程:1143.8km发放牌照:600+个上海开放路网里程:1800.0km发放牌照:600+个长沙开放路网里程:317.0km发放牌照:55+个深圳开放路网里程:201.4km发放牌照:260+个域云和中心云三级架构的云控基础平台,形成统一接口、数据和通信标准,提升网络感知、云端计算能力支持关键技术攻关支持重点大企业牵头,大中小企业参与,开展跨行业跨领域协同创新。加

北京市科委、中关村管委会发布北京市首批人工智能行业大模型应用案例自动驾驶大模型DriveGPT示范应用:毫末智行、长城汽车城市大脑大模型示范应用:科大讯飞、中科大脑公司英国允许无人驾驶汽车商用:2023年6月,英国初创

《关于更好发挥数据要素作用进一步加快发展数字经济的实施意见》“建设数据要素创新研究院,支持数据驱动的科学研究。探索数据训练基地,促进研发自然语言、多模态、认知等超大规模智能模型。”快关键芯片、高精度传感器、操作系统等新新产品的研发和推广应用,提升产业发展内生动力

公司ImperiumDrive推出无人驾驶汽车租赁项目,该项服年8月,加州议会的公共事务委员会宣判,允许谷歌旗下Waymo和通用旗下Cruise的Robotaxi在旧金山不受限制载客。7x24小时、区域不限、全无人、可收费信息来源:乘联会、中国海关总署、公开资料、亿欧智库8信息来源:乘联会、中国海关总署、公开资料、亿欧智库8国际市场逐年拓展,汽车及相关供应链企业出海大势在即中国车企出海已经不止于面向海外售卖整车及零部件产品,而是进入价值链全球化进程,在云的加持下,通过技术出海、出海、品牌出海、生产出海等多种方式,中国品牌以产品、及投资在全球各区域打造多样化服务生态圈,有望实现汽车生态的落地生根。亿欧智库:2018-2022中国纯电动、插电混动乘用车出口额及纯电动出口额占比

整车出海,带动“全链”,电动化、智能化多领域迈向国际市场39.6%

45.6%

61.7%

85.7%

88.9%1,363

随着中国汽车工业的发展,主机厂出海越来越多,以、、品牌出海等方式,主动“走出去”,成功打响国际化品牌。在主机厂的带动下,多个相关细分领域也向海外市场延伸。自动驾驶、智能座舱、智能网联、动力电池、软件、车载雷达等,作为智能汽车的核心部分,都跟随整车出海,在国际市场上形成了一定的影响力。云服务商在中国汽车企业出海之路上搭建云端“基础设施”,以保证数据快速传输、高效存储,并为中国汽车产业链企业出海提供安全合规保障。亿欧智库:部分自动驾驶企业出海事件百度、SBDrive、金龙客车三方合力于2018本版“Apolong”;2022年,百度在美国加州进行自556

基础设施

车载雷达

动驾驶出行测试里程已达3986km;139

3631 10968

17193

池 软件内饰能源服务

主机厂

比亚迪、极氪、蔚来、小鹏等新势力车企都相继于2020年、2021年布局海外市场,并逐年加码;宁德时代、中创新航等动力电池企业也较早布局海外;速腾聚创等激光雷达企业自2021年就已开始出海;2018年 2019

2020年

2021年

2022年

后市场

……智能网联

毫末智行成为中国首个AEB算法落地海内外的公司;芯驰、纳芯微等诸多半导体企业都已开启海外业务布局;华为云、腾讯云、阿里云等云厂商通过提供安全合规服纯电动乘用车(亿元)插电式混合动力乘用车(亿元)纯电动乘用车出口额占比

云服务

务及自动驾驶数据相关服务助力车企出海;盛弘股份、道通科技等能源服务企业稳步发展全球业务;文远知行于2023年7月拿到中东首张国家级牌照……99多维因素助推自动驾驶产业迈向高等级发展阶段量产“加速”与应用支撑产业的高速发展,未来很长一段时间,自动驾驶产业的竞争重点将聚焦在基于海量数据之上的智能化及量产落地上。量产“加速”大模型势头正盛,加速助跑能化发展技术“奠基”大模型势头正盛,加速助跑能化发展技术“奠基”展,助推L3及以上自动驾驶落地国内外城市级落地促发展政策“助推”以主机厂为主整车出海,树立品牌化、智能化多领域迈向国际市场出海“拓展”BEV融合方案助力城市NOA落地,促进自动驾驶城市级自动驾驶迈向高等级发展阶段,大规模城市级落地将成未来重点自动驾驶迈向高等级发展阶段,大规模城市级落地将成未来重点信息来源:《自动驾驶数据安全白皮书》(2020)PAGE信息来源:《自动驾驶数据安全白皮书》(2020)PAGE101.2数据处理问题成为高等级自动驾驶需要解决的“头等难题”仅对数据处理的提出要求,同样也为安全保障带来巨大挑战。高等级自动驾驶数据特点——流动性规模性非结构性流动性规模性非结构性不同来源格式不同,数据的涉密性数据处理挑战数据采集难数据处理挑战

标注要求高

模型训练久

标准不一致

传输存储贵

安全要求高需要具备甲级或 复杂长尾场景不断增加

算法训练需要有效的数据、丰富的场景、完备的,

去噪、清洗、统一格 感知、判断、决策、执

道路、环境、司机、乘客等数据都有安全要求,未

在此基础上需重复训练。但目前很多模型加载慢,

式、标注、处理等各步骤由不同企业执行,难以通过统一任务需求进行引导,

等各模块间每秒传输量达数GB,车端与云端间同样要求稳定、高效的

来在城市级铺开后,经过敏感地区所取得的信息若数据对的量级和有效性都提出挑战

本高、效率低,无法支撑快速的Connercase

训练时间长,由此导致模型迭代慢,市场缺乏成熟高效的训练模型

因而口径不一,易造成信息损耗、数据丢失等情况

传输,由此产生的数据存储与流量费用十分可观

不能脱敏处理与安全托管,就有可能存在遭泄漏或篡改风险,造成安全隐患信息来源:亿欧智库PAGE信息来源:亿欧智库PAGE12高效挖掘、有效利用是自动驾驶面对海量数据的必选项,数据闭环因此逐步落地传输处理智能电动汽车传输处理智能电动汽车集自动驾驶数据闭环清洗算法模型云服务器验证标注成熟的数据闭环将更多的使用自动化工具和算法对数据进行处理、清洗和转换,以减少人工干预流程自动化海量数据与算法能够双向赋能,以算法处理数据,数据训练算法,有效循环、高速迭代处理效率高环节流程完整、数据全程跑通、真值不丢失、反复循环进行训练,实现不断地、持续的数据循环完整有循环亿欧智库:自动驾驶数据闭环定义专业测试车队和社会化量产车辆其行驶数据、位置轨迹、路况数据、场景数据等多种信息,专业测试车队和社会化量产车辆其行驶数据、位置轨迹、路况数据、场景数据等多种信息,处理形成数据集,经过清洗、标注等,基于智能云底座进行传输、等操作,结合场景,在输入验证的循环反复中,对算法进行迭代和升级,覆盖更多cornercase,推动自动驾驶解决方案向成熟进阶,提升自动驾驶能力的快速闭环迭代,加速自动驾驶规模化量产落地。技术发展推进数据闭环不断升级,大数据与多场景逐步落地应用自动驾驶数据闭环建设并非一日之功,从仅限在少部分的测试车上开始,闭环通路1.0随着技术的升级,自动驾驶进入高等级发展阶段,数据闭环的也顺势升级进入2.0阶段;未来,将向大规模量产的3.0阶段发展。如今,中国自动驾驶数据闭环已经走过了初步构建的第一阶段,正处于数据高效驱动的第二阶段,未来向搭建生态、催生商业化的第三阶段进发。随着阶段推进,处理数据能力与自动化运转能力大幅提升,产业协同更加高效,云商扮演更重要的角色,支撑新的商业生态建设。亿欧智库:自动驾驶数据闭环发展三阶段1.0阶段:2013-2017闭环通路初步构建发展初期的数据闭环较为简单,只是简单的通路构建,主要在测试车上发现问题并上传,由工程师们分析错误报告,以找出问题原因,进而修改代码并在下次更新后予以解决。这是传统的、简单的数据闭环,但效率不高,多个环节需要人工辅助。

2.0阶段:2018-2024数据驱动闭环升级随着的进步和自动驾驶等级的发展,传统的数据这一阶段,面向更大规模数据的闭环及相应技术和服务被车企及供应商广泛。大规模

3.0阶段:2025-2030催化商业落地端助力自动驾驶的终极实现。自动驾驶数据闭环生态体系大规模标注分析问题上传错误出现问题大规模分析问题上传错误出现问题上线测试重写代码上线测试重写代码

大规模高频率

城市级高等级自动驾驶量产低等级自动驾驶量产高速测试z车端闭环 路端闭环云服务赋能2013 2018 2025目录目录CONTENTS01自动驾驶发展机遇与挑战01自动驾驶产业发展洞察自动驾驶产业发展面临新挑战自动驾驶发展需要更加高效的数据闭环02 云服务赋能自动驾驶数据闭环自动驾驶数据闭环发展痛点分析02 云服务赋能自动驾驶数据闭环自动驾驶数据闭环发展痛点分析自动驾驶数据闭环需要云服务赋能云服务加速数据闭环各环节高效运转自动驾驶数据闭环产业图谱及分析03云服务助力构建自动驾驶数据闭环新范式综述云服务助力构建自动驾驶数据闭环新范式解析信息来源:公开资料、专家访谈14信息来源:公开资料、专家访谈142.1.1数据闭环随自动驾驶升级挑战剧增,数据量指数级增长、长尾问题仍需突破比测试车而言数量级更大、类型更多,车端所需的数据以及提升自动驾驶功能所需的数据随之大幅升高。在数据量增长之外,长尾问题也日渐重要。自动驾驶需要尽可能多地涵盖cornercase而目前的长尾仍有很大一部分尚未覆盖,技术有待提升。亿欧智库:各等级自动驾驶汽车原始数据及所需存储空间示意图原始:15-20TB/小时数

长尾数据问题是高等级自动驾驶的核心问题当前业内普遍形成共识,自动驾驶的底层架构和大部分技术问题已经被解决,据量原始:200-300GB/小时所需空间:4-10PBL1

原始:1-2TB/小时所需空间:50-100PB

原始:4-5TB/小时所需空间:500PB-1EB

所需空间:3EB+L4

但由于现实道路场景复杂,即使现有已经实现绝大部分场景的自动驾驶,剩下的少数长尾场景始终无法覆盖。驾驶场景出现频率常见行驶场景:路况简单、易应对,驾驶场景出现频率常见行驶场景:路况简单、易应对,出现频率高极端行驶场景:路况复杂、响应要求高,出现频率低L2 环境天气、地理、道路、行政区划、停车场、充电桩……环境位置及轨迹出租车、乘用车、商用车、手机、共享单车、交通拥堵及事故、热点区域、位置及轨迹常驻地点……用户数据用户身份信息、程序使用历史、驾驶习惯、制动习惯、智舱操作习惯、用户数据购买行为及偏好、职业年龄及教育水平、交通事故违规记录、维修保养信息车辆数据车门状态、车内温度、胎压、雨刮器状态、油量/电池信息、电机速度,车灯/雾灯状态、传感器车辆数据

驾驶复杂程度90%尚未形成完整闭环,成了制约向高等级发展的90%最大难题。因此采集最后10%“极端工况”的长尾数据,让真正有用的数据被利用起来,才是闭环下一步应该具备的能力,也是高等级自动驾驶成败的关键点之一。信息来源:公开资料、亿欧智库15信息来源:公开资料、亿欧智库15数据增长速度与处理能力不匹配,平台发展初期仍存“数”“智”割裂难题共同加速数据闭环,数字化与智能化融合已成为必然趋势。然而产业发展初期数据与平台仍呈割裂状态,相互赋能的正向循环未能构建起来。自动驾驶在向高等级发展的过程中,极速增长的数据带来了一系列处理难题亿欧智库:自动驾驶技术发展三要素

数据孤岛算力算法平台/AI算力算法平台/AI格式各不相同,方式及管理方式亦不相同;

技术割裂自动驾驶数据闭环主要由管理和算法模型两部分组成,前者基于以大数据为核心的数据

不可能三角自动驾驶数据闭环追求更大数据量、更低存储成本、更高计

治理困难从到模型训练再到仿周期漫长,导致极具复杂多元异构使仓库、数

,后者基于以机器学习技

算,而这在传统架构中是

性,管理难度高、资源消耗大,据湖、数据等数据之间形成

术为核心的 ,者

无可实现的不可能三角问题

且模型训练前的数据准备工作孤岛 线并不相同,易产生技术割

耗时耗力大量数据未被利用与托管平台需要大规模准确数据哺育原本应紧密相连的数据平台与平台仍处割裂状态大量数据未被利用与托管平台需要大规模准确数据哺育资源的优劣极大程度决定了的落地效果。过去企业自身搭建的传统治理体系,多停留在对于结构性数据的治理优化,在质量、数据字段丰富度、数据分布和数据实时性等维度尚难满足对数据的高质量要求资源的优劣极大程度决定了的落地效果。过去企业自身搭建的传统治理体系,多停留在对于结构性数据的治理优化,在质量、数据字段丰富度、数据分布和数据实时性等维度尚难满足对数据的高质量要求自动驾驶等级越来越高,量产应用规模越来越大,、、加工等多个环节均有大量数据未被有效利用及托管,因此无法激活要素的潜能,兑换其价值数据、大规模算力与算法/模型是最为重要的三大元素,三者相互支撑、紧密相连。信息来源:专家访谈16信息来源:专家访谈16数据处理需要大量资源及技术投入,研发与应用成本齐飙自动驾驶成本既包括解决长尾问题的研发成本,也包括相应的数据成本。在收集长尾数据、自动驾驶能力的过程中,硬件设备的改装维修、算法模型的更新迭代、研发人员的雇佣维护以及海量数据带来的传输和存储都形成了数以百万、千万计的成本。而车企在不断冲刺高等级自动驾驶的同时,累积越来越多的里程与测试数据,进一步提高了发展成本。亿欧智库:高等级自动驾驶数据闭环各环节资源与成本消耗曲线

亿欧智库:自动驾驶不同等级预估最小测试车维护工程师成本压缩加密空间费用大量标注成本自建数据中心地图开集群搭建系统OTA传输车维护工程师成本压缩加密空间费用大量标注成本自建数据中心地图开集群搭建系统OTA传输通信带宽费用挖掘算法成本场景搭建算法研发成本研发人力成本研发成本GPT-3费用超过1200万美元)工作也需要很大的成本人力成本程师不断维护迭代/千人团队,人工成本3个月接近1000万元)时间成本亿论上需要3个月,、标注、训练等环节都需要大量的时间成本成本主要在模型训练集群其次是仿真集群、数据以及数据处理与标注最小车辆数最小里程数测试场景数L42000+10亿公里10亿+200+ 1亿公里 1000万+L310+1000万公里10万+6-10 10万公里 1万+L23-51万公里1000+2-31千公里100+运维成本应用部署成本的全部原始数据都,一年信息来源:《自动驾驶数据安全白皮书》(2020)17信息来源:《自动驾驶数据安全白皮书》(2020)17海量数据类型复杂,各层级均存在安全风险隐患自动驾驶数据量级越大、涉及面越广,其安全隐患就越大。在多层级处理、流动中都暗含大量安全风险,一旦被攻击、窃取、篡改,将对企业、公民、社会乃至国家安全造成损害。机密性用户隐私数据、测试数据、人机交互数据等不泄露给未授权的个人、实体、进程,并保证其不被利用。完整性决策控制数据、动态交通环境数据等未被更改或破坏,保证车辆信息数据的正确生成、和传输。可用性机密性用户隐私数据、测试数据、人机交互数据等不泄露给未授权的个人、实体、进程,并保证其不被利用。完整性决策控制数据、动态交通环境数据等未被更改或破坏,保证车辆信息数据的正确生成、和传输。可用性已授权的个人、实体一旦需要就可以访问和使用自动驾驶数据和资源。亿欧智库:自动驾驶各层级数据安全风险层层决策/控制安全(遭窃取或篡改后,可用性和完整性被破坏,造成车辆失窃或失控)个人信息安全(越权访问、存储导致泄露,可能导致车辆被盗或被非法控制)测试/仿真安全(遭到篡改导致集准确性降低,影响功能的安全性和可靠性)平台安全风险 大数据处理风险(不同类型、不同级别的自动驾驶 平台安全风险 大数据处理风险(不同类型、不同级别的自动驾驶 (海量数据未经细粒度访问控制,数据汇聚,数据价值较大,易成为 可能被滥用,未经分类隔离、分攻击焦点) 防护,数据融合易引发隐私泄露隐私泄露风险(地理信息、个人隐私、商业化测试数据、场景化数据、高精地图等可能流转外泄)越权访问风险系统/软件漏洞层(越权访问或滥用权限,非法获取(恶意修改平台系统及软件,造成数据破坏,篡改未加密升级包,阻止车辆安全漏洞、风险的修复)获取用户隐私、驾驶数据甚至车辆控制权,降低车辆安全性、稳定性通信层恶意节点攻击(传感器节点与云端接口间、通信总线与ECU间缺少认证保护机制)内外传输风险(内部交互易阻塞或被篡改,导致反馈不及时,外部交互易受到窃听或攻击,泄露地理信息、敏感数据等通信协议风险(多种网络接口的通信协议安全漏洞威胁传输安全,可能遭到破解窃取)采集层采集设备安全(测试车辆二次改装易造成组件丢失损坏,改装设备一致性差、性能不稳定)路测基建安全(路端基础设施改造成本巨大,数据安全防护机制设计部署不足)感知数据完整(传感器可能受到干扰而失灵,造成感知数据识别错误或污染,过程可能受到阻断)信息来源:公开资料、亿欧智库PAGE信息来源:公开资料、亿欧智库PAGE18云底座基础能力云服务赋能云服务以数据处理为核心,叠加大模型深度学习能力,赋能数据闭环降本增效云底座基础能力云服务赋能业实现降本增效和商业闭环,遵从法律法规保障安全合规等多方面,深度赋能数据闭环。数据闭环挑战“数据多”低底层硬软设施迭代慢数据处理效率低数据闭环挑战“数据多”低底层硬软设施迭代慢数据处理效率低“成本高”研发成本高 研发周期研发成果转化慢量产落地进度慢“合规难”确权模糊防护薄弱数据合规困难效率为先强化数据处理研发为核提升研发效率融合为方促进数智融合安全为重保障数据合规全球为局推动商业落地大模型计算网络云原生库云传输云底座信息来源:公开资料、华为云PAGE信息来源:公开资料、华为云PAGE19效率为先,计算上云加速海量数据处理理自动驾驶数据。云服务商提供高效海量数据处理方案更高算力、更高效率云计算

更大容量、更低成本云存储

更低延时、更快传输云传输云端大助力提升算力、分布式缓存技术提升针对海量数据的处理能力

分布式存储架构和对象存储技术,具备大容量、高可靠性、高性能、高伸缩性、低成本等优势第三方云可以节省成本,客户只需支付费用

大量数据接入点和网络节点遍布各个地区,支持数据快速上云理提升,成本降低

公有云存储成本相较于自建数据中心能减少10%-20%;云平台还可以用高压缩态的方式存储,同时进行数据筛选。如某头部云厂商冷数据下沉率可达96%

传统网络的时延以秒计算,云服务商打造数千个边缘节点,就近实现传输和计算处理,能够有效降低时延至100毫秒以下华为云:华为云云方案能够实现高效训练、精细存储、快速入云磁盘快递,专线传输完成路采24H入云全国50+接入点车企就近接入磁盘槽位600+,专线总带宽1000+Gbit/s每天完成10PB上云模型推理加速InferTurbo通过图编译加速模型推理推理效率提升2-5倍多模型多进程复用GPU优化,提升GPU磁盘快递,专线传输完成路采24H入云全国50+接入点车企就近接入磁盘槽位600+,专线总带宽1000+Gbit/s每天完成10PB上云模型推理加速InferTurbo通过图编译加速模型推理推理效率提升2-5倍多模型多进程复用GPU优化,提升GPU模型训练加速TrainTurbo加载优化,CV部分场景(多图片)加速30%高性能算子和编译优化,训练效率提升40%+通信优化,训练线性加速90%+数据加载加速DataTurbo利用本机SSD做分布式缓存,降低存储成本读取时间缩短50%元数据预热速度提升20倍10亿条元数据预热时间从100H降至5H语义直通1小时预热2亿条元云上云下近GPU加速成本下降20%冷数据下沉率最高96%多种存储规格4种规格适配不同热度数据智能数据分级自动识别冷存储指标看版70+指标,数据精细化管理

数据入云服务研发为核,全流程用云助力构建全栈开发工具链传统自动驾驶开发工具多头建设十分零散,外购与自研并存,流程难以打通,工具链路调试费时费力,严重拖慢研发进程。云以数据驱动为指导,覆盖闭环关键环节,提供全栈式研发工具链,实现开发入云,提升研发。业务割裂数据孤岛华为云:华为云坚持开放生态,全栈自动驾驶开发平台,满足企业一站式建设方式,也支持按需搭建、灵活组合的模式业务割裂数据孤岛华为云:华为云坚持开放生态,全栈自动驾驶开发平台,满足企业一站式建设方式,也支持按需搭建、灵活组合的模式为车企提供一站式平台:开发→测试→商用,实现按需使用、即插即用数据驱动闭环“自研”挖掘平台精准仿真+评价预期功能安全为车企提供模块化解决方案:数据驱动的自动驾驶开发,测试,仿真的闭环方案自动驾驶云服务平台算法模型 虚拟仿真和回放式仿真 开放和易扩展平台海量数据存储与处理 可拓展的算力支持增量数据集虚拟场景库仿真服务 训练服务 感知算法 数据标注 数据回放难例挖掘场景挖掘大屏展示实车测试 数据上云/ 数据处理 数据服务 开发效率低开发工具链需要数据打通以提高研发效率云服务商提供端到端全栈式连贯工具链云服务商提供端到端全栈式连贯工具链上云部署仿真评测平台模型训练数据处理平台数据管理平台工具连续从数据上云到模型,数据闭环各个环节对工具连续连通数据统一由云平台管理处理,满足合规要求,解决标准、格式不统一问题,打破孤岛,连通加速数据流通

减少调试、时间成本、人力成本,从而降低研发成本缩短模型训练时间,加速算法模型迭代,提升研发效率融合为方,云服务为数智融合统一搭建底座合,数据与相互赋能、共同加速数据闭环的正向循环。打破孤岛联结技术割裂突破不可能三角打破孤岛联结技术割裂突破不可能三角效益限制提高业务效率

华为云:采用存储-缓存-计算三层分离架构,数智融合平台,利用盘古大模型深度赋能数据闭环核心场景亿欧智库:华为云数智融合平台架构统一底座创新存算架构统一底座创新存算架构低代码自动化

数据闭环场景资产搜索定位全局血缘分析资产热度分析资产搜索定位全局血缘分析资产热度分析

盘古大模型深度赋能预标注大模型难例挖掘 数据标注 数据生成 KPI指标分析预标注大模型

生成理解大模型理解大模型多模态检索大模型三大核心能力多模态检索大模型

统一元数据服务训练数据统一元访问控制数据生命周期管理实训练数据统一元访问控制数据生命周期管理

时计算引擎 量计算引擎 交时计算引擎 量计算引擎 交处理引擎 计算擎缓存统一权限管控建立健全权限控制能力,明确业务间数据管控权责范围,实现统一权限管控统一共享统一权限管控建立健全权限控制能力,明确业务间数据管控权责范围,实现统一权限管控统一共享实现资产化,在统一中打通元数据管理模式,实现数据统一管理、共享

原始 脱敏后数据DataOps+MLOps同,在同一完成开发、测试、交付,打通技术便捷,提升业务创新效率间自由共享,实现用DataOps+MLOps同,在同一完成开发、测试、交付,打通技术便捷,提升业务创新效率间自由共享,实现用数更便捷、权限有保障;百PB级数据可视、可管三层池化架构(池、缓存池),打破资源边界,性价比提升30%统一开发编排模型训练任务,提升整体开发效率

统一存储服务标注集 集KPI标注集集KPI统一元数据管理全局数据地图统一元数据管理全局数据地图工作流统一编排安全为重,数据入云确保流程安全合规据使用全程监管、资质图商全程管控。《自然资源部关于促进智能网联汽车发展维护测绘地理信息安全的通知》 《中华人民共和国测绘法》 《中华人民共和国个人信息保护法》《自然资源部关于促进智能网联汽车发展维护测绘地理信息安全的通知》《中华人民共和国测绘法》《中华人民共和国个人信息保护法》界定测绘行为、明确测绘资质要求、严控外传

测绘合规:采集国家地理信息合规

隐私合规:采集用户隐私相关数据合规自动驾驶研发必须有数据合规方案数据采集数据采集传输数据存储传输数据处理传输进行合规。

采集之后将被到合规云,即图商管理区。云服务商对数据进行脱敏、脱密处理,使云服务商提供数据合规方案之成为非敏测绘成果数据;或脱敏、脱密处理使之成为非测绘成果数据,经过图商审查后可至其他私有云/公有云以供使用。云服务商提供数据合规方案

运维。华为云:华为云:建设乌兰察布汽车专区,提供全流程安全合规3分区合规架构7层安全防护认证资质华为云建设专区联合提供方案头部图商安全云脑 置安全运营智能化1 2理 全 63745机 线 线 线网络中继区身份认证|图商审批智驾业务区闭环|数据处理区双因子|专线接入|图商专属120+权威安全合规认证集成16+安全隐私合规模块10000+安全基线600+检测项30+年安全经验积累中国首个TISAX汽车行业认证云厂商信息来源:公开资料、亿欧智库PAGE信息来源:公开资料、亿欧智库PAGE23全球为局,云厂商护航自动驾驶相关企业安心出海自动驾驶数据闭环因出境而断层,助力中国车企安心出海。当前汽车出海地区多为东南亚、欧洲、南美洲等地区,各云商根据海外数据中心布局情况因地制宜为汽车企业出海护航。云服务商化身车企海外运营伙伴,发挥云服务能力维护境外数据闭环运行,助力车企出海自动驾驶功能继续快速更新迭代维护境外数据闭环完整运行专业本土团队全球数据中心云服务能力维护境外数据闭环完整运行专业本土团队全球数据中心云服务能力统一存算网络数据闭环出海挑战

海外本土合规难跨境沟通协同难

数据闭环易断层

数据合规化服务运营精细化服务覆盖多数出海地区提供强力存算保障安全合规云上不分家传输低延时沟通协同无障碍亿欧智库:2022年中国整车出口地域销量占比6.9%11.9%6.9%11.9%13.9%35.6%25.8%亚洲欧洲南美洲北美洲非洲大洋洲

云服务商在全球布局数据中心数据中心的位置通常用区域和可用区来描述:区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块、对象等公共。可用区(AZ,AvailabilityZone):一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ络、等资源划分成多个集群。

亿欧智库:中国部分云服务商海外布局情况(单位:个)84 887030 29 26华为云 阿里云 腾讯区域 可用区信息来源:亿欧智库PAGE信息来源:亿欧智库PAGE24大模型加速研发步伐,从多维度推动自动驾驶前行大模型的性能和泛化能力相比传统小模型有了显著提高,且深度学习能力让其可以自主加速进行算法迭代。在需要消耗大量人力且低下的环节中,大模型都可以起到十分重要的作用,在很大程度上帮助自动驾驶数据闭环解决效率及成本的问题。目前大模型在自动驾驶领域中主要有两种应用方式,分别是:自建通用大模型和通过微调垂类大模型。划、实例级的在线建图、城市NOA、车体纵横向控制等任务中。自建通用大是解决自动驾驶数据问题的首要解决方案,很多车企及头部Tier厂商选择构建自己的多模态通用大模型,但这同时也意味着挑战。如今我国通用大仍以追赶ChatGPT为主,未来依靠头部领军企业,将逐步开发出中国自己的ChatGPT,甚至超过GPT4的水平。自建通用大模型自建通用大是解决自动驾驶数据问题的首要解决方案,很多车企及头部Tier厂商选择构建自己的多模态通用大模型,但这同时也意味着挑战。如今我国通用大仍以追赶ChatGPT为主,未来依靠头部领军企业,将逐步开发出中国自己的ChatGPT,甚至超过GPT4的水平。自建通用大模型感知大模型通过半监督方式自迭代,增强视觉感知小模型,赋能多模态感知;同时利用图像弱监督预训练的模型挖掘长尾数据提升模型效果。视觉感知多模态感知生成赋能增强小模型远距离3D视觉感知在图像端和点云端提升感知效果感知大模型通过半监督方式自迭代,增强视觉感知小模型,赋能多模态感知;同时利用图像弱监督预训练的模型挖掘长尾数据提升模型效果。视觉感知多模态感知生成赋能增强小模型远距离3D视觉感知在图像端和点云端提升感知效果主要体现在突破长尾瓶颈、标注、模型训练上,助力成本下降,便于定制化训练模型生成海量数据,助力仿真平台构建公有云公有云训练+推理大经过反复训练,可将完整的驾驶策略分拆为自动驾驶的动态识别过程,进而实现可理解的逻辑链条。汽车专区云专属资源池车体控制远程安全接管脱困更好的车体纵横向控制基于安全可靠的预测技术,实现一对多接管提升对于障碍物的检测能力混合云HCS私有化部署恰当的微调能够赋予模型在特定领域的能力和与人类“对齐”的能力。调整的方法繁多,以ChatGPT的过程为例,预好的基础进一步的通常分为三步:采用人工标注好的数据来训练模型;人类对答案的排序一个奖励;使用奖励强化学习的方式训练ChatGPT。微调打造垂类大模型大模型规控智驾能力规控智驾能力NOA大模型泛化能力强,平滑性好,能够更好的应对复杂场景有效识别城市,实现城市导航辅助驾驶信息来源:公开资料、华为云PAGE信息来源:公开资料、华为云PAGE252.2.6头部企业聚焦大模型+NeRF技术,未来将赋能城市级自动驾驶多场景数据处理大模型对于闭环的赋能体现在车端、云端等多个方面。NeRF能自动驾驶数据闭环多个环节。多个头部企业也正通过技术研发,实现NeRF技术与大模型结合在自动驾驶中更广泛的应用,主要表现在自动标注、测试、路采扩充、cornercases生成等方面。图像 NeRF渲染位姿

新图像

NeRF即神经辐射场,采用神经网络对隐式重建,利用可微渲染,从已有视图中学习如何渲染新视角下的图像,从而实现照片级逼真的图像渲染。NeRF最先应用在新视角合成方向,由于其超强的隐式表达三维信息的能力,如今在三维重建领域迅速发展起来。目前NeRF相关的大概分成两类:单纯的视觉上进行大尺度无边界场景重建,和场景重建后对场景进行重新编辑,以进行自动驾驶测试。大尺度无边界场景重建 场景重建+重新编辑商汤科技2023年7月,商汤科技与上海体系”。其中,书生·级的NeRF建模,具备千亿参数,已实现对100平方公里城市实景进行4K高精度建模以及编

特斯拉特斯拉率先提出将NeRF应用在自动驾驶领域,主要体现在两方面:用NeRF做城市级大规模场景重建和借助体渲染为占用网络提供额外监督。其中城市级大规模场景重建能够生成自动驾驶模拟集,可以自定义场景,用以自动驾驶训练。2022年2月,Waymo构建了Block-NeRF

毫末智行毫末智行提升了NeRF最终合成的效果,除了重建三维结构,还以高精度恢复路面纹理,以便更准确地了解整个、掌控真值,从而根据需要做标注。结合BEV模型训练的带有3D标注的真值数据,场景重建的误差小于10cm,同时还能对中的动态物体做出肉眼难辨的重建和渲染。华为云华为云场景生成大模型采用NeRF技术对街景&泊车进行三维重建,实现“同一对象只标一次”即可迁移所有相关图像,“同一只采一次”即可获得不同视角图像。可按需模拟生成罕见和CornerCase,如不同天气,行驶路线、不同光照等,加速数据爬坡进程,降低成本和难度。同时,华为云也通过NeRF提升数据生成效率,以数据生成替代实车路采,降低仿真成本。

其他NeRF企业辑。如今,“书生”大模型正在自动驾驶等领域,助力感知决策一体化,让自动驾驶更智能。

网格,用280万张街景照片重建出整片旧金山市区的3D环境。在此前,NeRF的工作往往侧重于小规模和以对象为中心的重建。

盘古大模型NeRF生成

位姿偏移自动修正开阔大场景厘米级偏移生成场景可按需编辑信息来源:亿欧智库PAGE信息来源:亿欧智库PAGE27云服务助益数据闭环各个环节,加速闭环高效运转闭环的流程可以大致分为数据、数据标注、模型、测试和五个环节。随着自动驾驶的发展演进,各环节面对海量数据都出现了新的发展瓶颈与痛点,云厂商所提供的能够渗透进各个环节,从前端的数据到中间的感知环节,再到后期的和部署环节,云不同程度的帮助流程做到采集用云、数据入云、存算上云、测试进云、部署靠云的全链路支撑。亿欧智库:云服务能力支撑自动驾驶数据闭环发展应用部署标注 仿真测试应用部署专业测试车辆数据生成

输入/快递/

处理/采样/筛检

算法测试...

控制逻辑验证编辑

结果生成/分析

车端模型部署社会化量产车辆

压缩/加密/转换

标注、大模型

重复(下一步)

模拟/

软件模拟

OTA升级优化

越高等级自动驾驶越需要仿真测试,但同时也面临着测不

软件包版本众多、管理难度大;耗

率不高,且质量不齐

持续运转数据闭环

全、测不快、测不准、不会评等技术难题

时过长,影响用户体验等问题云服务能力加速自动驾驶数据闭环:用云、数据入云、存算上云、测试进云、部署靠云

云服务可以支撑3D点云、4DClip、NerRF

云服务支撑大模型进行大量的自主训练和

云服务为场景库提供高弹性的资源空间,同时大模型

分布式节点提供更快速、及时的传用云、清晰全面

模型等进行更高效的自动标注入云、降本提速

深度学习,推动算法不断迭代升级存算上云、准确高效

等技术可以帮助构建高质量的3D城市级测试进云,高质保量

输服务,助力OTA升级等环节部署靠云,安全便捷最大化兑现大模型价值,数据闭环云端环节全面受益业内普遍认为,自动驾驶的终局将会是一个超大规模的端到端自动驾驶数据闭环,而实现端到端的数据闭环,海量高价值数据、车端高算力缺特斯拉、小鹏、理想等主机厂,以及毫末智行、华为云、百度智能云等Tier1、挖掘、标注、、等多个环节,大大提升数据闭环的训练和迭代。车端:决策辅助物体检测:大模型能够更高效率的检测到车端:决策辅助物体检测:大模型能够更高效率的检测到真值比较固定的物体;合并小模型:在车端运用大模型,主要形式是把处理不同子任务的小模型合并,形成一个“大模型”,然后做联合推理;车道拓扑预测:动态环境大模型,可以精准预测道路的拓扑关系。云端相较于车端可以部署较大的大模型,以感知作用为主,从最开始的大模型助力长尾挖掘,到为未标注的3D数据进行自动标注,再到用这些再次训练感知以及测试,多次迭代后,大模型的感知性能实现快速提升。数据挖掘 标注 仿真测试泛化性强,更善于长尾挖掘:例

标注精度高:自动标注可以先用

提升训练量级:大模型能够生成海量

重建和生成:利用大模型进如CLIP模型可以在无监督预训练之后将文本和图像对应,从而基于文本对

海量未标注数据通过自监督的方式预训练一个大模型,微调后还能具备检

可训练数据,通过反复训练,提升模型自我迭代能力;

行自动化、大规模的三维重建,构建现实世界;图片进行数据挖掘;

测能力,进行自动标注;

提高训练:自主深度学习是大模

训练更具针对性:大模型能够识别自端云:通信部署促进端云协同:大模型能够有效促进端云协同模型训练、,提升通信能力。百度文心大模型小马智行BEV感知算法大模型摩院、上海实验室联合发布“洛犀”平百度文心大模型小马智行BEV感知算法大模型

更善于提取特征,找到相似目标:基于Transformer的BEV方案能够将来自多传感器的原始数据结合,最大程度获取目标物特征。

降低成本:数据标注原本是以人力为主导的行业,通过大模型自动化辅助可以有效降低过高的人力成本。OpenAICLIP觉非科技感知大模型

型的重要特征,能够有效建立端到端的感知决策一体化算法,提高数据闭环的训练效率。腾讯混元AI大模型……毫末智行DriveGPT:腾讯混元AI大模型……毫末智行DriveGPT:通过引入驾驶数据建立RLHF技术,对认知决策模型进行持续优化,现阶段主要用于自动驾驶的认知决策,终极目标是端到端华为云盘古大模型:采用5+N+X分层解耦设计,可以快速适配,快速满足行业的多变需求,能够赋能千行百业,如今已经应用在自动驾驶各环节商汤UniAD

动驾驶系统的弱点,自动创建对抗性,从错误中学习,自动迭代更新。例如,WaymoNeRF重建,训练新的算法,做回归测试。采集:从测试到量产场景,数据预处理将越来越依赖云服务采集包括采集、脱敏、传输、储存。对于L2、L3级别的DemoL4级别的Demo则会产生千亿级的图片数据,到了L4级的量产,数据将达到百万亿级。代速度的关键。数 亿欧智库:自动驾驶分阶段数据规模据规模百万级图片数据 亿级图片数据 千亿级图片+点云数据 百万亿级图片+点云数据

华为云面向海量数据提供存储、计算、合规等多方面深度归档存储服务:对长期不访问存档的企业信息数据进行归档。产 极强的数据采集能力、足够的数据存储空间、快速的数据传输速率

自动驾驶发展阶段

客户原始数据采集系统

华为云

客户业务系统 数据采集面临痛点 云服务助力数据高效 原始类别多

DISAgent DIS OBS DLI高等级自动驾驶数据包括摄像头数据、激光雷达数据、毫米波雷达数据、点云数据等等,来源多且类别复杂,格式属性不一有效挖掘难收集到的数据越来越多且庞杂,但并不是每一帧画面都有效,全部会占用极大空间,也会让后续工作变得困难

云服务加速清洗、过滤有效,扩容储存空间大模型及算法具有高性能信息识别能力及丰富的积累,在海量数据中快速清洗、过滤、挖掘高价值

“M”个分布式车联网节点华为云 中国联通等运营联合打造分布式车联网方案传输延时低数据入云更快捷

“N”个车用数据接入点华为云在全国提供50+汽车专用数据接入点实现海量数据24h高效上云传输速度更快传输数据速度慢完成后,需要进行归类、脱敏、压缩和打包,通过4G/5G

云服务搭建就近接入点,助力高效传输有效建立汽车数据专用接入点,尽可能减少4G/5G网络切换

“3”个超大数据中心构建汽车专区乌兰察布专区芜湖专区贵安专区乌兰察布专区芜湖专区贵安专区充分满足海量数据存储需求上传至云端服务器。但由于传输的上下行链路较长,且跨越不同基站网络不稳定等原因,会导致传输速度慢甚至丢失和乱序的情况信息来源:华为云

带来的时延问题

超大云核心枢纽满足海量数据计算需求提供全流程安全合规28信息来源:特斯拉、华为云29信息来源:特斯拉、华为云29标注:从人工标注走向自动标注,云服务结合深度学习高效处理海量数据车端数据完成之后,还需要经过数据标注,包括分配类标签、绘制边界框和标记对象边界等,经过标注的数据才能变成算法模型能够使用的有效样本。而随着自动驾驶技术的不断迭代,需要大规模且高质量的数据集进行训练。了标注。如今,已经有不少头部玩家正在逐步推动自动标注的落地应用。特斯拉标注历经4个阶段,精度、效率不断提升特斯拉标注历经4个阶段,精度、效率不断提升如今,特斯拉自动标注系统可以取代500万小时的人工作业量,人工仅需要检查补漏。华为云预标注大模型实现4D智能标注,使用NeRF进行三维重建,实现“同一对象只标一次”2019年人工进行3D图像标注2020年采用BEV进行标注2021年提出占用网络方案,在4D空间中进行标注华为云预标注大模型AP/AP50综合得分第一1/5;在权威榜单”KITTI360”中排名——NO.1建模小时级,物体建模分钟级支持对场景内物体进行替换2018年及之前只有纯人工2维图像标注,较低支持RGB、Lidar等多传感器数据支持动态物体检测和去除现阶段对数据需求高质量多元化海量

人工标注需要较高时间和人力成本,效率不高耗时长,成本高自动驾驶一个视觉算法训练涉及的图片标注量就达几十万级,人工标注耗时耗力,1小时的视频需要800个工时来进行人工标注,100帧车道线需250个标注员一个月才能完成,效率低下;标签体系不统一,标注质量参差不齐由于标注的标准难以统一,质量参差不齐,数据挖掘效率低下,容易导致错误频发、重复挖掘、返工率高等问题,数量与质量皆难保障。

自动标注基于大模型云计算能力,更能有效、加速数据处理云服务助力标注效率提升超高算力及智能化策略,极大程度提高了海量数据处理、库构建等各环节效率与精准度,自动标注的工作量相比人工标注可以降低约80%-90%,随着未来技术的进步,效率将进一步提升;有效识别高价值数据,加速难例挖掘过程云服务能够基于高性能信息识别能力及丰富的自动驾驶研发积累,在海量数据中快速清洗、过滤、挖掘高价值数据,帮助后续构建高质量数据库与场景集并及时反馈给算法训练,优化空间,加速自动驾驶算法迭代;基于高效能云服务,自动标注技术不断升级头部企业不断更新自动标注技术,包括Clip模型、4D标注、NeRF三维重建等都已成为最新趋势信息来源:公开资料、亿欧智库30信息来源:公开资料、亿欧智库30训练:唤醒沉睡数据,云服务加速驱动算法迭代在完成数据标注之后,需要对打好标签的数据进行训练、参数调优等。数据处理能力的高低是决定模型能否顺利进行的前提要素,模型所必须的海量数据处理及数据集的构建都需要云服务强大的计算能力和处理能力。业进行合作,灵活自己的技术。算法模型反复训练真值数据,以“小循环”促进“大循环”业务规律如今,一部分模型训练的工作已经可以实现自动化。自动标注基于通过大量数据的算法模型,能够实现对原始数据中需要标注的元素的自动识别、检测以及标注时经过不断训练的算法能够更进一步的赋能自动标注,实现更高精确度数据标注与模型训练双向赋能,以“小循环”促进“大循环”训练、喂养

自建超算中心一部分主机厂选择自建超算中心,用以支撑自动驾驶快速进化迭代。在此种方式下,车企需在满足数据合规要求的前提下进行数据,难度较大。同时超算中心初期投入较高,主机厂及Tier1对搭建计算中心的预算普遍超过亿元。且自建并非一次性支出,后续人工、硬件升级、扩容及更新迭代都需要大量的成本。以特斯拉为例——2021年8月,特斯拉正式发布自研云端超算中心Dojo,主要用于处理大量训练特斯拉自动驾驶汽车软件;2023年7月,Dojo投入生产;2024年,特斯拉预计将超过10亿美元,以推进超级计算机与神经网络训练。购买云服务除此之外,大部分自动驾驶企业会选择有实力的第三方云服务企业进行合作,相对于自建云而言投入较小,也是大多数企业的首选。专业云厂商提供的云服务能够做到标准化、集约高效、同时能够适用更多企业主体,在成本考虑上也更加友好。采 基础数据集

赋能、检测、标注部署

算法模型

仿 •专业标准:从软件算法到架构、从建设模式到商业模式都是高标准、高专业度的;真 •集约高效:专业云厂商有足够的实力采用顶尖领先的技术,保证其产品及的先进性;成本优势:作为自动驾驶厂商的数据基础设施服务商,其标准化产品适用于不同领域的主体,相对于前期投入极高的自建方式,更加节省成本信息来源:华为云31信息来源:华为云31仿真测试:加速数据处理、提质生成,云服务助力实现高质量城市级仿真测试在自动驾驶阶段,L2驾驶则需要海量的测试场景,对应的测试要求也越来越高:极强的GPU算力、足够的存储带宽和低时延等。云应运而生,相对于单车算力不足、周期长、低等问题,云仿真凭借其分布式架构及并行加速计算能力,大大提升了整体效率。基于NeRF的场景生成能力可以助力扩充。同时,在云端也可以帮助完成车端的测试,有效避免测试时间长、算力需求大等问题。亿欧智库:自动驾驶数据闭环仿真测试环节架构示意图

测试的关键:实验评价结果对库的构建进行反馈促进其进一步完善;对测试进程进行支撑;实验评价结果对库的构建进行反馈促进其进一步完善;对测试进程进行支撑;三者紧密耦合传感器(摄像头…)道路信息(车道、路灯...)模拟场景库交通流(行人、临时车辆、红绿灯...)传感器(摄像头…)道路信息(车道、路灯...)模拟场景库交通流(行人、临时车辆、红绿灯...)车辆(制动性能….)环境(天气、光照...) 模拟仿真测试 功能安全测试驾驶员在环测试硬件在环测试软件在环测试

大量模型 仿真模型海量数据测不全 测不快 测不准 不会评术技 •场景库覆盖度不足,基础场景效用较低,术挑 难例场景挖掘困难战从测试场景到城市级,实现难度大

里程数大、场景多,耗时长口不统一,测试效率低

部问题,置信度低

评价体系不完善,国标尚未落地率低云 云助力真实路测场景快速转化为场

以云服务丰富的场景库为载体,有服 通过“以图搜图”快速捕捉与挖掘难例场景,必务 覆盖度高进而丰富场景库必

理能力,支持多场景下同时完成多个任务

通讯等大量不同领域的专业技能、工具链及,实现高精准度,降

能力支撑建立多样化、面向多场景的评价指标体系要 基于云能力运行的NeRF可以生成性质量的3D城市级场景

云提供弹性的计算资源,可根据需要随时实现快速扩容

低与实车路测的差距深度学习,生成对抗性场景

云可以支持客户定制化开发仿真评价标准信息来源:国家市场监督管理总局、智见OTA、毫末智行、亿欧智库32信息来源:国家市场监督管理总局、智见OTA、毫末智行、亿欧智库32应用部署:车云一体,基于高效云服务的助力模型部署、优化升级闭环的最后一个环节是将好的自动驾驶模型在车端,而车端继续收集数据进行新一轮的数据闭环,再将新的模型通过动到车端,如此循环往复,形成数据闭环。升级数量呈爆发式增长趋势,而高效的云能够助力模型及的优化升级顺利进行,进而提供良好的终端体验,促进数据闭环的持续、高效运转。优化OTA升级亿欧智库:2020-2022主要车企在中国OTA升级次数(次)优化OTA升级527对车辆的车载娱乐系统进行升APP应用在软件层面的升级

FOTA对整车电子电气化架构进行全方位升级,是实现自

226

351动驾驶智能化的核心

2020 2021 2022毫末闭环产品不断迭代至2023年1月,毫末产品的自完善闭环率超过70%;已成功助力客户成功实现7次毫末闭环产品不断迭代至2023年1月,毫末产品的自完善闭环率超过70%;已成功助力客户成功实现7次OTA在线升级;2022年底数据成本降低98%;全新车型复用数据闭环开发只需4个月时间即达到量产落地状态。通过高效的数据处理与汽车业务分析能力,提供软件升级包的云端整理、版本分类管理等;依托汽车云服务的N个分布式节点,就近传输与升级,实现安全可靠的高速下载意获取、随意篡改或发布能性的区分,选择最安全合适的时间及对车辆进行OTA升级信息来源:亿欧智库33信息来源:亿欧智库33自动驾驶数据闭环产业图谱自动驾驶数据服务商 自动驾驶解决方案商/零部件供应商自动驾驶芯片供应商

具备数据闭环能力企业

主机厂中国厂商海外厂商云服务商中国厂商海外厂商信息来源:公开资料、专家访谈34信息来源:公开资料、专家访谈34云服务厂商头部竞争趋势明显,基础性能逐步趋同,服务及成本将是未来竞争高点如今,几大云厂商处理数据的基础实力逐步趋同,包括技术、产品、生态、全球化、严格的安全控制措施,以及符合各地法规和合规要求的认华为云 百度智能云 阿里云 腾讯云证等。亿欧智库认为,未来行业的竞争点将聚焦在差异化的服务和具有吸引力的成本上,这也将是车企选择云供应商的最重要考量因素。华为云 百度智能云 阿里云 腾讯云产品力专区+盘古大模型+异腾云服务+行业应用;深耕汽车垂直赛道多年(商乘并举),技术硬实力强,云原生领域综合实力排名第一、2022机器学习公有云市场份额排名第一产品力盘古大模型+昇腾AI云服务力基于底层昇腾芯片,上层搭建“基础大模型-力行业大模型-场景大模型”架构,赋能产业,在自动驾驶领域已有多个成功实践生态力460万+开发者,41000信强项,与华人运通(高合)、一汽、赛力斯TO、东风集团、Momenta、四维图新、毫末智行、禾多科技等均有合作生态力出海力KooVerse全球存算网布局30个地理区域,设置84个可用区,设立4个区域服务中心、170+本地服务中心,2800+CDN节点,并在全球具备120+权威合规认证以及20+安全合规遵从包出海力生态优势:相关多领域软件性核心优势能优异,盘古大模型提升开发,硬件通客户受众广泛:核心优势基础设施优越:设施覆盖面广,“车路云”一体优先布局;灵活交付方式:端到端+积木式交付方案

布局全面,体系健全:Apollo车+昆仑芯+飞浆平台+文心大模型+行业应用;依托图商基因,重点布局安全合规方案文心大模型目前多与座舱结合;在自动驾驶场景中,主要从地图生成、环境感知、数据处理等方面赋能数据闭环,实现低成本数据挖掘面向汽车行业推出集团云、网联云、供应链协同云“三朵云”。与长安、吉利、东风汽车等多家车企有合作,并打造面向不同市场的汽车云体系海内外共部署7个数据中心,1200+CDN打造出海易一站式数智外贸平台,秉持百度的互联网基因以及人工智能、大数据和云计算技术,为企业数智化赋能图商基因优势:图商基因使其拥有先天的数据采集优势及合规处理优势;产品矩阵全面:与集团内部Apollo合作,从而减少外采成本,自主可控的数据库;叠加“车路云”一体化相关业务,产品覆盖面广;C端优势明显:高频连接入口

布局全面,体系健全:含光800芯片+M6-OFA底座+通义大模型+行业应用;业务聚焦数据管理、自动驾驶、自研工具链上云等通义大模型适用于不同行业;在汽车行业应用上,通义大模型主要用于智能座舱,促进车内多模态交互融合阿里云以“一横三纵”为汽车企业提供的技术和可承诺的业务效果。其“汽车云”在国内已服务超过70%的汽车企业,主要包括小鹏、广汽、长城、路特斯等海内外共部署25节点,覆盖全球28个地理区域,运营85个可用区底座强大:电商基因赋予深厚底层算力,时叠加大模型支撑,提供强大的技术底座;企业客户优势:立良好口碑及行业信赖;成本相对较低:定价策略相对灵活,成本较低

全链路开发及运营:其中重点布局大数据云平台、模拟平台;依托高精地图业务,布局车联网解决方案混元大模型作为辅助和优化自身业务的工具,且腾讯业务聚焦社交、通信、游戏领域,其混元大模型在这些领域内应用较好,自动驾驶领域先较少以“车云一体化”战略,与奔驰、宝马、一汽等车企构建了丰富的车上服务生态,落地车型超过150款,在云端助力超过100家车企和出行科技企业海内外共部署17个数据中心,其中国外10家,海内外共2800+CDN节点,在全球运营了超过100万台服务器,覆盖全球26个地理区域,拥有70个可用区,全球一套云,帮助车企在同一体系内快速部署落地基础产品,为各国家用户提供服务车联网布局:“车路云”一体化布局较早;生态优势突出:ToC持差异化产品力塑造,可快速实现出行场景、数字营销等方面直连目录目录CONTENTS01自动驾驶发展机遇与挑战01自动驾驶产业发展洞察自动驾驶产业发展面临新挑战自动驾驶发展需要更加高效的数据闭环02云服务赋能自动驾驶数据闭环02自动驾驶数据闭环发展痛点分析自动驾驶数据闭环需要云服务赋能云服务加速数据闭环各环节高效运转03 云服务助力构建自动驾驶数据闭环新范式03 云服务助力构建自动驾驶数据闭环新范式云服务助力构建自动驾驶数据闭环新范式综述云服务助力构建自动驾驶数据闭环新范式解析信息来源:亿欧智库36信息来源:亿欧智库363.1数智时代,自动驾驶数据闭环新范式,需行业各方携手共同推进自动驾驶数据闭环发展道路上的挑战与痛点,本质上是产品硬实力的考验——是否能通过数据闭环赋能自动驾驶。以车企、Tier1核心的行业各方应携手并进,从技术、、生态等多方面,突破产业发展瓶颈,闭环新范式,助力自动驾驶高速发展与落地应用。突破是实现数据闭环的首要任务,引入大模型,能够加速处理海量数据,助力闭环的多个环节;量产落地是考验数据闭环是否能够实现的核心痛点,在搭建完成闭环流程后,如何更好的将数据用起来才是产品实力的体现;最后,数据闭环的终极使命是助推自动驾驶的实现,强大的生态圈携手路端感知和车端数据,将助力行业共同构建自动驾驶的终极形态。自动驾驶数据闭环新范式

新技术牵引,大催化技术跃迁发展新服务新技术牵引,大催化技术跃迁发展新服务数据闭环新范式新生态闭环的发展瓶颈主要在于数据处理难度大、系统复杂度高、模型训练难度大、合规安全要求高等问题。智驾大的引入将从感知和认知智能方面,很大程度上解决行业发展的痛点,以更高的可靠性、更快的响应速度和更有效的,助力数据闭环实现进阶发展新服务:量产导向,商业化助推产品落地应用成熟后,商业量产是产业发展必须解决的核心命题,产品是否能够大规模商用?是否有车企愿意为数据闭环服务买单?及产品是否能海外市场也将成为验证产业落地的热土新生态:端云协同,车路云共建产业终极形态闭环的终极目标是催化自动驾驶的实现。未来,自动驾驶将从车端智能向车路云一体化演进,通过车端、路端、云端协同,助力数据实现“大闭环”,为用户提供更好地出行体验,真正实现自动驾驶

行业需要的数据闭环服务商——专业强可信赖懂场景可泛化专业强可信赖懂场景可泛化强生态可持续强生态可持续信息来源:华为云37信息来源:华为云373.2.1新技术:全面接入大模型,底层模型+垂域布局提高技术应用上限传统自动驾驶的不同场景对应不同小模型,如CNN、RNN等,模型参数小、泛化性差,云服务支撑的大模型能够吸收海量知识,适配多种场景。华为云作为优秀的云商,了自动驾驶开发,将华为和伙伴在汽车行业的多年经验积累与盘古大模型等新技术进行深度结合,基于此进一步帮助客户面向多个细分场景的大模型,以“大模型+”的形式赋能自动驾驶数据闭环的多个环节,提高技术上限。亿欧智库:小模型→大模型,自动驾驶从模块化到端到端架构 华为云:大模型打通技术与商业桥梁,为自动驾驶提供加速“底座”且各个模块之间相互较为独立,容易出现重复计算,浪费车载算力资源的情况

端到端架构将多个小模型整合成了一个模块的功能,也就是传感器采集到

华为首创提出基础模型、行业模型和场景模型三层架构,加速推进forIndustries。自2021年传感器车辆行驶环境感知层传感器车辆行驶

原始数据,并将原始输入到一个统高精地图一的深度学习神经网络(大模型),并高精地图直接输出驾驶命令

基础模型L0科研机构

细分L2行业模型L1科研机构+行业伙伴行业模型L1科研机构+行业伙伴智慧医疗 金融风控传感器3C质检传感器信号灯交通标识车辆状态……

交通参与者状态信息道路拓扑结构……

辅助设计汽车制造……沉淀行业Know-how大模型行业开发套件客户脱敏L0基础大模型行为决策控制感知盘古大模型端到端自动驾驶决策规划层路径规划大模型行业开发套件客户脱敏L0基础大模型行为决策控制感知盘古大模型端到端自动驾驶决策规划层路径规划意图识别行为预测行为决策轨迹预测轨迹规划决策规划场景生成大模型决策规划场景生成大模型预标注大模型多模态检索大模型……L1行业大模型预标注大模型多模态检索大模型……L1行业大模型纵向控制横向控制理解大模型车辆控制层纵向控制横向控制理解大模型执行器 车辆 执行器

路径规划信息来源:公开资料、IDC、华为云38信息来源:公开资料、IDC、华为云38新技术:软硬协同,大算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论