




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025中国汽车流通行业新春启航大会暨促消费大会大模型时代的新能源汽车自动驾驶发展趋势演讲人:邓志东教授/博士生导师北京信息科学与技术国家研究中心清华大学计算机科学与技术系清华大学人工智能研究院视觉智能研究中心2025.2.22清华大学人工智能研究院视觉智能研究中心清华大学人工智能研究院视觉智能研究中心一、范式变革:基于多模态大模型的自动驾驶技术•VLM:视觉-语言(文本)模型•VLM:视觉-语言(文本)模型VLA融合了感知空间与动作空间,给出了两个空间与三大任务:•两大空间:从感知或观察空间到动作空间,还是从动作空间到感知空间?•两个空间之间的单段式或单模型一体化相互作用;•三个下游微调模型,即三大任务:具身理解、具身推理与具身动作生成大模型;•基于上述三大微调模型,可优化训练更多的下游微调模型2025中国汽车流通行业新春启航大会暨促消费大会本质上将VLM面向数字空间的理解与生成推向了面向物理世界的理解与生成!2025中国汽车流通行业新春启航大会暨促消费大会2025中国汽车流通行业新春启航大会暨促消费大会一、范式变革:基于多模态大模型的自动驾驶技术•VLM:视觉-语言(文本)模型•VLM:视觉-语言(文本)模型-性能增强的-性能增强的VLA:可望提升图像、视频、3D点云与语义地图等多模态数据的语义对齐水平,从而获得更好的交叉理解;一、范式变革:基于多模态大模型的自动驾驶技术•VLM:视觉-语言(文本)模型•VLM:视觉-语言(文本)模型-性能增强的-性能增强的VLA:也可望改善开放场景下的实例分割与目标检测准确率,实现更好的视觉“分词”;如谷歌Waymo达到99.3%2025中国汽车流通行业新春启航大会暨促消费大会一、范式变革:基于多模态大模型的自动驾驶技术•VLM:视觉-语言(文本)模型•VLM:视觉-语言(文本)模型-性能增强的-性能增强的VLA:对时空动态场景的预测,或将有效嵌入真实世界的物理学规律,从而获得更好的避碰能力;一、范式变革:基于多模态大模型的自动驾驶技术•VLM:视觉-语言(文本)模型•VLM:视觉-语言(文本)模型-性能增强的-性能增强的VLA:通过进一步引入小脑模型,可望获得更加精准、鲁棒与细滑的行为与动作生成。2025中国汽车流通行业新春启航大会暨促消费大会一、范式变革:基于多模态大模型的自动驾驶技术2、决策与规划:推动构建世界模型驱动的一段式端到端智能体VLA的决策推理势必面临更大的挑战,但却更有研发意义与落地应用价值,包括:•安全、效率、舒适度与低碳等多指标评估体系及其动态优化算法;•利用推理大模型DeepSeek等的应用潜力,如完成百万量级合成场景训练下的决策鲁棒性验证实验(将接管率推进到每10万公里1-3次将轨迹规划的实时响应时间从传统的150ms缩短至50ms左右。推理型大模型DeepSeek-R1及其蒸馏版系列2025中国汽车流通行业新春启航大会暨促消费大会清华大学人工智能研究院视觉智能研究中心二、世界模型驱动的一段式端到端解决方案可望获得突破1、世界模拟器引擎:时空场景合成数据的巨量生成-实现工业化合成数据,包括利用世界模型与世界模拟器生成百万量级的边缘事件时空场景,实现世界模型引擎与真实路测数据的闭环验证,不仅获得更加逼真的场景模拟,而且可大幅降低时空场景数据合成的生产成本。2025中国汽车流通行业新春启航大会暨促消费大会二、世界模型驱动的一段式端到端解决方案可望获得突破1、世界模拟器引擎:时空场景合成数据的巨量生成1)以数据驱动方式实现的物理规律模拟-4D时空世界模拟:-4D时空世界模拟:3维空间+1维时间,智能体在4D世界中与环境、其他智能体及人类进行交互式学习,以端到端数据驱动方式实现物理规律模拟,从而获得空间智能。二、世界模型驱动的一段式端到端解决方案可望获得突破1、世界模拟器引擎:时空场景合成数据的巨量生成2)在虚实平行世界获得的交互数据可反哺AGI的发展-数字孪生&虚实平行世界:利用数字孪生系统基于深度强化学习的自主决策与最优策略的虚实迁移;-反哺AGI的发展:由此获得的虚实交互数据,可进一步反哺通用智能体与通用人工智能的发展。二、世界模型驱动的一段式端到端解决方案可望获得突破2、硬件架构变革技术路线-感知设备:-感知设备:对纯视觉解决方案,是否需要额外增加4D毫米波雷达进行多传感器2025中国汽车流通行业新春启航大会暨促消费大会2025中国汽车流通行业新春启航大会暨促消费大会二、世界模型驱动的一段式端到端解决方案可望获得突破2、硬件架构变革技术路线-车载计算平台:-车载计算平台:2025年英伟达2000TOPS算力Thor芯片可望量产,五年内车载存算一体芯片是否能突破更高的能效比瓶颈?二、世界模型驱动的一段式端到端解决方案可望获得突破2、硬件架构变革技术路线-大模型上车:-大模型上车:车侧一段式端到端模型上车的AI硬件算力支撑的模型蒸馏压缩与轻量化,是否可以支撑百亿级别参数规模的密集大模型上车?二、世界模型驱动的一段式端到端解决方案可望获得突破3、创新型模型、架构与算法的基础性变革作用DeepSeek的成功再一次表明了大模型基础与技术创新的重要性。2025中国汽车流通行业新春启航大会暨促消费大会2025中国汽车流通行业新春启航大会暨促消费大会二、世界模型驱动的一段式端到端解决方案可望获得突破3、创新型模型、架构与算法的基础性变革作用2025中国汽车流通行业新春启航大会暨促消费大会二、世界模型驱动的一段式端到端解决方案可望获得突破4、数字孪生测试验证平台未来五年,未来五年,-数据闭环中自动标注的准确率会进一步提升到99%以上;-世界模拟器可望支持千万量级的场景生成,并进行并行测试;-数字路测里程占比有望突破70%。清华大学人工智能研究院视觉智能研究中心三、发展趋势:从感知智能到认知智能总之,在未来五到十年的更长时期:将逐步形成大模型主导的自动驾驶新范式;@世界模型驱动的一段式端到端模型可望获得突破;目车路云一体化下的分布式
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中铁砂石合同范例
- 生物课堂的回顾与展望计划
- 个人劳务挂靠合同标准文本
- 入党的动机和目的10篇
- 供应气体合同标准文本
- 主机销售合同标准文本
- 与店签定合同标准文本
- 公司品牌转让合同标准文本
- 专业分包团队合同标准文本
- 业务推广协议合同标准文本
- 公车私用管理制度
- 教学运行管理
- 幼儿园绘本:《小蛇散步》 课件
- Unit 6 Food and Drinks-Grammar 可数名词与不可数名词课件(共12张PPT)-2022-2023学年中职英语新高教版(2021)基础模块1
- 《艺术学概论考研》课件艺术本体论-形式论
- 墙面裱糊工程施工方案及工艺方法
- 核电厂安全核电厂安全设计
- 电解质分析仪MI操作规程 sop
- 常用酶切位点表含保护碱基
- 男性生育报销女方未就业证明(共1页)
- 彩钢棚施工方案
评论
0/150
提交评论