news 2026/1/22 1:05:10

理想下一步的重点:从数据闭环到训练闭环

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
理想下一步的重点:从数据闭环到训练闭环

点击下方卡片,关注“自动驾驶之心”公众号

戳我->领取自动驾驶近30个方向学习路线

>>自动驾驶前沿信息获取自动驾驶之心知识星球

理想汽在ICCV'25期间也分享了些新东西!目前还没有视频对外。

VLA团队负责人詹锟老师做了一场世界模型的presentation,名为World Model: Evolving from Data Closed-loop to Training Closed-loop。自动驾驶之心第一时间做了解读分享给大家~

首先是介绍下理想VLA司机大模型:

回顾了理想汽车智能驾驶的发展路线,从规则时代的轻图和无图,再到基于AI的E2E+VLM快慢双系统和VLA,这四个方案中Nav(导航)是重点突出的模块。

下面介绍的是数据闭环的价值。左上角这张图是一个完整的数据闭环流程:影子模式验证→经由数据触发回传到云端进行数据挖掘→有效样本进行自动标注→生成训练集训练模型→模型下发验证性能。

这个过程已经可以做到一分钟的数据回传。

目前已经有15亿公里的驾驶数据,200+的Trigger来生产15-45s的Clip数据。

目前理想的端到端量产版本MPI已经到了220+,相比于24年7月底的版本,MPI翻了19倍左右。

数据闭环虽然有效,但仅靠数据闭环解决不了所有问题。主要还是长尾场景的收敛问题,交通管制、烟花燃放、突然的变道等等。

所以抛出来一个观点:自动驾驶进入下半场

自动驾驶的下半场换个新玩法:从数据闭环到训练闭环。

L4的训练循环的核心是:VLA+RL+WM。

  • 轨迹由VLA的Diffusion和基于世界模型的强化学习共同优化;

  • 强化学习不仅仅是RLHF,还有RLVR和RLAIF

  • 右侧的世界模型主要指场景重建和新视角复原;

闭环自动驾驶训练关键技术栈:区域级别的仿真、合成数据和强化学习。

  • 仿真靠场景重建:视觉/Lidar重建、区域重建、多趟重建、场景编辑和风格迁移;

  • 合成数据靠多模态生成:视频/点云生成、神经渲染;

  • 强化学习靠Agent、3D资产和评测&奖励

詹锟老师本人出镜的重建和生成效果图。

理想汽车近期从重建到生成的方案发展,确实Feedforward 3DGS今年提的很多,无需点云初始化,直接由视觉输入得到最终结果。

理想这两年重建方面的工作,两篇顶会。

联合重建&生成方面的工作,一篇顶会。

生成方面的工作,三篇顶会。

生成的应用:从场景编辑,到场景迁移再到场景生成。

新的数据配比,看起来数据上下了不少功夫。

系统能力是增强引擎的关键,世界模型提供的仿真环境、3D资产构建多样化的场景、SimAgents做交互式行为建模、奖励模型准确的反馈泛化能力、GPU工程加速推理。

重点强调了可交互的Agent是训练闭环的关键挑战。

总结一下取得的成果和奖励。

自动驾驶之心

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/17 12:47:35

RAX3000M刷机终极指南:从零开始玩转OpenWrt系统

RAX3000M刷机终极指南:从零开始玩转OpenWrt系统 【免费下载链接】Actions-rax3000m-emmc Build ImmortalWrt for CMCC RAX3000M eMMC version using GitHub Actions 项目地址: https://gitcode.com/gh_mirrors/ac/Actions-rax3000m-emmc 想要让RAX3000M路由器…

作者头像 李华
网站建设 2026/1/21 19:56:25

软件产品设计中用户体验提升的主要问题分析

软件产品设计中用户体验的提升面临多维度挑战,这些问题不仅存在于产品开发的单一环节,而是贯穿整个设计流程的系统性障碍。用户体验的提升需要跨越用户研究与需求理解偏差、界面与交互流程的复杂性、可用性与易操作性的设计障碍、视觉设计与品牌体验的整…

作者头像 李华
网站建设 2026/1/21 11:24:01

Typst数学排版终极指南:告别对齐困扰,打造完美公式

Typst数学排版终极指南:告别对齐困扰,打造完美公式 【免费下载链接】typst A new markup-based typesetting system that is powerful and easy to learn. 项目地址: https://gitcode.com/GitHub_Trending/ty/typst 还在为数学公式的括号错位、盒…

作者头像 李华
网站建设 2026/1/17 23:13:10

22、企业环境下迁移 Windows 应用到 Linux 及瘦客户端计算的全面解析

企业环境下迁移 Windows 应用到 Linux 及瘦客户端计算的全面解析 在企业的 IT 环境中,将 Windows 应用迁移到 Linux 以及采用瘦客户端计算模式是两个重要的话题。下面我们将详细探讨这两个方面的相关内容。 Win4Lin 产品分析 Win4Lin 产品对于那些有现有 Windows 会话和软件…

作者头像 李华
网站建设 2026/1/17 17:51:50

24、探索瘦客户端计算与Linux桌面资源

探索瘦客户端计算与Linux桌面资源 瘦客户端计算的优势 在当今的计算领域,企业面临着在降低成本的同时提升性能的挑战。而瘦客户端计算为企业提供了一个有效的解决方案。使用瘦客户端供应商的好处不仅体现在硬件采购方面,还在于有机会借鉴其在安装和设计瘦客户端网络方面的专…

作者头像 李华
网站建设 2026/1/21 16:39:03

IT66122FN-300:低功耗发射器,配备HDMI 1.4 3D

IT66122-300是一款高性能低功耗单通道HDMI发射机,完全符合HDMI 1.3a、HDCP 1.2标准,并向下兼容DVI 1.0规范。IT66122-300还提供HDMI 1.4 3D功能,通过HDMI链路实现直接3D显示。它为数字电视兼容的消费电子产品(如机顶盒、DVD播放器…

作者头像 李华