"里维安重磅推出VLA大模型,自动驾驶迈入'思维链'新时代"
**里维安重磅推出VLA大模型,自动驾驶迈入“思维链”新时代**
在自动驾驶技术经历规则驱动与端到端迭代后,行业正迎来一场由“思维链”引发的范式革命。2025年12月,里维安(RIVIAN)正式发布其Vision-Language-Action(VLA)驾驶大模型,通过模拟人类“观察-推理-决策”的认知链条,首次让机器具备类人的驾驶逻辑与泛化能力。这一突破不仅解决了传统模块化系统的长尾场景瓶颈,更将自动驾驶技术推向“主动思考”的新高度。
**从“条件反射”到“因果推理”的技术跃迁**
传统自动驾驶系统依赖分层模块的串联,感知、预测、规划环节的信息衰减导致系统难以应对突发状况。而里维安VLA大模型通过多模态统一架构,将视觉输入、语言语义与动作输出编码至同一空间,形成闭环的思维链条。例如,面对潮汐车道时,VLA能解析道路标志文本、结合实时车流状态,像人类司机一样判断车道是否可用,并通过转向灯与其他车辆交互,最终完成变道。这种“理解-交互-执行”的一体化流程,显著提升了复杂场景的通过率。
**“快慢思考”双系统:效率与安全的平衡术**
里维安VLA的创新性在于其“快慢思考”双模式设计。“快思考”通过Action Token直接输出基础操控指令,确保实时响应;而“慢思考”则启动精简版思维链(CoT),模拟人类“边驾驶边规划”的行为。例如,当检测到前方有自行车突然变道时,“慢系统”会生成多条虚拟轨迹,动态评估风险后选择最优路径。这种机制使MPI(每干预里程数)较传统端到端模型提升超40%,尤其在无保护左转、施工路段等场景中表现突出。
**强化学习:用“人类标准”训练AI司机**
为让VLA更贴近真实驾驶习惯,里维安采用强化学习框架,以人类舒适度与合规性作为评价标准。模型在训练中会因急刹或压线被扣分,而平顺的加减速和预判性变道则获得奖励。这种“以终为始”的训练逻辑,使VLA逐渐掌握老司机的隐性经验,例如通过前车刹车灯亮度预判减速幅度,或根据天气调整跟车距离。
**开源生态与行业协同**
值得关注的是,里维安宣布将部分VLA底层技术开源,推动行业共建“因果链”数据集(Chain of Causation)。此类数据不仅记录车辆动作,更标注决策依据(如“因左侧卡车盲区而延迟变道”),为行业提供可解释的AI训练范本。分析师指出,VLA的开放或加速L4级自动驾驶落地,尤其在货运、共享出行等高频长尾场景中潜力显著。
随着VLA大模型的普及,自动驾驶技术正从“机械执行”迈向“认知智能”时代。里维安此次突破,不仅重新定义了“机器如何开车”,更揭示了AI与人类思维融合的无限可能。
最新问答




