小米开源跨域具身大模型MiMo-Embodied,打通自动驾驶与家居智能
**小米开源跨域具身大模型MiMo-Embodied,打通自动驾驶与家居智能**
11月21日,小米集团正式开源其自主研发的跨域具身大模型MiMo-Embodied,标志着人工智能技术在自动驾驶与家居智能领域的深度融合迈入新阶段。作为业界首个统一两大领域核心任务的基座模型,MiMo-Embodied通过创新的架构设计和训练策略,实现了从家庭场景到道路环境的全链路智能协同,为未来通用具身智能的发展提供了重要范式。
**跨域能力重构:打破场景边界**
MiMo-Embodied的核心突破在于其跨域能力覆盖。传统具身智能模型通常局限于单一场景,而该模型通过同步支持具身智能三大任务(可供性推理、任务规划、空间理解)与自动驾驶三大关键模块(环境感知、状态预测、驾驶规划),构建了全场景智能支撑体系。例如,模型在家庭环境中对物体功能(如“杯子可用于倒水”)的推理能力,可迁移至自动驾驶中对道路标识(如“红灯需停车”)的语义理解,显著提升了复杂场景下的决策效率。
**双向知识迁移:从家居到道路的智能闭环**
小米在技术验证中首次揭示了室内交互与道路决策能力的协同效应。模型通过共享底层视觉语言表征,实现了两大领域知识的双向迁移:家居场景中积累的空间布局理解能力可优化自动驾驶的路径规划,而车辆对动态障碍物的预测经验则能提升家庭服务机器人的避障效率。这种跨域协同效应为智能终端的泛化部署提供了新思路,未来或可应用于智能工厂、医疗护理等更多场景。
**全链优化保障落地可靠性**
为确保模型在真实环境中的稳定性,MiMo-Embodied采用多阶段训练策略:先通过具身与自动驾驶专用任务学习基础能力,再引入思维链(CoT)推理增强复杂任务分解能力,最终结合强化学习(RL)进行精细调优。在29项国际基准测试中,模型全面超越现有开源与闭源方案——具身智能领域刷新17项SOTA记录,自动驾驶领域突破12项性能瓶颈,其通用视觉语言能力也在多项跨模态任务中展现显著优势。
**开源生态助推行业创新**
小米同步开放了MiMo-Embodied的完整代码与部分预训练权重,开发者可基于该模型快速构建跨场景智能应用。业内分析指出,此举将加速自动驾驶与智能家居的技术融合,推动服务机器人、无人配送等产业的标准化进程。随着小米AIoT生态与造车业务的深度协同,MiMo-Embodied或成为连接“人-车-家”智能网络的核心技术枢纽。
最新问答





