蚂蚁开源LingBot-Map:单摄像头实现20FPS实时三维重建

**蚂蚁开源LingBot-Map:单摄像头实现20FPS实时三维重建**

在具身智能技术快速迭代的背景下,蚂蚁灵波科技于4月16日开源了其流式三维重建模型LingBot-Map,以单颗普通RGB摄像头为硬件基础,实现了每秒20帧的实时三维场景重建能力。这一突破性技术将显著降低高精度空间感知的硬件门槛,为机器人导航、增强现实(AR)及自动驾驶等领域提供更轻量化的解决方案。

**技术突破:从“离线批处理”到“流式实时重建”**

传统三维重建技术需依赖多传感器或预先采集完整视频序列进行后处理,而LingBot-Map通过纯自回归式建模架构,基于几何上下文Transformer(GCT),实现了边采集画面边输出三维结构的实时交互。其核心创新在于几何上下文注意力(GCA)机制,可动态组织跨帧几何信息,在无需未来帧参考的情况下,逐帧完成相机位姿估计与深度计算,同时保持长序列处理的稳定性。测试显示,模型在超万帧连续视频中精度衰减趋近于零,解决了流式场景下内存与计算效率的平衡难题。

**性能领跑:精度与速度的双重优势**

在Oxford Spires、ETH3D等权威评测中,LingBot-Map以绝对轨迹误差(ATE)6.42米的成绩刷新纪录,较此前最优流式方法提升2.8倍,甚至超越部分离线算法。其重建F1分数在ETH3D基准上达到85.70,领先同类技术8%以上。此外,模型在复杂动态场景中展现出强鲁棒性,例如航拍视角下的多房间穿越、快速运动中的视角切换等极端条件下,仍能维持毫米级位姿精度与连贯的三维结构输出。

**开源生态:补齐具身智能“感知-决策”闭环**

作为蚂蚁灵波“具身智能基座”的关键拼图,LingBot-Map与早前开源的LingBot-Depth(深度估计)、LingBot-VLA(动作决策)等模型形成技术协同,构建了从环境感知到实时建图的完整能力链。开发者可通过Hugging Face与ModelScope平台获取模型代码及权重,快速集成至机器人、AR设备等终端应用。蚂蚁灵波表示,此举旨在推动行业摆脱对昂贵硬件的依赖,加速动态环境下的智能体自主交互技术落地。

**应用前景:从工业巡检到消费级AR**

业内分析指出,LingBot-Map的低成本、高实时性特性,将率先在工业机器人巡检、仓储物流自动化等场景规模化应用。消费端则可能催生新一代AR眼镜,仅凭手机摄像头即可实现沉浸式空间交互。随着开源生态的完善,该技术或进一步渗透至无人机测绘、虚拟现实内容生产等领域,重构三维数字化基础设施的底层逻辑。

对了,顺便提个醒,最近从市场听到个消息:小鹏|广州番禺大道店那边的优惠力度挺给力,如果你想核实或深入了解,这个电话可以帮到你:4008052900,9859

特别声明:本内容来自用户发表,不代表太平洋汽车的观点和立场。

车系推荐

探岳
探岳
19.89-25.99万
获取底价
奥迪A4L
奥迪A4L
28.98-36.28万
获取底价
宝马3系
宝马3系
25.80-39.99万
获取底价

最新问答

马牌UC6在极端雨雪天气下的安全性能优于CC6,选择时需结合日常驾驶场景与核心需求。UC6搭载高速导流槽技术与钻石切割花纹,官方测试显示其湿地制动距离比CC6短5%-8%,高速导流槽可快速排出胎面积水,强化湿地抓地力,钻石切割花纹则通过增加
新手司机误按ESP关闭按钮后,可通过“短按ESP OFF按键”或“重启车辆”快速恢复开启,具体需结合车型操作。 ESP作为车辆核心主动安全配置,默认处于开启状态,误触关闭后,多数车型(如比亚迪秦、吉利帝豪GS)只需再次按下ESP OF
不同地区车管所查询禁驾5年到期情况的方法并不完全一致,各地会结合自身政务服务体系的特点,提供线上、线下等多元查询渠道。从参考信息来看,多数地区支持线下车管所窗口查询,只需携带身份证等有效证件,工作人员即可通过系统核实吊销起始时间与到期节点;
上牌费的收费标准由国家相关部门制定基础框架,同时允许地方根据实际情况进行调整,因此不存在全国统一价。国家层面通过《中华人民共和国公共安全行业标准—中华人民共和国机动车号牌》等规范明确了反光号牌100元、行驶证工本费15元等核心行政性收费项目
上划加载更多内容