智元机器人团队提出EnerVerse架构
2025-01-08
来源:IT之家
关键词:
智元机器人
EnerVerse架构
1 月 8 日消息,如何让机器人在任务指引和实时观测的基础上规划未来动作是具身智能领域核心问题,其受“模态对齐”和“数据稀缺”制约。智元机器人团队提出 EnerVerse 架构,通过自回归扩散模型(autoregressive diffusion),在生成未来具身空间的同时引导机器人完成复杂任务。
据介绍,不同于现有方法简单应用视频生成模型,EnerVerse 深度结合具身任务需求,创新性地引入稀疏记忆机制(Sparse Memory)与自由锚定视角(Free Anchor View, FAV),在提升 4D 生成能力的同时,实现了动作规划性能的突破。
智元机器人官方称,实验结果表明 EnerVerse 不仅具备未来空间生成能力,更在机器人动作规划任务中实现了当前最优(SOTA)表现。从智元官方获悉,目前项目主页与论文《EnerVerse:设想机器人操作的具身未来空间》已上线,模型与相关数据集即将开源。
EnerVerse 主要科研成员来自智元机器人研究院具身算法团队。论文共同一作黄思渊是上海交通大学与上海人工智能实验室的联培博士生,师从 CUHK-MMLab 的李鸿升教授。博士期间的研究课题为基于多模态大模型的具身智能以及高效智能体的研究。在 CoRL、MM、 IROS、ECCV 等顶级会议上,以第一作者或共同第一作者身份发表多篇论文。另一位共同一作陈立梁是智元机器人的具身算法专家,主要负责具身空间智能与世界模型的研究。
本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。