首个机器人世界模型开源平台发布
近日,智元机器人推出行业首个面向真实世界机器人操控的统一世界模型平台 Genie Envisioner,并宣布将开源全部代码、预训练模型及评测工具。
该平台创新性地将未来帧预测、策略学习与仿真评估整合进以视频生成为核心的闭环架构,首次实现机器人在同一世界模型中完成从感知到决策再到执行的端到端推理流程。
传统机器人学习系统普遍采用quot;数据收集—模型训练—策略评估quot;的分阶段开发模式,各环节相互独立且依赖任务特定调优,导致开发复杂度高、迭代周期长。
GE平台通过构建统一的视频生成世界模型,破解了这一碎片化架构瓶颈。基于约3000小时的真实机器人操控视频数据,平台建立了语言指令到视觉空间的直接映射,完整保留机器人与环境交互的时空动态信息。
核心突破在于视觉中心的世界建模范式。区别于主流VLA方法依赖语言抽象,GE直接在视觉空间中建模机器人与环境交互动态,实现对物理规律的精准捕捉。这一范式带来显著性能跃升:
跨平台泛化效率提升:在Agilex Cobot Magic等全新机器人平台上,GE-Act动作模型仅需1小时遥操作数据即可高质量执行任务,优于需大规模多本体预训练的π0和GR00T模型;
长时序任务执行突破:在折叠纸盒等超10步连续任务中,GE-Act成功率高达76%,关键归因于视觉空间显式建模时空演化的能力及创新的稀疏记忆模块设计。
技术架构由三大协同组件构成:
GE-Base多视角视频基础模型:采用自回归视频生成框架,通过头部与双臂腕部三路视角输入保持空间一致性,结合稀疏记忆机制增强长时序推理。训练分两阶段:3-30Hz多分辨率时序适应训练提升运动鲁棒性,5Hz固定采样策略对齐微调;
GE-Act平行流匹配动作模型:160M参数轻量架构通过交叉注意力机制将视觉表征转换为控制指令,采用quot;慢-快quot;异步推理,在RTX 4090 GPU实现200毫秒54步实时响应;
GE-Sim层次化动作条件仿真器:通过Pose2Image条件与运动向量编码,将控制指令精确转换为视觉预测,支持闭环策略评估与数据生成,每小时可完成数千次策略rollout。
为量化世界模型质量,团队同步推出EWMBench评测套件,从场景一致性、轨迹精度等维度评估建模能力。在Kling、OpenSora等模型对比中,GE-Base在关键指标均领先且与人类判断高度吻合。平台现已开放项目主页、论文及代码仓库,推动具身智能从quot;被动执行quot;向quot;想象—验证—行动quot;范式演进。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
版权声明:凡注明“来源:“生活消费网”的所有作品,版权归生活消费网 | 专注于国内外今日生活资讯网站所有。任何媒体转载、摘编、引用,须注明来源生活消费网 | 专注于国内外今日生活资讯网站和署著作者名,否则将追究相关法律责任。
-
小鹏G7交付量破1万,连续三周登顶20-25万级纯电SUV销量冠军作为小鹏汽车在2025年上市的第一款新车,小鹏G7身肩重任。 在G7上市之前,为了给其一个更加清晰的产品定位,小鹏对G系列产品进行了换代上新调整。其中,G6主打科技实用,G9注重科技豪华,G7则定位......2025-08-15 01:08
-
海南国际医学中心举办院士讲堂暨视觉健康交叉创新论坛揭牌仪式现场。 8月10日,由上海交通大学医学院海南国际医学中心主办的院士讲堂暨视觉健康交叉创新论坛在乐城国际医疗旅游先行区举行。 在院士讲堂环节,上海交通大学副校长、医学院院长、中国工程院院士范......2025-08-14 17:48
-
广湛高铁枢纽站点湛江北站项目建设获25亿元授信额度14日,广湛高铁关键节点工程——湛江北站综合交通枢纽工程项目建设迎来重大融资进展,获得国家开发银行广东省分行25亿元的授信额度并成功签约。 据了解,这是湛江市首个采用“债贷组合”模式融资的重大基础设......2025-08-14 16:16
-
平安租赁荣获第四届国际绿色零碳节“2025杰出绿色金融奖”近日,第四届国际绿色零碳节暨ESG领袖峰会于上海举办,平安国际融资租赁有限公司(下称“平安租赁”)以在绿色金融领域的卓越实践与突出贡献,荣获“2025杰出绿色金融奖”。以金融活水灌溉实体经济沃土作为平......2025-08-14 14:44
-
我国人工智能专利数占全球60%综合实力整体性、系统性跃升国家发展改革委党组成员、国家数据局局长刘烈宏8月14日在国新办举行的“高质量完成‘十四五’规划”系列主题新闻发布会上表示,我国人工智能综合实力实现整体性、系统性跃升,人工智能专利数量占全球总量的60%......2025-08-14 13:19