3月10日,由华为前“天才少年”稚晖君创立的智元机器人(以下简称:智元)发布首个通用具身基座大模型:智元启元大模型(GenieOperator-1)。据智元官方介绍,该模型基于Vision-Language-Latent-Action (ViLLA)架构,该架构由VLM(多模态大模型) + MoE(混合专家)组成。这种模型架构可以让机器人持续学习进化,利用人类视频学习,完成小样本快速泛化,将具身智能推上一个新台阶。
创立背景:智元机器人(AgiBot)由前华为“天才少年”彭志辉(稚晖君)与上海交大教授闫维新于2023年2月联合创立。彭志辉曾以华为最高档年薪(201万元)加入,从事昇腾AI芯片与算法研究,2022年底离职创业,其个人IP(B站250万粉丝的“野生钢铁侠”)为品牌初期带来广泛关注。
技术分工:彭志辉负责人形机器人的“大脑”(AI算法与模型),闫维新负责“身体”(机械设计与本体研发),形成软硬件协同开发模式。
核心产品发布:
2023年8月:首款具身智能机器人“远征A1”亮相,展示基础运动与交互能力。
2024年8月:推出第二代商用人形机器人产品线,包括交互服务机器人“远征A2”、柔性智造机器人“远征A2-W”等,覆盖工业与消费场景。
2025年3月10日:发布全球首个通用具身基座模型智元启元大模型(GO-1),采用ViLLA架构(Vision-Language-Latent-Action),支持人类视频学习、小样本快速泛化、跨本体适配及持续进化,显著提升机器人任务成功率(平均提高32%)。
据介绍,GO-1 的底层支撑则是一个名为 AgiBot World 的超大规模机器人数据集。据了解,AgiBot World 数据集包含超过 100 万条轨迹,由 100 个真实机器人收集,涵盖 100 多个真实世界场景和 217 个具体任务。
该数据集基于 AgiBot G1 硬件平台构建,由 100 多台同构机器人共同收集,提供高质量的开源机器人操作数据,支持解决多种现实生活场景中的挑战性任务。最新版本的 AgiBot World 数据集,包含 100 万条轨迹,总时长达 2976.4 小时,覆盖 87 项技能和 106 个场景。
同时,AgiBot World 超越了实验室环境中的基本桌面任务(如抓取和放置),专注于涉及双臂操作、灵巧手和协作任务的现实场景。
与行业内现有的数据集(Open X-Embodiment)相比,智元的数据在数量上更为庞大,且数据质量、规范性和一致性更好。 Open X-Embodiment 数据集包含很多不同形态的本体,数据的形态差异性较大,会给模型的训练带来极大地干扰。