13 8 月, 2025

Figure机器人展示叠衣服新技能:神经网络架构未变,数据集扩展助力

figure-

在一场引人注目的首次亮相中,Figure人形机器人展示了其在没有改变神经网络架构的情况下,仅通过扩展数据集便能学会叠衣服的新技能。这一突破性展示发生在一个模拟的家庭环境中,机器人不仅能够与人类进行眼神交流,还在接过衣物后点头致意,并做出“点赞”手势,显示出其对新任务的适应能力。

这一发展标志着机器人技术在日常家务中的应用迈出了重要一步。Figure机器人以其灵巧的双手,从杂乱无章的毛巾堆中挑选、折叠毛巾,整个过程流畅自如。其操作包括拇指描边、拎角、理顺褶皱等,显示出高水平的精细控制能力。整个过程采用端到端的方式,从视觉和语言输入到精准的运动控制,均由神经网络驱动。

从物流到家务:Figure机器人的多样化能力

两个月前,Figure机器人在物流场景中展示了其包裹分拣的能力,整个过程长达一小时。机器人能够识别、抓取、翻转并运送各种形态的包裹,表现出接近人类水平的灵活性和速度。如今,Figure机器人同样的模型在处理叠衣服这一完全不同的任务时,展现出令人印象深刻的适应能力。

对于人类而言,叠衣服可能是日常琐事,但对于机器人来说,这是一项极具挑战性的精细操作任务。衣物的易变形、多样的形状和不可预测的弯曲性,使其成为机器人操作的难点。机器人需要精细的手指控制来追踪边缘、捏住角落、抚平表面,并实时调整操作。

Helix架构的关键作用

在此次展示中,Helix架构发挥了关键作用。Helix是Figure与OpenAI分道扬镳后的首个成果,是一个适用于通用人形机器人控制的端到端“视觉-语言-动作”模型。它能让机器人像人一样感知、理解和行动。

Helix由两个系统组成,经过端到端训练,并可以进行通信。其强大性能在于,使用单一的神经网络权重即可在各种任务中实现精准操作。上次在包裹分拣任务中,研究团队对Helix的视觉电机策略进行了改进,引入了新的内存和传感模块。

视觉记忆与状态历史

Helix的视觉记忆模块能够从系列视频帧中组合特征,形成短期视觉记忆,帮助机器人更有效地查找条形码位置。状态历史策略则通过分块动作序列,确保模块间的连续性,即使在重新规划或面对干扰时,机器人也能保持稳健。

力反馈机制

为了赋予Helix触感,机器人施加在环境和目标上的力被反馈至神经网络状态输入中。这一机制帮助机器人动态调整运动过程,提高运动的成功率和一致性。

未来展望与挑战

尽管Figure机器人在叠衣服任务中表现出色,但机器人在家务领域的应用仍处于早期阶段。未来,Figure计划在现实世界数据规模扩大的基础上,继续提升机器人的灵活性、速度和泛化能力。实现洗衣、叠衣、晾衣等一整套家务动作的闭环,或许不再是遥不可及的梦想。

机器人在家务中的应用正逐步扩展,未来我们还期待机器人能承担更多家务任务。随着技术的进步,机器人或将成为家庭生活中不可或缺的一部分。

推荐阅读  OpenAI 推出 GPT-5,称其为全球最佳写作与编程 AI 模型