英伟达与斯坦福等联合推出NitroGen模型,革新游戏与机器人技术
IT之家12月21日消息,由英伟达、斯坦福大学和加州理工学院等机构的研究人员组成的多元化团队,研发出了一款名为NitroGen的开源模型。英伟达人工智能总监、杰出科学家吉姆・范在领英发文称,NitroGen是“一款经训练可玩转1000余款游戏的开源基础模型”。然而,其影响力不仅限于游戏领域,还能为仿真技术和机器人学带来可观的价值。
据IT之家了解,这款研究成果可以被看作是打造“行动版GPT”的一次尝试。因此,它是大型语言模型(LLM)领域的一项突破,将成熟的大规模训练技术拓展到了语言和计算机视觉领域之外。研究论文的引言部分指出,“打造能够在未知环境中运行的通用化具身智能体,长期以来一直被视为人工智能研究的圣杯”。
从游戏到机器人技术的跨界应用
NitroGen的底层架构是GROOT N1.5,这一架构最初是为机器人技术设计的。研究人员对NitroGen进行了改造,使其能够驾驭玩法机制和物理引擎截然不同的各类游戏,这正是电子游戏的魅力所在。研究团队采用了超过4万小时的游戏主播公开实机演示视频,其中那些叠加了玩家手柄实时操作画面的视频,为模型训练提供了尤为关键的帮助。
吉姆・范兴奋地表示,在测试中,NitroGen成功玩转了“角色扮演、平台跳跃、大逃杀、竞速等各类游戏,无论是2D还是3D品类,几乎无所不包”。尽管成果喜人,但吉姆・范也坦言,这仅仅是个开始,还有很长的路要走。
技术突破与未来展望
NitroGen第一个版本的研发重心明确放在快速动作控制上,吉姆・范将其称之为“玩家直觉”。研究成果显示,这款新型大型语言模型还具备“跨领域的强大能力”;在程序化生成的游戏世界,以及从未接触过的新游戏中,相较于从零开始训练的模型,其任务成功率实现了52%的相对提升。
“打造能够在未知环境中运行的通用化具身智能体,长期以来一直被视为人工智能研究的圣杯。”
截至目前,关于NitroGen的所有研究成果均已开源,研究团队鼓励所有对游戏、机器人技术和大型语言模型感兴趣的人士参与调试优化。预训练模型权重、完整的动作数据集以及相关代码均对外开放,任由开发者发挥奇思妙想,亲手探索打磨。
这项研究不仅为游戏开发者带来了新的可能性,还为机器人技术的进步铺平了道路。随着NitroGen的进一步发展,未来或许会在更多领域看到其应用。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。