物理学家揭示AI创造力背后的“技术缺陷”

两位物理学家通过生物系统的自我组装过程,揭开了人工智能(AI)创造力的来源,令人意外的是,这竟然是一种“技术缺陷”。他们提出并验证了一个大胆的假设:扩散模型的去噪过程类似于细胞的分化重组,图像生成AI无法精确“复制”的原因也可能与其“基因”(架构)有关。
在一篇已被ICML 2025接收的论文中,这两位研究者通过建立具有扩散模型特性的数学模型证明:AI的“创造力”本质上是一种确定性过程,是模型架构直接且必然产生的结果。
算法的独特创造力
人工智能系统在进化过程中越来越模仿人类的思维能力,并展现出一种独特的“创造力”天赋。以扩散模型为例,作为DALL·E、Imagen和Stable Diffusion等图像生成工具的核心,其设计初衷是精确拟合训练数据的分布,生成与训练图像完全一致的副本。然而在实践中,它们似乎在即兴创作,将图像中的元素融合以创造出新的东西。
巴黎高等师范学院的人工智能研究员、物理学家朱利奥·比罗利将这种现象称为扩散模型的“悖论”:为了生成图像,扩散模型使用一种称为去噪的过程,它们将图像转换为数字噪声,然后重新组装。研究人员一直困惑不解:如果扩散模型只是在重组数据,那创造力从何而来?
惊人的发现:现实与AI的共性
论文的第一作者梅森·坎姆长期以来一直痴迷于形态发生学,即生命系统自我组装的动态过程。而他的研究生导师苏里亚·冈古利同时在神经生物学和电气工程领域也有任职。两人提出了一个大胆的假设:在重组的过程中是否有信息丢失?
要理解人类和其他动物胚胎的发育过程,有一种方法是通过“图灵模式”,解释了细胞群如何自行组织形成不同的器官和肢体。根据图灵模式,细胞的协调完全是在局部层面完成的,没有一个“总指挥”来监管数万亿个细胞。
“AI生成的那些奇怪图像和形态发生学联系在了一起:这感觉就像是一个自下而上的系统会犯的错误。”——梅森·坎姆
证明的方法:优化局部性和等变性
为了证明这个假设,坎姆和冈古利设计了一种验证思路:如果他们能够设计一个系统,只优化局部性和等变性,那么这个系统应该表现得像扩散模型。他们的系统被称为等变局部评分机(ELS),它不是一个训练好的扩散模型,而是一组方程。
然后他们将一系列转换为数字噪声的图像同时输入ELS与多种强力扩散模型进行对比测试。结果显示,ELS能够以90%的平均准确率与训练好的扩散模型的输出完全匹配。
“一旦加入局部性限制,‘创造力’就会自动产生;它完全自然地来自于系统动态。”——梅森·坎姆
额外的问题与未来展望
尽管这项研究阐明了扩散模型创造力的机制,但仍有一些疑惑亟待解决:例如,大型语言模型和其他AI系统似乎也表现出了创造力,但它们并不利用局部性和等变性。它们的创造力从何而来呢?
佐治亚理工学院的机器学习研究员本·胡佛表示:“人类和AI的创造力可能并没有那么不同。我们根据我们所经历、所梦想、所见、所听或所渴望的事物来组合事物。AI也只是从它所见和被要求做的事情中组合基本构件。”
这项研究不仅为AI创造力提供了新的视角,也可能为人类思维的“黑箱”提供洞察。或许,正是这种对世界理解的不完整,促成了我们所称的创造力。