世界模型,Make AI Great Again?

这是AI领域最容易被滥用的词,大多数被冠以“世界模型”之名的东西根本不是真正的世界模型。

责任编辑:黄金萍

AI真的能理解世界的物理规律吗?如果大语言模型不能,世界模型能不能?何时才能?

2026年5月25日,一篇论文《When Does LeJEPA Learn a World Model?》登上了arXiv,作者栏里有个熟悉的名字:Yann LeCun。

LeCun又在讲世界模型,这不稀奇。但这次他不是发布新模型,而是给出了支撑世界模型的数学证明。

论文的核心观点是,当世界的潜在变量(如物体位置、速度)遵从高斯分布,AI学到的表示就能与真实世界的变量建立线性的对应关系,即AI能真正学会世界的底层物理结构。一旦这种线性关系建立起来,AI在表示空间里做简单的直线插值规划,解码回真实世界后,就相当于求解了复杂的物理最优控制问题,比如让机器人用最稳的方式抓取一个杯子。

换言之,LeCun终于为他笃信了多年的路线补上了关键的理论支撑:世界模型不是在简单复现某种编码,而是在数学意义上学到了真实的世界物理结构。

2026年5月的最后十天,从谷歌Gemini Omni到自变量WALL-WM、Geneisis World 1.0,再到英伟达Gamma-World……世界模型在集中爆发。一年前还在堆叠LLM、寄望于Scaling Law“大力出奇迹”的AI圈,今天都跟在了LeCun身后。

与全硅谷“唱反调”的人

2018年,时任Google Brain研究员的David Ha和深度学习元老Jürgen Schmidhuber发表论文《World Models》,让神经网络构建世界模型,并在赛车游戏中通过“想象”学会驾驶。这是世界模型在AI领域形成明确技术概念的最早追溯。

LeCun是世界模型的坚实拥趸,同时也是大语言模型(LLM)的批评者,并因此而备受争议。

这些年,从DeepMind创始人Demis Hassabis到OpenAI创始人Sam Altman,再到有着“人工智能教父”之称的Geoffrey Hinton,LeCun几乎与整个AI圈的“顶流”吵了一个遍。他尖锐批判大语言模型:“继续堆LLM、用更多数据去喂模型、再雇成千上万的人在后训练阶段

登录后获取更多权限

立即登录

校对:赵立宇

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}