王仲远:大语言模型之后,智源为何押注世界模型?

智源研究院希望持续聚焦下一代技术,做“高校做不了、企业不愿做”的研发。

责任编辑:黄金萍

五年前,在AI大语言模型尚属小众技术时,一家叫作北京智源人工智能研究院(BAAI,以下简称智源研究院)的新型研发机构,启动了大语言模型“悟道”系列研发,聚焦知识推理、多语言生成等核心功能。

中国的“AI六小龙”中,智谱创始人唐杰、面壁智能联合创始人刘知远、月之暗面创始人杨植麟等,都曾是“悟道”项目的参与者。

五年后,AI正在从以语言和推理为主的“数字智能”阶段,迈向与真实世界互动的“物理AI”阶段。智源研究院在2024年初关停大语言模型相关项目并交给智源所孵化的企业继续迭代,自己则开始聚焦在多模态与世界模型等下一代大模型的研发上。2025年6月6日,他们发布了“悟界”系列大模型,其中包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小脑协作框架RoboOS 2.0、具身大脑RoboBrain 2.0以及全原子微观生命模型OpenComplex2,试图将AI技术拓展至对真实世界的感知、决策与交互。

1996年由清华大学和深圳市人民政府共同建立的深圳清华大学研究院,开启了中国首家新型研发机构的序曲,孵化出三十多家上市公司、三千多家科技企业。在近年的中国创新生态中,新型研发机构如雨后春笋般涌现,从事科学研究、技术创新和研发服务。2018年11月成立的智源研究院,目标是“做出有创新性的科研系统,探索下一代技术路线”。

2024年2月履新智源研究院院长的王仲远,曾先后任职于微软亚洲研究院(MSRA)、Facebook、美团和快手,此前一直专注于自然语言处理、知识图谱及多模态的研究。

2025年8月初,南方周末研究员拜访王仲远,请教关于新型研发机构、AI和具身智能的话题。

王仲远对AI技术发展演进的判断是:从大语言模型到多模态模型,再到世界模型,最终向着具身智能和物理AGI(通用人工智能)发展。智源研究院希望持续聚焦下一代技术,做“高校做不了、企业不愿做”的研发。

他对南方周末表示,机器人产业的蓬勃发展,让外界对具身智能有些过于乐观。具身智能类似十年前的无人驾驶,到底哪一条路径最优、谁能最终跑出来都不确定,真正实现大规模产业化还需要至少5-10年乃至更长时间。

从研发到应用,再回归科研

南方周末:你此前从微软去到Facebook,是希望从研发端聚焦于产业端,而今在智源研究院,算是又回归科研端了?

王仲远:这其实与人工智能自2006年起的第三次浪潮中的技术发展趋势密切相关。

2012年,杰弗里·辛顿(Geoffrey Hinton)带着两名学生(Ilya Sutskever和Alex Krizhevsky),在ImageNet大规模视觉挑战赛(ILSVRC)中一举夺冠,让产业界看到了深度学习的价值。之

登录后获取更多权限

立即登录

校对:赵立宇

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}