王仲远：大语言模型之后，智源为何押注世界模型？

原创 2025-08-14 科创力

智源研究院希望持续聚焦下一代技术，做“高校做不了、企业不愿做”的研发。

南方周末研究员曹妍

责任编辑：黄金萍

五年前，在AI大语言模型尚属小众技术时，一家叫作北京智源人工智能研究院（BAAI，以下简称智源研究院）的新型研发机构，启动了大语言模型“悟道”系列研发，聚焦知识推理、多语言生成等核心功能。

中国的“AI六小龙”中，智谱创始人唐杰、面壁智能联合创始人刘知远、月之暗面创始人杨植麟等，都曾是“悟道”项目的参与者。

五年后，AI正在从以语言和推理为主的“数字智能”阶段，迈向与真实世界互动的“物理AI”阶段。智源研究院在2024年初关停大语言模型相关项目并交给智源所孵化的企业继续迭代，自己则开始聚焦在多模态与世界模型等下一代大模型的研发上。2025年6月6日，他们发布了“悟界”系列大模型，其中包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小脑协作框架RoboOS 2.0、具身大脑RoboBrain 2.0以及全原子微观生命模型OpenComplex2，试图将AI技术拓展至对真实世界的感知、决策与交互。

1996年由清华大学和深圳市人民政府共同建立的深圳清华大学研究院，开启了中国首家新型研发机构的序曲，孵化出三十多家上市公司、三千多家科技企业。在近年的中国创新生态中，新型研发机构如雨后春笋般涌现，从事科学研究、技术创新和研发服务。2018年11月成立的智源研究院，目标是“做出有创新性的科研系统，探索下一代技术路线”。

2024年2月履新智源研究院院长的王仲远，曾先后任职于微软亚洲研究院（MSRA）、Facebook、美团和快手，此前一直专注于自然语言处理、知识图谱及多模态的研究。

2025年8月初，南方周末研究员拜访王仲远，请教关于新型研发机构、AI和具身智能的话题。

王仲远对AI技术发展演进的判断是：从大语言模型到多模态模型，再到世界模型，最终向着具身智能和物理AGI（通用人工智能）发展。智源研究院希望持续聚焦下一代技术，做“高校做不了、企业不愿做”的研发。

他对南方周末表示，机器人产业的蓬勃发展，让外界对具身智能有些过于乐观。具身智能类似十年前的无人驾驶，到底哪一条路径最优、谁能最终跑出来都不确定，真正实现大规模产业化还需要至少5-10年乃至更长时间。

从研发到应用，再回归科研

南方周末：你此前从微软去到Facebook，是希望从研发端聚焦于产业端，而今在智源研究院，算是又回归科研端了？

王仲远：这其实与人工智能自2006年起的第三次浪潮中的技术发展趋势密切相关。

2012年，杰弗里·辛顿（Geoffrey Hinton）带着两名学生（Ilya Sutskever和Alex Krizhevsky），在ImageNet大规模视觉挑战赛（ILSVRC）中一举夺冠，让产业界看到了深度学习的价值。之

登录后获取更多权限

立即登录

校对：赵立宇

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有，任何第三方未经授权，不得转载，否则即为侵权。

具身智能世界模型

专题

王仲远：大语言模型之后，智源为何押注世界模型？

从研发到应用，再回归科研

登录后获取更多权限

AI现在进行时

相关文章

ChatGPT Study、自主“AI科学家”、“人工智能+”……一周AI大事记

新政迭出，脑机接口快马加鞭在路上

开局一捆麦草，你在沙漠里种出了绿洲