华为UCM、英伟达Cosmos Reason、达摩院开源“三大件”……一周AI大事记

原创 2025-08-17 科创力

编者按：

智元发布机器人世界模型平台Genie Envisioner；英伟达发布Cosmos Reason；达摩院开源具身智能“三大件”；百川智能发布开源医疗增强大模型；浙江发布“AI+医疗健康”三年行动计划；科学家用AI从头设计抗生素，精准杀灭耐药菌；科学家利用AI加速核聚变装置安全设计；华为发布AI推理技术UCM；美国发布人才战略，为黄金时代的美国劳动力赋能。

2025科创要闻No.32（AI篇）
8月11日-8月17日

南方周末科创力研究中心

责任编辑：黄金萍

AI与机器人

01 智元发布机器人世界模型平台Genie Envisioner

8月14日，智元推出面向真实世界机器人操控的统一世界模型平台Genie Envisioner（GE）。与传统“数据-训练-评估”的割裂流水线模式相比，GE将未来帧预测、策略学习与仿真评估整合，以视频生成为核心形成闭环架构。

基于约3000小时的真实机器人操控视频数据，GE建立了从语言指令到视觉空间的直接映射，保留了机器人与环境交互的完整时空信息，让机器人在同一世界模型中完成从“看”到“想”再到“动”的端到端推理与执行。

• 点评：当前，机器人学习系统普遍采用分阶段开发模式，这种碎片化架构增加了开发的复杂度，延长了迭代周期，限制了系统的可扩展性。不同于主流VLA（视觉-语言-动作）模型利用视觉-语言进行间接建模，GE可以直接在视觉空间中建模，让机器人完成“想象-验证-行动”的完整闭环。（曹妍）

02 英伟达发布Cosmos Reason

8月11日，英伟达发布机器人视觉语言模型（VLM）Cosmos Reason，它拥有70亿参数，用于机器人等具身智能，让机器人和AI代理能够像人类一样进行推理，利用先验知识、常识来理解现实世界，并在现实世界中行动。

同时，现有Cosmos世界模型系列将新增Cosmos Transfer-2，能加速从3D模拟场景或空间控制输入中生成合成数据。此外，英伟达还推出了一系列面向机器人开发者的数据库及相关基础设施。

• 点评：Cosmos Reason的突破在于解决多步骤任务，有望应用于数据管理、机器人规划和视频分析等领域。这一系列动作，标志着英伟达正在加码进军机器人赛道，拓展AI数据中心之外的下一个重要应用场景。（曹妍）

03 达摩院开源具身智能“三大件”

8月11日，阿里达摩院宣布开源自研的VLA模型RynnVLA-001-7B、世界理解模型RynnEC，以及机器人上下文协议RynnRCP，推动数据、模型与机器人的兼容适配，打通具身智能开发的全流程。

达摩院将MCP（Model Context

登录后获取更多权限

立即登录

校对：赵立宇

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有，任何第三方未经授权，不得转载，否则即为侵权。

科创要闻具身智能 AI Cosmos Reason Genie Envisioner Baichuan-M2 核聚变

华为UCM、英伟达Cosmos Reason、达摩院开源“三大件”……一周AI大事记

AI与机器人

01 智元发布机器人世界模型平台Genie Envisioner

02 英伟达发布Cosmos Reason

03 达摩院开源具身智能“三大件”

登录后获取更多权限

相关文章

新政迭出，脑机接口快马加鞭在路上

沪苏浙皖首次协同立法加快打造长三角科创策源地

ChatGPT Study、自主“AI科学家”、“人工智能+”……一周AI大事记

不再有“中间商赚差价” 航司官方直销平台能否终结机票销售乱象?