华为UCM、英伟达Cosmos Reason、达摩院开源“三大件”……一周AI大事记

编者按:

智元发布机器人世界模型平台Genie Envisioner;英伟达发布Cosmos Reason;达摩院开源具身智能“三大件”;百川智能发布开源医疗增强大模型;浙江发布“AI+医疗健康”三年行动计划;科学家用AI从头设计抗生素,精准杀灭耐药菌;科学家利用AI加速核聚变装置安全设计;华为发布AI推理技术UCM;美国发布人才战略,为黄金时代的美国劳动力赋能。
2025科创要闻No.32(AI篇)
8月11日-8月17日

责任编辑:黄金萍

AI与机器人

01 智元发布机器人世界模型平台Genie Envisioner

8月14日,智元推出面向真实世界机器人操控的统一世界模型平台Genie Envisioner(GE)。 与传统“数据-训练-评估”的割裂流水线模式相比,GE将未来帧预测、策略学习与仿真评估整合,以视频生成为核心形成闭环架构。

基于约3000小时的真实机器人操控视频数据,GE建立了从语言指令到视觉空间的直接映射,保留了机器人与环境交互的完整时空信息,让机器人在同一世界模型中完成从“看”到“想”再到“动”的端到端推理与执行。

• 点评:当前,机器人学习系统普遍采用分阶段开发模式,这种碎片化架构增加了开发的复杂度,延长了迭代周期,限制了系统的可扩展性。不同于主流VLA(视觉-语言-动作)模型利用视觉-语言进行间接建模,GE可以直接在视觉空间中建模,让机器人完成“想象-验证-行动”的完整闭环。(曹妍)

02 英伟达发布Cosmos Reason

8月11日,英伟达发布机器人视觉语言模型(VLM)Cosmos Reason,它拥有70亿参数,用于机器人等具身智能,让机器人和AI代理能够像人类一样进行推理,利用先验知识、常识来理解现实世界,并在现实世界中行动。

同时,现有Cosmos世界模型系列将新增Cosmos Transfer-2,能加速从3D模拟场景或空间控制输入中生成合成数据。此外,英伟达还推出了一系列面向机器人开发者的数据库及相关基础设施。

• 点评:Cosmos Reason的突破在于解决多步骤任务,有望应用于数据管理、机器人规划和视频分析等领域。这一系列动作,标志着英伟达正在加码进军机器人赛道,拓展AI数据中心之外的下一个重要应用场景。(曹妍)

03 达摩院开源具身智能“三大件”

8月11日,阿里达摩院宣布开源自研的VLA模型RynnVLA-001-7B、世界理解模型RynnEC,以及机器人上下文协议RynnRCP,推动数据、模型与机器人的兼容适配,打通具身智能开发的全流程。

达摩院将MCP(Model Context

登录后获取更多权限

立即登录

校对:赵立宇

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}