人形机器人简史:你的“落地”,我的“星辰大海”

“如果特斯拉说人形机器人不做了,可能机器人整个赛道都会垮掉”。

有人讽刺众擎机器人是一家影视制作公司,这让赵同阳感到愤怒。

“每个机构的人都想在牌桌上,这个赛道,可以投错,但不能错过”。

他最近研发的项目是,“让机器人去叫同事开会”,据说机器人能记住1000张脸。

责任编辑:顾策

从2023年产业大爆发开始,只花了两年时间,人形机器人赛道就变得非常拥挤。

2025年11月27日,国家发委在例行新闻发布会给出的数据显示,中国已经有超过150 家人形机器人公司,半数以上为初创或跨行入局。

在这长长的队伍中站在前台的大多是四肢发达、大脑简单的硬件派,创始人大多来自自动化或机械工程专业。他们更偏重造机器人本体,造出的人形机器人往往拥有完整的双足,可以格斗、跳舞、跑马拉松因此更容易吸引眼球

另一批隐于幕后的公司则是造大脑的AI派,创始人基本拥有博士学位,有海外学术背景,出自人工智能专业。他们的人形机器人大多是轮式底盘,没有双足。在真正决定技术走向的科研前线上,AI派才是真正的主角。

究竟哪些公司能成功跑到终点哪些公司只是昙花一现?

不可能的任务

2020年,31岁的王潜从美国一所大学博士毕业,没有选择读博时的机器人学习研究方向,而是成立了一家量化基金公司。他那时悲观地认为,在技术没有本质改变之前,机器人没有未来。

因为即便穷尽整个地球的资源,以当时的技术路径,也不可能训练出一个真正具备通用智能的机器人。他对南方周末记者

早在1973年,日本早稻田大学教授加藤一郎就开发了WABOT-1,它被视为全世界第一个全尺寸人形机器人,加藤一郎也因此被称为人形机器人之父。但WABOT-1仍是一个预设算法控制的提线木偶式机器人。

沿着这一技术路线,波士顿动力北美机器人于1990年代分别脱胎于麻省理工学院、卡内基梅隆大学,两所学校的机器人实验室大多是自动化背景。

波士顿动力的Atlas,曾是历史上最先进的机器人,可以完成后空翻,在人类难以保持平衡的地形中跑酷,可是没办法替代人类工作。因为那些炫酷动作都是预先编程的结果,这种基于传统算法去控制机器人的方式,始终突破不了“提线木偶”的宿命。

到了2016年,AlphaGo与李世石的围棋世纪大战让强化学习方法一战成名,其迅速成为机器人圈最炙手可热的技术。

强化学习对数据量的需求极其庞大,而机器人几乎没有现成的数据

谷歌当时一项研究曾显示,一只机械臂仅通过自监督学习的方式,就需要采集超过5万条样本,才能学会一个稳定的抓取模型。一个婴儿学会稳稳拿住一把勺子,显然不需要5万次练习。

如果让真实的机械臂去完成这5万次抓取,人工与设备成本将高得难以承受。现实中更可行的办法,是先在物理仿真器中,为机械臂搭建一个虚拟世界的抓取训练场。但物理仿真器却难以对真实世界做到100%还原,由此产生了一个著名问题——“仿真到现实鸿沟sim-to-real gap)。仿真环境中学到的策略,到了真实机械臂上往往会失灵

更重要的是,随着任务难度的提升,所需的学习样本还会呈指数级增长,基本上没有实现条件。

2022年年底,ChatGPT在自然语言领域验证了用预训练这种方式,能让计算机掌握自然语言,科学家们自然联想到,预训练是不是也可以让机器人拥有视觉理解和生成动作的能力?

2023年4月,谷歌验证了这一猜想的合理性。它把大语言模型的训练方式,迁移到计算机视觉领域,发布机器人成果 RT-1,能覆盖700个任务。

3个月后,它又发布了迭代过的RT-2,提出一种针对机器人的全新预训练模型架构:VLAVision-Language-Action,视觉语言动作)模型,这是在互联网规模的视觉和语言数据上训练的大模型。

谷歌的新成果让王潜重新点燃了希望。他对南方周末记者说,RT-1RT-2证明了一件事,如果能训练出一个通用的能完成任何任务的VLA模型随着任务复杂性增加,机器人学会一项技能所需的数据样本反而更少了。这让他确定,实现通用机器人唯一的路径,就是打造一个具身智能的通用大模型。

2023年7月,王潜回国,12月创办了自变量机器人公司。他如今留着一头飘逸长发,看上去更像一个艺术家。

当时,可以对标的具身智能公司在美国已经出现。20222月Figure公司在美国加州创办宣布要打造通用人形机器人。20235月,Figure14亿美元的估值完成了7000万美元A轮融资

2024年,Figure打造出了具身智能大模型Helix,展现出强大的物体泛化能力。只需通过自然语言指令,就能抓取数千种形状、大小、颜色和材质各异的全新家居用品,哪怕这些物品在训练过程中从未出现过。

模型发布后Figure估值在一年里暴涨十几倍,2025年以369亿美元的估值问鼎全世界最贵的机器人公司。

大爆发的一年

王潜回国创业之前,优必选、宇树科技可能是国内最早创办的人形机器人公司均属于造本体的硬件派

优必选创始人周剑原本是一门外汉,他本科毕业于南京林业大学木材工业学院,依靠做自动化设备生意积累了第一桶金。

2008 年,受到日本小型人形机器人的启发,

登录后获取更多权限

立即登录

校对:星歌

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}