创造出病毒的AI,也可以创造出生命?
AI已经成功设计出许多有活性的、结构迥异于天然病毒的病毒。这意味着它离随心所欲地创造出真正的生命已经很近了。
责任编辑:朱力远
AI已经登上科学研究的核心舞台。未来,AI会不会改造生命,甚至创造出自然界中根本就不存在的生命?
事实上,这个未来并不像人们想象的那么遥远,因为此时此刻,人类已经站在AI设计和创造生命这扇大门的门口,只差那临门一脚了。就在不久前,斯坦福大学的研究者开发出了一种AI系统。根据科学家给出的文本提示,这种AI成功设计出了诸多有活性的病毒,而且其结构迥异于天然病毒。尽管科学家通常认为病毒不算真正意义上的生命,但这样一种在条件适当的情况下可以完成复制和自组装的系统已经离生命很近了,可以说仅有“一步之遥”。更令人震撼的是,这种AI的核心原理与你手机中的ChatGPT、DeepSeek应用并没有本质上的不同。它也是一种语言模型,只不过学习的不是我们日常使用的自然语言,而是生命和演化的语言。

人类已经站在AI设计和创造生命这扇大门的门口。视觉中国|图
很大程度上,大语言模型的AI就像一个天赋异禀、善于钻研的学生,你只需要给它提供海量的学习材料就行了,在模型算法的框架下,它能无师自通,自学成才。
但你有没有想过,大语言模型为什么会有如此强的学习能力,可以从一名一无所知的“小学生”变成一个几乎无所不知,而且还能灵活分析问题的“全才”?
原因都隐藏在“语言”二字里。
别有洞天
任何一段语言文本,无论是一篇小说,一本诗集,还是一段计算机代码,都不是字符的随机排列。它们不仅结构有序,而且还蕴含着丰富的信息。这是因为语言在演化和发展的过程中形成了一套独特的规则:语法。以训练大语言模型的自然语言为例,最直观的是狭义的语法,它们关乎语言的结构:一个冒号的后面往往更可能出现引号,而不是问号;动词往往需要一个主语;数字后面常常需要一个量词,等等。但语言还有一种更“高级”的规则——我们不妨把它们视作一种广义的“语法”。它们不是人为制定的刻板条款,而是语言在演化和发展过程中“沉淀”下来的统计关联规律。比如,“诺贝尔奖”往往和卓绝的科学成就有关,常常与“科学家”“物理学”“化学”“生理学或医学”等共同出现,而不太可能与“面包机”并列;“黑洞”则更可能与“恒星”“质量”“坍缩”相关,而不是“海洋”。
这些联系往往都关乎现实世界中的客观规律,这意味着从人类认识到这些规律和联系,使用语言记录、交流和传播它们的那一刻起,不仅最直接的相关事实信息被语言保存了下来,这些关联性也被一种独特的语法浓缩存储在了语言当中。换句话说,语言不仅是人类交流和传承信息的工具,而且其中别有洞天,隐藏着很多不那么“显而易见”的信息,包括人类并未意识到,但事实上已经能够“推导”挖掘出的信息。而在大模型海量参数的框架下(ChatGPT-5的参数已经达到了数万亿个),经过训练的AI就像一名神探,能够根据参数中编码的统计关系(这些关系在本质上就是语言中蕴含的广义语法),把无数种不符合“线索”的选项逐一排除掉,从而留下或者说“推断”生成最可能的那一个。不断地运行这样一个词素生成过程,AI最终就能回答你的问题,创作艺术作品,甚至做出科学发现。
我们不妨设想人类置身于一座巨大的岩洞之中。洞穴深处埋藏着无数宝藏,这些宝藏并不是金银财宝,而是人类在此时此刻有可能(但未必有能力)触及的“知识信息”的总和——关于物质、自然、宇宙、生命……有些宝藏埋得很浅,俯首可及;有些则埋在岩层深处,人类此前几乎无法触及。大语言模型的出现就像人类第一次拥有了强大的探测设备和钻探机器。它们并没有创造全新的宝藏,而是帮助人类可以定位和发掘那些早已埋藏在语言岩洞深处的知识矿脉。
这同时也揭示了大语言模型的能力边界:它们无法挖掘出“洞穴之外”的宝藏。凡是尚未被人类的经验和科学所覆盖的未知疆域,大语言
登录后获取更多权限
校对:吴依兰