AI做几何题,堪比奥数冠军

人工智能在解决数学问题上取得了突破性进展。AlphaGeometry的惊人成功是DeepMind之前的技术积累与当下大型语言模型相结合的结果。

责任编辑:朱力远

2024年1月17日,DeepMind团队在《自然》期刊上发表了一篇名为《无需人类示例即可解决奥数几何问题》(Solving olympiad geometry without human demonstrations)的文章。

该篇文章介绍了DeepMind团队最新的人工智能系统AlphaGeometry。正如论文标题所说的,AlphaGeometry可以自行求解国际奥数难度的平面几何问题。据论文中所说,在对30道奥数几何题的基准测试中,AlphaGeometry在标准奥数时限内解决了25道。相比之下,之前最先进的系统解决了其中10个几何问题。与之对应的,人类金牌得主平均解决了25.9个问题,银牌得主平均解决了22.9个问题,而铜牌得主平均解决了19.3个问题。

一个男孩在写满数学公式的黑板前。视觉中国|图

一个男孩在写满数学公式的黑板前。视觉中国|图

这是继2016年3月和2017年5月,同样由DeepMind团队研发的AlphaGo,在围棋上接连战胜李世石和柯洁之后,人工智能系统再一次在纯智力竞赛领域,达到人类最顶点选手的水平。也是继2022年ChatGPT引发的新一轮大型语言模型类人工智能系统热潮以来,人工智能系统在求解数学问题领域取得的最惊人的成功。

平面几何的特殊性

与2023年加州理工、英伟达、MIT等机构的学者共同撰写的论文中声称的,面向所有数学问题的人工智能系统Leandojo不同,这次DeepMind发布的人工智能系统,是专门为了解决数学中的平面几何问题而特化的。这一点,从AlphaGeometry的名字,阿尔法几何就能看出来。这是因为,在所有的数学分支当中,平面几何是极为特殊的。

现代数学的一大特征就是公理化。所谓公理化数学,首先要约定几条“不可辩驳”的公理,或者说公设。然后由此作为基础,通过逻辑和数学的推理过程,来推演引理、定理和推论,从而推演出整个数学体系。只要承认公理,那么所有的推导结果必然自动为真。在过去的一百余年时间里,数学家们逐步完成了各个数学分支的公理化。例如,概率论的公理化就是在二十世纪三十年

登录后获取更多权限

立即登录

校对:星歌

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}