Alphabet公司的人工智能研究部门谷歌深度思维(Google DeepMind)表示,该公司在解决复杂数学问题方面取得了长足进步,这一领域对当今的人工智能程序来说仍然具有挑战性。
周四,谷歌推出了专门用于数学推理的AlphaProof和AlphaGeometry 2,后者是该公司今年早些时候推出的一个专注于几何的模型的更新版本。谷歌在一篇博客文章中表示,这些程序解决了国际数学奥林匹克竞赛(International Mathematical Olympiad)中六个问题中的四个问题。国际数学奥林匹克竞赛是一项每年举行的竞赛,学生们需要解决代数和几何等主题。
在产品之间难以比较的人工智能行业,解决数学问题已成为关键的证明点。这是因为大型语言模型是在大量的书面文本上训练的,往往倾向于语言智能而不是数学智能。虽然计算机擅长数字和传统计算,但基于单词的数学问题不属于这些标准,需要更复杂的推理技能。
虽然人工智能工具在自然聊天或生成图像方面变得越来越熟练,但它们往往难以解决需要计划或采取多个步骤才能解决的问题。但谷歌及其竞争对手并没有放弃。据彭博社报道,该公司最大的竞争对手OpenAI也一直在研究新的推理技术。
谷歌表示,AlphaProof是从谷歌的人工智能程序进化而来的,这些程序擅长于复杂的战略游戏,如国际象棋、将棋和围棋。2016年,DeepMind的一个程序击败了世界顶级围棋选手之一。
大型语言模型倾向于产生幻觉,或者以令人信服的方式传递不正确的信息。谷歌表示,它利用人工智能将数学问题转化为技术陈述,即所谓的“形式语言”,从而避开了这一挑战。
人工智能系统在数学方面面临的另一个问题是缺乏可用的训练数据,这与聊天机器人不同,后者可以从大量在线文本中收集信息。谷歌表示,随着AlphaProof模型成功解决问题,其代码也会更新,使其能够应对更困难的挑战。
该公司还发布了AlphaGeometry人工智能模型的改进版本,据称该模型能够解决过去25年来国际数学奥林匹克竞赛中83%的历史几何问题。
但谷歌的研究人员也表示,人工智能远不能以其解决问题的能力取代人类数学家。谷歌DeepMind负责强化学习的副总裁大卫·西尔弗(David Silver)说,“即使我们有最大的雄心壮志,我认为我们的目标是提供一个可以证明任何事情的系统。”“但这并不是数学家工作的终点。”
西尔弗说,DeepMind的人工智能模型更类似于计算尺或计算器:强大的计算工具,有朝一日可能会帮助人类提出数学证明。但人工智能系统缺乏的是想象力。“数学家提出了有趣的问题,”他说。- - - - - -布隆伯格