OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

  时令发自凹非寺

  量子位 | 公众号 QbitAI

  太尴尬了。

  就在周末,GPT-5 又双叒带来了数学方面的新突破,一道难题被宣称解决…

  然鹅……很快就被发现是 OpenAI 的“营销过度”,小题大作,根本算不上什么突破。

  友商大咖们也都不装了。

  DeepMind CEO 哈萨比斯贴脸热嘲得很直接:太尴尬了吧。

  目前仍然供职于 Meta 的 LeCun,吐起别人槽点时天赋全开——

  目前:OpenAI 方面已经把“大新闻”删除了。

  GPT-5 又搞出数学“大突破”

  这一切的一切,还得从 OpenAI 研究员 Mark Sellke 在X上的一条推文说起。

  Mark 高调宣布 GPT-5 在数学上取得了重大突破。他们借助 GPT-5 成功找到了 10 个著名的厄尔多斯数学难题(Erdős problems)的解法,还兴奋表示到:

  • 经过数千次 GPT-5 的查询,我们发现了 10 个原本还处于“未解状态”的厄尔多斯难题的解答,分别是 223、339、494、515、621、822、883(第二部分)、903、1043、1079。
  • 此外,还有 11 个难题取得了重要的部分进展,并更新到了官网上。甚至在第 827 题上,我们还发现厄尔多斯本人原始论文里存在错误,这个错误由 Martínez 和 Roldán-Pensado 两位学者后来进行了修正。看来,未来的科学研究真的要变得有趣了!

  甚至连 OpenAI 高管 Kevin Weil 也在X上惊呼:

  • GPT-5 找到了 10 个此前未解决的 Erdős问题的解答,并在另外 11 个问题上取得进展。

  随后,OpenAI 另一名知名研究员 Sebastien Bubeck 也兴奋地转发并补充道:

  • AI 驱动的科学加速时代正式开启了!两位研究员仅靠一个周末、借助 GPT-5 成功解开 10 个厄尔多斯难题。

  消息一出,全网震动,一时间不少人误以为 GPT-5 独立破解了这些困扰数学界数十年的难题。

  但事情真这么简单吗?

  哈萨比斯 Lecun 贴脸热嘲

  这场欢呼很快被谷歌 DeepMind CEO 哈萨比斯狠狠泼了一盆冷水。哈萨比斯直接在 Bubeck 推文底下回复道:

  • 这真是尴尬啊!

  咦?不是重大数学突破吗?咋还尴尬上了呢?

  这时,哈萨比斯冷静地引导大家去查看 Thomas Bloom 发布的一则关键说明。

  这里值得一提的是,Thomas 正是 OpenAI 引用的那个 erdosProblems.com 网站的创始人兼维护人。

  Thomas 澄清到:

  • 作为 erdosproblems .com 网站的拥有者和维护者,我得声明:OpenAI 的说法明显夸大了事实。GPT-5 只是通过网络搜索,找到了早已存在的论文,这些论文中早就解答了这些问题,只是我个人不知道而已。网站上的“未解”状态只是说明我尚未发现相关的论文,而不代表全世界数学界没有解决方案。

  简单来说,就是 GPT-5 实际上并没有独立地破解任何厄尔多斯难题。它所做的仅仅是比人类网站管理员更迅速地在互联网上检索到了已知的答案,而这些答案其实早已存在。

  事后,Bubeck 删除了之前的推文:

  • 我删除了之前的推文,我显然不是有意误导任何人,我原本以为自己的表达很清楚,对此感到抱歉。我们仅仅是发现了已经发表在文献中的解法,仅此而已。我认为这依然是一种巨大的进步,因为我知道检索文献有多么困难。

  LeCun 也在下面回复:

  • 这次他们被自己吹嘘 GPT 的言论坑惨了.

  (梗注:原文为“Hoisted by their own GPTards”,源自英文俗语 “hoisted by their own petard”,意指“搬起石头砸自己的脚”,这里被 LeCun 改为 GPTards,以讽刺那些盲目吹捧 GPT 的人。)

  但话说回来,这次的乌龙事件也不是平白无故就发生的……

  毕竟在解数学题方面,GPT-5 的过往战绩确实有迹可循。

  GPT-5 有点数学能力在身上

  在国庆期间,陶哲轩就用 GPT-5 解决数学难题:

  • 序列 lcm (1,2,…,n)是否是高度丰数的一个子集?

  天才甚至直言不讳地表示:

  • 如果没有 AI 帮忙,完成同样任务就需要花费数小时(主要是手动编写代码和调试)。

  甚至难如量子复杂性理论,它也能在不到半小时内给出关键证明思路。

  就在上个月,GPT-5 还在数学教授引导下,首次将定性的第四矩定理扩展为带有显式收敛率的定量形式。

  这一桩桩,一件件,GPT-5 的能力确实不容小觑。

  而此次乌龙事件的关键原因就在于:宣传的发言模棱两可,让人们误以为 GPT-5 真的自主解决了非常难的数学题。

  更糟糕的是,这种误导性的说法还被自家人进一步夸大宣传,才造成了如此尴尬的局面。

  当然,也有其他网友杀人诛心,主要还是 GPT-5 太拉胯了——越差劲越想证明自己优秀。

  还有人拿出了卡帕西最新火爆的访谈论断:

  总而言之,AI 带来轰动大进展的节奏似乎正在过去,或者说大众已经开始对 AI 突破脱敏了,如果不是真正的大突破大进展,总想搞个大新闻,还是容易出偏差的…

  参考链接:

  [1]https://the-decoder.com/leading-openai-researcher-announced-a-gpt-5-math-breakthrough-that-never-happened/

  [2]https://x.com/dotey/status/1979640848041071097?s=46&t=fzKJptGJMpr-yj3MUXd6HA

  [3]https://x.com/demishassabis/status/1979417877590774063

  https://x.com/ylecun/status/1979595060447416733