GPT-5泄露!首次统一GPT和o系列,实测demo抢先曝光,下周发布?

  明敏鹭羽发自凹非寺

  量子位 | 公众号 QbitAI

  GPT-5 这回是真的要来了。

  现在,全网都在“偶遇”GPT-5。

  不仅是 ChatGPT 上有踪迹:

  而且在MacOS应用的模型列表中也发现了 GPT-5。

  还有 Cursor、微软 Copilot 以及 OpenAI API 平台上,也都被网友捉到已经悄悄接入/测试 GPT-5。

  这一大波泄露,大家对 GPT-5 的热情和好奇再次被重新拉回高点,还是奥特曼会玩啊。

  连向来怼天怼地的马库斯都说:不开玩笑,这一次 GPT-5 真的要来了。

  从已经泄露的信息来看,GPT-5 肯定更强大。

  它将整合 GPT 系列和o系列,实现多模态和推理能力大一统、编程能力很强、百万 tokens 上下文、支持 MCP 等。

  最快下周就会发布!

  据说微软 Copilot 上的 GPT-5 将向所有人开放,不受订阅限制。今年 3 月,奥特曼在采访中还说了 GPT-5 将免费向用户开放。

  感觉 GPT-5 这一波,是要全面铺开啊。

  所以到底有多强?

  两款模型都编程能力突出

  根据 OpenAI 内部人士透露,GPT-5 实现推理能力(o系列)和多模态交互能力(4o 以及 GPT 系列)的大一统,以后不用再手动切换模型。

  模型包含多个版本:

  • GPT‑5 主模型(代号 “nectarine” 或 “o3‑alpha”)
  • GPT‑5 mini(代号 “lobster”)
  • GPT‑5 nano(代号 “starfish”)

  模型的技术亮点可能包括:

  • 输入上下文窗口高达 100 万 tokens,输出可达 10 万 tokens。
  • 支持 MCP(模型上下文协议)与并行工具调用。
  • 动态处理短时与长时推理,集成 Code Interpreter 与其他工具。
  • 性能更快、更可靠、更少幻觉、提升长期对话记忆与逻辑处理能力。

  其中GPT-5(o3-alpha)被曝在高级编程方面表现出色,能达到接近人类程序员水平,“实现更快、更精准的软件开发”。

  它可以自动编写高质量的游戏原型,支持很多应用程序定制以及可以根据特定要求进一步细化。

  以及在物理方面也表现出色,一些 zero-shot 的 demo 效果也很不错。

  Lobster(mini 版本代号)有消息称它是一个专用的编程模型。在精度和功能方面均优于 Claude 4 等模型,尤其是在一些复杂的编码任务上。

  Lobster 可以通过极少的输入快速生成结构完整、功能准确的代码,非常适合处理凌乱的遗留代码,可以自动优化代码结构、清除冗余,同时管理大型软件项目中的依赖关系。

  例如一名用户让 Lobster 和另一个模型同时创建交互式神经网络动画,Lobster 一次性就生成了一个带有彩色节点的解决方案,而另一个模型在代码运行中出现错误。

  另外 Lobster 据悉也集成了o3 系列模型的高级推理能力,能在简单任务中使用快速响应模式,在复杂任务中触发深层推理模块,更擅长逻辑推理以及解决数学问题。

  支持文本、图像、工具调用等多模态,具备类似 Agent 的多步骤组合执行能力,可以让其同时完成解释图像、编写代码和使用工具等任务,而无需像 GPT-4 一次只能处理一类输出。

  Lobster 将是编码、推理、多模态理解的融合,将 OpenAI 之前彼此独立的模型集合在一起,让用户直接拥有一个功能更强大的工作助手,轻松执行复杂的多步骤任务。

  starfish(nano 版本)则在前几天悄悄出现在了大模型竞技场上。

  测试结果显示,这个模型只能做静态的小游戏界面,无法启动游戏。

  除了模型本身外,现在微软和 cursor 也被曝将火速接入 GPT-5。

  微软正试行新版 Copilot 的“Smart 模式”(或称 “magic mode”),能够智能判断何时调用 GPT‑5 的深度推理与多模态能力,以简化用户无需手动选择模型的流程。这项功能显示微软极可能在 GPT‑5 发布后第一时间集成该模型至 Copilot 及 Microsoft 365 生态中,Azure 也在为集成 GPT-5 做准备。

  同时也有人发现,cursor 团队正在内部测试 GPT-5 Alpha 版本(图中被模糊掉的部分原来标了 GPT-5-Alpha)。

  但大家不容易被奥特曼忽悠了

  从各方泄露信息来看,GPT-5 确实如奥特曼所说,强得可怕。

  不过,现在大家更冷静、更理智、也更不容易被忽悠了。

  有人就说,那又如何?GPT-5 可能在刚刚发布时表现很好,1 周过去它就会开始变笨,像此前所有模型一样。

  也有人表示这可能是因为模型发布后,出于安全考量会 ban 一部分能力,所以让大家感觉这是炒作出来的幻象。

  “泼冷水王”马库斯也发文表示,即便 GPT-5 真的更强大,但是他还是要给出7 个悲观预测

  1. 尽管 GPT-5 在能力上会远超 GPT-4,但 GPT-5 仍然是难以控制的,会继续犯一些难以预料的低级错误,甚至不会完全听从指令操作。
  2. GPT-5 仍然难以处理一些复杂的物理、心理和数学推理任务。
  3. 幻觉依旧普遍,且误导性更高,更容易生成看起来正确但实际内容错误的输出。
  4. 自然语言输出仍然无法可靠地链接到下游系统(如数据库、虚拟助手等),自然语言指令难以准确映射到用户意图上。
  5. GPT-5 不会是像 AGI 一样的通用人工智能,仍旧需要其它工具协助完成复杂场景任务。
  6. 系统仍将无法稳定地遵循有用无害的人类价值观,在输出回答时可能隐含部分偏见。
  7. GPT-5 只是基础的规模扩展,未来 AGI 将朝向更结构化、具备显性知识与规划能力发展,与更广泛的其它技术集成,而这些都是 GPT 系列所缺乏的。

  社区里也弥漫着相似的观点,毕竟已经被奥特曼溜了太多次,再不发布,网友们都累了……

  天天各种真假混杂的爆料,一些泄露的 GPT-5 基准测试都是 fake news,网友表示,现在除了官方,谁都不可信。

  当然也有不少网友认为,这些“不经意间的”泄漏,都是 OpenAI 在炒作。

  总之,不管模型是不是真如宣传所说的这么好,都赶紧发布吧!

  参考链接:

  [1]https://www.geeky-gadgets.com/openai-gpt-5-lobster-ai/

  [2]https://garymarcus.substack.com/p/what-to-expect-when-youre-expecting-62e

  [3]https://x.com/nicksomed/status/1950507062091485551

  [4]https://www.bgr.com/1926255/gpt-5-leaks-reveal-more-features-ahead-of-launch/?utm_source=chatgpt.com