最新实测GPT-5-Codex:前端能力碾压,复杂项目轻松搞定,Claude可以扔了!

  新智元报道

  编辑:定慧

  GPT-5-Codex 最新一手实测,网友们都说 Claude Code 可以扔了!同时最新 Codex 提示词也已泄露。

  昨天 OpenAI 正式发布了 GPT-5-Codex,一个专门为 Codex 编码智能体研发的 GPT-5 版本。

  在看了全球网友实测效果后,基本结论就是可以告别 Claude Code,放下 Cursor,直接来拥抱 Codex 了!

  为了验证网友们的说法和 GPT-5-Codex 的真实能力,我们全面的测评了一下。

  确实这次 OpenAI 没有再喊「狼来了」,实测很多项目的效果都比较惊艳,比如一键秒出像素风格的小游戏。

  或者,制作一个页面来展示强化学习里最经典的实验环境之一目标是让小车左右移动,同时保持杆子竖直不倒。

  还可以几分钟秒出一个贪吃蛇游戏。

  甚至,你可以给坤哥制作一个火柴人动画。

  你只需要上传一张经典的图片~

  不过这个确实有点为难 GPT-5-Codex 了。

  下面这张比较完美的还原了图片场景,但是动作识别错误,也不符合实际物理情形。

  这张虽然动作符合,但是缺少一点精髓。。。

  最后的效果就是这样子啦,等 GPT-5-Codex 再练习两年半应该就能完美生成了。

  这次 GPT-5-Codex 的前端能力确实得到了非常大的提升。

  随手制作一个记录每日 AI 精选新闻的网站。

  Btw,有网友感叹,现在这个阶段,对于最前沿的程序员来,技术迭代的速度非常迅猛!

  实际上,他们都不写代码了!

  只是对 Codex 智能体大喊大叫(发号施令)就行,AI 做一切!

  而且,在 GPT-5-Codex 上线后,OpenAI 发现需求实在过于猛了点!

  运行速度竟然比预期的慢了 2 倍,现在 OpenAI 的研究员已经确认,重新补上 GPU,算力再次起飞。

  由此可见,确实好用,大家才会「疯狂使用」!

  GPT-5-Codex 实测

  首先简单介绍下实测使用的方法,Codex 官方提供了多种方式。

  你可以使用 npm 安装在终端,也可以用扩展的形式在 Cursor、VS Code 等使用。

  这次我们实测使用终端方式和 Cursor 中扩展的方式。

  像素风游戏

  在 OpenAI Developers 的官方账号上,给出了几个示例,我们就拿这些示例做一次测试。

  首先是,「制作一个像素风游戏,让我可以四处走动、与村民交谈,并捕捉野外昆虫。」

  以下是 OpenAI 给出的效果。

  而下面是我们实测的效果。

  「制作一个像素风游戏,让我可以四处走动、与村民交谈,并捕捉野外昆虫。」

  玩起来还是很丝滑的。

  手稿直出

  还可以将手画的草稿,直接制作成一个网页。

  这个效果还是很不错的,毕竟只有一张图和简单的提示。

  「以这张图片为灵感,在此创建一个简单的 HTML 页面 aiera.html,包含所有资源/JavaScript 和内容,以实现该网络应用的展示版本。宜人的动画和响应式设计会很棒,但不要弄得太花哨」。

  复杂项目

  直接使用 OpenAI 开发者账号的草图,将这个图片制作为一个复杂的项目。

  刚开始 GPT-5-Codex 给了一个和上面草图类似的 HTML 页面,所以我要求它使用 nextjs 框架重新制作。

  最终的效果如下图所示,还是很好的还原了 UI 设计稿的页面布局。

  在实测中也想感叹,自从有了 AI 智能体以后,写代码真的就是「大喊大叫」。

  比如在实测 GPT-5-Codex 时,可以后台同步开启N个项目测试,这次 ChatGPT 给 Plus 和 Pro 用户的量还是很大方的。

  贪吃蛇游戏

  这次 Codex 提供的终端体验也非常棒,比如制作一个贪吃蛇游戏。

  效果如下,Codex 还是严格按照要求实现了。

  飞行器

  使用 GPT-5-Codex 也测试经典的「飞行器从火星飞往地球」的动画演示,整体 GPT-5-Codex 表现还行,能够让飞行器飞行。

  当然这个模型并不是完美的。

  我们在实测中发现,GPT-5-Codex 生成的页面 UI 经常出现「堆叠」的情况,这个也得到了网友们的佐证。

  这些都是小瑕疵,更重要的是:

  当 Claude Code 还在偷给模型降智的时候,OpenAI 为了实现更好的编程能力,专门给 Codex 更新了为编程场景特别优化的 GPT-5-Codex,高下立判!

  这次还是要支持奥特曼的!

  彩蛋

  而且 GPT-5-Codex 出来后不久,Grok 4 宣布在 AGI 基准测试中取得了突破!

  马斯克今天突然发帖说,他觉得 Grok 5 有可能实现通用人工智能,让我们拭目以待。

  也许谷歌的 Gemini 3 和马斯克的 Grok 5 年底前就会给我们一个惊喜。

  并且还有网友爆料 Codex 的提示词现已泄露,快来一探究竟吧!

  参考资料:

  https://x.com/ItsTKai/status/1968060790625419634

  https://x.com/tszzl/status/1967821096545382858