DeepSeek新大招曝光:下一步智能体

  鱼羊发自凹非寺

  量子位 | 公众号 QbitAI

  DeepSeek 下一步,被曝剑指智能体。

  知情人士透露,DeepSeek 正在开发具有更强大 AI Agent 能力的新模型,预计在今年年底就会推出。

  △图片由 AI 生成

  官方尚无回应,但这一爆料并非无迹可寻。

  在 DeepSeek 8 月的最近一次更新中,DeepSeek-V3.1 上线。官方发布的升级公告中就提到:

  DeepSeek-V3.1 具备更强的 Agent 能力,通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。

  迈向 Agent 时代的第一步

  “R2”将造更强智能体?

  彭博社援引知情人士消息,爆料 DeepSeek 的下一个模型,仅需少量提示,就能帮用户执行复杂操作,并且还能根据历史操作自我进化和学习。

  这一模型将在今年最后一个季度面世。

  此前,业内普遍推测,按照 DeepSeek V3 和 DeepSeek R1 的发布节奏,在被期待已久的“R2”之前,DeepSeek 应该会先一步推出新一代V系列的基础模型。

  而从去年 12 月到今年 8 月的近 9 个月时间里,DeepSeek V 系列的版本号只从 V3 来到了 V3.1。

  看上去仅仅是小版本的改进,但从 DeepSeek 官方后来公布的测试结果来看,似乎又暗藏玄机。

  DeepSeek-V3.1 的主要升级包括 3 点:

  • 混合推理架构,就是把思考模式和非思考模式都集成到了一个模型里。
  • 更高的思考效率,比 DeepSeek-R1 想得更快。
  • 更强的 Agent 能力,新模型在工具使用与智能体任务中的表现有较大提升。

  具体来看提升效果。

  编程智能体方面,在代码修复测评 SWE 和命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 相较 V3 和 R1 有明显提高。

  而在搜索智能体测评中,相较于 DeepSeek-R1-0528,DeepSeek-V3.1 也展现出了全面的性能提升。

  下一个 DeepSeek 时刻

  DeepSeek R1 将推理模型推向发展新高潮,成了搅动全球大模型行业格局的一尾鲶鱼。

  Manus 让智能体的概念火爆出圈,被称为“第二个 DeepSeek 时刻”——

  来到 2025 年的下半年,几乎没有大模型产品不谈智能体。吴恩达也在最新 Andrew’s Letters 中提到:并行智能体正在成为提升 AI 能力的新方向。

  早早预定 2025 年年度热词的 DeepSeek 和智能体一叠加,立刻又触动了人们兴奋的神经。

  已经有人开始期待:如果是 DeepSeek 来做这件事,那智能体的价格门槛,真的要被打下来了。

  但也有人保持怀疑:这个时候入局智能体,还算好时机吗?

  不管怎么说,可以确定的是,在 2025 年余下的最后1/3 时间里,大模型领域的热闹依然将每天持续。

  最后的最后,小小 One More Thing 一下,信源来自官方,妥妥靠谱:

  Qwen 3 max 也要来了吗?

  欢迎一起,见证下一个历史时刻。