通义继续上新:Qwen3-30B-A3B 新版

  昨晚,阿里通义宣布,旗下 Qwen3-30B-A3B 模型迎来了新版本「Qwen3-30B-A3B-Instruct-2507」。

  官方介绍,2507 版本是一个非思考模式(non-thinking mode)的新模型,仅激活 3B 参数,就能取得可媲美 Gemini 2.5-Flash(non-thinking)、GPT-4o 等顶尖闭源模型的超强性能。

  而在关键提升上:

  • 通用能力大幅提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多方面;
  • 在多语言的长尾知识覆盖方面,模型进步显著;
  • 在主观和开放任务中,新模型进一步紧密对齐了用户偏好,可以生成更高质量的文本,为用户提供更有帮助的回答;
  • 长文本理解能力提升至 256K。

  目前,Qwen3-30B-A3B-Instruct-2507 已在魔搭社区和 HuggingFace 等平台开源,同时上线 QwenChat。