1/8成本比肩Claude 3.7,Mistral Medium 3来了

  西风发自凹非寺

  量子位 | 公众号 QbitAI

  用1/8 成本比肩 Claude 3.7,刚刚,“欧洲 OpenAI”Mistral AI 发布多模态新模型。

  MistralMedium3,主打编程和多模态理解,且在性能和成本间进行了平衡。

  官方称,在各类基准测试中,Mistral Medium 3 性能达到或超越 Claude Sonnet 3.7 的 90%,且成本大大降低。

  Claude 3.7 Sonnet 的价格为每百万输入 token 3 美元,每百万输出 token 15 美元,而 Mistral Medium 3:

  每百万输入 token 仅 0.4 美元,每百万输出 token 2 美元

  整体性能,不管是和领先开源模型 Llama 4 Maverick 还是和企业级模型 Cohere Command A 相比,Mistral Medium 3 都能打得有来有回。

  目前,Mistral Medium 3 API 已在 Mistral La Plateforme 和 Amazon Sagemaker 上线,不久后还将在 IBM WatsonX、NVIDIA NIM、Azure AI Foundry 和 Google Cloud Vertex 上推出。

  具备一系列企业级能力

  下面具体来看看基准测试。

  Mistral Medium 3 在编程和 STEM 任务中尤为突出。

  官方原话是“其性能甚至接近非常大且运行速度慢得多的竞争对手”。

  不过呢,既不开放模型权重,也没有透露模型大小

  另外,Mistral AI 还发布了第三方人类评估。

  人类评估中,Mistral Medium 3 依旧是在编程方面占优势。

  在多模态和其他人语言任务中,相比 Llama 4 Maverick,Mistral Medium 3 的表现也占上风。

  除了测试数据之外,官方还特别强调了其适应企业环境的能力,包括:

  • 混合部署或本地 / 虚拟私有云(VPC)内部署
  • 定制化后期训练
  • 与企业工具和系统集成

  企业可以轻松将智能全面集成到系统中,借助 Mistral 的应用 AI 解决方案,该模型可以持续进行预训练、全面微调,并融入企业知识库,使其成为针对特定领域训练、持续学习和自适应工作流程的高保真解决方案。

  官方称,金融服务、能源和医疗保健领域的客户正在使用该模型测试,通过深入的背景信息来丰富客户服务、实现业务流程的个性化,并对复杂的数据集进行分析。

  另外,他们还推出了Le Chat Enterprise,这是一项面向企业的聊天机器人服务,提供了 AI Agent 建造器之类的工具,并将 Mistral 的模型与 Gmail、Google Drive、SharePoint 等第三方服务集成。

  据了解,Le Chat Enterprise 将很快支持 MCP。

  Mistral Medium 3 发布后引发大批网友关注,有网友为其“高性价比”点赞。

  不过也有不少网友吐槽模型没说开源结果又高调地和开源模型比较,有点奇怪。

  还有行动派网友,想看什么自己比较。

  StabilityAI 创始人翻出了 Gemini 2.5 Flash 的基准测试结果:

  看后表示:

  • 与 Gemini 2.5 Flash 竞争是多么困难,Gemini 2.5 Flash 成本比 Mistral Medium 3 低 70%。
  • 期待开源模型的发布,这是 Mistral 的关键优势。

  One More Thing

  继三月份推出 Mistral Small、今日推出 Mistral Medium 后,Mistral AI 透露接下来几周正着手开发“大型”项目。

  [1]https://mistral.ai/news/mistral-medium-3

  [2]https://x.com/MistralAI/status/1920119463430500541

  [3]https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/