国思软件 - 1/8成本比肩Claude 3.7，Mistral Medium 3来了

　　西风发自凹非寺

　　量子位 | 公众号 QbitAI

　　用1/8 成本比肩 Claude 3.7，刚刚，“欧洲 OpenAI”Mistral AI 发布多模态新模型。

　　MistralMedium3，主打编程和多模态理解，且在性能和成本间进行了平衡。

　　官方称，在各类基准测试中，Mistral Medium 3 性能达到或超越 Claude Sonnet 3.7 的 90%，且成本大大降低。

　　Claude 3.7 Sonnet 的价格为每百万输入 token 3 美元，每百万输出 token 15 美元，而 Mistral Medium 3：

　　每百万输入 token 仅 0.4 美元，每百万输出 token 2 美元

　　整体性能，不管是和领先开源模型 Llama 4 Maverick 还是和企业级模型 Cohere Command A 相比，Mistral Medium 3 都能打得有来有回。

　　目前，Mistral Medium 3 API 已在 Mistral La Plateforme 和 Amazon Sagemaker 上线，不久后还将在 IBM WatsonX、NVIDIA NIM、Azure AI Foundry 和 Google Cloud Vertex 上推出。

　　具备一系列企业级能力

　　下面具体来看看基准测试。

　　Mistral Medium 3 在编程和 STEM 任务中尤为突出。

　　官方原话是“其性能甚至接近非常大且运行速度慢得多的竞争对手”。

　　不过呢，既不开放模型权重，也没有透露模型大小

　　另外，Mistral AI 还发布了第三方人类评估。

　　人类评估中，Mistral Medium 3 依旧是在编程方面占优势。

　　在多模态和其他人语言任务中，相比 Llama 4 Maverick，Mistral Medium 3 的表现也占上风。

　　除了测试数据之外，官方还特别强调了其适应企业环境的能力，包括：

　　企业可以轻松将智能全面集成到系统中，借助 Mistral 的应用 AI 解决方案，该模型可以持续进行预训练、全面微调，并融入企业知识库，使其成为针对特定领域训练、持续学习和自适应工作流程的高保真解决方案。

　　官方称，金融服务、能源和医疗保健领域的客户正在使用该模型测试，通过深入的背景信息来丰富客户服务、实现业务流程的个性化，并对复杂的数据集进行分析。

　　另外，他们还推出了Le Chat Enterprise，这是一项面向企业的聊天机器人服务，提供了 AI Agent 建造器之类的工具，并将 Mistral 的模型与 Gmail、Google Drive、SharePoint 等第三方服务集成。

　　据了解，Le Chat Enterprise 将很快支持 MCP。

　　Mistral Medium 3 发布后引发大批网友关注，有网友为其“高性价比”点赞。

　　不过也有不少网友吐槽模型没说开源结果又高调地和开源模型比较，有点奇怪。

　　还有行动派网友，想看什么自己比较。

　　StabilityAI 创始人翻出了 Gemini 2.5 Flash 的基准测试结果：

　　看后表示：

　　One More Thing

　　继三月份推出 Mistral Small、今日推出 Mistral Medium 后，Mistral AI 透露接下来几周正着手开发“大型”项目。

　　[1]https://mistral.ai/news/mistral-medium-3

　　[2]https://x.com/MistralAI/status/1920119463430500541

　　[3]https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/

1/8成本比肩Claude 3.7，Mistral Medium 3来了