4 月 15 日凌晨,奥特曼预告的好东西登场。OpenAI 一口气发布 GPT-4.1 系列三款模型:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,称其为“有史以来最小、最快、最便宜”的模型组合。
新系列模型已通过 API 向所有开发者开放。奥特曼表示该系列模型仅限 API 使用,不会集成进 ChatGPT 系列产品中。
三款模型均支持高达 100 万个 token 的上下文窗口,最大输出 token 数为 32,768 个,知识截至日期更新至 2024 年 6 月。OpenAI 表示,该系列在性能、成本与响应速度上全面超越 GPT-4o 和 GPT-4o mini。
GPT-4.1 为旗舰模型,在编码、指令遵循和长文本理解方面表现最佳,适用于复杂任务。SWE-bench 测试中得分 54.6%,比 GPT-4o 高出 21.4%,较 GPT-4.5 提升 26.6%。
GPT-4.1 mini 定位为高效小型模型,延迟降低近一半,成本下降 83%。在多个基准测试中超越 GPT-4o,适合注重性能效率的使用场景。
GPT-4.1 nano 是 OpenAI 首个超小型模型,也是迄今为止速度最快、成本最低的模型,MMLU 得分 80.1%、GPQA 得分 50.3%,适用于分类、补全等低延迟任务。
OpenAI 表示将逐步弃用 GPT-4.5 预览版,并将在 7 月 14 日正式关闭。原因是 GPT-4.1 系列在关键能力上表现相近,但成本和延迟更低。
在定价策略上,GPT-4.1 比 GPT-4o 中等查询费用低 26%。提示缓存折扣从 50% 提升至 75%。长上下文请求将不再收取额外费用。
OpenAI 表示,GPT-4.1 系列将为构建智能系统和复杂智能体应用提供更高性价比与开发效率。(袁宁)