
昨日,在 FORCE Link AI 创新巡展· 厦门站,火山引擎发布豆包·图像编辑模型 3.0、豆包·同声传译模型 2.0,豆包大模型 1.6 系列全新升级,以及开源扣子核心能力,并发布企业自有模型托管方案、Responses API 等多个模型服务和工具产品。具体来看:
- 豆包·图像编辑模型 3.0:具备更强的指令遵循能力、图像保持能力和更强的图像生成质量。用户只需通过自然语言指令,即可完成多种操作;同时,豆包·图像编辑模型 3.0 具备对风格、结构与语义的精准控制力。
- 豆包·同声传译模型 2.0:支持全双工语音理解和生成框架,将传统机器同传的语音延迟降低到 2-3 秒,实现文本与语音的同步生成;无需提前录制,一边说话一边采样,实现 0 样本声音复刻。
- 豆包大模型 1.6 系列升级:此次,极速版 Doubao-Seed-1.6-flash 模型在保持出色的视觉理解能力,升级了代码、推理、数学等大语言模型能力。值得一提的是,该模型具有业界领先的极低延迟,TPOT 仅 10ms。价格也是一大亮点:每百万 tokens 输入仅需 0.15 元,输出仅 1.5 元。
- 本次开源覆盖扣子平台最核心的两个项目: 扣子开发平台(Coze Studio)、 扣子罗盘(Coze Loop),并采用没有任何附加条件的 Apache 2.0 许可证开源,用户可在 GitHub 下载。
- Responses API 上线:具备原生上下文管理能力,支持多轮对话的链式管理,可以无缝衔接文本、图像、混合模态数据;此外,Responses API 支持自主选择调用工具。