在国产大模型竞争日益激烈之际,AI 初创公司北京月之暗面科技有限公司(以下简称“月之暗面”)日前发布全新开源模型 Kimi K2(以下简称“K2”),试图重新争夺市场领先地位。7 月 13 日,美国 AI 搜索初创公司 Perplexity CEO 阿拉温德(Aravind Srinivas)发文称,K2 模型在测试中良好表现,后续可能会基于 K2 进行后训练。
Perplexity 的 CEO 阿拉温德(Aravind Srinivas)点赞 Kimi
有业内人士对此次 K2 模型的发布表示看好,他认为“Kimi 现在在走一条比之前更正确的道路,具备深度研究能力才是大模型提供真正价值的核心”。该业内人士进一步向澎湃科技表示,大模型此前依靠 Token(词元)低价竞争的策略并不会长久。
前述业内人士分析指出,大模型的研发和运营成本非常高,包括巨大的计算资源消耗、电力成本以及顶尖人才的投入,低价竞争策略会让企业难以收回成本,无法持续投入在研发上。从长远来看,这种模式并不利于行业发展。
Kimi K2 在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)三大能力维度的基准性能测试。 来源:月之暗面
月之暗面此次发布的 K2 模型具备更强的编程能力,在执行通用智能代理任务与工具整合方面表现出色,能更高效地拆解复杂任务。该模型总参数达到一万亿,激活参数为 320 亿。K2 的 API 服务支持最长 128K 上下文,具备更强的通用性与工具调用能力,每百万输入 tokens 4 元,每百万输出 tokens 16 元。
而在此之前,国产大模型市场经历了一轮激烈的价格战,DeepSeek、豆包、文心一言、通义千问等头部厂商纷纷大幅下调模型服务价格。今年 2 月,DeepSeek 宣布在每日 00:30 至 08:30 的夜间时段大幅降价:DeepSeek-V3 输入价格降至每百万 tokens 0.25 元、输出价格 1 元,较原价下调 50%。2024 年 5 月,阿里云也将其 Qwen-Long API 的输入价格从 0.02 元/千 tokens 降至 0.0005 元,输出价格约为 0.002 元/千 tokens,整体降幅最高达 97%。
在模型性能上,K2 在自主编程、工具调用及数学与逻辑推理三大核心能力的基准测试中表现良好。在前端开发任务中,K2 擅长生成兼具设计感与视觉表现力的代码,支持粒子系统、可视化和 3D 场景等表现形式,具备较强的图形能力与交互性。此外,在 Agent(智能体)任务执行方面,K2 Agent 现已具备稳定的复杂指令解析能力,完成复杂任务或自动化编码。
月之暗面成立于 2023 年,由清华大学毕业生杨植麟创办,获得阿里巴巴等多家互联网巨头支持。该公司在 2024 年因推出具备长文本分析和 AI 搜索功能的 Kimi 模型而迅速走红,吸引大量用户关注。
不过,随着竞争对手 DeepSeek 今年初推出低成本、高性能模型 R1 并重塑全球 AI 市场格局,月之暗面的市场反响和热度略有所下滑。据追踪人工智能产品的中国网站 aicpb.com 称,月之暗面的 Kimi 应用程序去年 8 月在月活跃用户中排名第三,但到 6 月份却跌至第七位。
在沉寂数月之后,6 月中旬,月之暗面推出 Kimi-Research(深度研究)功能内测。据介绍,Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。