2026 AI变天:从“陪聊”到“干活”,中国模型成全球开发者首选

  智东西

  作者王涵

  编辑漠影

  3 月 2 日,西班牙巴塞罗那,持续四天的世界移动通信大会 MWC 2026 正式开幕。在春节后的首场全球科技盛会上,中国科技厂商的展台面前人头攒动。

  智东西在逛展时便发现,围绕人工智能的新技术新应用,在本届 MWC 大会上无处不在。

  从字节跳动和努比亚合作的“豆包 AI”手机到荣耀新发布的机器人手机,展台都被来自世界各地的参会者围得水泄不通,他们都想要亲自上手体验,看 AI 到底是如何操作手机、如何做事的。

  在同一天,一度让全球开发者为之疯狂,连 AI 大神卡帕西都曾盛赞为“令人惊叹的科幻级爆发现象”的开源 AI Agent 助手 OpenClaw,已经超越了所有 GitHub 开源软件项目,正式成为史上最受欢迎开源项目。

  OpenClaw 本质上是一个能直接操作你电脑的 AI Agent,开发者们疯狂地为它接入各种大模型,只为了一个目的:让 AI 真的动起来,帮自己干活。

  这两件事看似没有关联,但他们都不约而同地反映出 2026 年 AI 发展的一个核心趋势,那就是:AI 正在从能听懂你的话,进化到可以帮你做事了。

  一、阶跃星辰新模型,凭何成为全球爆火 OpenClaw 玩家的拥趸?

  同样是使用 OpenClaw 来干活,活干得怎么样,背后的大模型就至关重要。在知名模型聚合平台 OpenRouter 上,OpenClaw 的调用量榜单成了衡量模型“动手能力”的直接体现。

  就在 3 月 2 日,国内大模型头部创企阶跃星辰在 2 月新开源的 Agent 基座模型 Step 3.5 Flash 单日调用量已超过 40B,在 OpenClaw 的调用量榜中排名第二,超过 Kimi K2.5、Gemini 3 Flash Preview、Claude Sonnet 4.5 等一众国内外主流模型。

  对于 OpenClaw 这种需要复杂推理、长时间运行的 Agent 系统,用户更加倾向速度快、推理强、成本低的模型。而 Step 3.5 Flash 恰恰满足了 OpenClaw 用户的痛点。

  Step 3.5 Flash 采用稀疏 MoE 架构,每个 token 仅激活约 110 亿参数(总计 1960 亿),在单请求代码类任务上最高推理速度可达每秒 350 个 token。在 Agent 场景和数学任务上,Step 3.5 Flash 的能力逼近闭源模型,能够胜任复杂、长链条任务,是阶跃星辰迄今最强的开源基座模型。

  这款模型一经发布,便受到大量海外开发者的关注好评,向来低调的阶跃星辰研发团队,罕见现身 Reddit r/LocalLLaMA 社区回答全球开发者有关 Step 3.5 Flash 的提问。

  有开发者提问:在规划 Step 3.5 Flash 时,你们是否心中已经瞄准了这个特定的“最佳平衡点”:89 tokens/参数,并且正好卡在消费级硬件规模的上限(128GB 用于 Q4 量化,11B 激活参数以保证实用的运行速度)?

  阶跃星辰 CTO 朱亦博回复称,团队的确有明确目标,即让相关模型能够运行在 128GB 内存系统中。他发现,目前市场上约 230B 规模的模型,刚好超出了其个人 MacBook Pro 设备 4 位量化的承受范围,因此他便要求团队对模型规模进行了适当缩减。

  从开发者的角度去研发产品,而不是让开发者来适应产品。有开发者说,这正是他觉得兴奋的地方。

  有外网网友分享称,对 Step 3.5 Flash 的印象很深刻,已经将该模型作为自己 OpenClaw 的主力 Agent。

  二、有求必应,阶跃星辰 Step 3.5 Flash 全链路“开诚布公”

  在与阶跃星辰研发团队的沟通中,有开发者希望阶跃星辰可以将基础模型与指令/思考模型一起发布,这样社区就可以对它进行微调了。

  阶跃星辰对开发者有求必应,阶跃星辰将 Step 3.5 Flash 的 Base 权重、Midtrain 权重、Steptron 训练框架一同开源,希望通过更彻底的开源,让开发者能够以 Step 3.5 Flash 为基座进行更深度模型定制,打造真正属于自己的 Agent。

  这一举动在当前大模型开源趋于保守的环境下,显得颇为彻底。开源不到 24 小时,海外社区对阶跃星辰的进一步开源的反馈十分热烈。

  还有开发者赞叹说,Step 3.5 Flash 速度十分惊艳,与 OpenClaw 的自然兼容性也很出色。

  三、开发者用脚投票:从应用出发,才能让 AI 更好地应用

  从全球开发者们使用大模型构建 Agent 的实践反馈中,我们也可以看出:

  最近一两年,AI 的核心是“理解用户”,大模型比拼的是谁更懂人的语义、谁的上下文更长。而 2026 年的分水岭在于,AI 的核心正在向“执行任务”迁移,比的是谁能让 AI 真正操作工具、谁能帮人类做更多的事情。

  而阶跃星辰的技术路线,正是围绕着“让 AI 做事”展开。

  在阶跃星辰团队与全球开发者的交流中,他们说了这样一句话:“Step 3.5 Flash 的目标,从一开始就是三件事:智能密度、推理与生成速度、Agent 能力。目标清晰后,算法、数据与基础设施会自然对齐。”

  这句话很清晰地反映出了阶跃星辰“让 AI 做事”的技术路径。在他们的逻辑里,一个模型好不好,不再只看它在基准测试上刷了多少分,而是看它能不能在开发者的本地机器上跑起来、跑得快、跑得稳。

  最近,阶跃星辰也登上了央视焦点访谈,首席战略官李璟在节目中说到,在这半年以来,阶跃星辰在 AI 应用与融入人们生活的方面投入了更多的研发力量,AI 已经从能听懂你说话进化到能帮你做事。

  以应用来作为牵引指导多模态的发展,用应用落地的目标倒推基座大模型的研发,是阶跃星辰的发展主线。

  结语:阶跃星辰选择了一条难走但正确的路

  如果说 2025 年是国产大模型的“爆发之年”,那么 2026 年或将成为 AI 的“分水岭”,谁能找准 AI 落地价值与场景,谁就有可能突出重围。

  阶跃星辰认准的“应用牵引多模态发展”发展路径,是一条难走但正确的路,他们认准 AI 的价值不在于对话,而在于它能走进多少人的生活,能帮人们做到多少事。这或许正是国产大模型从“流量竞争”走向“价值竞争”的一个缩影。

  喧嚣终会退去,真正留下的是那些能扎根场景、解决实际问题的技术。