
阶跃星辰宣布正式开源其最新一代基础大模型 Step3。该模型采用专家混合(MoE)架构,总参数量为 321B,激活参数量为 38B,旨在为企业和开发者提供性能与成本极致均衡的推理方案。
Step3 模型在设计上专注于多模态推理,通过端到端的设计最小化解码成本,在视觉语言推理任务中表现出色。
技术上,模型采用了自研的 MFA(Multi-matrix Factorization Attention)注意力机制和 AFD(Attention-FFN Disaggregation)系统架构。MFA 旨在降低 KV 缓存开销和计算消耗,而 AFD 则将 Attention 和 FFN 计算解耦为两个子系统,通过流水线并行调度提升吞吐效率。
为支持 AFD,阶跃星辰还开源了专用的通信库 StepMesh,以实现跨卡的低延迟高带宽数据传输。
在性能评测方面,Step3 在 MMMU、MathVision、AIME 2025 等多个基准上,表现优于同类开源模型。在社区测试中,该模型也展现了不错的指令遵循和生成能力。vLLM 项目宣布已支持 Step3 模型,并报告在 Hopper GPU 上实现了高达 4,039 tok/sec/GPU 的吞吐量。
Step3 模型权重已在 Hugging Face 和魔搭社区发布,支持 bf16 和 block-fp8 格式。
- Github:https://github.com/stepfun-ai/Step3
- Hugging Face:https://huggingface.co/stepfun-ai/step3
- 魔搭 ModelScope:
https://www.modelscope.cn/models/stepfun-ai/step3
https://www.modelscope.cn/models/stepfun-ai/step3-fp8
用户可以通过阶跃星辰开放平台(platform.stepfun.com)访问其 OpenAI 兼容的 API,上下文长度为 64K,目前提供折扣价格,输入为每百万 token 1.5 元,输出为 4 元。