国思软件 - 阶跃星辰新一代基础大模型 Step3 正式开源，专注多模态推理

　　阶跃星辰宣布正式开源其最新一代基础大模型 Step3。该模型采用专家混合（MoE）架构，总参数量为 321B，激活参数量为 38B，旨在为企业和开发者提供性能与成本极致均衡的推理方案。

　　Step3 模型在设计上专注于多模态推理，通过端到端的设计最小化解码成本，在视觉语言推理任务中表现出色。

　　技术上，模型采用了自研的 MFA（Multi-matrix Factorization Attention）注意力机制和 AFD（Attention-FFN Disaggregation）系统架构。MFA 旨在降低 KV 缓存开销和计算消耗，而 AFD 则将 Attention 和 FFN 计算解耦为两个子系统，通过流水线并行调度提升吞吐效率。

　　为支持 AFD，阶跃星辰还开源了专用的通信库 StepMesh，以实现跨卡的低延迟高带宽数据传输。

　　在性能评测方面，Step3 在 MMMU、MathVision、AIME 2025 等多个基准上，表现优于同类开源模型。在社区测试中，该模型也展现了不错的指令遵循和生成能力。vLLM 项目宣布已支持 Step3 模型，并报告在 Hopper GPU 上实现了高达 4,039 tok/sec/GPU 的吞吐量。

　　Step3 模型权重已在 Hugging Face 和魔搭社区发布，支持 bf16 和 block-fp8 格式。

Github：https://github.com/stepfun-ai/Step3
Hugging Face：https://huggingface.co/stepfun-ai/step3
魔搭 ModelScope：
https://www.modelscope.cn/models/stepfun-ai/step3
https://www.modelscope.cn/models/stepfun-ai/step3-fp8

　　用户可以通过阶跃星辰开放平台（platform.stepfun.com）访问其 OpenAI 兼容的 API，上下文长度为 64K，目前提供折扣价格，输入为每百万 token 1.5 元，输出为 4 元。

阶跃星辰新一代基础大模型 Step3 正式开源，专注多模态推理

我们的产品

相关链接

关于我们

联系我们