
7 月 27 日的世界人工智能大会(WAIC)上,燧原科技和沐曦这两家头部国产 AI 芯片厂商首发各自新一代的主力 AI 芯片。
燧原科技新发布的 L600 芯片历时两年半开发,采用训推一体的架构,亦即可用于大模型训练和推理。L600 配备 144GB 的存储容量,存储带宽为 3.6TB/s,支持 DeepSeek 模型在训练过程中使用的 FP8(8 位浮点数)低精度——低精度可提升训练速度和降低计算成本。
L600 是燧原科技第四代芯片,上一代产品为 2024 年 6 月量产的 S60 推理芯片,面向大语言模型、多模态大模型、搜索广告推荐、传统 AI 模型等场景。在 S60 的基础上,燧原科技还推出 DeepSeek 一体机,可运行满血版、蒸馏版不同尺寸的模型。
南都记者了解到,S60 芯片目前已出货 7 万颗,在国产卡落地规模上进入前列,且覆盖到国内五大智算集群。其中,2024 年 12 月,燧原科技在甘肃庆阳建成万卡推理集群,使用了 10016 张 S60 算力卡。
燧原科技创始人兼首席运营官张亚林介绍,公司的算力已支持腾讯诸多的互联网应用场景,并通过智算集群支撑腾讯产业生态客户的业务拓展。
天眼查显示,腾讯自 2018 年以来参与了燧原科技 6 轮融资,是其重要产业投资方。
WAIC2025 的燧原科技展厅。图:杨柳
沐曦新推出的曦云 C600 延续了训推一体的方案,具备多精度的混合算力,同样支持 FP8 精度。C600 采用 HBM3e 显存(第五代高带宽内存),数据存储容量从上一代 C500 的 64GB 提升至 144GB。值得一提的是,HBM3e 是当前市场上较先进的高带宽内存产品,仅次于最新的 HBM4,英伟达旗下 H100 等芯片也搭载 HBM3e。
沐曦联合创始人、首席技术官彭莉称,曦云 C600 实现芯片研发制造全技术流程的国产自主可控。但她同时表示:“如何打造基于国产供应链的可持续供给,是公司面临的挑战。”
招股书显示,C600 项目于 2024 年 2 月立项,投资总额约 13.7 亿元。2024 年 10 月,C600 交付流片(芯片设计完成后、规模化制造前的关键环节),并于 2025 年 5 月完成回片,预计今年第四季度小批次量产。2025 年 4 月,沐曦已启动了下一代的 C700 系列研发,投资总额约 20.4 亿元,预计 2026 年第二季度开始进入流片测试阶段。
WAIC2025 沐曦展厅内展示的曦云 C600 GPU 芯片。图:杨柳
目前,沐曦的产品结构涵盖三大类别:训推一体的曦云C系列、面向传统人工智能场景的推理 GPU 曦思N系列、用于图形渲染的曦彩G系列。曦云C系列是其中的主力产品。根据沐曦的招股书,2024 年度和 2025 年前三月,曦云的 C500 芯片的收入占比分别高达 97.28% 和 97.87%。南都记者了解到,沐曦正在基于 C500 系列建设万卡集群。
招股书显示,截至今年 3 月,沐曦的 GPU 产品累计销量超过 2.5 万颗。上海证券交易所官网显示,沐曦的 IPO 进程已于 7 月 19 日进入受理后的问询阶段。
采写:南都N视频记者杨柳王子黎樊文扬发自上海