国思软件 - 又走一个！OpenAI研究VP离职，转投Anthropic做RL研究员

　　新智元报道

　　编辑：倾倾

　　OpenAI 的人才地震还在继续！刚刚，前研究副总裁 Max Schwarzer 宣布离职，这位亲手主导 o1、o3 和整个 GPT-5 系列 post-training 的核心人物，选择加入 Anthropic，重返一线 RL 研究。

　　心态崩了！OpenAI 又走了一个重量级人物。

　　刚刚，前研究副总裁 Max Schwarzer 在X上发文，宣布正式离开 OpenAI，转投 Anthropic。

　　他在 OpenAI 主导整个 post-training 团队，亲手参与训练了 o1、o3，以及 GPT-5、5.1、5.2、5.3-Codex 全系列模型。

　　但他不是被挖走的，是自己主动选择走的，理由是「渴望回归一线 IC 研究工作」。

　　这个选择，比离职本身更耐人寻味。

　　他亲历了 o1 的诞生

　　在 AI 圈，Max Schwarzer 算不上家喻户晓，但他的履历相当拿得出手。

　　2024 年 3 月，他在蒙特利尔人工智能研究院 Mila 完成博士答辩，导师是强化学习领域的两位重量级人物：Aaron Courville 和 Marc Bellemare。

　　博士期间，他的研究聚焦在「规模化与样本高效强化学习」的交叉地带。

　　通俗来说，就是怎么让 RL 训练既强又省。

　　他在 2023 年 ICML 发表的论文拿下了当年的顶会奖项，证明了不依赖 LLM 或世界模型，纯靠扩展无模型 RL 就能达到人类水平的样本效率。

　　论文传送门：https://arxiv.org/abs/2305.19452

　　但真正让他进入 OpenAI 核心圈的，是他对推理的判断。

　　2024 年 9 月 12 日，o1-preview 发布当天，他发帖说这是「推理时代的开端」。

　　他是 OpenAI o1 的核心贡献者之一，参与了「草莓团队」（Strawberry team）的 RL 算法开发，o1-preview 的早期去风险化实验更是出自他手。

　　之后，他主导了 o1 和 o3 的 post-training，2025 年 3 月晋升为研究副总裁，领导整个 post-training 团队，负责打磨 GPT-5 系列。

　　从应届博士生入职，他用不到两年半时间就坐上了研究 VP 的位置。

　　顶级 VP：我只想回去做研究

　　离职声明里都是对 OpenAI 的称赞：「OpenAI 有我见过的最有才华的一批研究员」「我学到的东西超出了我作为应届毕业生时的想象」。

　　关于离职的真正的理由，他说：

　　领导了一年的 post-training 工作之后，我渴望重新出发，回到 IC 研究岗位。我一直在认真考虑回归技术研究这件事，而且我真心相信，我的同事和团队在没有我的情况下完全能够继续成功。

　　这句话值得细品。

　　IC 研究，相对于管理角色来说，就是亲手写代码、跑实验；管理层负责管人、协调资源、做路线规划。

　　对研究员来说，升得越高，离真正的研究越远。

　　Schwarzer 显然不适应这种状态。

　　他在 OpenAI 的最后一年，更多时间花在带团队、做决策上。

　　站在研究 VP 的位置上，他可以影响几十人的研究方向，但自己动手的空间少了很多。

　　这种选择在 AI 行业并不罕见，但肯做出这个选择的人需要勇气。

　　毕竟，「研究 VP」的头衔在任何简历上都足够好看，放弃它回去当普通研究员，不是每个人都愿意的。

　　事实上，Schwarzer 不是第一个从 post-training 主管位置出走的人。

　　他的前任 Liam Fedus，同样担任过 OpenAI 研究副总裁兼 post-training 负责人，于 2025 年 3 月离职，随后联合创办了 AI 初创公司 Periodic Labs，目标是打造「AI 科学家」。

　　从 OpenAI 离职的人前赴后继，令人深思。

　　OpenAI 的人才流失：不只是走了几个人

　　Schwarzer 是近两年 OpenAI 人才出走潮中的最新一个，但绝对不是最后一个。

　　2025 年以来，离开 OpenAI 的研究员和高管名单越来越长：前 CTO Mira Murati、首席研究官 Bob McGrew、研究副总裁 Barret Zoph，在 2024 年集中离职。

　　2025 年夏天，Jason Wei、Zhiqing Sun、Hyung Won Chung 等多位研究科学家相继跳槽 Meta。

　　后者在 LinkedIn 上公开表示，很高兴能「从一张白纸开始，与真正有才华密度的团队共事」，言下之意耐人寻味。

　　到现在，Altman 是 OpenAI 原始 11 人创始团队中仅剩的两位成员之一。

　　两周前，CNN 报道称，一批 AI 研究员正在「边走边拉警报」。

　　OpenAI 的一位研究员在离职时表示，这项技术「有以我们无法理解、更无法阻止的方式操纵用户的潜力」。

　　OpenAI 还在同一周因为反对推出成人模式而解雇了一名安全主管，并被曝解散了专注于确保 AI 对全人类有益的使命对齐团队。

　　Schwarzer 的离职声明里没有任何批评，反而充满了对 OpenAI 的善意。

　　这种体面的分手，反而格外少见。

　　此时此刻的 Anthropic

　　他选了 Anthropic，岗位是 RL 研究，这个他最擅长的领域，不做管理，就做研究。

　　Anthropic 近两年持续吸引了来自 OpenAI 的顶尖人才。

　　2024 年，对齐研究负责人 Jan Leike、OpenAI 联合创始人 John Schulman 先后加入，前者明确表示是因为对 OpenAI「没有认真对待安全」的不满。

　　2026 年初，OpenAI 的高级安全研究员 Andrea Vallone 也跳槽到 Anthropic，在 Jan Leike 手下工作。

　　而 Schwarzer 加入的时间节点，格外微妙。

　　就在前几天，Anthropic 正经历它五年历史中最大的一场风波：与五角大楼的正面交锋。

　　Anthropic 拒绝向国防部开放 Claude 用于大规模监控或全自主武器的权限，特朗普随即在 Truth Social 上命令所有联邦机构立即停用 Anthropic 的技术。

　　而与此同时，OpenAI 迅速填补了这一真空，达成向五角大楼开放其模型的协议。

　　讽刺的是，在 Anthropic 最艰难的时刻，Claude 在苹果AppStore 的下载量反而超过了 ChatGPT，Anthropic 的估值目前高达3800 亿美元。

　　Schwarzer 在声明结尾写道：「我期待支持在这个重要时刻的朋友们。」

　　他说的重要时刻，大概不只是指 Anthropic 自身的研究进展。

　　Schwarzer 选择在这个节点加入，某种程度上是一次站队。

　　正面临最大危机的 Anthropic，正在用一件事证明自己的吸引力：在商业压力和安全底线之间，它选择了后者，哪怕代价是失去整个联邦政府的合同。

　　对于那些不缺钱、只缺使命感的顶级研究员而言，这种姿态，比任何 offer 都有说服力。

　　参考资料：

　　https://x.com/max_a_schwarzer/status/2028939154944585989?s=20

又走一个！OpenAI研究VP离职，转投Anthropic做RL研究员

我们的产品

相关链接

关于我们

联系我们