Ilya之后,两位90后撑起OpenAI核心研究

  白交鹭羽发自凹非寺

  量子位 | 公众号 QbitAI

  Ilya 之后,谁是支撑起 OpenAI 研究的人?

  GPT-5 发布前夕,奥特曼公开了他背后的两位 90 后得力干将。

  Mark Chen,首席研究官,小扎挖人首份名单,“拒绝了小扎 10 亿美金薪酬”。

  Jakub Pachocki,Ilya 的接替者,OpenAI 的新首席科学家,曾被奥特曼称赞为“我们这一代最杰出的头脑之一”。

  正是他们两个人撑起了 OpenAI 的核心研究,Chen 负责组建和管理研究团队;Pachocki 负责制定研究路线图,并确立长期技术愿景。

  除此之外,他们两个还透露了不少细节,比如为什么要解散超级对齐团队,平时又是如何协作等细节。在这样一个特别的时间节点,小扎疯狂挖人、GPT-5 发布前夕,不排除有奥特曼一些特殊的考量,也许是给大家一颗定心丸。

  网友调侃:合作伙伴关系如此牢固,甚至 ChatGPT 都称他们为爸爸妈妈。

  • 小扎刚刚更新了他的名单。

  不过,你又怎知小扎没有早早下手,但却又是现在这样一个结果。(Doge)

  两位 90 后 OpenAI 顶梁柱

  这两位 OpenAI 顶梁柱有不少共同点,都是 90 后(Mark Chen 90 年,Jakub Pachocki 91 年),都有奥赛经验,都是 OpenAI 资深员工,参与了包括 GPT 系列核心项目。

  接下来那就来好好了解下这两个人。

  Mark Chen

  相信持续关注小扎挖人的朋友应该对他很熟悉。他应该是小扎的第一个名单对象,也是他给到小扎「加大人才投资」的灵感。

  Mark Chen 是 OpenAI 的首席研究官。他曾经牵头创建了 DALL-E、参与 GPT-3、GPT-4 的开发——构建了 GPT-3 模型并行策略的早期版本;为 GPT-4 添加图像识别功能,此外还领导了编码模型 Codex 的开发。

  今年春天的时候小扎和 Mark Chen 进行了一次闲聊,内容主要是小扎向对方请教如何改进自家的生成式 AI 部门。

  Mark Chen 当时也没多想,所以就认真建议他加大对人才的投资。结果这一下仿佛就打通了小扎的任督二脉,堪称硅谷史上最疯狂的抢人大战就此启动。

  当时小扎就向给他灵感的 Mark Chen 发出邀请:是否愿意考虑加入 Meta,以及如何才能打动你?

  后面爆料称,报价似乎达到了 10 亿美金。

  但已经在 OpenAI 待了 6 年的 Mark Chen 没咋考虑就回绝了,并表示自己在 OpenAI 干得很开心。

  他本科毕业于 MIT 计算机专业,在 OpenAI 之前,他曾在华尔街公司 Jane Street Capital、Integral Technology LLC 担任量化研究员,开发了用于期货交易的机器学习模型。

  Jakub Pachocki

  在 OpenAI 刚成立的第三年,他就加入了,Ilya 是他的工作导师。现在已经在 OpenAI 呆了 8 年,今年 34 岁。他曾负责 Dota 的 AI 应用项目,先后担任推理团队负责人、深度学习科学团队负责人。

  2024 年,在他导师 llya 离职后被提升为首席科学家,负责监督 GPT-4 和 o1 等项目,曾被奥特曼称赞为“我们这一代最杰出的头脑之一”。

  他的工作经历更为简单。在哈佛大学搞完博士后研究就来了 OpenAI,在此之前,他在 CMU 读博,只读了三年就获得了博士学位,在华沙大学读的本科。

  除此之外,他还有个竞技程序员的身份。

  高中期间,他曾六次入围 IOI 竞赛决赛,2009 年他获得银牌。 2012 年,他代表大学参加了国际大学生程序设计竞赛,他的团队赢得了金牌并获得了总成绩第二名。同年,他还是 Google Code Jam 的冠军。

  这两个人撑起 OpenAI 核心研究

  如果说奥特曼是 OpenAI 对外的公关名片,那么 Chen 和 Pachocki 则是这家公司的幕后支柱,在 llya 走后,二人共同承担起核心研究的重任。

  他们在 OpenAI 里的关系比想象中更为紧密,Chen 主要负责塑造和管理研究团队,而 Pachocki 则负责制定研究路线图,并建立长期技术愿景

  但双方角色并不固定,Chen 描述他们二人是研究人员,只要看到可以修正的技术细节,就会立马去做,彼此之间相互协同配合。

  也许这种默契来源于他们都曾参与过国际编码比赛,Chen 还是美国计算机奥林匹克队的教练,这也影响了 OpenAI 积极参与国际赛事的战略部署。

  最近 OpenAI 就在全球编程竞赛 AtCoder 中斩获第二名,仅次于人类选手 Psyho,成绩突破人类表现层级,极具开创性意义,另外 OpenAI 又刚刚取得 IMO 金牌成绩,实现在复杂推理问题上的进步。

  有意思的是,Psyho既是 OpenAI 的头号竞争对手,也曾是 OpenAI 旗下的员工,Pachocki 和他亦是朋友关系,曾经一起参加比赛,现在 OpenAI 的 LLM 正在试图跨越这座编程界的大山,就像当年 AlphaGo 和李世石。

  这也是 Chen 和 Pachocki 的共同观点,只有去积极挑战数学和编码上的顶级人类,模型才能飞速进步,因为数学和编码才是通向更强大的通用模型的关键。

  例如 Psyho 在本次比赛中也给出了一个非常新颖的解决方案,这是模型之前从未见过的解法,而这也恰恰让模型获得知识提升的机会。

  Pachocki 表示:

编程和数学实际上关乎创造力,提出新颖的想法,以及连接来自不同地方的想法。

  诚然,OpenAI 一直在飞速发布新产品,从 GPT-4 到o系列推理模型,再到即将发布的 GPT-5,OpenAI 始终保持着这种创新势头。

  至于OpenAI 是如何同时兼顾开放式研究和产品开发,Pachocki 表示,他们始终在尝试构建通用人工智能,但在走向 AGI 的过程中,延伸出的新技术就可能成为一个支线产品。

  OpenAI 始终对构建 AGI 充满热情,他们现在所做的就是在了解并突破其技术瓶颈,例如它能做什么,它不能做什么?

  目前最前沿的推理模型,虽然可以将问题分解,也知道很多知识,但无法真正像人类一样串联起知识,仍旧处于推理范式初期,而 OpenAI 正在试图回答这个问题。

  他们相信,缩放定律在该推理范式的构建上并没有完全崩溃,只需要找到合适的模型构建方式,或者挑选可用的数据训练,就能逼近 AGI 的瓶颈。

  当然关键还是在于模型的自主时间(autonomous time),即模型如何在没有停滞的情况下,在有效时间内完成对复杂问题的自主研究。

  Chen 和 Pachocki更重视 AGI 作为工具的实用性,认为发展应当循序渐进,而 llya 和他们的观点则截然不同,llya 曾在采访中表示,AGI 将会是里程碑式的改变世界的存在。

  因此 llya 希望从设计更优秀的模型转向控制模型,于是他曾在 OpenAI 内部成立超级对齐团队,旨在投入 OpenAI 五分之一的资源以控制超级智能。

  但当 llya 离开公司后,超级对齐团队迅速被解散。

  谈及解散原因,Chen 和 Pachocki 认为所谓对齐研究已经融入 OpenAI 的核心业务,模型必须按照预期工作才能发挥作用,且当前应当更关注现有模型的对齐,而非假设性的超级智能。

  OpenAI 正在从纯研究实验室转向兼顾研究和产品落地的公司,关于前沿研究和产品发布之间的关系,Chen 表示:

这是一个非常微妙的平衡。

  但有关GPT-5的更多信息,Chen 和 Pachocki 没有进行过多的透露,官方说法只有奥特曼的“即将发布”,以及称之为实验性模型

  所以当这篇文章被奥特曼转发后,网友的关注焦点还是放在了 GPT-5 上:

请停止发推文并发 GPT-5。

  参考链接:

  1. https://www.technologyreview.com/2025/07/31/1120885/the-two-people-shaping-the-future-of-openais-research/
  2. https://x.com/sama/status/1950936581810041143
  3. https://www.reddit.com/r/singularity/comments/1m5c4mj/mark_zucker_asked_mark_chen_if_he_would_consider/