OpenAI离职员工自曝:干了一年就润了!007压力逼到极限,AGI成宗教

  新智元报道

  编辑:英智

  OpenAI 如何以自下而上的文化和行动导向,推动大模型突破?从零到上线仅用 7 周,Calvin 带你走进 OpenAI 编程智能体 Codex 的诞生过程,体验高强度冲刺的魔力。

  外界对于 OpenAI 众说纷纭,很少有人从内部视角描述它的真实文化。

  三周前,在推出 Codex 后,Calvin French-Owen 离开了 OpenAI。

  在 2024 年 5 月,他加入了 OpenAI,全程见证了 OpenAI 编程智能体 Codex 的诞生。

  如今,Calvin French-Owen 想趁热打铁,效仿 Nabeel Quereshi 的《对 Palantir 的反思》,揭秘 OpenAI 的独特之处。

  没有任何商业机密,更多的是他对当下历史性时刻的思考——在当前阶段,关于这个史上最迷人组织之一所呈现的样貌。

  首先澄清:离开 OpenAI 并非因为个人矛盾,实际上他对这个决定非常纠结。

  从创业公司创始人,转变为一家 3000 人规模企业的员工,这个角色转变并不容易。

  现在,他渴望一个全新的开始。

  但这份优质的工作完全有可能再次吸引他回来。

  构建 AGI 是无与伦比的使命,LLM 无疑是这十年最重要的技术突破。

  他很幸运能亲眼见证一些技术进展,并参与了 Codex 的发布。

  当然,这些仅为个人观点,不代表公司立场。OpenAI 海阔天空,这只是管中窥豹的一瞥。

  深度揭秘 OpenAI 文化

  首先,要了解的是 OpenAI 的发展速度之快。

  2024 年 5 月,他加入时,OpenAI 大约有 1000 多人。

  一年后,员工数暴增至 3000 多人,他的工龄竟然排在前 30%。

  几乎所有领导层如今负责的工作,都与他们两三年前的大相径庭。

  如此快速的扩张导致许多机制出现问题:内部沟通、组织架构、产品发布流程、人员管理和招聘体系等,都在不断调整。

  不同团队的文化差异显著:有的团队全力冲刺,有的负责大型计算任务,有的则节奏更平稳。

  因此,OpenAI 的体验因团队而异,研究、应用和市场团队的工作节奏完全不同。

  Slack 驱动一切

  OpenAI 的独特之处在于,所有事情——没错就是指所有事情——都依赖 Slack 运转。

  几乎所有工作都在 Slack 上完成,没有电子邮件。

  如果不擅长信息管理,这种模式会让你分心到崩溃;但如果精心规划频道和通知设置,这套系统其实相当高效。

  OpenAI 的文化非常「自下而上」,尤其是在研究领域。

  刚加入时询问下一季度的路线图,他得到的回答是:「没有路线图」(现在有了)。

  好的想法可以来自任何地方,很难提前预测哪个想法会成功。

  相比宏大的总体计划,OpenAI 的进展靠不断试错和研究突破推动。

  得益于这种文化,OpenAI 也极为推崇「实力至上」。

  公司领导者的晋升主要基于他们提出好点子并付诸实践的能力。

  许多优秀领导并不擅长演讲或办公室政治,但在 OpenAI,这不是重点。

  真正的好想法往往能脱颖而出。

  行动导向!

  公司鼓励直接行动。不同团队常不约而同地探索类似想法。

  刚加入时,他参与了一个与 ChatGPT Connectors 类似的内部项目。

  Codex 发布前,内部有3-4 个不同的原型项目,通常由几个人自发启动,无需特别审批。

  一旦显现出潜力,团队便会迅速围绕它们集结起来。

  Codex 负责人 Andrey 曾说,研究员就像独立的小高管,独立探索项目。

  优秀的研究经理和项目经理(PM)影响力巨大,同时也极为稀缺。

  最顶尖的经理能将众多不同的研究项目串起来,推动更大规模的模型训练。

  他合作的 ChatGPT 工程经理非常沉稳,他们大多放手管理,但擅长招聘优秀人才,并尽力为他们创造成功的条件。

  OpenAI 能快速调整战略方向,决策调整非常迅速。

  这是创业时就很看重的:根据新信息做正确的事,远比固守计划重要。

  令人惊讶的是,OpenAI 这样的大公司仍保持这种灵活性,谷歌显然做不到。

  一旦决定某个方向,公司会全力以赴。

  OpenAI 备受外界关注。内部尚未公布的消息常被媒体提前曝光。甚至有X用户用脚本监控 OpenAI 的新功能发布。

  因此,公司内部非常注重保密,无法详细透露工作内容。

  Slack 工作空间有不同权限,收入和支出数据更是严格保密。

  OpenAI 也比你想象的要严肃,这里的风险和机遇都太大了。

  一方面,公司追求 AGI,责任重大;另一方面,产品服务数亿用户,涵盖医疗建议到心理咨询等场景。

  尽管 OpenAI 常被媒体批评,他遇到的每个同事都在努力做正确的事。

  作为最受关注的 AI 实验室,OpenAI 容易招致批评。

  不应该将 OpenAI 视为单一的整体。

  它最初是一群科学家和技术爱好者,共同探索科学的前沿。

  这个团体偶然间催生了历史上最具病毒传播效应的消费级应用。随后,它又萌生了向政府和企业销售产品的雄心。

  因此,不同时期加入、身处不同部门的员工,其目标和视角也大相径庭。

  待得越久,就越可能倾向于从「研究实验室」或「非营利组织」的视角看待公司。

  积极分享成果

  最欣赏的一点是,公司在分享 AI 成果方面,是真正地说到做到。

  顶尖模型没有被限制在高价企业套餐中,任何人都能免费使用 ChatGPT 获取答案。

  API 向初创公司开放,最先进的模型通常很快接入 API。

  这一点 OpenAI 值得高度赞扬,也是公司文化的核心。

  OpenAI 对安全的重视超出外界猜测。

  许多人在开发安全系统,重点关注实际风险(如仇恨言论、滥用、政治偏见、生物武器、自我伤害、提示注入等),而非理论风险(如智能爆炸)。

  安全方面的工作大多未公开,OpenAI 应更积极分享这方面成果。

  纪念品稀缺:不像其他公司大肆发放纪念品,OpenAI 的纪念品限量分发。第一次投放需求太大,Shopify 商店直接崩溃。内部还流传了如何用 JSON 绕过限制的教程。

  GPU成本惊人:相比 GPU 开支,其他成本几乎微不足道。比如,Codex 一个功能模块的 GPU 成本,就相当于我们整个 Segment 基础设施的开支。

  雄心勃勃:OpenAI 可能是最有野心的组织。不仅满足于顶级消费级应用,还想在 API、深度研究、硬件、代码代理、图像生成等多个领域竞争。这里是实现想法的沃土。

  X驱动:公司很关注X。病毒式传播的 OpenAI 相关内容常被内部注意到。朋友开玩笑说:这家公司靠X氛围驱动。

  团队流动性:团队协作非常灵活。Codex 发布时,需要 ChatGPT 工程师支持,第二天就来了两位高手加入,没有繁琐的审批流程。

  高管参与度高:领导层非常投入,gdb、sama、kw、mark、dane 等人常在 Slack 上发言,没有甩手掌柜式的领导。

  代码与技术栈

  OpenAI 使用一个庞大的单一代码库(monorepo),以 Python 为主,但也加入了 Rust(用于部分服务)和 Golang(用于网络代理等)。

  由于 Python 的灵活性,代码风格差异很大:既有谷歌十年老兵设计的可扩展库,也有刚毕业的博士写的临时 Jupyter 笔记本。

  API 开发主要依赖 FastAPI,数据验证用 Pydantic,但公司没有统一的代码风格规范。

  OpenAI 的全部基础设施运行在 Azure 上,只有三项服务被认为是可靠的:

  • AzureKubernetes Service:用于容器管理。

  • CosmosDB:Azure 的文档存储。

  • BlobStore:用于对象存储。

  OpenAI 较少依赖自动扩展单元,权限管理(IAM)功能也比 AWS 更受限。公司倾向于「自研优先」。

  在工程团队中,有大量从 Meta(包括 Instagram)跳槽到 OpenAI 的人才。

  OpenAI 在很多方面类似早期 Meta:拥有现象级消费应用、基础设施尚在发展、追求快速行动。

  这些 Meta 背景的工程师为 OpenAI 带来了强大的基础设施经验,也导致 OpenAI 的基础设施有些 Meta 的影子,比如:

  • 自研了类似 Meta TAO 的系统(用于图数据库)。

  • 在网络边缘整合身份认证的尝试。

  代码为王(Code wins)

  OpenAI 没有中央架构或规划委员会,决策通常由执行工作的团队做出,这带来强烈的行动导向,但也导致代码库中存在大量重复功能。

  例如,至少有六种队列管理和代理循环的库。

  值得称赞的是,内部团队正投入大量精力来改善这一状况。

  消费级品牌的运作

  OpenAI 以「专业订阅」(pro subs)为核心衡量指标。

  即使是 Codex 这样的产品,也主要考虑个人用户而非团队使用。这对于 B2B/企业背景的人来说有点颠覆认知。

  产品上线第一天就能吸引大量流量,令人震撼。

  大模型训练

  训练过程介于「实验」和「工程」之间:

  • 初期是小规模实验,调整核心算法和数据组合,仔细分析结果。

  • 如果实验结果有潜力,会被纳入更大规模的训练。

  • 大规模训练类似分布式系统工程,会遇到各种意外情况,需要不断调试。

  Codex 发布

  过去三个月,他参与了 Codex 的发布,这无疑是职业生涯的亮点之一。

  2024 年 11 月,OpenAI 定下 2025 年推出编程智能体的目标。

  到 2025 年 2 月,内部已有几个工具效果不错,市场对编程智能体的需求日益明确,模型在编程任务上已非常实用。

  他提前结束陪产假,加入 Codex 发布工作。

  回归一周后,两支团队合并,开始了疯狂冲刺。

  从第一行代码到产品上线,仅用了 7 周!

  Codex 的开发是近十年来最艰苦的工作。

  每天工作到深夜 11 点或凌晨,早上5:30 被新生儿吵醒,7 点到办公室,周末也几乎都在工作。

  整个团队全力以赴,每一周都至关重要,感觉像回到了 Y Combinator 的创业节奏。

  这种速度令人叹为观止。从未见过任何组织(无论大小)能在如此短的时间内从想法到免费上线的完整产品。

  Codex 构建了容器运行时、优化了代码库下载、微调了代码编辑模型、支持了各种 Git 操作、引入了全新功能界面、启用了网络访问。

  最终打造了一款让用户用起来得心应手、体验极佳的产品。

  OpenAI 依然保有那种全力以赴、快速发布产品的冲劲。

  对的人聚在一起,真的能创造奇迹。

  团队有 8 名资深工程师、4 名研究员、2 名设计师、2 名市场人员和 1 名项目经理。

  如果有机会与 Codex 团队的成员共事,他们每一个人都非常出色。

  发布之夜

  发布前夜,五个人一直熬到凌晨 4 点,部署巨大的单体服务(一个耗时数小时的流程)。

  早上 8 点,他们回到办公室进行发布直播,打开功能开关后,流量迅速涌入。

  他从未见过一个产品仅靠出现在 ChatGPT 侧边栏就立即获得如此大的流量——这就是 ChatGPT 的力量。

  Codex 采用完全异步的形式。

  与当时的 Cursor 或 Claude Code 不同,团队希望用户能像与同事合作一样使用编程智能体:发送任务,代理在独立环境中运行,完成后返回拉取请求(PR)。

  这是一个大胆的尝试。当前模型虽好,但还不够完美,能运行几分钟但无法持续几小时。

  用户对模型能力的信任度千差万别,甚至不清楚模型的真正的上限在哪里。

  Codex 在处理大型代码库时表现优异,能很好地理解和导航代码结构。

  与其他工具相比,它最大的优势是能同时启动多个任务,并比较它们的输出结果。

  公开数据显示,Codex 自发布以来生成了 63 万个 PR,平均每个工程师在 53 天内贡献了约 7.8 万个公开 PR(私有 PR 的数量可能更多)。

  这可能是他职业生涯中最具影响力的项目。

  坦白说,最初加入 OpenAI 时有些犹豫。

  放弃创业者的自由、接受管理、成为大机器中的小齿轮,他不确定能否适应。

  如果创业者感到停滞不前,可以:

  1. 深入反思如何能进行更多、更大胆的尝试;

  2. 加入一家顶级的 AI 实验室。现在是投身创造的绝佳时机,也是窥探未来的绝佳时机。

  目前,通向 AGI 的竞争三足鼎立:OpenAI、Anthropic 和 Google。

  公司路径因其 DNA 不同(消费级产品 vs. 企业级服务 vs. 坚如磐石的基础设施+数据),在其中任何一家工作,都将是大开眼界的经历。

  参考资料:

  https://calv.info/openai-reflections

  https://techcrunch.com/2025/07/15/a-former-openai-engineer-describes-what-its-really-like-to-work-there/