封杀中国的美AI巨头创始人,当年为何离开百度?

  (文/陈济深编辑/张广凯)

  9 月 5 日,美国 AI 巨头 Anthropic 发布了一则《更新对不受支持地区的销售限制》公告,再度聚焦中国市场,明确宣布立即停止向“多数股权由中国资本持有的集团或其子公司”提供 Claude 人工智能服务,政策还涵盖在境外注册的中资子公司、云服务中转实体等。

  早在 2024 年 5 月,Anthropic 就曾有条款表示不对中国地区开放服务。本次规则是进一步收紧,对中国的封杀不局限于地理意义上的中国地区,而是对于其认定的中资实体,无论其注册地是否位于中国,均一律禁止使用 Anthropic 旗下产品 Claude 的服务权限。

  Anthropic 此举不仅是中美科技战的最新缩影,其创始人 Dario Amodei 的从业履历也引发了众人的关注。很多人并不知道,Dario Amodei 职业生涯的起点是一家中国公司——百度。

  从中国公司员工到封杀中国,Dario 到底经历了什么?

  从医学博士后到百度人

  作为与 OpenAI 分庭抗礼的 AI 巨头 Anthropic 的创始人,Dario Amodei 在大学期间并未学习计算机及 AI 相关内容。

  Dario 原本就读于斯坦福大学物理系本科,但其父亲因患有一种罕见病,于 2006 年不幸去世。

  受此影响,Dario 决心弃理从医,将研究生研究方向从理论物理转向生物学,实现解决人类疾病难题的愿望。而就在他学习期间,其父亲所患病症取得了重大医学突破,治愈率从不到 50% 上升到 95%,更是坚定了他从事医学的决心。

  在普林斯顿大学取得博士学位后,2011 年至 2014 年,Dario 在斯坦福大学医学院进行博士后研究,主要聚焦质谱技术在细胞蛋白质组网络模型及癌症生物标志物探寻方面的运用。

  命运的齿轮如何转动,才能让一个医学高材生转行搞 AI?这就不得不提到当年百度在 AI 领域的布局了。

  2013 年 7 月,百度深度学习研究院(IDL)成立,李彦宏任院长,余凯出任常务副院长。

  IDL 的成立可以被认定为百度“ALL in AI”的起点。

  2014 年 5 月,在余凯的力荐下,AI 大牛吴恩达加入百度,同期百度成立了百度硅谷人工智能实验室(SVAIL),由吴恩达领导,并以优厚条件广纳贤才。

  在吴恩达 SVAIL 的团队成员中,人工智能专家 Greg Diamos(现人工智能企业 La Mini 创始人)作为团队核心成员,承担着招兵买马的任务,其偶然间看到了 Dario Amodei 在斯坦福大学期间编写的代码,对其质量赞叹不已。

  尽管他没有科班履历,也没有行业顶级论文加持,但是这个年轻人在项目中展现出来的建模功力打动了 Greg Diamos。

  他评价称:“能写出这些代码的人,一定是一位非常优秀的程序员”,基于这种欣赏,Greg 将 Dario 推荐给百度,促使其在 2014 年 11 月成功入职百度。

  在百度摸到 Scaling Law 门槛

  来到百度的 Dario 并没有从事其医学老本行,而是 All in AI。

  当时,百度硅谷研发中心正在大量招兵买马,旗下的硅谷人工智能实验室也引来 Facebook 前科学家徐伟、AMD 架构师吴韧、Twitter 数据中心专家 Ali Heydari 等一批行业大牛的加盟,百度也马不停蹄地开启了项目的研究。

  Dario 在百度参与的是 Deep Speech 2,一款语音识别项目。他在复杂系统建模上的学术能力能够自然迁移到神经网络的建模与算法优化中,助力语言及语音处理模型构建。

  Deep Speech 2 在当时发布后可谓遥遥领先,不仅在识别进度上超过谷歌、苹果、微软、Facebook 等公司竞品 10 个百分点以上,其短语识别词错率已降至 3.7%,并在 2016 年入选《麻省理工评论》年度十大突破技术。

  相比起这个产品本身,这段研发经历对于 Dario Amodei 有着更加重要的启示。

  他曾表示,在百度做语音研究期间,他们已非正式地察觉到了只要为模型供给越多数据、算力,对其训练越充分,模型性能就越优。

  他的这番总结,在如今有个更加熟悉的称呼——扩展定律(Scaling Law)。这条经验公式也成了如今大模型发展的底层逻辑。

  也就是说,在百度的职场启蒙生涯直接让他看清了 AI 的未来,而当时只有百度等极少数拥有大量数据的大厂才有机会去探索出这个规律。

  2015 年 10 月,Dario 选择离开百度。

  对于其为何离开百度,Dario 本人并未明言,不过随着 2015 年 5 月余凯离职创业,IDL 和 SVAIL 确有一批人陆陆续续出走。

  在离开百度后,Dario 前往谷歌加入 Google Brain,不久后加入草创期的 OpenAI。

  根据其自己描述,奥特曼和马斯克当初的 AGI 愿景并没有打动他加入,最终加入 OpenAI 是基于公司非营利定位和自由研究氛围。

  凭借在百度和谷歌累积的经验,他参与负责了 GPT-2、GPT-3 的研发。

  值得注意的是,在 2019 年 GPT-2 面世时,他就反对完全开源,担心滥用风险。最终 OpenAI 选择“有限开放”,理由正是“潜在恶用”。从此,“AI 安全”就成为了他身上最显著的标签。

  随后的故事更加为人所知,微软 10 亿资金投资 OpenAI,他代表的部分“安全派”员工和奥特曼为首的“快速商业化”派出现了分歧,并最终分道扬镳自立门户。

  Dario 在成立 Anthropic 后提出 Constitutional AI,用书面宪法规则约束模型,通过 AI 自评自改(RLAIF)减少人为偏见。Claude 模型由此诞生,成为 ChatGPT 的最大对手。

  短短几年,Anthropic 拿到 Google、Amazon 的数十亿美元融资,跻身大模型第一梯队。

  没有“如果” 的遗憾

  Anthropic 封杀中国与 Dario Amodei 在百度的经历大概并无关联。市场普遍认为,核心原因是其获得的美国军方订单,迫使其必须与中国划清界限。

  但这一事件却凸显出一个遗憾的事实:曾经的百度,本有着极为前瞻性的 AI 技术眼光和深厚根基。

  一个著名的故事是,2012 年,“AI 教父”、后来的诺奖得主杰弗里·辛顿曾在谷歌、Facebook 等国际大厂间引发过一场“拍卖”,百度也是参与者之一,曾开出上千万美元的天价,但最终辛顿因个人意愿选择了谷歌。

  在自然语言处理、计算机视觉等 AI 核心领域,百度都积累了大量技术成果,构建了庞大的 AI 人才团队,甚至早早摸到了大模型的核心规律。但百度不仅错过了成为大模型领域全球领跑者的机会,也未能充分留住关键人才,令这些人才助力其他企业发展壮大。

  以余凯为例,他曾在百度深度学习研究院担任要职,离职后与同样来自百度的黄畅共同创立地平线机器人公司,专注为深度神经网络提供专用计算方案。

  此外,诸多从百度离职的人才在其他 AI 企业中也发挥着重要作用。在自动驾驶尤其是 Robotaxi 领域,百度堪称“黄埔军校”,比如彭军和楼天成创立小马智行;韩旭创办文远知行;周光成立元戎启行;倪凯创办禾多科技。

  而和 Dario 在百度 SVAIL 共事过的同事们,如今也有不少成为了行业内响当当的人物。其在百度的同事 Sherjil Ozair,成为了 OpenAI 的初创团队成员;Deep Speech 2 的研发组长 Bryan Catanzaro,如今是英伟达深度学习应用研究副总裁;而他亲手招聘的实习生 Jim Fan,如今也已经成为英伟达具身智能项目的负责人。

  人们不禁会想,如果当时百度在内部管理、战略决策以及人才激励等方面能够做出更优选择,充分发挥自身在数据、技术和人才上的优势,或许就能率先打造出类似 GPT 的现象级产品,在全球 AI 竞争中占据更为领先的地位。

  然而,商业竞争的残酷性就在于没有“如果”。

  事实上,在当时的条件下,中国企业与美国相比仍然存在较大的限制。包括辛顿在内的许多科研天才,都会提及谷歌极其自由包容的工作氛围和不计成本的投入,OpenAI 更是依托美国发达的投融资环境,为天才们提供了非盈利的发展环境。而在中国,无论是科技企业自身的盈利能力,还是资本市场的体量,都让企业很难下定决心去长期投入一个烧钱项目。而本土人才培养体系的尚不成熟,也让中国企业不得不去美国开设研发机构,这在人才争夺上处于天然劣势。

  好在,短短十年的时间里,中国正在快速补上曾经的短板。