1000亿美元!华人干出全球第四大AI独角兽

  智东西

  作者陈骏达

  编辑心缘

  又一家千亿美元估值 AI 独角兽即将诞生!

  智东西 8 月 20 日报道,昨日,AI 数据分析平台 Databricks 宣布,该公司已经签署了K轮融资的条款清单,预计将在现有投资者的支持下很快完成,这轮融资对 Databricks 的估值已经超过了 1000 亿美元(约合人民币 7179.1 亿元),估值与 8 个月前的 620 亿美元(约合人民币 4451.0 亿元)相比,上涨了超 61%。

  ▲Databricks 官宣新融资(图源:Databricks 官网)

  据 TechCrunch 援引知情人士的消息称,Databricks 最新一轮融资规模约为10 亿美元(约合人民币 71.8 亿元),投资方包括 a16z、Thrive Capital 等,并且获得了“疯狂的超额认购”。

  成立于 2013 年的 Databricks,主要提供统一的数据与 AI 平台服务,帮助企业整合和处理大规模数据,用于数据工程、数据科学、机器学习与 AI 应用,也能为电商、金融、医疗等领域的企业提供数据服务。其创始团队中还有华人,联合创始人兼首席架构师为Reynold Xin(辛湜)。

  作为独特的“湖仓一体”数据库架构开创者,Databricks 是数据智能领域的代表性企业,也是 AI 时代重要的数据基础设施提供商。截至目前,有超过 60% 的财富 500 强企业采用了 Databricks 的数据智能平台来管理数据,并将其与 AI 结合。

  Crunchbase 的数据显示,Databricks 目前是全球估值排名第八的独角兽企业。完成K轮融资后,Databricks 有望成为仅次于 OpenAI、字节跳动、xAI,估值排名全球第四的 AI 独角兽企业。

  值得一提的是,英伟达也是 Databricks 的投资方之一,曾领投 Databricks 的I轮融资,规模为 5 亿美元,但并未参与本轮融资。

  Databricks 称,本轮融资中获得的资金,将被用于加速 Databricks 的 AI 战略,这包括进一步扩大企业级智能体服务 Agent Bricks、投资面向 AI Agent 优化的新数据库 Lakebase,并支持未来的 AI 领域收购,深化 AI 研究。

  一、成立 12 年估值 1000 亿刀,客户规模已突破 1.5 万

  Databricks 的创始团队由七位加州大学伯克利分校的教授和研究生组成,自 2013 年成立以来,陆续吸引了大约 80 家投资者的关注。

  该公司的创始人大部分为加州大学伯克利分校 AMPLab成员,共同打造了开源分布式计算框架 Apache Spark,还创下数据排序速度的世界纪录。后来,他们决定将相关技术商业化运作,Databricks 应运而生。

  ▲Databricks 七位创始人(图源:福布斯)

  据 The Information 报道,早期投资者称,Databricks 的创始人们对如何赚钱几乎没有直觉,董事会原本打算在外部聘请有经验的领导者担任 CEO,但发现时任 Databricks 工程副总裁的 Ali Ghodsi在员工中很有声望。

  接任 CEO 后,投资者对教授出身的 Ghodsi 还是有些迟疑。Ghodsi 加紧研读商业书籍,恶补了企业管理的方法。如今,他以亲力亲为地方式管理这家企业,高强度工作,风格强硬,并凭借这种方式带领 Databricks 快速发展,也获得了客户的信赖。

  ▲Ali Ghodsi(图源:Databricks)

  Adobe 的首席数据官 Bin Mu 曾如此评价 Ghodsi:“如果我遇到一个大问题,他会在接下来的一个小时内解决这个问题。”

  Databricks 的创始人团队中还有华人身影。其联合创始人兼首席架构师为 Reynold Xin(辛湜),他高中毕业后前往加拿大多伦多大学就读本科,后续在加州大学伯克利分校 AMPLab 完成博士学业,毕业后直接参与 Databricks 的创立。

  ▲辛湜(图源:Linkedin)

  “湖仓一体”架构是 Databricks 最重要的护城河之一。这一技术起源于 DataBricks 团队创业前打造的 Apache Spark 项目,将数据仓库的结构化数据存储功能,与数据湖的非结构化和半结构化数据存储能力融合,从而提升数据处理的效率与可靠性。

  在 AI 时代,湖仓一体架构的价值愈发凸显。AI 训练、推理过程中都需要使用到大量的结构化、半结构化和非结构化数据,湖仓一体架构能对这些数据统一存储管理,支持实时数据摄入、处理和分析,还能弹性伸缩,从而降低存储和计算成本。

  湖仓一体架构也具备向量化检索、与机器学习框架(如 PyTorch)集成等 AI 原生设计,可简化 AI 数据处理的流程。

  2022 年,OpenAI 推出 ChatGPT 并引发全球 AI 热潮后,Databricks 联合创始人兼 CEO Ghodsi 看到了 AI 对数据分析领域的巨大潜力,决定加大对 AI 技术的投资。当时,Databricks 预计 2022 财年至 2025 财年期间的总现金消耗成本为 15 亿美元。

  2023 年,Databricks 还斥资 13 亿美元收购了大模型创企 MosaicML,此次收购帮助 Databricks 在 2024 年 3 月份发布了一个开源模型,但并未推出后续版本,转而使用开源模型。

  Databricks 的一体化数据智能平台提供 AutoML(自动化模型训练)、Mosaic AI(模型部署)、AI Playground(无代码互动测试)、Unity Catalog Agent 工具管理、MLflow 集成等 AI 服务,支持从数据管理、训练、部署到监控的 AI 开发全流程,可整合大模型、工具链,与数据平台无缝融合。

  2024 年时,Ghodsi 称,截至当年 11 月,包括 Mosaic 在内的生成式 AI 产品收入同比增长了 300%

  二、连发多款 AI Agent 服务,年化收入达到 37 亿美元

  在去年年底拿下 100 亿美元的巨额融资后,Databricks 在 AI 领域的动作不断,推出多款新产品与服务,还在收购市场斩获一家 AI 创企。

  Agent 是近期 Databricks 投资、发展 AI 技术的主线。今年 5 月,Databricks 宣布收购无服务器 Postgres 数据库(一种开源的对象关系型数据库)公司 Neon。Neon 使用 AI Agent 来驱动数据库的配置,其平台上八成的数据库均由 AI 自动打造。

  这笔交易的规模达到 10 亿美元,Databricks 可借此进一步消除传统数据库的弹性伸缩瓶颈,为 AI Agent 提供“AI 优先”的底层数据库功能。

  收购 Neon 后不久,Databricks 在今年 6 月推出了两款 Agent 服务。

  其中,Agent Bricks可用于自动化创建 AI Agent,用户只需提供对任务的简单描述,并通过 Databricks 的数据库向 Agent 提供企业数据,就能完成 Agent 创建。

  Agent Bricks 已经针对常见的行业用例进行了优化,比如结构化信息提取、知识辅助、自定义文本转换和多智能体系统等,企业可以用其完成对电子邮件、法律文书等内容的处理。

  Databricks 还推出了Lakebase,这是一款用于 AI 应用和 Agent 的新型完全托管 Postgres 数据库。

  Lakebase 由 Databricks 此前收购的 Neon 提供技术支撑,与 Databricks 的数据湖仓平台 Lakehouse 深度整合,把业务数据和分析数据融合在一起,既能用来运行大规模分析,又能支持实时应用,满足了 AI Agent 对快速查询数据的需求。

  这两项服务起到了互补的作用,Agent Bricks 显著简化了企业打造 Agent 的流程,而 Lakebase 能为这些 Agent 提供合适的数据库。虽然都仍处在预览阶段,不过其易用性、生态整合度、兼容性等获得了市场的认可。

  各类 AI 服务的推出,也成为 Databricks 的新增长点。今年 6 月,Databricks 高管在一场投资者活动上称,该公司的年化收入会在 7 月份达到37 亿美元(约合人民币 265.6 亿元)同比增长 50%。同时,Databricks 的客户数量已经达到了15000 多家

  三、外部力量大力推动本轮融资,但还面临多方竞争

  Databricks 已经成为硅谷当今最炙手可热的投资标的之一,累计融资额近 200 亿美元。收获新一轮融资后,Ghodsi 接受了 CNBC 的采访,他称在 Figma 完成 IPO 并股价飙升后,“他的手机被投资者轰炸了”,这轮融资“肯定有来自外部的大力推动”。

  这也显示出,投资方希望在 Databricks 这家同样炙手可热的 AI 企业 IPO 之前,分得一杯羹。在去年 12 月底官宣的J轮融资中,Databricks 获得了 100 亿美元的巨额融资,创下当年度的融资纪录,目前并不缺乏运营资金

  Ghodsi 称,目前投资者最关心的问题就是,Databricks 的 Agentic AI 服务能否真正地自动化工作流程,有没有给企业带来价值?Ghodsi 对此的回应是,这些服务仍处在早期阶段,目前更注重解决企业的日常任务。

  Databricks 的本轮融资,印证了市场对此类新型 AI 数据基础设施公司的浓厚兴趣,不过,Databricks 仍需面对来自 Snowflake、甲骨文等对手的竞争。

  成立时间与 Databricks 相仿的Snowflake,被普遍认为是前者的主要竞争对手之一。Snowflake 源自云数据仓库(Data Warehouse),主打结构化数据分析、易用性与企业级安全性。Databricks 的 Lakehouse 则强调对结构化与非结构化数据的处理能力及 AI/ML 能力。

  在 AI 时代,两家公司的业务重合度不断提升,都推出了数据 Agent 服务,在收购上也选择了相同的方向——Snowflake 于今年收购了 Postgres 数据库创企 Crunchy Data,与 Databricks 收购的 Neon 类似。Snowflake 目前的市值约为 642 亿美元,低于 Databricks 目前的估值。

  ▲Snowflake 股价变动(图源:雅虎财经)

  甲骨文这样的老牌数据库企业,也在加紧布局 AI 相关的数据产品。甲骨文于 2024 年推出了生成式 AI Agent 服务,提供检索增强生成(RAG)等功能。今年 3 月,该公司进一步推出 AI Agent Studio,作为企业创建、扩展、部署和管理 AI Agent 和 Agent 团队的综合平台,也能为 Agent 接入企业的自有数据。

  诸如微软 Azure、谷歌云、AWS 等大型云基础设施公司也是这一市场中的重要参与者,并相继推出了 AI 相关的数据服务。

  咨询公司 IDC 的报告显示,2025 年,在全球数据平台软件提供商中,Databricks 在能力维度排名全球第一,与谷歌、甲骨文、Snowflake 等共同处于领导者范畴,但在规模上略小于谷歌和 Snowflake。

  结语:Databricks 接近自由现金流盈利,下一步会是 IPO 吗?

  多家分析机构指出,Databricks 虽然仍在亏损,但在运营效率和成本控制上已有显著改善,并有望在 2025 年实现自由现金流盈利。

  随着美股 IPO 市场回暖以及 AI 相关股票的惊人涨幅,投资者对 Databricks 潜在 IPO 的表现普遍看好——而近期一轮由投资者力推完成的融资,便成为最好的佐证。

  不过,Databricks 目前尚未提交 IPO 申请,其高管对相关事项的表述也较为模糊,仅透露有 IPO 意向,但未明确时间。