2万亿巨兽来袭,小扎亮底牌! 首次回应Llama 4风暴,开源榜单背锅

  新智元报道

  编辑:编辑部 NYs

  Meta 首届 LlamaCon 开发者大会亮点满满,Llama 加持的 Meta AI 新升级,正式开放一行代码即可调用的 API。更劲爆的是,小扎在采访中剧透,2 万亿满血版 Llama 4 即将上线。

  Meta 在首届 LlamaCon 开发者大会上火力全开。

  不仅发布了对标 ChatGPT 的 Meta AI App,还有面向开发者的 Llama API 预览版,正式向 OpenAI 发起挑战!

  Meta 首席产品官 Chris Cox 表示,Llama 及其衍生模型的下载量,两个半月内从 10 亿次飙升至 12 亿。

  开源 AI 已是大势所趋。

  Llama 模型已深度融入 WhatsApp、Instagram 等 Meta 旗下应用,在对话交互、移动场景适配等方面表现出色。

  最新采访中,小扎首次对 Llama 4 基准测试做出回应,关于开/闭源,AI 未来发现给出了自己的预判。

  他甚至豪言,未来 12-18 个月,大部分代码将由 AI 编写。

  AI 智能体不仅仅是自主完成,还会设定目标、运行测试、发现问题,能够写出比顶级工程师更优秀的代码。

  2 万亿 Llama 巨兽即将上线

  访谈刚开始,扎克伯格透露现在每个月有上亿人使用 Meta AI。

  他说他们正在构建一种新的推荐系统,不仅包括所有你感兴趣的信息,还包括你与 AI 互动的内容。

  为了推广 LlamaCon 开发者大会,小扎参加了知名科技主持人 Dwarkesh 播客节目

  「那将是下一个非常令人兴奋的事情。我十分看重这件事。」他说。

  接着,他将话题转向了刚刚发布的 Llama 4。

  扎克伯格说最受欢迎的 Llama 3 模型是 8B 参数的,所以这次 Llama 4 系列中也引入了一款这样大小的模型,他们内部代号叫「Little Llama」,会在几个月内推出。

  他说已经发布的 Llama 4 Scout 和 Maverick 很棒,是市面上性价比最高的模型之一。

  不过扎克伯格显然不想说这些传闻,他随后放出猛料,即将推出一款巨无霸模型 Behemoth。

  Behemoth 是 Meta 的第一个前沿模型,拥有超过 2 万亿参数。

  扎克伯格表示,这个模型太大了,以至于不得不构建大量的基础设施才能对其进行后训练。

  开源、闭源之争

  Dwarkesh 提到在过去一年,最好的开、闭源模型之间的差距有所扩大。

  Llama 4 Maverick 在聊天机器人竞技场的排名已经下降到了第 35,在许多主要基准测试中表现都不如 o4-mini 或 Gemini 2.5 Flash。

  对此,扎克伯格回应说,开源模型在过去一年整体上是非常好的。

  他表示,过去 Llama 是唯一真正创新的开源代码模型,但现在有很多。并预测称,今年开源将普遍超过闭源成为最常用的模型。

  然后是推理,扎克伯格说这是一个非常好的范式,他们也在研发 Llama 4 的推理模型,并将会适时推出。

  不过他也表示,对于很多应用来说,模型的计算成本和延时也是非常关键的点。比如消费类的产品,人们不希望等待半分钟才得到答案。

  至于聊天机器人竞技场排名及开源基准测试表现不佳,扎克伯格解释说,这些测试并非大家平时会做的事情。它们衡量的东西与人们实际关心的事情不同。

  所以,Llama 没有过度优化这类东西,他们始终将产品锚定在使用价值上,有时这与基准不完全吻合。

  对此,他举例说,Sonnet 3.7 是个很好的模型,但并不在竞技场的排名顶端。

  他说团队可以很轻易地将 Llama 4 Maverick 调整到排名顶端,但他们选择不做任何调整,主要与用户价值对齐。

  他认为模型需要做到:快速、非常自然地交互、原生多模态及融入到日常互动中。

  回应 DeepSeek

  Dwarkesh 把话题转向了 DeepSeek,他问扎克伯格是否担心 DeepSeek 会超过他们。

  对此,扎克表示这是一场竞争。

  中国有更多的电力,而美国需要专注于建设数据中心和能源,否则会处于明显的劣势。

  扎克伯格认为,由于受到算力的限制,DeepSeek 做了非常令人印象深刻的底层优化。

  因为出口管制,DeepSeek 基本上不得不花费大量精力和时间进行底层基础设施优化,而美国的实验室则不必这样做。

  提到技术进展时,扎克认为蒸馏是过去一年中真正崛起的强大技术之一,它的效果比大多数人预测的都要好。

  你可以通过蒸馏捕捉到一个大模型 90%-95% 的智能,然后在一个 10% 大小的系统中运行。

  这相当不错。

  更有趣的是,随着多样化开源社区的发展,还可以从多个来源进行蒸馏。

  比如说,Llama 的多模态能力很强,另一个模型的编码方面做得更好。那你就可以从这两个模型中提取信息,蒸馏出一个更好的东西。

  智能爆炸,AI 编写大部分代码

  Dwarkesh 提到了智能爆炸概念。

  简单说就是 AI 能够实现自主升级。

  扎克伯格认为很有可能。他们在 Meta 内部开发了一个编码智能体和一个 AI 研究智能体,专门来推进 Llama 研究。

  扎克伯格猜测,在未来 12 到 18 个月内,大部分工作代码将由 AI 编写。

  给 AI 一个目标,它可以运行测试,可以改进事物,可以发现问题,可以编写比团队中非常优秀的人还要高质量的代码。

  除了信息和生产力,还会有一些 AI 系统更注重陪伴。将会有一大堆 AI 只是有趣和娱乐,并出现在你的动态信息流中。

  要实现智能爆炸并不容易。扎克表示,建设物理基础设施需要时间。需要一大堆的软硬件、网络、建筑、法律、能源等问题。

  而且,人们学习使用、适应这些系统也需要时间。

  这实际上是一种「共同进化」——人们学习如何使用这些人工智能助手,同时,人工智能助手也在学习人们关心的事情从而变得更好。

  人工智能朋友、治疗师与女友

  Dwarkesh 接着问道,人们如何与 AI 保持健康的关系。

  扎克伯格回答说,人们会使用对他们有价值的东西。

  他说他在设计产品时的一个核心指导原则是,人们是聪明的,他们知道生活中什么是有价值的。

  扎克说根据自己的经验,如果你认为某人正在做错误的事情,而他自己认为这非常有价值,那么大部分情况下,都是你搞错了。

  你只是还没有理解他们所做的事为什么有价值、对他们的生活有哪些帮助。

  扎克说他看到人们使用 Meta AI 的主要事情就是如何面对艰难的对话,比如,「我和我的女朋友有个问题。帮帮我进行这次对话。」或者「我需要在工作中和老板进行一次艰难的谈话。我该如何进行这次谈话?」。

  这些都非常有帮助,随着交流的深入,AI 会更好地了解你。

  不过,他也表示虚拟治疗师、虚拟女友之类的产品还处在非常早期的阶段。

  100 倍生产力,人类不会被淘汰

  想象一下,如果软件生产力在两年内提升 100 倍,会发生什么?

  小扎表示,回顾过去 100-150 年发展轨迹,人类的精力从生存逐渐转向创意与文化,因为基本需求的满足也越来越容易。

  他预测,随着 AI 工具成为超人软件工程师,这一趋势将加速。这些工具不仅能治愈疾病,解决重大问题,还将此生文化与社交活动的井喷。

  100 倍生产力,可能彻底改变企业的运营方式。

  小扎分享了一个引人注目的例子——Meta 每天服务 35 亿用户,提供语音客户支持是一个不切实际的想法, 成本可能高达每年 100-200 亿美元。

  但如果 AI 处理 90% 客户咨询,就像自动驾驶汽车能应对大部分路况,Meta 就能负担得起这项服务。

  结果,并非是工作岗位的减少,而是增加。

  通过大幅降低成本,AI 可能让高接触度的服务变得可行,从而创造更多人工客服岗。

  也就是说,100 倍生产力同样可能扩大机会、让人们选择工作时间,追求创意和个人兴趣。

  商业化 AGI

  此外,小扎还分享了自己对 AI 商业化模式的看法,包括广告、订阅制,以及多样商业模式的未来。

  他指出,广告的魅力在于,它让用户无需付费就能享受优质服务。通过现代广告体系,不仅能覆盖成本,还能为用户增添价值。

  在 Meta,面向消费者的 AI 服务可能会继续以广告支撑,提供免费基础体验。

  小扎也表示,「并非所有的 AI 服务都适合免费模式」。

  他以 Netflix、ESPN 为例,去阐述内容生产成本高昂的服务,同样需要用户付费订阅,因为广告收入不足以覆盖成本。

  同样,AI 的商业化也是如此。

  Meta 版 ChatGPT 超进化

  Llama 4 无缝集成

  大会上,Meta AI 基于全新 Llama 4 模型再次升级,实现了全双工语音交互,就像和真人聊天一样,可以边听边说、随时打断。

  它能打通 Facebook 和 Instagram 账号,摸清你的兴趣爱好,记住聊过的内容。

  更酷的是,这款 App 能和 Meta RayBan AI 眼镜无缝配合,戴上眼镜就能直接和 AI 聊天。

  对话记录也能在 App 和网页端随时查看。目前 Meta AI App 及 Web 版本已免费开放。

  Meta AI App 链接:https://ai.meta.com/

  一行代码,即可调用 Llama API

  面向开发者,LlamaCon 大会上小扎还放出了令人惊艳的 Llama API。

  它支持一键创建 API 密钥,开发者只需一行代码就能调用。

  适配 Python、Typescript 以及 OpenAI SDK,调用 OpenAI API 的产品可无缝切换。

  在 Llama API 的交互式 playground,开发者可以试用不同模型,调整各种参数,找到最适合的配置。

  开发者还能对 Llama 3.3 8B 模型进行微调:上传自己的数据,或者使用 Meta 提供的合成数据工具包,在平台上实时查看训练进度,训练完成还能自由下载。

  Meta 宣布和 Cerebras、Groq 合作以加快推理速度。目前,Llama API 预览版可以申请免费试用。

  参考资料:

  https://venturebeat.com/ai/metas-first-dedicated-ai-app-is-here-with-llama-4-but-its-more-consumer-than-productivity-or-business-oriented/

  https://venturebeat.com/ai/meta-unleashes-llama-api-running-18x-faster-than-openai-cerebras-partnership-delivers-2600-tokens-per-second/

  https://www.dwarkesh.com/p/mark-zuckerberg-2

  https://ai.meta.com/blog/llamacon-llama-news/

  https://www.youtube.com/watch?v=6mRP-lQs0fw

  https://www.facebook.com/MetaforDevelopers/videos/1792349135036347/