出品|网易科技《态度》栏目
作者|袁宁丁广胜
发自山景城海岸线圆形剧场 Google I/O大会
“我听说今天是双子星季(Gemini Season)的开始,”Sundar Pichai 一上台就抛出冷笑话,“但我不明白这有什么特别的。在谷歌,每天都是双子星(Gemini)季。”
2025 年 Google I/O 主题演讲刚一开场,Pichai 就用 Gemini 做了个梗,引得全场轻笑。
5 月 20 日的山景城,气氛热烈,网易科技排队一小时挤进会场前排,和来自全球的开发者、分析师、媒体一同见证这场发布。
而就在 I/O 开幕前,微软才刚刚开了 Build,大张旗鼓讲“AI Agent”;而苹果也官宣 WWDC 定档 6 月。
压力之下,谷歌也不再藏牌:升级后的 Gemini 2.5 系列模型、全新图像与视频生成模型 Veo3 和 Imagen4、音乐模型 Lyria2,AI 电影制作工具 Flow,备受关注的 Android XR,甚至连 AI 虚拟试衣和 Gmail 智能回复都安排上了。
一句话:Gemini 正以“操作系统”的姿态,全面融入谷歌的生态,进入我们的日常设备与工作流程中。
发布会临近结束,谷歌在屏幕上打出“AI 提及次数:92”这一数字,现场再次爆发出笑声。
去年,这个数字是 120,堪称“AI 烂大街”的笑话起点。而今年的减少,不仅是一种克制,也是一种信号:AI 不是用来说的,而是要落在产品里的。
01 Gemini 2.5 再进化:速度快、推理强、会操作电脑
不出意料,Sundar Pichai 一上来就把焦点交给了 Gemini。
他强调最新的 Gemini 2.5 Pro 表现抢眼,是“基准测试中的顶级选手”,“在 Cursor 上增长最快” “性价比最高。”
这次 Gemini 2.5 系列更新的重点有三:
首先,原生支持音频生成,不再只是图文视频那一挂,语音领域也安排上了。
其次,推出一项名叫“Deep Think”的实验性增强推理模式,模型不再是一拍脑门地回答,而是“多想一步”,并列出多个假设之后再输出结果,尤其在复杂数学和编码问题上表现亮眼。
最后,具备原生电脑操作能力,开始学会“动手”了。
另外,开发者体验也在同步升级。谷歌引入了“思维摘要”和“思维预算”功能,让模型的推理过程更透明、也更可控。你不仅能知道它是怎么想的,还能设定它“最多想多久、想多细”。
谷歌还为 Gemini API 和 SDK 加入了对 MCP 工具的支持,等于是打开了更多开源工具的工具箱。
02 Veo 3、Imagen 4、Lyria 2 齐发,Flow 直接让你拍电影
这次谷歌的多模态生成模型更新,显然是奔着“全栈 AI 创作者工具箱”来的。
发布会一口气讲完三大主角:Veo 3、Imagen 4、Lyria 2,外加一款新工具 Flow,试图把创作这件事变成“一句话起片”的全流程自动化。
视频生成模型 Veo 3 接棒了 Veo 2 的位置,还加上了与之相配的配乐:从街道喧嚣到鸟叫虫鸣,甚至能让角色开口说话,口型对得也很准。
而且它还强调理解能力:你在提示里讲一个简短小故事,它会给你剪出一段完整、有节奏感的镜头内容。也就是说,它不只是拼图,而是开始“导演”了。
目前,Veo 3 已面向美国的 Gemini Ultra 用户开放,也能在企业级 Vertex AI 中使用。
其次是图像生成模型 Imagen 4,主打两个字:清晰。
水珠、毛发、织物细节一个不少,连拼写排印都照顾到了,贺卡、海报甚至漫画都能直接生成。分辨率最高能到 2K,适合商用输出场景;风格上,既能写实也能玩抽象,灵活度不低。
后面谷歌还要推出一个“加速版”,声称比 Imagen 3 快 10 倍,赶图党们可以期待。
Imagen 4 已接入 Gemini 应用、Workspace 的 Slides、Vids、Docs 等产品,走的依然是“平台+场景一体化”路线。
音乐方面,谷歌悄悄扩大了对 Lyria 2 的开放权限。虽然没大张旗鼓,但这套系统依旧是业内最顶尖的 AI 音乐生成模型之一。
而最有趣的是 Flow——这款看起来像是 AI 导演助手的工具,背后集成了 Veo、Imagen 和 Gemini 的能力。你可以用一句话描述场景,然后 Flow 来帮你安排演员、布置场景、选风格,最后剪出一段完整视频。它不仅是一个“生成器”,更是一个创作流程管理平台。
Flow 目前只在美国区对 Pro 和 Ultra 订阅者开放,谷歌表示“很快全球上线”——这话我们听过很多次了。
值得一提的是,会前的媒体沟通会上,谷歌表示未来生成内容依旧会带有 SynthID 水印。并透露,谷歌已经给超过 100 亿张图片、视频、音频和文本打上了这枚“AI 身份标签”。
03 AI 模式成 Google 搜索的未来,一键试衣购物
搜索,是谷歌的“祖传主业”,也是 AI 时代最不能输的阵地。
这一次,谷歌不再只是“在搜索里加 AI”,而是让 AI 变成搜索本体,推出的 “AI 模式”,将 Gemini 正式纳入搜索栏。
该更新将于周三开始向年满 18 岁的英语用户推出,但仅限于每月 20 美元的 Google AI Pro 或每月 250 美元的 Google AI Ultra 订阅用户,以及 Chrome Beta、Dev 和 Canary 用户。
购物是此次 AI 搜索升级中的另一大亮点。
谷歌将 Gemini 与自家的商品图谱(Shopping Graph)打通,结合 500 亿 + 商品数据源和评论系统,让用户从“浏览灵感”一步跳转到“理性选择”。
最惊艳的,是“试穿功能 Try-On”。
你在搜索连衣裙时点击“试穿”图标,上传一张自己的全身照,几秒钟后就能看到那件裙子穿在你身上的效果。不满意?保存造型、发给闺蜜讨论、换风格一键重来。
这功能现在已在美国 Search Labs 上线,首批支持衬衫、裙子、裤子、连衣裙等品类。
更狠的是“代理结账”功能。你设定颜色、尺寸、预算,Gemini 会在后台盯着价格变动,并在合适时机“替你下单”——从加入购物车到通过 Google Pay 安全结账,全程自动。你只需点击“确认购买”,剩下的都交给 AI 处理。
值得一提的是,为了让回答更“对你胃口”,谷歌宣布,AI 模式未来会引入更多用户上下文——从搜索记录,到 Gmail 中的航班、日程、预订信息。
比如,你搜索“这个周末在纳什维尔和朋友一起做什么,我们喜欢音乐和美食”,AI 可以结合你过去订过哪些餐厅、飞到哪、住哪,推荐有户外座位的餐厅,顺便附带附近的音乐活动清单。
当然,谷歌强调,这些个性化信息的使用完全可控,你可以随时开启或关闭,并查看 AI 是怎么用的。隐私提示也会同步出现。
04 Gmail、Docs、Meet,Gemini 正式接管 Google Workspace
在 Gemini 入驻搜索的同时,谷歌也把这位“AI 助理”带入了每一位打工人的日常——Gmail、Docs、Meet。
这一轮 Workspace 升级,关键词只有一个:自动完成你懒得做的事。
在 Gmail 里,Gemini 可以学习你给特定联系人、群组的邮件风格,自动回信;你还可以指示 Gemini 删除特定发件人在某时间段内的邮件;而如果 AI 检测到你在邮件中试图约时间,它还会自动弹出一个会议窗口推荐时间段,连跳转 Google Calendar 的步骤都省了。
Docs 则加入了一个对专业用户非常实用的新功能:基于来源的写作辅助。你可以预设信息来源,比如某份 PDF、某篇网文,Gemini 就只从你指定的材料中提取观点和数据进行写作建议,不再“自作聪明”引用外部网络。该功能将于下季度正式开放。
Meet 将支持几乎实时的语音翻译功能。你用中文发言,听众就能同步听到英文版;你讲法语,Gemini 实时帮你转成德语。这项功能将优先向 AI Pro 和 Ultra 订阅者开放。
05 Google Ultra 版本登场,月费 249.99 美元
与 OpenAI 和 Microsoft 的订阅模式类似,谷歌也发布了 Google AI Ultra:目前定价为 249.99 美元/月,先在美国上线,未来将扩展至更多国家。
Ultra 版到底值不值?来看它给了哪些特权:
Ultra 计划包括 Google 的最高速率限制、抢先体验即将推出的实验性 AI 产品,如 Project Mariner、Veo 3 和具有深度思考模式的 Gemini 2.5 Pro。
从商业视角看,它是 Google 首次系统化出售“前沿大模型使用权”。
释放的信号是:Gemini 不是玩具,而是你可以为之付费的核心工作力。
下一步要看的则将是,在 GPT-4o 推出免费化后,谷歌的“高价模型订阅”路线,是否能赢得专业用户的青睐。
06 Starline 项目更名为 Google Beam,Android XR 也亮相了
几年前,Google 曾用 Project Starline 掀起视频通信革命。它不是一个会议工具,而是一个颠覆性的构想 —— 用 AI 和光场技术,把枯燥的远程会议变成“仿佛就在你面前”的 3D 面对面交流体验。
Project Starline 是一条独立于 Gemini、搜索、Android 之外的产品路线,更多代表的是 Google 对“未来人机交互方式”的长期押注。
如今,这个曾经看起来“黑科技”十足的研究项目迎来了正式产品化:Project Starline 更名为 Google Beam,并将在今年正式走入企业市场。
此外,在经历了十年从 Google Glass 到实验性原型的技术摸索后,Google 终于在今年 I/O 大会上首次展示了真正意义上的 Android XR 智能眼镜设备形态。
过去几个月,Android XR 作为系统层方案已经低调发布,旨在统一 Google 的 XR/VR 设备体验。而现在,Google 把 Android XR 拓展到智能眼镜,将 Gemini 融入现实世界视角中,打造出日常可穿戴的 AI 助理。
谷歌表示将与创新眼镜品牌合作,首批合作伙伴包括 Gentle Monster 和 Warby Parker。与此同时,还将深化与三星的合作,将 Android XR 的应用范围从头戴式设备扩展到眼镜。
以上就是本次发布的主要内容。发布会结束,随着人流走出会场,大家在讨论 Android XR、Veo3、Google Beam,耳边还回响着最后一句话:
“几十年的研究,正在成为现实。”Pichai 的声音沉稳,没用大词,也没许诺奇迹。
这不是一场靠惊艳取胜的发布会,但如果你问,哪家 AI 公司最可能让十亿人每天用上 AI——我想,这一刻,我在山景城现场,看见了答案。