谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷

  新智元报道

  编辑:桃子定慧

  图片也能开口说话了!昨晚,谷歌 Veo 3 全新升级,上传一张照片即可生成音频和视频,角色一致性更是达到新高度。

  刚刚,AI 视频顶流 Veo 3 重磅升级。

  这一次,只需一张图即生成音频+视频大片,进入谷歌 Flow 创作平台即可体验。

  同一个角色,能在多个镜头下,保持高度一致性。就连星际迷航类型的科幻片,Veo 3 可以一键复刻出来。

  还有网友直接用 Veo 3 拍了一部「巨魔之死」的预告短片,音效、人物一致性极其震撼。

  Veo 3 如此炸裂的效果,如何体验?

  图片张口说话了

  在进行实测后,感叹 Veo3 的视频生成表现力真的令人惊艳。

  钢铁侠竟然可以开口说话了!看了让人头皮发麻。

  本次使用的图片如下,提示词为「let him talk something」

  生成效果非常惊艳!Veo3 生成了两个版本的视频。

  第一个比较「正经」,是类似变形金刚中擎天柱的风格。

  第二个就比较「符合」钢铁侠本人的风格。

  整体来看,这两个视频和初始图片的一致性非常之高,画面运镜也没有任何不和谐之处。

  本次更新需要在 Flow 平台下进行,选择「Frames to Video」的选项,就能从一张图片开始生成视频。

  需要注意的是,在 Gemini Veo3 入口目前还无法使用该项功能。

  可以选择首帧,并进行调换来设置想要生成视频的内容。

  这里也需要注意,同时选择首帧和尾帧,是无法使用 Veo3 的,只能使用 Veo2。

  值得一提的是,此次更新,加入非常丰富的运镜功能,比如 Dolly in 推镜头,指的就是摄像机沿轨道向前移动。

  这是以上所有运镜功能的总结,给大家参考。

  同时,也用奥特曼做了测试,这次我们只给了图片,没有给出任何文本提示,Veo3 依然进行完美的配乐和动画创造。

  最后,你可以通过选择更好的 Quality 模型,生成质量更高的视频,但要消耗更多的 credits。

  Quality 消耗的是 Fast 的5 倍,Fast 消耗 20credits,Quality 是 100credits。

  关于此次更新更多改进,可以查看谷歌官方的更新文档。

  网友实测

  Veo 3 更新后,网友第一时间开启了测试。

  有人表示,图像带音频的视频生成,堪称是 AI 叙事领域的一大突破,尤其是前后一致的角色

  包括人物角色的表情非常自然,表演也很到位。

  还有前段时间,比较火爆的第一视角 AI 视频生成,Veo 3 基于图像的生成同样令人惊艳。

  再看这位老人,带着巨大的笑容说着,「谷歌刚刚更新了 Veo 3,而且 Veo 3 在 Flow 上速度很快,但他们还没把它带到 Gemini 应用里」。

提示词:
{
  "shot": {
    "composition": "Medium close-up, 85mm lens, shot on ARRI Alexa Mini LF, shallow depth of field, static camera",
    "camera_motion": "locked off",
    "frame_rate": "24fps",
    "film_grain": "light Kodak 250D grain overlay"
  },
  "subject": {
    "description": "An elderly woman with exaggerated, cartoonish features: enormous toothy grin stretching nearly ear to ear, deep crow’s feet around wide, manic eyes, a long thin neck with pronounced tendons, and wild silver hair pulled back in a loose bun with stray wisps. She wears a bright blue floral blouse with pink hibiscus flowers and small silver hoop earrings.",
    "wardrobe": "bright blue floral blouse with pink hibiscus print, silver hoop earrings"
  },
  "scene": {
    "location": "studio backdrop",
    "time_of_day": "indeterminate, evenly lit",
    "environment": "smooth gradient background in lavender to mauve tones, minimal distractions"
  },
  "visual_details": {
    "action": "the woman leans slightly forward toward camera, her enormous grin widening unnaturally, eyes bulging with gleeful intensity as she clasps her bony hands together just below her chin",
    "props": "none"
  },
  "cinematography": {
    "lighting": "soft key light slightly overhead, gentle fill to reduce shadows, creating an uncanny hyperreal clarity on her wrinkles and teeth",
    "tone": "darkly comedic, unsettling"
  },
  "audio": {
    "ambient": "faint hum of studio lights",
    "voice": "old, raspy, whispery with a gleeful, creepy lilt"
  },
  "color_palette": "muted pastels with pops of saturated pink and blue, creating an eerie contrast",
  "dialogue": {
    "character": "Elderly Woman",
    "line": "Google just updated Veo3… and Veo3 fast on Flow… but they didn’t bring it yet to the Gemini app… (giggles, then erupts into a raspy, unhinged laugh)",
    "subtitles": false
  }
}  

  还有网友上传一张 Midjourney 生成的图片,再交由 Veo 3 配音+视频画面,瞬间定制一款独特的香奈儿广告。

  就连动画领域,Veo 3 也没有放过。

  参考资料:

  https://x.com/venturetwins/status/1942371183644794987

  https://x.com/Diesol/status/1942452185259991246

  https://x.com/TawohAwa/status/1942547376121725096

  https://www.youtube.com/watch?v=-xthML25JOs