一致性对标Nano Banana,国产Vidu Q1同时支持7张参考 | 实测

  不圆发自凹非寺

  量子位 | 公众号 QbitAI

  最近 AI 生图赛道简直卷疯了!

  从 Nano Banana 的爆火,到即梦 AI 4.0,豆包 4.0 接连上线,一直专注于视频大模型的 Vidu 也按捺不住了:

  Vidu Q1 参考生图堂堂登场!同时支持7 张参考。

  主体一致性比起谷歌 Nano Banana 也毫不逊色。

  (Nano Banana 最多支持 3 张参考图)

  量子位抢先实测了这款模型,它的表现相当不错——能够自由引用的 7 张参考图,带来了极高的可操作性。

  用简单的自然语言描述即可。

  或者是直接生成时尚大片,现场拍摄啥的都省了。

  我们探索了很多有趣的玩法,提示词、图片都放在下面了,一起来看一下!

  7 张参考图,能怎么玩?

  我们实测了几种玩法,比如让各种违和的元素凑成一张和谐的画面、或者是制作时尚大片……

  可以说,只要有创意,万物皆可合成。

  万物皆可合成

  无论是让秦始皇骑北极熊在上海喝柠檬水:

  还是让李白坐火箭成功登月:

  参考图一放,就看 Vidu Q1 参考生图的结果是否符合想象。

  潮流单品秒变 OOTD

  既然有那么多参考,岂不是可以直接全套换装?

  所有单品一键上身,是时候展现搭配之力了(摩拳擦掌)。

  用这套提示词,不管是地中海还是西海岸通通可行。

  在线试衣再也不是问题。

  一个人也能拍时尚大片

  光是换装还不够,更进一步,生成一张海报级别的写真如何?

  看,只需要简单的提示词,背景、光影、构图都可以随意调整。

  合照?不,是大合照

  双人合照已经满足不了需求了,来点更多的?

  让少年漫主角齐聚一堂怎么样。

  即使画风差别过大,甚至跨了一个次元,也可以自然地出现在同一个画面里。

  更多玩法等待探索

  当然,更有趣的玩法还有很多。

  基本上 Nano banana 能做的,Vidu Q1 参考生图也可以。

  无论是小某书爆火的手办生成。

  还是设计稿变 3D 立体效果。

  又或者最经典的主体替换。

  同类产品多数仅支持1-3 张参考图,且很多不能支持同一类型的多元素参考,比如同时参考多个人物。

  而 Vidu Q1 参考生图可同时支持 7 张参考图,并在多人、多场景、多次生成下,依旧保证人物/主体的面貌与特征不跑偏。

  测试数据全面超越 Flux Kontext,直接对标 Nano Banana。

  一致性能力评分全场最佳。

  最后让我们简单介绍一下 Vidu Q1 参考生图的使用方法。

  在参考生图页面,支持 7 张参考图片,上传后会显示在下方的输入栏,可以拖动和更改提示词。

  也可以输入【@】选择图片。

  点击创建主体可以输入自己的常用数据,或许三视图效果更佳。

  目前仅有 1080p 分辨率,可选择生成图片的宽高比和生成数量,最多可一次生成 4 张。

  Vidu Q1 参考生图现已全球同步上线,欢迎大家在评论区分享自己的作品~

  实测地址:https://www.vidu.cn/create/reference2image