今天,全球超 6000 万用户的拍我 AI(PixVerse)在首尾帧模块中新增「多关键帧生成」功能。用户可上传最多 7 张图片作为关键帧,在首尾帧模式下轻松生成最长 30 秒的连贯视频,显著增强创作者对 AI 视频叙事的掌控力。
▲用户可通过拍我 AI 网页端首尾帧功能添加最多 7 张关键帧
AI 通过解析关键帧之间的语义关系,智能构建动作与场景的流畅运动路径,优化静态或慢速画面中的动态表现,特别适用于短剧分镜、产品动态演示等深度场景。比如,用户把产品展示图变成旋转动画,或者把短剧的分镜头草图变成流畅小短片。
爱诗科技创始人兼 CEO 王长虎博士曾在 2025 北京智源大会上演讲表示:“让普通用户、普通消费者用 AI 能力创造出过去无法创造出来的视频。在我心中,这一刻才是视频生成的'GPT 时刻'——好的模型带来了好的产品。”
多关键帧生成功能的上线,使 AI 视频创作从简单的“片段”迈向具有完整叙事连贯性的“故事性表达”。通过精准定义起始、转折与结束帧,AI 不仅能实现角色动作、场景转换的自然衔接(如人物从走到跑的流畅过渡),还实现类似导演镜头语言的表达,智能切换不同景别(如特写、全景)与视角,显著增强叙事表现力。这一突破意味着 AI 技术能力的提升,使其能更自然地模拟时间线上的事件发展,为电影预告、小说动态漫、广告剧情短片等高叙事需求场景显著提升创作效率。
用户可整合同一人物(如童年至成年)或关联场景下的多主体照片(如家庭合影中的不同成员),生成具有逻辑连贯性的叙事视频。目前平台已有用户借此制作人生回忆、明星成长史、家庭故事、宠物变身等短片。
▲上传五张关键帧生成的视频短片(截图)
此前,爱诗科技自研视频生成大模型产品 PixVerseV2 已支持首尾帧功能,能够将两幅构图相似的图像智能对齐,并生成其间流畅的视觉动效,用 3D 数字艺术家 Travis Davids 的话来说,两幅构图相近的图像放在一起非常有趣,就像变魔术一样。海外用户曾利用首尾帧功能生成《辛普森一家》风格短片,在社交媒体获超过百万播放量。
▲Travis Davids 首尾帧作品 Gif
爱诗科技日前在“全球人工智能向善峰会”(AI for Good Global Summit)上,入选“创新扩大影响案例集”(Innovate for Impact Use Cases Collection)优秀案例。公司联合创始人谢旭璋在峰会期间发表题为《AI 视频向善》(AI Video for Good)的主题演讲。他表示:“全世界还有几十亿人没有做过视频,没有用过视频来传递信息、分享生活、讲述故事,我们希望用 AI 来帮助这些大多数人,实现视频创作的普惠。"
拍我 AI(PixVerse)全球累计用户数已突破 6000 万,国内版拍我 AI 于 2025 年 6 月 6 日上线,目前面向全球提供 9 个国家语言版本(含中/英/日/韩/法等)。爱诗科技希望通过此次升级为用户提供更好的 AI 视频生成体验。爱诗科技致力于打造全球领先的 AI 视频生成大模型及应用,以满足 AGI 时代视频领域的全新创作及消费需求,推动 AI 视频生成技术的普惠,并将持续降低创作门槛,帮助每一个人成为生活的导演。