昆仑万维开源全球首个「不限时」视频模型

  昨日,昆仑万维 SkyReels 团队正式发布并开源 SkyReels-V2。

  据悉,SkyReels-V2 通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion-forcing)框架来实现协同优化。

  官方介绍,SkyReels-V2 现已支持生成 30 秒、40 秒的视频,且具备生成高运动质量、高一致性、高保真视频的能力。为开发专业的影视生成模型,昆仑万维整合的原始数据集规模达到亿级(O(100M))。同时,团队还训练了统一的视频理解模型 SkyCaptioner-V1,能够高效地理解视频数据,生成符合原始结构信息的多样化描述。

  性能方面:

  • SkyReels-V2 在昆仑万维构建的人类评估测试「SkyReels-Bench」,和开源的自动化评估测试「V-Bench」中,在多个方面媲美甚至超越了多个视频生成模型(如 HunyuanVideo-13B 和 Wan2.1-14B)。
  • 在 SkyReels-Bench 的 I2V 多维度人工评测集下,SkyReels-V2 在所有质量维度上均优于其他开源模型,并与闭源模型表现相当。
  • 作为首个商业级 E2V 开源模型,SkyReels-A2 在 E2V 评估 Benchmark A2-Bench 中的结果表明,其一致性和质量维度上评估与闭源模型相当。

  目前,昆仑万维已将 SkyCaptioner-V1 和 SkyReels-V2 系列模型(包括扩散强迫、文本到视频、图像到视频、摄像导演和元素到视频模型)的各种尺寸(1.3B、5B、14B)进行完全开源,已上架 SkyReels 官网、Arxiv、GitHub。

  官网地址:https://www.skyreels.ai/home

  GitHub 地址:https://github.com/SkyworkAI/SkyReels-V2

  论文地址:https://arxiv.org/abs/2504.13074SkyReels