中国团队自研 AI 图像生成大模型 HiDream-I1 正式开源

  HiDream 智象未来团队宣布正式开源图像生成大模型 HiDream-I1 与交互编辑模型 HiDream-E1。

  HiDream-I1 在权威榜单 Artificial Analysis 中 24 小时内登顶,成为首个跻身全球第一梯队的中国自研生成式 AI 模型,并在图像质量、语义理解、艺术表现三大维度刷新行业纪录,实现图像的多风格生成,涵盖动漫、肖像、科幻等场景。

  目前,设计工具 Recraft 已集成 HiDream 模型,用户 3 步即可实现 “一键出图 + 智能编辑”。

  HiDream-I1  已开源三个版本的模型,分别是:

  其中 HiDream-I1-Full 是由 HiDream.ai 团队发布的开源图像生成基础模型,具备 170 亿参数,旨在实现高质量的图像生成。该模型采用 Diffusion Transformer(DiT)架构,支持多种风格的图像生成,包括写实、卡通、艺术等,适用于多种创作场景。

  核心特性

  • 卓越的图像质量:在多个基准测试中表现出色,HPS v2.1 平均得分为 33.82,优于 SDXL、DALL・E 3 等主流模型 。

  • 强大的提示词理解能力:在 GenEval 和 DPG-Bench 等评测中,HiDream-I1 的表现优于其他开源模型,展示了其在理解和执行复杂提示词方面的能力。腾讯网 + 1 阿里云开发者社区 - 云计算社区 - 阿里云 + 1

  • 开源且商业友好:采用 MIT 许可证,允许用户在个人、科研和商业项目中自由使用生成的内容。

  性能评估

  在多个评测中,HiDream-I1 展示了其强大的性能:

  • DPG-Bench:在整体、实体、属性等多个维度上得分领先,展示了其在图像生成质量方面的优势。

  • GenEval:在单目标、双目标、计数、颜色等任务中表现优异,反映了其对提示词的准确理解和执行能力。

  • HPS v2.1:在动画、概念艺术、绘画、照片等风格的图像生成中,HiDream-I1 的得分均高于其他主流模型,展示了其多风格生成的能力。

  HiDream-I1-Full 模型整体采用 MIT 协议开源,可自由商用,但部分依赖组件(如 LLaMA3 编码器)需遵守各自协议,商用前应留意其具体限制。