7 月 9 日,昆仑万维发布并开源 Skywork-R1V 3.0 版本。
官方介绍,Skywork-R1V 3.0 后训练阶段通过强化学习策略深度激发模型的跨模态推理能力,在复杂逻辑建模与跨学科泛化方面实现双重飞跃。
性能表现上,Skywork-R1V 3.0 在多领域获得优秀成绩:
- 多模态评测 MMMU 中,Skywork-R1V 3.0 取得了 76 的开源模型最高成绩;在 2025 年高考数学新一卷上,R1V 3.0 取得了 142 分的突出成绩,超越了 OpenAI o3、Qwen3-235B。
- 考验视觉推理的 EMMA-Mini(CoT)上,以开源领先的 40.3 分超过更大尺寸的 Qwen2.5-VL-72B-Instruct 和 InternVL3-78B 等模型,并缩小了与闭源模型 Claude-3.7-Sonnet 的差距。
- 在物理推理、逻辑推理、数学推理中,R1V 3.0 均取得优异成绩。
据悉,Skywork-R1V 3.0 最核心的改进体现在训练算法的创新,即通过精巧的强化学习(GRPO)策略,以及关键熵驱动的模型判别机制,高效激发了模型本身潜在的推理能力。
目前,Skywork-R1V 3.0 已全面开源,并上架 HuggingFace、GitHub。
HuggingFace:https://huggingface.co/Skywork/Skywork-R1V3-38B
GitHub:https://github.com/SkyworkAI/Skywork-R1V
技术报告:https://github.com/SkyworkAI/Skywork-R1V/blob/main/Skywork_R1V3.pdf