林俊旸离开千问,会改变什么?

  文 | 定焦 One,作者 | 王汉星,编辑 | 魏佳

  春节过后,AI 圈子还没等来 DeepSeek V4,却先等来了千问的人事“地震”,千问大模型技术负责人林俊旸的离职为年后国内 AI 圈子投下第一颗重磅炸弹。

  3 月 4 日凌晨,林俊旸在社交媒体发文“me stepping down. bye my beloved qwen.(我将辞职,再见了我亲爱的千问)”推文发出后的几小时内产生了一连串连锁反应,多位千问技术团队成员陆续宣布离职,包括 Qwen 后训练负责人郁博文、Qwen3.5/VL/Coder 核心贡献者李凯新。

  大量 AI 从业者在社交媒体上表达了对林俊旸离开的惋惜、认可与感谢。

  随之而来的是对这场突如其来“分手”原因的各种猜测。一位接近阿里云的人士告诉「定焦 One」,林俊旸离职的根本原因并不复杂,“尽管小模型好评如潮,但最新的旗舰模型 Qwen3.5 表现不及预期。”

  叠加组织架构调整,以及对林俊旸管理权限的缩减直接导致了他的出走,本质上这是一个双向“选择”的结果。

  对于此次人事调整,阿里高层在 3 月 4 日下午的 All Hands 会议上给出了定性:Qwen 没有收缩,这是一次团队扩张,无关任何政治斗争,反而需要投入更多资源。

  当一项新的技术来临,人们往往容易在短期内高估其影响,而在长期低估。这同样适用于一个优秀人才的流失。

  结合多位 AI 从业者和阿里云内部人士的看法,林俊旸的离开,短期内对于千问和阿里云的影响有限,但灵魂人物出走背后折射出的开源生态与商业利益之间的矛盾与平衡,是摆在阿里面前不能被低估的长期课题。

  最年轻的阿里 P10 离开后的 14 个小时

  林俊旸最新一则动态发布于 3 月 4 日下午 2 点,他在朋友圈发文:“抱歉各位朋友,今天不回复消息和电话了,我真的需要休息。qwen 的兄弟们,按照原来安排继续干,没问题的。”

  此时距离他发布离职动态已经过去了近 14 个小时。

  林俊旸出生于 1993 年,本科就读北大计算机科学专业,2019 年从北大语言学与应用语言学硕士毕业后以应届生的身份加入阿里达摩院,并在此后参与了阿里 M6 多模态预训练大语言模型的研发。

  2022 年年底,达摩院多个研究团队重组为通义实验室并调整并入阿里云,林俊旸开始正式出任通义千问的技术负责人。

  2025 年通义千问所发布的 Qwen 系列大语言模型凭借开源生态,在开发者社区的下载量突破 10 亿,成为全球顶尖的开源模型,林俊旸也在这一年被提拔为阿里最年轻的 P10 之一。

  在刚刚结束的春节 AI 大战期间,阿里先后开源了 Qwen3.5 的旗舰模型和系列小模型,引发特斯拉 CEO 马斯克关注,并称赞 Qwen3.5 系列具备令人印象深刻的智能密度。林俊旸随后转发了马斯克的动态,并表示感谢。

  提出离职时,林俊旸成为阿里 P10 还不满一年,无论是对于外界还是阿里云内部,这都是一个非常突然的事件。

  就在离职推文发布的几天前,林俊旸还在社交媒体上为 Qwen Coding Agent 发布招聘相关信息。此外,有千问团队成员在社交媒体上表示,3 月 2 日还在与林俊旸讨论关于大模型的新想法和训练计划。

  作为技术负责人,林俊旸被视为千问大模型的灵魂人物,他的离开最直接的影响就是引发了千问技术团队的一波密集离职。

  离职消息在 AI 圈子发酵半日后,为了稳定军心,3 月 4 日下午 1 点,通义实验室紧急召开了一场 All Hands 会议,阿里巴巴董事长兼 CEO 吴泳铭、阿里巴巴首席人才官蒋芳、阿里云 CTO、通义实验室负责人周靖人出席了这次会议。

  管理层表示,林俊旸的离开是因为组织调整过程中沟通没有处理好,但这次调整本身是为了团队扩张,而非收缩,“新人引入肯定会带来阵型变化,扩大过程中必然涉及到这些,我们可能没处理好。”

  其中提到的新人引入之一是来自 Google 的周浩,据多家媒体报道,周浩将接替与林俊旸同期离职的郁博文的职位,出任 Qwen 后训练负责人。

  周浩本科毕业于中科大,此前在 Google DeepMind 担任 Gemini 强化学习与自我改进团队的负责人。

  截止到 3 月 4 日下午 2 点林俊旸发布朋友圈,关于他是否真的会离开阿里和下一步的去向还没有最终定论,这一轮通义实验室的组织调整以及人员变动也还没有尘埃落定。

  绩效考核背后,Qwen 大模型真实表现如何?

  作为阿里 AI 战略基石的千问大模型技术负责人突然离职,难免引发外界对于其背后原因的猜测,其中对于大厂嫡系文化、“宫斗”的猜测尤甚。

  但综合多位知情人士提供的信息,林俊旸离开的原因并没有那么复杂,直接原因是最新的组织调整中管理权限被压缩,根本原因是最新发布的 Qwen 大模型没有达到管理层的预期。

  据晚点 LatePost 报道,近期,通义实验室计划将 Qwen 团队分拆,从涵盖不同训练流程和模态的“垂直整合”体系,变成预训练、后训练、文本、多模态等一个个分开的水平分工团队,这些团队仍隶属通义实验室。

  这种部门划分方式与字节跳动 Seed 团队豆包主模型训练的流程划分相似。

  拆分后汇报线会发生变化。比如最新加入的后训练负责人周浩将直接向通义实验室负责人周靖人汇报,而不是汇报给林俊旸,这意味着后者从之前的统筹管理基础模型研发的所有环节,变成了负责其中的一部分环节,管理权限收缩。

  此外,拆分后的组织形式也与林俊旸一直推崇的垂直整合开发理念相悖。

  一位阿里云内部人士告诉「定焦 One」,拆分是为了各个团队未来可以更好、更灵活地服务于集团业务的需求,而非此前单纯的技术导向。

  之所以会有这一次调整,主要的原因之一是 Qwen3.5 系列小模型与旗舰模型的“割裂”表现。

  在开源社区,Qwen3.5 系列四款开源小模型(Qwen3.5-0.8B、2B、4B、9B)表现亮眼,上线后不仅获得马斯克的点赞,也在 AI 开源社区与模型托管平台 Hugging Face 上热度飙升,包揽趋势榜单前 8 位。

  其中 Qwen3.5-4B 作为一款小模型,在多个维度上的性能表现已经可以比肩许多大模型。

  但旗舰模型 Qwen3.5-397B 的表现却不尽如人意。

  在海外知名大模型“盲测擂台”、各家模型首发必刷榜单 LMArena 上,截至 2026 年 3 月 3 日总榜(Overall Rankings)中,Qwen3.5-397B 仅排名第 18。前十中则包括字节的 Seed-2.0 大模型。

  值得注意的是,阿里在去年 9 月发布的 Qwen3-Max Preview 曾一度进入该榜单的前三,与 Gemini、Claude、ChatGPT 等全球顶尖闭源模型比肩,但随着各家 AI 厂商在去年年末和今年年初更新大模型版本,Qwen 从第一梯队头部持续下滑,Qwen3.5 的发布并没有扭转这一势头。

  并且在专门对大模型中文能力测评的榜单 SuperCLUE 上,千问的排名也并不拔尖,落后于豆包、Kimi 等。

  至于外界盛传的由于 DAU 不达标导致林俊旸离职,上述阿里云内部人士告诉「定焦 One」,管理层并不会以 DAU 来作为基础模型能力的考核标准,但会对模型在开源社区的影响力,以及模型本身的性能进行综合考核。

  很显然,Qwen3.5 的“性能绩效”并不高。

  开源生态可能被影响,但对阿里影响有限

  今年年初的世界政府峰会 2026 上,阿里巴巴集团董事会主席蔡崇信在一场圆桌论坛上提到,“我们的千问大模型是开源的,同时也经营云计算业务。随着用户在我们的基础设施上进行模型训练、开发与推理,我们得以实现商业变现。”

  这是阿里云变现的底层逻辑。但蔡崇信随后又补充道,未来如何让消费者持续为月度订阅付费,产生经济效益,这是中国市场最大的挑战。

  从蔡崇信的发言中不难看出,仅仅依靠开源模型打出影响力并通过出售阿里云算力实现收益已经无法满足阿里的商业化需求,打开C端市场同样重要。

  在组织结构上,阿里采用的是与字节一样“产模分离”形式,产品与模型分属于不同的部门。

图源 / 阿里巴巴官网

  隶属于阿里云的通义实验室主要负责基础模型的研发,技术负责人直接汇报给阿里云 CTO 周靖人。

  产品端则是由包含千问 APP、夸克在内的千问C端事业群负责,阿里副总裁吴嘉任负责人,直接向集团汇报。

  在整个 AI 战略布局上,阿里提出基础大模型、云计算、和芯片的三位一体“通云哥”战略。由通义实验室负责基础模型研发,由云计算提供算力,由平头哥供应芯片。

  可以看到,无论是在组织结构上还是 AI 战略布局上,通义实验室都是阿里 AI 生态的重要一环。这也注定了在 AI 竞争日趋白热化的今天,通义实验室不能脱离集团业务心无旁骛地做基础模型研发。

  对于林俊旸的离开,一位阿里云的员工告诉「定焦 One」,内部更多的人主要担心对团队士气的影响,以及对外来组织调整不确定性的担忧,但林俊旸已经带领团队完成了千问大模型从 0 到 1 的技术突破,尽管情感上难以接受,但客观来说,他的离开对阿里整体 AI 战略的影响有限。

  过去一段时间,通义实验室的人员流动一直较为频繁,今年初 Qwen Code 的负责人惠彬原刚刚从阿里离职加入 Meta。放眼全球 AI 行业,人才竞争正在变得越来越激烈。

  相比于对阿里有限的影响,不少 AI 从业者担心如果阿里的开源战略出现转向,对于大量中小型 AI 创业公司会产生巨大的冲击。

  千问的一系列小模型因为低成本、易部署、可选项丰富的特性,在过去很长一段时间都受到创业公司的追捧。

  截至目前,千问的开源模型数量已经超过 400 个,衍生模型数量突破 20 万个,下载量超过 10 亿次。不仅是全球开源模型数量第一,在小模型的覆盖度、生态成熟度等方面也都是全球第一。

  一位 AI 创业者告诉「定焦 One」,Qwen 小模型养活了一大批中小公司,最核心的原因就是千问的选择最多,几乎总是能在短时间内找到最适合自己的尺寸需求的小模型,并且性能还不错。

  不少 AI 从业者将林俊旸带领下的千问大模型战略称为“以小胜大”“小模型包围大模型”,但林俊旸离开后这一战略还能否延续,将是一个未知数。

  过去近一年的时间里,千问大模型凭借开源生态和丰富的小模型获得了良好的口碑,打出了知名度。但开源不是一门“好生意”,在免费开放的背后,是长期的训练投入、社区维护与技术支持成本。当 AI 战争全面爆发,阿里作为一家上市公司,商业化需求被摆上台面,开源带来的影响力,未必能在财报中直接体现,好评如潮的小模型也不足以掩盖旗舰模型的性能短板。

  作为开源路线的重要推动者,林俊旸所代表的是更强调社区影响力与技术普惠的路径,而公司层面则需要一个能够跑通商业闭环的 AI 体系。这种路线差异,在 AI 投入持续攀升、回报压力加大的当下,变得越来越难以调和。

  去年年底,Meta 被爆出将以闭源的形式推出下一代前沿模型“牛油果”。在此前的一封公开信中,扎克伯格也提到未来 Meta 会谨慎选择开源内容。

  在全球 AI 巨头或坚持闭源、或转向闭源大模型的背景下,阿里也需要重新审视自己在大模型生态中的站位与商业逻辑的闭环。