Back to Articles
Mar 4, 20261 week ago

At 32, The Steersman of the World's Top Open-Source Model Said "Bye" and Left

A
AI进化论-花生@AlchainHust

AI Summary

This article explores the sudden and significant departure of Lin Junyang, the 32-year-old technical leader behind Alibaba's Qwen, the world's most downloaded open-source large language model. It is a story that transcends a simple resignation, offering a poignant lens into the tensions between technological idealism and corporate strategy, between the builders of an era and the managers of its maturity. The piece is worth reading not just for its insider account of a major industry shift, but for its nuanced examination of the human and structural forces reshaping the global AI landscape. The narrative traces Lin's unique path from linguistics student to AI pioneer, highlighting how his deep understanding of language itself fueled Qwen's rise to global ecosystem dominance. Yet, this "world first" status concealed growing pressures: intensifying competition from rivals like DeepSeek, a persistent gap between stellar developer adoption and consumer product traction, and internal brand confusion. The core of the story reveals that his departure was not a voluntary exit at the peak of success, but a consequence of a major organizational restructuring that dismantled his integrated team in favor of a horizontal, siloed division of labor. This shift, coupled with the arrival of external executives, clashed fundamentally with his hands-on, "chef-from-start-to-finish" philosophy for model development. Ultimately, the article frames this not as an isolated incident but as a generational transition. It portrays the dispersion of foundational builders like Lin—homegrown talents who rode the first wave—as companies move from the "siege" phase of technological breakthrough to the "garrison" phase of commercialization and efficiency. The piece leaves us with a resonant image of creators parting with their beloved creations, prompting reflection on what is gained and lost when faith in a project diverges from the business it becomes. For a deeply reported and thoughtful analysis of the real-world dynamics behind today's AI headlines, the full article is essential reading.

3月2日,阿里千问发布了Qwen3.5小尺寸模型系列。马斯克在X上点了赞,评价说「令人惊叹的智能密度」。

林俊旸感谢了马斯克的关注。

第二天下午,他向阿里提交了辞职申请。

3月4日凌晨,他发了一条推文:

"me stepping down. bye my beloved qwen."

24小时。从全球瞩目到转身离场。

一个语言学学生的意外路线

其实在所有标签里面,我觉得最有意思的一个,大多数报道反而没怎么展开。

林俊旸是北大计算机本科,这没什么稀奇。但他的硕士,读的是语言学——正儿八经的外国语学院语言学与应用语言学,不是CS方向的NLP。

一个学语言学的人,后来成了全球使用量最大的开源大语言模型的技术负责人。

这个路径倒过来想就很有趣了。大语言模型的本质是什么?是对人类语言的建模。绝大多数做LLM的人从计算机科学出发,先懂算法再学语言规律。林俊旸反过来——他同时理解语言本身的结构,又有计算机的工程能力。

2020年GPT-3发布后,阿里达摩院内部调兵遣将。恰恰是因为他这个「语言学+技术」的复合背景,被分配到了周靖人领导的智能计算实验室,成为M6模型团队的核心开发者。

这个分配决定了后面所有的事情。

93年出生,2019年硕士毕业直接进阿里达摩院。没有读博,没有海外经历,纯粹的本土培养路线。然后一路狂飙——M6(共同一作)、OFA(One-For-All)、Chinese CLIP,在多模态预训练领域都是里程碑式的工作。Google Scholar被引量超过4万次。

2022年底,达摩院AI团队并入阿里云成立通义实验室,林俊旸被任命为通义千问的技术负责人。

那年他29岁,成了阿里巴巴最年轻的P10级技术专家。阿里的技术体系里,很多工程师干了十几年也到不了P10。他用了3年。

去年的AGI-Next峰会上,他和杨植麟、姚顺雨、唐杰同台,被媒体称为「基模四强」。四个人代表了中国基础大模型的主要力量。那个场景现在回看,多少有些唏嘘。

全球第一,但全球第一的另一面

从2022年底接手到2026年初离开,林俊旸带着千问走了大概3年。

这3年的成绩单,数字说得比人清楚:在HuggingFace上,Qwen的衍生模型数量突破了20万个,总下载量超过3亿次,超越了Meta的Llama,成为全球被使用最多的开源模型。旗舰版Qwen3-Max超万亿参数,在多个权威评测中跻身全球前三,和GPT-5、Claude掰手腕。

注意,这里说的「全球第一」是指生态第一。全世界最多人下载、最多团队基于它做二次开发的开源模型。某种意义上,这个「第一」的含金量比跑分更高。

而且产品侧也终于打起来了。千问APP在2026年初经历了爆发式增长。1月月活突破1亿,春节期间DAU峰值飙到7352万,到2月月活已经达到2.03亿,增速552%全球第一,总量排全球第三。

我去年11月写过一篇「横扫硅谷的千问,杀回国内了」,当时Airbnb的CEO说他们大量依赖千问模型,「比OpenAI更好更便宜」。一个中国团队做的开源模型,被硅谷公司当核心基础设施在用。

但如果你从2024年一直跟到现在,会发现「全球第一」这个头衔,其实藏着一些微妙的东西。

2024年的时候,Qwen确实是开源世界的领头羊,没什么争议。但2025年DeepSeek爆发之后,整个格局变了。Kimi K2开源了,GLM-5开源了,MiniMax M2.5也开源了。开源不再是Qwen的独家优势,国内大模型的竞争格局变成了「一超三强」——DeepSeek一骑绝尘,Qwen、GLM、Kimi各有强项。

Qwen的位置变得有点微妙。它依然是全球下载量最大的开源模型,衍生模型数量也是全球第一。很多团队拿Qwen当基座来做进一步训练——Cursor的Composer模型被发现思考过程会输出中文,有国产模型微调的痕迹;DeepSeek-R1也有基于Qwen的蒸馏版本。

某种意义上,Qwen成了AI世界的「Android」——底层无处不在,但品牌感知反而不那么强烈。

在具体赛道上也是这样。Qwen采取的是「饱和式发布」策略——各种尺寸、各种模态不断往外放,从0.6B到235B,从文本到视觉到语音,全覆盖。开发者生态的优势确实大,但也给人一种什么都做、什么都不够极致的感觉。AI Coding领域Kimi K2的声量更大,多模态世界模型方向Gemini 3系列走得更远。Qwen什么都有,但没有一个赛道是让人第一时间联想到它的。

产品侧的问题更明显。模型叫Qwen,产品叫通义,C端APP又叫通义千问——三个名字指向同一个东西但侧重不同,品牌认知一直是割裂的。直到2025年11月APP才改名「千问」,而阿里正式把所有AI品牌统一为「千问」,是2026年3月2日的事——对,就是林俊旸提辞职的前一天。

开发者生态和消费者市场之间的鸿沟,千问一直没有完全填上。APP月活突破2亿是这个春节靠30亿补贴砸出来的,留存率还是个问号。晚点小数据做过一张春节期间AI应用对比图,很能说明问题:千问DAU在2月6日开始砸30亿补贴后冲到高点,但不发红包的DeepSeek反而用户黏性最强——日均使用时长16分钟,远超其他三家。补贴能买来用户,但买不来习惯。

Qwen在开发者圈子里的口碑确实好,但把模型优势转化成产品优势,阿里走了很长一段弯

这种「模型很强但产品化一直差口气」的状态,可能是理解后面发生的事情的一个入口。

「团队没有跑路,我们还在」

在所有报道里,我翻到一个细节,挺能说明林俊旸是什么样的人。

之前千问的代码仓库因为GitHub的标注问题被误下架,网上一片恐慌,各种猜测满天飞。林俊旸直接出来回应:「团队没有跑路,我们还在。」

就这么一句话,没有官方声明模板,没有公关辞令,直接把事情说清楚了。

他的管理理念也挺有意思。他说过,做负责人「ego要小」——不要觉得自己无敌、能把所有事情做完。每个小团队负责人最重要的事就是「招比自己更强的人」,如果做不到这一点,「是很失败的」。

在AGI峰会上,当其他人聊模型能力的时候,他更关注客观限制:「美国的算力可能整体比我们大1到2个数量级。」他说国内企业的算力主要用于交付,而美国公司在用算力做下一代的研究。这不是一个喜欢报喜不报忧的人。

他团队里有很多00后。他说过,随着这代年轻人进来,中国AI领域的冒险精神在增强。

这些细节拼在一起,你大概能感觉到这是一个什么样的人——技术出身、性格直接、不太讲客套、更信逻辑而不是关系。这种人适合从0到1地搭东西,但未必适合在复杂的组织架构里做政治博弈。

不是他自己的选择

如果只看成绩单,你很难理解林俊旸为什么要走。

千问刚发了新模型,马斯克刚点了赞,全球第一的位置还坐着——按正常剧本,应该庆功、加薪、继续冲。

但千问的核心贡献者Chen Cheng在X上说了一句话:「离开似乎不是林俊旸自己的选择。」

似乎不是自己的选择。这句话的分量比什么分析都重。据晚点LatePost报道,有Qwen同事得知他将离职的消息后难掩情绪,「伤心地哭了」。

背后的直接原因,是通义实验室正在进行的一场组织调整。

简单说,阿里打算把Qwen团队从「垂直整合」改成「水平分工」。原来的千问团队是一个统一体,从预训练到后训练,从文本到多模态,一个团队端到端负责。现在要拆——预训练一个组,后训练一个组,文本一个组,多模态一个组。

林俊旸的管理范围,被缩小了。

这种拆法和他的技术理念直接冲突。他多次公开表达过,预训练、后训练和Infra团队应该「更紧密地结合和沟通」,而不是拆开各自为战。做大模型,他认为厨师得全程把控——从选材到烹饪到摆盘。公司觉得不行,选材的归选材,烹饪的归烹饪,流水线效率更高。

与此同时,阿里从外部引入了前DeepMind高级资深研究员周浩来接替后训练负责人的位置。据晚点报道,周浩是Gemini 3.0、DeepResearch等项目的关键贡献者,曾领导针对Gemini 3.0的多步骤强化学习——这恰恰是千问当前最需要补强的方向。一个从零搭建团队的人,看着外来的人带着更前沿的方法论接管自己搭建的东西——这种感受不难想象。

V2EX上有人说得挺扎心:「业务发展期强行提的P10,业务稳定后就守不住位置了。」

这话听着刺耳,但确实点到了一个结构性的问题。大厂在「攻城」阶段和「守城」阶段需要的人是不一样的。攻城的人被推到最高位,守城的时候就容易成为被优化的对象。不是能力不行,是公司进入了不同的阶段。

而且林俊旸不是一个人走的。同一天,后训练负责人郁博文也正式离职。Qwen Code负责人惠彬原早在1月就离开了,去了Meta。核心贡献者Kaixin Li发文告别。Binyuan Hui也跟着说了句「bye qwen, me too」。

不是一个人的离开,是一群人的散场。

一代人的命运

把视角拉远一点看,这不是千问一个团队的故事。

字节跳动的Seed团队,2025年走了7个研究骨干。乔思远去了Meta,姜璐去了Apple,冯佳时成了腾讯多模态团队的负责人。智谱AI半年内4名高管离职,包括副总裁和首席战略官。阿里通义实验室自己的NLP负责人、视觉负责人、语音负责人,也都先后离开了。

这一波人有个共同特征:大多是2019到2022年间加入公司的,赶上了大模型从零起步的黄金期。他们是亲手搭地基的人。

林俊旸、郁博文、惠彬原——还有个更具体的共同点:都是应届毕业直接进的阿里。据晚点报道,林俊旸2019年北大硕士毕业,郁博文2022年中科院博士毕业、当年的「阿里星」,99年出生的惠彬原2022年天津大学硕士毕业。三个人从零开始搭建,一路做到核心。不是空降的高管,不是挖来的大佬,是阿里自己培养出来的。

然后,阿里自己做了一轮组织调整,这批人就散了。

这不是谁对谁错的问题。大模型赛道从「技术叙事」进入了「商业化」阶段。公司开始算ROI了,开始问「开源到底能赚多少钱」了。千问的APP虽然春节期间靠补贴冲到了2亿月活,但开源模型本身几乎不产生授权收入,品牌认知也是刚刚才理顺。公司自然会想:是不是该换个打法了?

我之前写Dario Amodei那篇文章时说过一句话:「当信仰和生意完美对齐的时候,你无法分辨一个人到底是在坚持原则,还是在做精明的品牌定位。」放到这里也一样——当技术理想和公司战略对齐的时候,一切和谐美好。一旦出现分歧,走人往往是唯一的选项。

区别在于,AI行业的人才不愁去处。据晚点报道,在这次变动之前,已有多位投资人和大公司在接触林俊旸,有人期待他创业,有人给出工作offer。

所以「bye my beloved qwen」这句话,读起来有一种复杂的味道。不是悲情。更像是一个建造者对自己作品的告别——你倾注了3年心血做出的东西还在,还会继续跑,全球第一的位置大概率能保持一阵子。但你已经不是开它的人了。

留下的问题

千问不会因此垮掉。模型在那里,代码在那里,20万个衍生模型在全世界的服务器上跑着。3800亿砸下去,总会有新的人补上来。

但有些东西确实不一样了。

去年他们花了将近一年时间攻克Qwen3的三个核心难题:让强化学习框架稳定支撑长时序推理、平衡跨领域数据分布、强化多语言能力。这种过程靠的不是组织架构图上的汇报线,而是一群人真的相信同一件事。

现在这群人散了。千问可能在新的架构下反而跑得更快。水平分工在规模化阶段有它的道理。建造者和维护者本来就是两种角色,没有高下之分。

而林俊旸他们带走的东西——经验、直觉、踩过的坑——不管去了哪儿,都会继续发挥作用。人散了,能力不会消失,只是换了个地方生长。

32岁,全球第一,说走就走。

在AI这个行业里,也许这就是某种正常。

By
AAI进化论-花生