精彩内容在最后
就在字节跳动Seed团队加速招兵买马之后,阿里万万没想到,通义千问团队里的“后训练一哥”郁博文,在3月3日这天,突然拍桌子递交了辞呈,第二天就正式走人了。
阿里对Qwen团队来了一次伤筋动骨的架构调整,搞起了严格的商业化硬考核,想要彻底把纯技术路线扭向赚钱模式。公司随后拆分了大模型团队,一方面,首次明确把预训练和后训练这两个本该深度配合的模块硬生生地割裂开来。另一方面,对核心技术骨干层层加压,其顶尖人才的流失率正在一路飙升,那郁博文的离开只是冰山一角,现在阿里在留人这块是真的吃瘪了。
不过,让阿里没想到的一点,就在郁博文离职的当口,字节跳动Seed团队成功招揽了这位“阿里星”出身的技术大牛,让他负责视觉模型与多模态交互的后训练工作,实现了在这一关键领域的重大突破。
这也进一步证实了一个事实:阿里僵化的管理方式对顶尖人才造成了严重挤压,但字节跳动不甘示弱,愈挫愈勇,通过算力资源与组织协同双线突围,硬是从巨头嘴里抢来了核心骨干。
这次郁博文转投字节,代表了AI人才争夺在后训练赛道上的白热化。这位中科院博士出身的技术大牛,手里握着把通用底座模型变成实打实产品的绝活,能把冷冰冰的算法转化为有血有肉的交互体验,直接拉升了模型的实用价值。其战略价值在于,他带来了一条不依赖于传统大厂封闭体系的技术路线。通过预训练与后训练的深度耦合,郁博文正在帮助字节Seed团队突破多模态交互的技术瓶颈。
在多模态大模型、视觉交互这些新兴领域,阿里与字节几乎站在同一起跑线。这使字节有可能打破阿里在通义千问领域的长期领先局面。
郁博文的出走也进一步说明了大模型团队必须做出的痛苦调整,那就是在基础研发领域保持技术纯粹,在组织管理领域实现灵活协同。
但无论如何,当前的AI人才战正在重塑整个行业格局,一方面,阿里及其盟友试图通过架构调整和薪酬体系锁定核心人才。另一方面,字节则通过技术愿景和算力支持吸引顶尖大牛。
这种人才流动已经开始显现出技术路线分化的苗头,郁博文在字节持续推动后训练与预训练的耦合创新,同时,在多模态交互领域,字节通过视觉模型和算法优化广纳贤才。就像郁博文通过自研的后训练技术深度调教模型,打通技术落地的最后一公里,有效提升了产品的实际体验。
更何况,人才流失可能将进一步加剧,郁博文在通义千问中的核心地位无人替代,要知道大模型技术栈中后训练这个关键环节,原本就是郁博文一手搭建起来的,而字节对技术自由度和资源支持的重视,正在不断加大阿里留人的难度。
而且从组织管理来看,郁博文跳槽事件暴露出的危机已趋于明显,一方面,通过“阿里星”等人才计划招募来的顶尖大牛正在接连流失,1月份Qwen Code负责人惠彬才刚跑去了Meta,另一方面,内部培养的技术骨干也心生去意,在后训练、多模态等新兴领域不断出现人才缺口。
目前,字节在AI大模型领域的技术储备日益雄厚,全球顶尖人才的目光都在转向字节,这为字节在通用人工智能领域挑战阿里打开了新局面。同时,阿里的技术护城河正面临被掏空的风险。郁博文因对阿里拆分团队的决策彻底失望而选择离开,而其盟友Meta对阿里前员工的招募也日益激进。
无论如何,随着字节技术实力的提升,AI行业的格局正从“阿里独大”向“群雄并起”转变,这将彻底改写大模型竞争的规则。而郁博文加入字节也进一步证明,字节不仅在人才争夺上愈战愈勇,更在核心技术的后训练、多模态等前沿领域实现了弯道超车。所以我认为,阿里通义千问的技术壁垒再深厚,也挡不住人才流失的汹涌浪潮。未来一段时间,随着字节在AI后训练领域持续发力,整个行业将重新洗牌。这次郁博文跳槽字节,就证明了这一点。