2026年5月19日,一条推文让整个科技圈安静了五秒钟。
Andrej Karpathy——OpenAI 联合创始人、前 Tesla AI 负责人、全网最受欢迎的 AI 教师——在 X 上简短地写道:"I've joined Anthropic."
没有长篇大论,没有告别感言。短短几个字,却在 Hacker News 上炸出了 1195 分、495 条评论,登顶当日热榜第一。一个工程师的选择,为什么比很多公司的产品发布更让人震动?
因为 Karpathy 的职业轨迹,本身就是一部浓缩的 AI 进化史。
第一章:Stanford,当 AI 还是一种信仰
Karpathy 的起点并不特殊——或者说,太"经典"了。
他在斯坦福大学读博,师从李飞飞。那是 2015 年前后,深度学习刚刚开始爆发,ImageNet 竞赛刚刚证明了神经网络的威力,但没人知道这条路最终会通向哪里。
那时的 AI 研究者有一种现在很难感受到的气质:理想主义。
他们相信 AI 能让世界变得更好,相信学术自由的力量,相信开放合作比封闭竞争更能推动人类进步。Karpathy 在 Stanford 的工作——用神经网络识别图像、生成描述——听起来像科幻,但他做的每一件事都在论文里公开,每一行代码都可以被任何人下载。
这种"开放 AI"的精神,后来成为了他职业生涯最鲜明的标签,也是他一次次做出选择时底层的价值判断。
但理想主义的黄金期并不长。
第二章:OpenAI,AGI 梦想的起航与幻灭
2015 年底,Karpathy 成为了 OpenAI 最早的员工之一。
注意,是"员工之一",不是"联合创始人"。虽然他现在经常被称为 OpenAI co-founder,但严格来说,OpenAI 的创始人是 Sam Altman、Elon Musk、Ilya Sutskever 等人。Karpathy 是第一批核心研究员,是那种你走进办公室就能和 Musk 讨论 AGI 路线图的早期成员。
那时的 OpenAI 还是一家非营利组织。
它的使命很纯粹:确保通用人工智能(AGI)能够造福全人类。没有商业化压力,没有估值焦虑,只有一群最聪明的人在思考一个最根本的问题——如果机器真的能像人一样思考,我们应该怎么做?
Karpathy 在那里工作了两年。他参与了 GPT 的早期研究——是的,现在价值数千亿美元的 GPT 系列,最初的种子就在那时种下。
但他离开了。2017 年,他去了 Tesla。
为什么?
因为实验室里的 AI 和现实世界的 AI 之间,有一条巨大的鸿沟。而 Karpathy 想跨过那条鸿沟。
第三章:Tesla,AI 落地的五年
在 Tesla 的五年,是 Karpathy 职业生涯中最"务实"的一段。
他的头衔是 AI 高级总监(Senior Director of AI),负责 Tesla Autopilot 的计算机视觉系统。这不是论文里"在某个数据集上达到 SOTA"的研究,这是要让一辆时速 120 公里的汽车在高速公路上安全行驶的系统。
一个错判,就是人命。
这五年里,Karpathy 学会了工程化的思维。他提出了"影子模式"(Shadow Mode)——让 AI 系统在不控制车辆的情况下持续运行,收集真实世界的数据来训练模型。这个方法后来成为了自动驾驶行业的标准实践之一。
更重要的是,他亲眼目睹了 AI 从"学术研究"变成"工业产品"的全过程。从实验室里跑通一个 demo,到部署到数百万辆汽车上实时运行——这中间隔着数据处理、模型压缩、边缘计算、安全验证无数道坎。
很多人只看到 AI 模型本身,但 Karpathy 看到了 AI 落地的全貌。
2022 年,他离开了 Tesla。原因众所周知——与 Elon Musk 的分歧。Musk 对 Autopilot 的乐观宣传与工程团队对安全性的谨慎态度之间,存在无法弥合的裂痕。
Karpathy 选择了离开。不是因为不看好自动驾驶,而是因为他对 AI 的信念比对个人忠诚更重要。
第四章:回归与出走,理想主义的最后一搏
离开 Tesla 后,Karpathy 做了一件有趣的事。
他回到 OpenAI,但这次的身份和第一次完全不同。此时的 OpenAI 已经不再是那个纯粹的非营利组织了。GPT-3 的商业化成功让公司走上了另一条路——融资、估值、竞争、ChatGPT 的现象级爆发。
Karpathy 在 2023 年回归,但只待了一年左右就再次离开。
这一年里发生了什么,外界不得而知。但从他离开后的行动可以看出一些端倪——他没有加入另一家大厂,而是选择了独立研究。
他做了一系列被全网 AI 学习者视为"圣经"的视频教程。他开源了 nanoGPT——一个极简的 GPT 实现,让任何人都能从零开始理解大语言模型是如何工作的。他在 YouTube 上分享 AI 研究进展,就像一个大学教授在做公开课。
这些行为有一个共同特征:完全不为商业利益。nanoGPT 不能帮他赚钱,YouTube 教程的收益远不如去大厂当高管,但他还是做了。
因为那是他的底色——开放、分享、让更多人理解 AI。
但独立研究者的身份并没有持续太久。
第五章:Anthropic,为什么是现在?
2026 年 5 月 19 日,Karpathy 宣布加入 Anthropic。
这次他没有去 OpenAI,没有回 Tesla,也没有去 Google DeepMind。他选择了一家成立才四年多、但增长速度让人瞠目结舌的公司。
让我们看看 Anthropic 在过去十五个月里发生了什么:
年收入从约 10 亿美元飙升至超过 300 亿美元 ARR(年化收入),15 个月内增长 30 倍。这个数字什么概念?Salesforce 用了十几年才达到的收入规模,Anthropic 用了不到两年。
Claude Code——Anthropic 的 AI 编程助手——单品贡献超过 25 亿美元,每周有开发者使用超过 20 小时。它不仅仅是一个聊天机器人,而是一个能真正理解代码库、执行复杂编程任务的"AI 同事"。
Karpathy 加入的是 Anthropic 的预训练团队(pre-training team)。他的具体工作是:用 Claude 本身来加速 Claude 的预训练。
听起来有点绕,但这是 AI 行业正在发生的一个根本性转变——从"人类工程师训练模型"到"AI 训练 AI"。Karpathy 要做的,是设计一套系统,让 Claude 能够参与到自身下一代模型的研发过程中去。
这不是一个简单的技术岗位。这是一个定义未来 AI 研发范式的岗位。
为什么 Karpathy 会选择 Anthropic?
我们可以从几个角度来理解。
首先是价值观的契合。 Anthropic 从一开始就强调"负责任的 AI 发展"(responsible AI development)。它的核心理念不是"不惜一切代价追求最强模型",而是"在确保安全的前提下发展 AI"。这和 Karpathy 从 Stanford 时期就开始坚持的开放、审慎、以人为本的 AI 理念是一致的。
其次是技术方向的前瞻性。 "用 AI 训练 AI"这个方向,如果成功,将是 AI 研发方法论的一次范式跃迁。对于 Karpathy 这样一个从学术到产业都经历过的研究者来说,这是最具吸引力的技术挑战。
最后是时机。 Anthropic 正处于从"快速追赶者"向"行业领导者"转变的关键节点。在这个时间点加入,意味着 Karpathy 有机会直接影响一家可能定义 AI 未来格局的公司的技术路线。
这不是又一次"跳槽"。这是一次深思熟虑后的战略选择。
第六章:人才战争,中国在哪里?
Karpathy 的选择让很多人兴奋,但也让很多人焦虑。
因为他的故事折射出了一个更大的问题:在全球 AI 人才争夺战中,中国在哪里?
过去十年,全球最顶尖的 AI 人才绝大多数流向了美国。Google DeepMind、OpenAI、Anthropic、Meta FAIR——这些机构的核心团队中,中国面孔随处可见。李飞飞、何恺明、张潼……这些名字支撑起了美国 AI 研究的一半江山。
但最近两年,趋势正在发生变化。
据《华尔街日报》2026 年报道,2025 年选择回中国就业的华裔科技毕业生人数增长了 12%,这个数字在过去三年翻了一番。CNN 的报道则指出,至少有 85 名顶级 AI 研究人才正在从美国回流中国。
为什么?
一方面是中国在 AI 基础设施上的巨大投入。算力中心、数据资源、应用场景——这些都是 AI 研究者难以拒绝的条件。另一方面是美国日益收紧的科研环境和地缘政治不确定性,让一些华裔科学家开始重新考虑自己的位置。
但这并不意味着中国已经在人才竞争中占据优势。
就在 Karpathy 加入 Anthropic 的同一个月,Meta 据报以 20 亿美元的天价试图收购中国 AI 公司 Manus 的团队。这不是合作,这是"买人"。中国培养了人才,美国写支票——这种模式仍在继续。
更深层的问题在于:中国的 AI 人才生态还需要完成一次关键跃迁。
我们有很多优秀的工程师和研究员,但缺乏像 Karpathy 那样能够从学术研究到产业落地全链条打通的"通才"。我们有海量的数据和应用场景,但在底层模型创新能力上仍有差距。我们有强大的工程化能力,但在定义下一代 AI 范式的话语权上还不够。
Karpathy 的每一次选择都对应着 AI 行业的一个关键转折点:
- 加入 Anthropic:从人类训练模型到 AI 训练 AI
这五步,恰好是 AI 从实验室走向世界的完整路径。而中国 AI 人才要在这条路径上找到自己的位置,需要的不是更多经费和论文,而是更多像 Karpathy 那样能够跨越学术与产业、技术与产品、短期利益与长期价值的人。
尾声
Karpathy 在推文中没有解释为什么选择 Anthropic。
也许他觉得不需要解释。也许他认为行动本身就是最好的回答。
十年前,他在 Stanford 的实验室里训练图像识别模型时,大概不会想到自己会成为 AI 行业最关键的人才风向标。
但也许这正是他的价值所在——他不是在追逐风口,而是在用每一次选择定义下一个风口。
当 Karpathy 开始在 Anthropic 用 Claude 训练下一代 Claude 的时候,AI 的研发方式可能会发生根本性的改变。就像当年他提出"影子模式"改变了自动驾驶的数据采集方式一样。
这就是顶级人才的意义——他们不只是执行者,他们是定义游戏规则的人。
而全球 AI 竞争的核心,从来不是算力,不是数据,不是融资。
是人。
🍃 随风而至,随遇而安。