事情是这样的。
昨天刷着刷着X,突然刷到Karpathy那条个人更新。短短几行字,点赞已经冲到13万+,浏览两千多万。我当时就愣住了——这哥们儿又动了。
“Personal update: I've joined Anthropic. ... I remain deeply passionate about education and plan to resume my work on it in time.”
就这么云淡风轻一句。没搞大新闻发布会,没放一堆渲染图,就是老老实实说:我去Anthropic干pre-training了,接下来几年LLM前沿会特别关键,我挺兴奋的,教育那块以后还会继续搞。
我寻思了一下,这事儿真丫的有意思。
你要是AI圈混过几年,肯定知道这哥们儿。OpenAI联合创始人,Tesla AI前总监,斯坦福PhD,写过nanoGPT,把Transformer从零手撕给你看的那种。
最牛的不是他技术多硬,而是他讲东西特别像人。
别人发论文,他发YouTube把LLM从零实现讲得像给朋友聊天。很多人(包括我)第一次真正入门大模型,就是靠他那些公开课和repo。不是高高在上的教授范儿,就是“我也试过这个坑,你来看看”那种活人感。
现在他跑去Anthropic了
这波操作到底意味着啥?
我不是业内人士,纯吃瓜视角,但看得出来,这不是简单的“跳槽”。
Anthropic一直走“安全、对齐”路线,Claude以靠谱、不乱说话闻名。
Karpathy呢?更偏实用派、工程派、能把东西真正落地给开发者用的那种。俩风格撞在一起,火花肯定不小。
从公开信息看,他去了pre-training团队,就是负责给模型打底的那批人——决定Claude核心知识和能力的底层大训练。Anthropic还专门说,要用Claude自己来加速pre-training研究。
这循环听起来就很赛博:
让已经很强的模型
帮我们把模型变得更强。
社区反应也很有趣,有人说“像KD加盟72胜勇士”,有人说“Anthropic赢麻了”,还有人直接刷“AI lab现在就是足球俱乐部抢人”。
我看着这些评论,突然有点感慨。
顶级人才正在像顶级运动员一样,被几家实验室疯狂争夺。 这既说明前沿竞争白热化,也说明普通开发者其实离“前沿”越来越远——我们能接触到的模型越来越强,但背后是怎么炼出来的,普通人越来越看不清。
短期看,可能没那么戏剧性。
Karpathy刚入职,大概率先埋头干活,不会马上放新教程或开源repo。别指望明天就看到他用Anthropic新东西手撕一个Agent。
但长期看,我是真心觉得这是好事。
教育输出大概率会延续。他自己说了,会继续搞教育。想想以前那些nano系列、LLM讲座,以后可能会有Anthropic版“从零实现Claude级能力”的内容——对我们这些想跟上的普通人来说,简直是降维打击级别的福利。
实用 + 安全 的碰撞。Anthropic本来就谨慎,Karpathy又特别会“让AI真正好用”。如果这俩能融合好,说不定能出既强大、又不那么“神经”、还能实际干活的模型。
给我们普通人的信号:别等救世主,自己动手才是正道。
Karpathy这种站在金字塔尖的人,都在积极拥抱新阶段的挑战。我们这些在下面卷的,有什么理由躺平?
说实话,看到这条消息,我既兴奋又有点复杂。
兴奋是因为AI还在高速迭代,还有人在真心想把事情往更好、更实用的方向推。
复杂是因为——信息差又一次被拉大了。顶级实验室招的人、用的算力、掌握的know-how,我们普通开发者只能通过公开模型和社区碎片去窥探一角。
但转念一想,这不就是AI时代最真实的模样吗?
好奇心永远比焦虑有用。
与其纠结“又被甩开多远”,不如问问自己:我今天能用现有模型多做点什么?能不能把Ling-2.6这种高性价比模型、或者Claude、或者随便哪个好用的工具,真正塞进自己的工作流里?
我最近就在折腾前端静态页面生成,用Ling模型喂了一堆设计spec,让它吐完整可运行的HTML模板。效果真香。速度快、上下文长、成本低,正好适合我这种一个人搞项目的。
(感兴趣的朋友我后面可以单独分享那套prompt模板)
Karpathy加入Anthropic,不过是2026年AI军备竞赛里又一个醒目的注脚。
我们普通人能做的,就是保持好奇、持续下场、别被信息差吓到。
多动手,多试新东西,多把AI当成“超级实习生”而不是“要取代我的人”。
你最近在用哪个模型卷什么项目?
评论区聊聊,我真心想听听大家的真实感受。
(愚钝如我,也还在摸索阶段,欢迎一起交流)