Andrej Karpathy 在 Sequoia Ascent 2026 上的火边谈话,用三个例子揭示了 LLM 的“新地平线”——不是让现有流程更快,而是让之前不可能的事成为可能。这可能是理解 AI 未来方向最重要的一个框架。

核心观点:AI 行业正在经历从“取代人类”到“创造经典计算不可能完成的任务”的范式转移,那些只将 LLM 视为加速器的公司和开发者,将错失这场革命的核心价值。

如果你问一家科技公司的 CEO,大语言模型能做什么,他们大概率会回答:提高代码效率、自动化客服、加速数据处理。这些答案没有错,但它们只看到了表象。Andrej Karpathy 最近在 Sequoia Ascent 2026 上的发言触及了一个更深层的问题:我们是否在用旧瓶装新酒?是否在将一种全新计算范式强行塞入“加速旧世界”的框架?他提出的三个“新地平线”案例,值得每个人认真思考。

第一个案例是 menugen:一个完全被 LLM 吞噬的应用。你输入一张图片,输出一张图片,LLM 原生地完成了整个过程,没有一行经典代码。这听起来像是一个玩具,但它背后隐含的变革是惊天动地的。传统软件开发中,任何图像处理任务都需要明确的算法设计、循环控制、条件分支。而现在,你可以用自然语言描述“把这张图里的猫换成狗”,LLM 就做了。这意味着什么?意味着软件开发的门槛从“会写代码”变成了“会描述需求”。

第二个案例更具颠覆性:用 `install.md` 技能替代 `install.sh` 脚本。传统上,安装一个软件需要编写复杂的 bash 脚本,处理各种操作系统差异、依赖冲突、权限问题。Karpathy 提出,为什么不直接写一份安装说明文档,然后交给 LLM 去执行?LLM 可以理解你的系统环境,智能地调整安装步骤,在线调试一切错误。这不仅仅是简化——这是将“指令执行”从“确定性计算”转移到了“理解性推理”。经典代码只能处理已知的、可预测的路径;而 LLM 可以处理未知的、动态变化的情况。

第三个案例是 LLM 知识库:经典代码完全无法完成的任务。因为知识库的本质是计算非结构化数据——来自任意来源、任意格式的文本、文章、对话。传统数据库要求结构化、模式化,但人类的知识天然是混沌的。LLM 能够在这种混沌中建立连接、提取洞察、回答开放性问题。这不是加快已有流程,而是创造了一个全新的能力领域。

这三个案例共同指向一个核心论点:LLM 的真正价值不在于它能让旧事物更快,而在于它能让之前不可能的事情成为可能。

然而,当前 AI 行业的主流叙事仍然集中在“取代”和“加速”上。我们看到无数的“AI 取代程序员”、“AI 取代客服”的标题,这些叙事迎合了对失业的恐惧和媒体的猎奇心理,但它们误导了开发者和企业家的注意力。如果只将 LLM 视为一个更快的代码生成器,你就会错过它最独特的价值:作为“新型计算范式”,它能够处理经典计算无法触及的问题空间——那些不精确的、模糊的、依赖常识推理的任务。

一个常见的反对意见是:LLM 的幻觉问题使其不可靠,无法用于关键任务。这种反对意见有一定道理,但它忽视了 Karpathy 提到的“锯齿形能力模式”——LLM 可以在一个领域表现出惊人的能力(重构 10 万行代码),在另一个领域却表现愚蠢(告诉你开车去洗车行洗车)。理解这种不一致性,是有效使用 LLM 的关键。这种不一致性来自于训练数据的分布:当任务落在 RL 训练的“轨道”上时,LLM 表现出色;当任务偏离这个轨道时,它就变成了一个在丛林中胡乱挥舞砍刀的莽汉。这不是 LLM 的缺陷,而是一种新的计算特性。

对于开发者来说,这意味着需要一种新的能力:判断哪些任务可以被 LLM 原生处理,哪些任务需要经典代码来处理。这不是一个非此即彼的选择,而是一个协同问题。Karpathy 在发言中提到了“agent-native economy”——将产品和服务分解为传感器、执行器和逻辑单元,然后分散到传统计算和 LLM 计算中去。这种混合架构正是未来 AI 应用的正确形态。

但同时,我们必须警惕“过度承诺”的风险。每一次技术革命都会经历从“万能工具”到“专用工具”的认知回归。LLM 不会解决所有问题,它只是开辟了一个新的能力维度。那些试图用 LLM 完成它不擅长任务的人,必然会碰壁。真正的挑战在于,如何将 LLM 的能力域与经典计算的能力域完美结合,创造出一个比两者之和更大的系统。

回到 Karpathy 的框架:LLM 革命的下半场,不是关于“谁的工作会被取代”,而是关于“哪些完全新型的应用会诞生”。那些在“加速旧世界”的叙事中迷失的开发者,可能会发现,当他们终于用 LLM 把代码生成速度提高了 10 倍时,别人已经创造出了他们之前连想都想不到的东西。

如果把这个判断再往前推一步,真正重要的不是 Fireside chat at Se…、年度巨献《致爱弥斯》父亲离世后,我完成…、《绝区零》星徽比利EP | Billy… 本身,而是它们共同暴露出的分配逻辑。 x、bilibili 在同一轮里把注意力推向同一问题,通常意味着这个主题正在从圈层内部经验,转向更可共享的公共议题。 这也是为什么这种内容值得写成长文:短帖只负责提醒你“这里有事发生”,但只有长文才能把背景、代价、误判空间和后续影响放到同一张桌面上。 换句话说,AI 行业正在经历从“取代人类”到“创造经典计算不可能完成的任务”的范式转移,那些只将 LLM 视为加速器的公司和开发者,将错失这场革命的核心价值。 之所以重要,不是因为它看上去新,而是因为它会重新定义用户接下来应该如何理解这一类内容。