LLM 革命的下半场:从加速旧世界到创造不可能
Andrej Karpathy 在 Sequoia Ascent 2026 上的火边谈话,用三个例子揭示了 LLM 的“新地平线”——不是让现有流程更快,而是让之前不可能的事成为可能。这可能是理解 AI 未来方向最重要的一个框架。
核心观点:AI 行业正在经历从“取代人类”到“创造经典计算不可能完成的任务”的范式转移,那些只将 LLM 视为加速器的公司和开发者,将错失这场革命的核心价值。
如果你问一家科技公司的 CEO,大语言模型能做什么,他们大概率会回答:提高代码效率、自动化客服、加速数据处理。这些答案没有错,但它们只看到了表象。Andrej Karpathy 最近在 Sequoia Ascent 2026 上的发言触及了一个更深层的问题:我们是否在用旧瓶装新酒?是否在将一种全新计算范式强行塞入“加速旧世界”的框架?他提出的三个“新地平线”案例,值得每个人认真思考。
第一个案例是 menugen:一个完全被 LLM 吞噬的应用。你输入一张图片,输出一张图片,LLM 原生地完成了整个过程,没有一行经典代码。这听起来像是一个玩具,但它背后隐含的变革是惊天动地的。传统软件开发中,任何图像处理任务都需要明确的算法设计、循环控制、条件分支。而现在,你可以用自然语言描述“把这张图里的猫换成狗”,LLM 就做了。这意味着什么?意味着软件开发的门槛从“会写代码”变成了“会描述需求”。
第二个案例更具颠覆性:用 `install.md` 技能替代 `install.sh` 脚本。传统上,安装一个软件需要编写复杂的 bash 脚本,处理各种操作系统差异、依赖冲突、权限问题。Karpathy 提出,为什么不直接写一份安装说明文档,然后交给 LLM 去执行?LLM 可以理解你的系统环境,智能地调整安装步骤,在线调试一切错误。这不仅仅是简化——这是将“指令执行”从“确定性计算”转移到了“理解性推理”。经典代码只能处理已知的、可预测的路径;而 LLM 可以处理未知的、动态变化的情况。
第三个案例是 LLM 知识库:经典代码完全无法完成的任务。因为知识库的本质是计算非结构化数据——来自任意来源、任意格式的文本、文章、对话。传统数据库要求结构化、模式化,但人类的知识天然是混沌的。LLM 能够在这种混沌中建立连接、提取洞察、回答开放性问题。这不是加快已有流程,而是创造了一个全新的能力领域。
这三个案例共同指向一个核心论点:LLM 的真正价值不在于它能让旧事物更快,而在于它能让之前不可能的事情成为可能。
然而,当前 AI 行业的主流叙事仍然集中在“取代”和“加速”上。我们看到无数的“AI 取代程序员”、“AI 取代客服”的标题,这些叙事迎合了对失业的恐惧和媒体的猎奇心理,但它们误导了开发者和企业家的注意力。如果只将 LLM 视为一个更快的代码生成器,你就会错过它最独特的价值:作为“新型计算范式”,它能够处理经典计算无法触及的问题空间——那些不精确的、模糊的、依赖常识推理的任务。
一个常见的反对意见是:LLM 的幻觉问题使其不可靠,无法用于关键任务。这种反对意见有一定道理,但它忽视了 Karpathy 提到的“锯齿形能力模式”——LLM 可以在一个领域表现出惊人的能力(重构 10 万行代码),在另一个领域却表现愚蠢(告诉你开车去洗车行洗车)。理解这种不一致性,是有效使用 LLM 的关键。这种不一致性来自于训练数据的分布:当任务落在 RL 训练的“轨道”上时,LLM 表现出色;当任务偏离这个轨道时,它就变成了一个在丛林中胡乱挥舞砍刀的莽汉。这不是 LLM 的缺陷,而是一种新的计算特性。
对于开发者来说,这意味着需要一种新的能力:判断哪些任务可以被 LLM 原生处理,哪些任务需要经典代码来处理。这不是一个非此即彼的选择,而是一个协同问题。Karpathy 在发言中提到了“agent-native economy”——将产品和服务分解为传感器、执行器和逻辑单元,然后分散到传统计算和 LLM 计算中去。这种混合架构正是未来 AI 应用的正确形态。
但同时,我们必须警惕“过度承诺”的风险。每一次技术革命都会经历从“万能工具”到“专用工具”的认知回归。LLM 不会解决所有问题,它只是开辟了一个新的能力维度。那些试图用 LLM 完成它不擅长任务的人,必然会碰壁。真正的挑战在于,如何将 LLM 的能力域与经典计算的能力域完美结合,创造出一个比两者之和更大的系统。
回到 Karpathy 的框架:LLM 革命的下半场,不是关于“谁的工作会被取代”,而是关于“哪些完全新型的应用会诞生”。那些在“加速旧世界”的叙事中迷失的开发者,可能会发现,当他们终于用 LLM 把代码生成速度提高了 10 倍时,别人已经创造出了他们之前连想都想不到的东西。
如果把这个判断再往前推一步,真正重要的不是 Fireside chat at Se…、年度巨献《致爱弥斯》父亲离世后,我完成…、《绝区零》星徽比利EP | Billy… 本身,而是它们共同暴露出的分配逻辑。 x、bilibili 在同一轮里把注意力推向同一问题,通常意味着这个主题正在从圈层内部经验,转向更可共享的公共议题。 这也是为什么这种内容值得写成长文:短帖只负责提醒你“这里有事发生”,但只有长文才能把背景、代价、误判空间和后续影响放到同一张桌面上。 换句话说,AI 行业正在经历从“取代人类”到“创造经典计算不可能完成的任务”的范式转移,那些只将 LLM 视为加速器的公司和开发者,将错失这场革命的核心价值。 之所以重要,不是因为它看上去新,而是因为它会重新定义用户接下来应该如何理解这一类内容。
参考来源
- Fireside chat at Sequoia Ascent 2026 from a ~week ago. Some highlights:
- The first theme I tried to push on is that LLMs are about a lot more than just speeding up what existed before (e.g. coding). Three examples of new horizons:
- 1. menugen: an app that can be fully engulfed by LLMs, with no classical code needed: input an image, output an image and an LLM can natively do the thing.
- 2. install .md skills instead of install .sh scripts. Why create a complex Software 1.0 bash script for e.g. installing a piece of software if you can write the installation out in words and say "just show this to your LLM". The LLM is an advanced interpreter of English and can intelligently target installation to your setup, debug everything inline, etc.
- 3. LLM knowledge bases as an example of something that was *impossible* with classical code because it's computation over unstructured data (knowledge) from arbitrary sources and in arbitrary formats, including simply text articles etc.
- I pushed on these because in every new paradigm change, the obvious things are always in the realm of speeding up or somehow improving what existed, but here we have examples of functionality that either suddenly perhaps shouldn't even exist (1,2), or was fundamentally not possible before (3).
- The second (ongoing) theme is trying to explain the pattern of jaggedness in LLMs. How it can be true that a single artifact will simultaneously 1) coherently refactor a 100,000-line code base *and* 2) tell you to walk to the car wash to wash your car. I previously wrote about the source of this as having to do with verifiability of a domain, here I expand on this as having to also do with economics because revenue/TAM dictates what the frontier labs choose to package into training data distributions during RL. You're either in the data distribution (on the rails of the RL circuits) and flying or you're off-roading in the jungle with a machete, in relative terms. Still not 100% satisfied with this, but it's an ongoing struggle to build an accurate model of LLM capabilities if you wish to practically take advantage of their power while avoiding their pitfalls, which brings me to...
- Last theme is the agent-native economy. The decomposition of products and services into sensors, actuators and logic (split up across all of 1.0/2.0/3.0 computing paradigms), how we can make information maximally legible to LLMs, some words on the quickly emerging agentic engineering and its skill set, related hiring practices, etc., possibly even hints/dreams of fully neural computing handling the vast majority of computation with some help from (classical) CPU coprocessors. - https://nitter.net/karpathy/status/2049903821095354523#m
- 年度巨献《致爱弥斯》父亲离世后,我完成了这部作品……【不乐得·鸣潮细节盘点】 - https://www.bilibili.com/video/BV1f9VN6mEYw
- 《绝区零》星徽比利EP | Billy Mode - https://www.bilibili.com/video/BV16xVw6gEgu