LLM不是加速器,是物种入侵:从Karpathy的红杉谈话看Agent时代的真实冲击
当Karpathy说LLM不只是加速编码时,他在暗示一个更深的断裂:我们正在进入一个"技能即安装脚本"、"应用即提示词"的世界。这不是工具的迭代,是计算范式的物种更替。
核心观点:LLM的真正颠覆性不在于加速现有流程,而在于它创造了三类此前不存在或不应存在的功能形态,这要求我们以Agent原生思维而非传统软件范式来重新定义产品、技能和经济模式。
Andrej Karpathy上周在红杉资本Ascent 2026上的炉边谈话,表面上是关于LLM能力的边界讨论,但实际上它撕开了一道更深的裂缝。他在谈话中试图推进的第一个主题是,LLM远不只是加速现有流程——比如提高编码效率——那么简单。他用三个例子来说明这一点,每一个都值得仔细审视,因为它们共同指向了一个正在发生的、远比我们大多数人意识到的更激进的范式转换。第一个例子叫"menugen",一个可以被LLM完全吞噬的应用程序,不需要任何经典代码:输入一张图片,输出一张图片,LLM可以原生地完成这件事。第二个例子更具冲击力:用`.md`技能文件替代`.sh`脚本。为什么要为一个软件的安装写一段复杂的bash脚本?如果你可以用自然语言写出安装步骤,然后说"把这个给你的LLM看",它就会像一个高级的英语解释器一样,智能地针对你的系统配置进行安装,在行内调试所有问题。第三个例子是LLM知识库,这是一种用经典代码根本不可能实现的东西,因为它是在非结构化数据——来自任意来源、任意格式的知识——之上进行计算。这三个例子之所以重要,不是因为它们展示了LLM能做什么,而是因为它们共同定义了一个新的物种:一种计算方式,它不再遵循"输入程序-处理-输出结果"的经典逻辑,而是遵循"输入意图-理解-生成结果"的新逻辑。这不是速度上的提升,这是根本性的本体论转换。
我们习惯于将每一次技术变革都理解为对旧有流程的优化。互联网让信息传播更快,搜索引擎让信息检索更高效,云计算让计算资源更便宜。LLM当然也做这些事情,但如果我们只看到这一点,就会错过真正关键的变化。Karpathy的第一个例子指向了一种可能性:有些应用,以其现有的存在形式,在LLM时代可能根本不应该再存在。一个专门用来从图片生成图片的应用,如果LLM能原生地完成同样的任务,那这个应用的独立存在价值就消失了。这不是竞争,这是生态位的直接抹除。第二个例子更为激进:在经典计算范式中,安装脚本是必要的,因为它需要精确、可重复、无歧义地描述一系列操作。但LLM改变了这个前提。如果指令可以被模糊地、用自然语言描述,而执行者(LLM)能够理解并适应性地执行,那么脚本的精确性就不再是必需品,而成为一种过时的冗余。`.md`文件替代`.sh`文件,背后是计算本质的转变:从"程序必须无歧义"到"程序可以理解歧义"。第三个例子则展示了完全不可能的事情:经典计算无法处理任意格式、任意来源的非结构化知识,因为你需要预先定义数据结构和处理逻辑。但LLM不需要。它可以"理解"一篇文章、一段对话、一张图表,并在理解的基础上进行操作。这意味着,知识本身——而不是数据的结构化表示——成为了计算的对象。
这三个例子合在一起,构成了一幅关于"Agent原生经济"的草图。Karpathy在谈话中提到了这个主题,但并未深入展开。他谈到产品和服务可以被分解为传感器、执行器和逻辑,这些组件可以跨1.0(经典软件)、2.0(机器学习)和3.0(LLM)计算范式进行分配。但在这背后,更核心的问题是:当LLM成为计算的核心执行单元时,我们整个经济系统的组织方式会发生怎样的变化?"Agent原生经济"不是关于机器人或者自动化,而是关于一个根本性的观察:在LLM时代,"信息对LLM的可读性"和"信息对人类的可读性"正在分叉。我们长期以来构建信息的方式——文档、报表、界面——都是以人类理解为目的。但在Agent原生经济中,这些信息首先需要被LLM理解。这意味着,信息的格式、结构、甚至内容都可能发生改变。一个最直接的例子:如果你的客户是LLM,你的产品界面应该长什么样?不是漂亮的UI,而是结构化、可解析、可推理的文本。这不是反乌托邦,而是经济效率的必然要求。
Karpathy谈话中的第二个核心主题——LLM能力的锯齿状模式——恰恰是理解这一经济转型的关键。他提出了一个困扰很多人的问题:为什么同一个LLM既能连贯地重构一个10万行的代码库,又能告诉你应该走到洗车场去洗车?这个矛盾不是偶然的,它是LLM能力本质的体现。他指出,这既与领域的可验证性有关,也与经济性有关:收入和总可寻址市场(TAM)决定了前沿实验室在强化学习阶段选择将哪些内容打包进训练数据分布。如果你在数据分布之内——在强化学习电路的轨道上——那么你会飞起来;如果你不在,那么你就得在丛林中挥着砍刀开路。这个比喻极其精准。LLM不是通用的智能体,它是被训练数据分布塑造的、具有高度特异性的能力集合。在数据分布内部,它的表现远超人类;在外部,它可能连常识性的任务都完不成。这种锯齿状的能力分布,意味着在Agent原生经济中,"什么可以做"和"什么不能做"之间的边界不是固定的,而是由经济力量动态塑造的。这意味着,那些能够将自己置于LLM数据分布之内的产品和服务,将获得巨大的竞争优势;而那些不能的,将面临被边缘化的风险。
这就引出了一个更深层的问题:在Agent原生经济中,"技能"这个概念本身正在被重新定义。Karpathy提到的"安装.md技能"不仅是对安装脚本的替代,更是一种新的技能获取方式的隐喻。在传统经济中,技能是学习、积累、认证的结果。但在Agent原生经济中,技能可以是即时的、可组合的、由LLM解释执行的文本。这意味着,"开发者"和"非开发者"之间的界限正在模糊。一个能写出清晰自然语言指令的人,实际上已经具备了编程的能力——不需要学习Python或JavaScript,只需要学会如何与LLM沟通。这不是对编程的降维打击,而是对"编程"这个概念的重新定义。编程不再是向机器下达精确指令的艺术,而是向智能体表达清晰意图的艺术。这种转变的后果是深远的:它将改变教育、就业、创新乃至整个社会的生产关系。那些能够掌握"意图表达"这一新技能的人,将在Agent原生经济中占据有利位置;而那些仍然固守于传统编程范式、只关注"如何做"而非"做什么"的人,可能会发现自己正在被边缘化。
当然,这种转变并非没有反方和不确定性。最核心的质疑在于:LLM的"理解"是否足够可靠?当我们将越来越多的关键功能交给一个能力呈锯齿状分布的智能体时,我们是否在承担不可接受的风险?Karpathy本人也承认,对于LLM能力的准确模型,他"仍然不是100%满意",这是一个持续的挣扎。这种不确定性不是理论上的,而是实践中的。一个LLM可能在重构代码方面表现得令人惊叹,但在简单的常识推理上却犯下低级错误。这种不可预测性,使得Agent原生经济的落地充满了挑战。企业如何在依赖LLM的同时,防范其"锯齿状"能力的陷阱?这可能需要全新的验证、监控和回退机制。另一个重要的不确定性在于经济激励的扭曲。如果数据分布是由TAM决定的,那么那些小众、冷门但关键的任务,可能会被LLM系统性地忽视。这会造成一种新的"算法不公"——不是因为偏见,而是因为经济效率。这些质疑并不意味着Agent原生的方向是错误的,而是说明我们需要的不是盲目拥抱,而是一种审慎的实验主义态度。我们需要在不断试错中,找到LLM能力的安全边界,并围绕这个边界设计我们的经济系统。
回到Karpathy谈话中最具启发性的那个洞察:"用.md文件代替.sh文件"。这个简单的类比背后,隐藏着计算史上一次真正的断裂。我们正在从"程序即指令"的时代,进入"程序即意图"的时代。这不是工具的迭代,这是物种的更替。那些能够理解这一变化,并主动将自己置于Agent原生经济中的个人和组织,将能够利用LLM的"技能安装"能力,以极低的成本获得此前需要大量专业知识和时间才能积累的能力。而那些拒绝承认这一变化的人,可能会发现自己就像那些在互联网时代开始时拒绝建立网站的企业一样,被悄无声息地边缘化。Karpathy的谈话是一份宣言,它宣告的不是LLM的胜利,而是计算范式的更替。这个更替的过程不会一帆风顺,充满了锯齿状的不确定性和分布不均的经济激励。但方向已经明确:我们不是在使用LLM加速旧世界,我们是在用LLM建造一个新世界。在这个新世界里,技能不再是写在简历上的清单,而是安装进LLM的文本文件。这个世界的规则,正在被此刻的每一行提示词书写。
参考来源
- Fireside chat at Sequoia Ascent 2026 from a ~week ago. Some highlights:
- The first theme I tried to push on is that LLMs are about a lot more than just speeding up what existed before (e.g. coding). Three examples of new horizons:
- 1. menugen: an app that can be fully engulfed by LLMs, with no classical code needed: input an image, output an image and an LLM can natively do the thing.
- 2. install .md skills instead of install .sh scripts. Why create a complex Software 1.0 bash script for e.g. installing a piece of software if you can write the installation out in words and say "just show this to your LLM". The LLM is an advanced interpreter of English and can intelligently target installation to your setup, debug everything inline, etc.
- 3. LLM knowledge bases as an example of something that was *impossible* with classical code because it's computation over unstructured data (knowledge) from arbitrary sources and in arbitrary formats, including simply text articles etc.
- I pushed on these because in every new paradigm change, the obvious things are always in the realm of speeding up or somehow improving what existed, but here we have examples of functionality that either suddenly perhaps shouldn't even exist (1,2), or was fundamentally not possible before (3).
- The second (ongoing) theme is trying to explain the pattern of jaggedness in LLMs. How it can be true that a single artifact will simultaneously 1) coherently refactor a 100,000-line code base *and* 2) tell you to walk to the car wash to wash your car. I previously wrote about the source of this as having to do with verifiability of a domain, here I expand on this as having to also do with economics because revenue/TAM dictates what the frontier labs choose to package into training data distributions during RL. You're either in the data distribution (on the rails of the RL circuits) and flying or you're off-roading in the jungle with a machete, in relative terms. Still not 100% satisfied with this, but it's an ongoing struggle to build an accurate model of LLM capabilities if you wish to practically take advantage of their power while avoiding their pitfalls, which brings me to...
- Last theme is the agent-native economy. The decomposition of products and services into sensors, actuators and logic (split up across all of 1.0/2.0/3.0 computing paradigms), how we can make information maximally legible to LLMs, some words on the quickly emerging agentic engineering and its skill set, related hiring practices, etc., possibly even hints/dreams of fully neural computing handling the vast majority of computation with some help from (classical) CPU coprocessors. - https://nitter.net/karpathy/status/2049903821095354523#m
- 《绝区零》星徽比利EP | Billy Mode - https://www.bilibili.com/video/BV16xVw6gEgu
- 【碧蓝航线9周年】唐国强守护千年非遗,碧蓝航线×成都漆艺特别联动 - https://www.bilibili.com/video/BV1QSGR66EsU