大型语言模型在构建代理原生态经济中的角色与结构性缺陷
从Sequoia的炉边谈话到Reddit上关于LLM失效模式的深度剖析,我们看到了一个从“加速器”到“新经济引擎”的范式转变。但Karpathy口中的“代理原生态”能否真正实现,取决于我们是否准备好应对那些隐藏在代码和提示词背后的结构性陷阱。
核心观点:大型语言模型并非仅仅加速现有流程,它们正在催生一个全新的“代理原生态”经济,但这种经济形态的成功依赖于对模型结构性失败模式的深刻理解与系统化防御,而非单纯依赖提示工程。
当Andrej Karpathy在Sequoia Ascent 2026的炉边谈话中提出“代理原生态经济”这一概念时,他描绘的不是一个加速版的硅谷,而是一个全新的计算范式。他的三个例子——一个不需要传统代码的图像处理应用、以.md技能文件代替.sh安装脚本的安装流程、以及不可能用经典代码实现的LLM知识库——都在表达同一个观点:LLM不仅仅是更快地做旧的事情,它正在创造以前不可能做的事情。然而,就在同一条信息流里,Reddit上那篇《LLM失效图谱》的文章揭示了硬币的另一面:递归一致、上下文腐烂、叙事惯性——这些结构性的失败模式正在悄然侵蚀着代理系统的可靠性。这两个观点看似矛盾,实则互补。它们共同指向一个结论:代理原生态经济的成败,不在于LLM能做什么,而在于我们如何系统性地应对它不擅长什么。Karpathy提到的“锯齿状能力曲线”是一个绝佳的隐喻:同一个模型可以重构十万行代码库,却会建议你把车开到洗车店去洗车。这种能力的不连续性并非偶然,而是由训练数据的分布和强化学习的路径决定。当你处于数据分布的轨道上时,模型表现惊人;一旦偏离轨道,进入“丛林”,它就变成了一把钝刀。这恰恰是《失效图谱》中“递归一致”和“叙事惯性”的温床。一个早期的弱假设会像滚雪球一样在推理步骤中不断放大,最终成为被系统当作“真理”的错误前提。在代理原生态经济中,当一个自主代理系统被委以采购、调度或客户服务的重任时,这种结构性错误可能导致的是真实世界中的经济损失和信任崩塌。因此,构建代理系统不能停留在“把提示词写好”的层面。Karpathy所暗示的“全神经计算”愿景——让神经网络处理绝大多数计算任务,仅辅以经典CPU作为协处理器——实际上是一场系统架构的革命。它要求我们重新思考如何将传感器、执行器和逻辑在不同计算范式间有效分配。这不仅仅是一个技术问题,更是一个设计哲学问题:我们是否愿意接受一个不完美但不断进化的代理系统,并为之建立容错和回滚机制?还是说,我们要求每一个决策都100%可解释和可预测?现实可能是这两者之间的甜蜜点。顶尖的AI公司已经在实验“人机协作”模式,让LLM处理创造性、模糊性强的任务,同时用传统算法和人工审核把关关键结果。这种混合架构既利用了LLM的泛化能力和创造性,又规避了其在确定性任务上的不可靠性。这恰恰是代理原生态经济的真正开端:它不是让机器完全取代人,而是重新定义人与机器的分工边界。Karpathy的演讲和《失效图谱》共同警示我们:不要被LLM的惊人能力迷惑,而忽视了其内在的脆弱性。真正的进步来自于对这些脆弱性的深刻理解,以及系统化的防御机制。这需要开发者、产品经理和投资者共同转变思路:从“如何写更好的提示”转向“如何设计更能容忍错误的系统”。那些在代理原生态经济中胜出的公司,将不是提示词调优的高手,而是系统架构上的大师。
如果把这个判断再往前推一步,真正重要的不是 Fireside chat at Se…、The LLM Failure Atl…、一个脱胎换骨的"你",正于新世界诞生… 本身,而是它们共同暴露出的分配逻辑。 x、reddit、bilibili 在同一轮里把注意力推向同一问题,通常意味着这个主题正在从圈层内部经验,转向更可共享的公共议题。 这也是为什么这种内容值得写成长文:短帖只负责提醒你“这里有事发生”,但只有长文才能把背景、代价、误判空间和后续影响放到同一张桌面上。 换句话说,大型语言模型并非仅仅加速现有流程,它们正在催生一个全新的“代理原生态”经济,但这种经济形态的成功依赖于对模型结构性失败模式的深刻理解与系统化防御,而非单纯依赖提示工程。 之所以重要,不是因为它看上去新,而是因为它会重新定义用户接下来应该如何理解这一类内容。
当然,这个判断仍然有边界。技术 领域的很多内容天生带有夸张表达、圈层黑话和强情绪包装, 这意味着原始材料本身未必可靠,甚至会故意放大戏剧性。 所以这里真正需要辨认的,不是表层标题是否足够抓人,而是标题下面有没有重复出现的结构:问题是否反复被提到,解决路径是否开始稳定, 以及不同来源是否在无意中指向相同结论。只有这些条件同时成立时,大型语言模型并非仅仅加速现有流程,它们正在催生一个全新的“代理原生态”经济,但这种经济形态的成功依赖于对模型结构性失败模式的深刻理解与系统化防御,而非单纯依赖提示工程。 才算站得住。否则,它最多只能算一个值得观察的苗头,而不是已经完成的判断。
接下来真正值得跟踪的,也不是重复消费 Fireside chat at…、The LLM Failure A… 的情绪回声,而是观察后续内容是否开始出现更高质量的二次信号: 有没有人给出更完整的数据,有没有人补上背景脉络,有没有人提出相反证据去挑战这个判断。 一篇合格的深度评论不应该把读者停在“我同意/我不同意”这一层,而应该把读者推向下一步: 如果 大型语言模型并非仅仅加速现有流程,它们正在催生一个全新的“代理原生态”经济,但这种经济形态的成功依赖于对模型结构性失败模式的深刻理解与系统化防御,而非单纯依赖提示工程。 为真,它会改变什么;如果它为假,又是哪一个前提先出了问题。只有这样,这篇文章才不是对平台噪音的复述,而是对一个真实选题的建立。
参考来源
- Fireside chat at Sequoia Ascent 2026 from a ~week ago. Some highlights:
- The first theme I tried to push on is that LLMs are about a lot more than just speeding up what existed before (e.g. coding). Three examples of new horizons:
- 1. menugen: an app that can be fully engulfed by LLMs, with no classical code needed: input an image, output an image and an LLM can natively do the thing.
- 2. install .md skills instead of install .sh scripts. Why create a complex Software 1.0 bash script for e.g. installing a piece of software if you can write the installation out in words and say "just show this to your LLM". The LLM is an advanced interpreter of English and can intelligently target installation to your setup, debug everything inline, etc.
- 3. LLM knowledge bases as an example of something that was *impossible* with classical code because it's computation over unstructured data (knowledge) from arbitrary sources and in arbitrary formats, including simply text articles etc.
- I pushed on these because in every new paradigm change, the obvious things are always in the realm of speeding up or somehow improving what existed, but here we have examples of functionality that either suddenly perhaps shouldn't even exist (1,2), or was fundamentally not possible before (3).
- The second (ongoing) theme is trying to explain the pattern of jaggedness in LLMs. How it can be true that a single artifact will simultaneously 1) coherently refactor a 100,000-line code base *and* 2) tell you to walk to the car wash to wash your car. I previously wrote about the source of this as having to do with verifiability of a domain, here I expand on this as having to also do with economics because revenue/TAM dictates what the frontier labs choose to package into training data distributions during RL. You're either in the data distribution (on the rails of the RL circuits) and flying or you're off-roading in the jungle with a machete, in relative terms. Still not 100% satisfied with this, but it's an ongoing struggle to build an accurate model of LLM capabilities if you wish to practically take advantage of their power while avoiding their pitfalls, which brings me to...
- Last theme is the agent-native economy. The decomposition of products and services into sensors, actuators and logic (split up across all of 1.0/2.0/3.0 computing paradigms), how we can make information maximally legible to LLMs, some words on the quickly emerging agentic engineering and its skill set, related hiring practices, etc., possibly even hints/dreams of fully neural computing handling the vast majority of computation with some help from (classical) CPU coprocessors. - https://nitter.net/karpathy/status/2049903821095354523#m
- The LLM Failure Atlas: 4 Structural Failure Modes That Break Modern AI Systems (Free PDF) - https://www.reddit.com/r/PromptEngineering/comments/1tghwc8/the_llm_failure_atlas_4_structural_failure_modes/
- 一个脱胎换骨的"你",正于新世界诞生 | 《逆水寒:新世界》首支预告片 - https://www.bilibili.com/video/BV1JfLy6vEPu