当我们惊叹于LLM能重构十万行代码时,它却可能建议你“走到洗车店去洗车”。这种能力上的巨大落差并非Bug,而是理解AI时代的核心线索。本文从Sequoia内部谈话的洞察出发,剖析LLM“锯齿模式”的根源,并探讨在“Agent原生经济”中,我们如何与这个既强大又“偏科”的伙伴共舞。

核心观点:将LLM视为传统软件的加速器是危险的,其真正的价值在于它开启了一种“非古典计算”的新范式,但我们必须接受其“锯齿状”能力图谱——这一矛盾既是其力量的源泉,也是其最大的陷阱,而应对它的唯一方式是建立一种基于深度实用主义的认知框架。

我们正处在一个奇特的认知断层时代。一方面,铺天盖地的宣传让我们相信,大型语言模型(LLM)是无所不能的魔法师,能取代程序员、艺术家、客服,乃至一切知识工作者。另一方面,每一个深度使用者都亲身经历过那种令人抓狂的瞬间:它刚刚逻辑清晰地帮你重构了一个庞大的代码库,转眼间却给出一个荒谬到令人发笑的建议,比如“你可以走到洗车店去洗车”。这种巨大的能力落差,被前Tesla AI总监、现OpenAI成员Andrej Karpathy在红杉资本Ascent 2026的一场炉边谈话中精准地概括为“锯齿模式”。这并非一个需要被修复的Bug,而是LLM能力的核心特征。理解并内化这一特征,不再把LLM当成一个性能不均的“传统软件”,而是将其视为一种全新的、非古典的计算范式,才是我们能否在即将到来的“Agent原生经济”中取得优势的关键。

Karpathy在那场谈话中,试图推动一个远比“加速”更深远的认知转变。他举了三个例子来证明,LLM的价值远不止于“让已有的东西变得更快”。第一个例子是一个叫做“menugen”的应用,它完全被LLM“吞噬”,不需要一行古典代码:输入一张图片,输出一张图片,LLM原生地完成了整个任务。第二个例子更具颠覆性:用“install .md”技能取代“install .sh”脚本。想象一下,不再需要编写复杂的bash脚本来安装软件,而是将安装步骤用自然语言写成一个Markdown文件,直接交给LLM去理解和执行。LLM会智能地根据你的系统环境进行适配、调试,并解决一切意外问题。第三个例子是LLM知识库,这是一种在古典计算时代“不可能”实现的功能,因为它涉及对来自任意来源、任意格式的非结构化数据进行计算。这三个例子的共同点是,它们都触及了古典软件(Software 1.0)无法触及的领域:一个应用可以完全由LLM的逻辑构成;一个“程序”可以是一段可读的自然语言;而处理人类海量的、杂乱无章的知识,终于有了可行的计算路径。

然而,正是这种前所未有的能力,使得“锯齿模式”成为一个既迷人又危险的谜题。我们该如何解释,同一个模型能在同一分钟内同时展现出“天才”和“傻瓜”的两面?Karpathy对此提供了一个逐步深化的解释。起初,他将此归因于“领域的可验证性”——在数学、编程这些可以对输出结果进行明确对错的领域,LLM表现得非常出色;而在需要常识、直觉或理解人类微妙情感的领域,它就变得不可靠。但在红杉资本的这次谈话中,他引入了另一个维度:经济学。原因在于,前沿实验室在强化学习阶段,会选择性地将那些拥有巨大市场规模(TAM, Total Addressable Market)和可预测收入流(Revenue)的领域打包进训练数据分布。这意味着,如果你的需求恰好落在那些被精心“铺设了轨道”的数据分布之内,你就像是坐着高速火车飞驰;而一旦脱离了这些轨道,你就不得不在未经开发的丛林中手持砍刀开路。这解释了为何LLM在代码生成领域如此强大——因为其市场价值巨大,训练数据极其丰富;而在“如何正确地把车开到洗车店”这种琐碎但需要物理世界常识的任务上,它可能表现糟糕——因为这根本不在商业优化的优先级列表里。

这个解释虽然深刻,却远非令人满意。它暗示着一种深刻的“先验偏见”:LLM对世界的理解,是被资本和市场筛选过的。它更擅长处理那些已经被数据化、被货币化、被结构化的知识,而对于那些尚未被充分挖掘的、或个人化的、或需要真实世界交互的“暗知识”,它则表现得像一个天真的异乡人。这就是为什么,仅仅把LLM当作一个“更智能的搜索引擎”或“更快的程序员”是远远不够的,甚至是有害的。这种思维定式会让你在它擅长的轨道上过度依赖,而在它薄弱的丛林中毫无防备。

这种认知的缺失,直接导致了一个正在酝酿中的巨大陷阱:对“Agent”的盲目崇拜。当“Agent原生经济”成为新的热词,无数创业者和产品经理开始构想如何将产品和服务分解为传感器、执行器和逻辑单元,并创造出能自主完成任务的“Agent”时,他们往往忽略了一个关键问题:你的Agent的核心大脑——LLM,是“锯齿状”的。一个被设计来自动处理客服工单的Agent,可能非常擅长查找订单状态(处于数据分布内),却可能在与客户共情时表现得像个机器人(处于数据分布外)。一个被寄予厚望来自动化招聘流程的Agent,能高效筛选简历关键词,却可能无法理解一个优秀候选人的微妙潜力。如果我们不把“锯齿模式”作为设计Agent系统的首要前提,那么迎接我们的不是生产力的大解放,而是一系列令人啼笑皆非的“自动化事故”。

那么,面对这样一个强大却“偏科”的伙伴,正确的策略是什么?答案不是放弃,也不是盲目信任,而是建立一种“深度实用主义”的认知框架。首先,我们必须承认“锯齿模式”的不可消除性。不要试图去训练一个在所有领域都完美的通用模型,至少在可预见的未来这不现实。相反,我们要做的是绘制出特定LLM的“能力地形图”,清晰地知道它在哪些轨道上飞驰,在哪些领域是丛林。其次,在产品设计上,要主动地“引导”LLM进入其优势轨道。这意味着为Agent创造一个高度结构化、可验证的操作环境。例如,在代码生成工具中,为其提供明确的接口定义、类型系统和测试用例,让它在一个逻辑清晰、反馈即时的空间里工作。而对于那些需要“丛林技能”的任务,比如处理模糊的客户投诉或进行创造性的头脑风暴,则应该设计人机协作的循环,让人类来补足LLM的短板。最后,拥抱“信息为机可读”的原则。Karpathy提到的“agent-native economy”的另一个重要维度,就是让信息对LLM最大化“可读性”。这不仅仅是提供结构化的API,更是要思考如何用自然语言精确地描述意图、流程和约束。一个写得好的Markdown文件,可能比一段复杂的代码更能有效地指挥一个Agent。

我们正在目睹的,并非一个通用人工智能的诞生,而是一种全新计算范式的黎明。这种范式的核心,不是无所不能的神谕,而是一个能力分布极不均匀、可以被调用但不能被完全信赖的“数字大脑”。把LLM当作传统软件的“加速器”,就像把第一辆汽车当作“更快的马车”,虽然短期内能获得效率提升,但会错失整个新大陆的版图。真正的竞争力,来自于理解“锯齿模式”的本质,并在此基础上设计出那些在古典计算时代“可能不该存在”或“根本不可能实现”的应用和商业模式。那些学会了如何在这个“非古典”的计算世界中绘制地图、设立路标、搭建桥梁的人,才会在Agent原生经济的浪潮中,找到真正的立足之地。而所有试图绕过这种理解的、期待LLM变成完美工具的人,最终只会被其锋利的锯齿所伤。