Andrej Karpathy在Sequoia Ascent 2026上提出,LLM的价值远超加速编码等旧流程,它创造了三类之前不存在或不应存在的功能。这个观点不是技术乐观主义的翻版,而是对当前AI叙事的一次根本性纠偏——我们可能正在经历计算史上最深刻的范式跃迁,而大多数人还将其误解为一场更高效的自动化。

核心观点:LLM的真正革命性不在于它让旧事物更快,而在于它让原本不可能或无需存在的事情变得可能,这一转变要求我们重新定义产品、技能和经济的底层逻辑。

每隔一段时间,技术界就会迎来一次“重新发明轮子”的时刻。但大多数时候,这种发明不过是对现有轮子的打磨、抛光、加装轴承——让它转得更快更顺。LLM的叙事在过去两年里正经历这种“轮子加速”的集体暗示:所有人都在谈论AI如何让程序员一天写两千行代码,如何让客服回复速度提升十倍,如何让文档摘要节省两小时。这些当然重要,但它们回避了一个令人不安的事实:如果LLM只是一个超级加速器,那它最终会撞上人类需求和注意力总量的天花板。

然而,Andrej Karpathy在Sequoia Ascent 2026的发言提出了一个截然不同的框架。他明确指出,LLM的真正爆发力在于三类新功能:第一类是“可以完全被LLM吞噬的应用”——比如一个输入图像、输出图像的纯AI应用,不需要一行传统代码;第二类是“用.md文件替代.sh脚本”——用自然语言描述安装步骤,让LLM理解并执行,彻底绕开传统编程的语法牢笼;第三类是“基于LLM的知识库”——对非结构化数据进行任意来源、任意格式的计算,这在经典编程中几乎不可能实现。这三个例子不是在讨论如何让旧工作变快,而是在划定新工作的边界。它们暗示了一个更深的命题:当某种技术能够重新定义“什么算是一个功能”时,它就不再是工具,而是新的计算范式。

这个转变的激进之处在于,它直接动摇了软件工程的根基。传统软件是模块化的、规则驱动的、层次分明的——我们编写精确的指令,机器机械地执行。LLM带来的则是分布式的、自我组织的、概率性的智能体:它不依赖你写的每一行条件判断,而是从数据、环境和交互中自行推导出行为。用Karpathy的话说,这不再是“Software 1.0”或“Software 2.0”的升级,而是一个混合范式——1.0的经典代码负责确定性逻辑,2.0的神经网络负责非确定性推理,而LLM作为中间层,将两者缝合在一起。更激进的观点来自Reddit上那篇题为《Toward Self-Organizing Neural Civilizations of Intelligence》的文章,它将当前AI智能体视为两种计算范式之间的“过渡妥协”:一边是传统软件工程,另一边是“神经智能”——后者最终可能发展到自我组织、自我重构的程度,完全摆脱人类设计的工作流。这种观点听起来像科幻,但它的逻辑线索是清晰的:一旦你承认LLM可以处理非结构化、不可编程的任务,你就打开了通向自我演进系统的大门。

反对者会说,这些“新功能”不过是旧功能的二次包装。一个由LLM驱动、没有传统代码的应用,本质上仍然是一个API调用和前端框架的组合;一个用自然语言写的安装脚本,最终还是要被解析成系统命令;一个知识库,底层仍然依赖向量数据库和检索算法。这些反驳有道理,但它们忽略了一个关键点:用户体验的范式转变和实现细节的连续性并不矛盾。人们使用电脑的每一次跃迁——从命令行到图形界面,从桌面到移动端——都不是因为底层硬件发生了质变,而是因为交互方式产生了根本性的重构。LLM带来的正是这种界面级重构:用户不再需要学习指令语法,不再需要理解模块依赖,不再需要辨别数据格式;他们只需要表达意图,然后让智能体去处理一切。就像安装软件时,你不再需要手写一个bash脚本去检测环境、下载依赖、配置路径——你只需要写一句话“在Ubuntu 22.04上安装Python 3.11”,LLM就能完成所有工作。这不是加速,这是消除“软件安装”这个本身就不该存在的认知负担。

这也解释了为什么“jaggedness”(参差不齐的能力分布)是当前LLM最令人困惑的特征。一个智能体可以优雅地重构十万行代码库,同时告诉你“去洗车店洗车”——这种矛盾在传统软件中不可能出现,因为代码的行为是一致的、可预测的。Karpathy将这种参差不齐归因于“可验证性”和“经济学”:那些拥有大量训练数据、高收入潜力的领域(如代码生成),被强化学习电路打磨得闪闪发光;而其他“长尾”任务则像在丛林中用砍刀开路。这个框架虽然不完美,但它给出了一个实用的行动指南:要充分利用LLM,你必须学会区分“在轨道上飞行”和“在丛林中开路”——前者可以放心地交给智能体,后者则需要你随时准备介入。

这个区分直接导向了Karpathy提到的第三个主题——“智能体原生经济”。他认为,未来的产品和服务将被分解为传感器、执行器和逻辑三个部分,并分布在1.0、2.0和3.0三种计算范式上。逻辑指的是传统的确定性计算,2.0是神经网络概率推理,3.0则是LLM驱动的自我组织智能。企业需要重新思考如何让信息对LLM“最大可读”——也就是以机器可理解的方式结构化知识,以便智能体能够自主决策和行动。这不仅仅是技术问题,更是组织架构和招聘策略的问题。智能体原生经济需要一种全新的工程师:他们既懂经典软件的严谨性,又懂神经网络的灵活性,还懂得如何设计提示词和智能体协作流程。这种人才目前在市场上极度稀缺,因为教育体系仍然在培养“纯后端工程师”或“纯数据科学家”,而不是这种混合型“智能体工程师”。

那么,这个“新计算范式”到底有多真实?反对意见认为,这不过是一场由资本推高的叙事泡沫。Sonar 4.0的发布、Claude Code的插件集成、各大模型的迭代更新——这些都被包装成“里程碑”,但实际体验仍然充满缺陷。LLM会产生幻觉,会执行错误的命令,会泄露隐私数据。更重要的是,它永远无法完全替代人类的判断力——尤其是在高风险决策中。这些批评是合理的。但真正的问题不是LLM是否完美,而是它是否已经打开了新的可能性空间,并且这个空间正在吸引越来越多的资源和人才。从Karpathy的发言到Reddit上的技术讨论,再到Sonar 4.0和Claude Code的实际产品更新,信号正在从分散走向收敛。也许我们正处于一个典型的“低估长期影响、高估短期影响”的时刻。但无论如何,产品逻辑的基石已经松动。

回到Karpathy的第一个例子:一个完全不需要传统代码的“menugen”应用。如果我们认真对待这个例子,就会发现它隐含了一个颠覆性结论:软件开发的“门槛”正在急剧降低。任何能够清晰描述问题的人——不管他们会不会编程——都可能成为“软件创造者”。这不是说程序员会被取代,而是说“编程”这个概念本身在扩展。未来的编程可能80%是用自然语言描述意图,20%是用传统代码处理那些需要精确定义的边界情况。这种转变将从根本上改变软件行业的供需结构、创新速度和竞争格局。

当然,我们不必立刻接受“自我组织的神经文明”这种宏大叙事。但我们可以接受一个更温和的版本:LLM正在让一些之前“不经济”或“不可能”的产品变得可行。知识库就是一个典型例子——在LLM之前,构建一个能够从任意来源、任意格式的数据中提取知识并回答问题的系统,需要昂贵的NLP管道和复杂的规则引擎。现在,一个简单的RAG(检索增强生成)架构就能实现80%的功能。这种“80%解决方案”的扩散,正在改变“什么值得做”的判断标准。

这就是为什么“LLM只是加速器”是一个危险的误解。它让我们忽略了那些正在发生但难以量化的变化:人们开始用自然语言做数据分析,用对话界面管理项目,用智能体调度任务。这些变化不是使原有流程更快,而是使原有流程变得多余。当“写一个SQL查询”被“问一个问题”取代时,不是因为SQL查询变快了,而是因为“查询”这个动作本身被重新定义了。

最终,Karpathy的讲话和围绕它的讨论指向了一个不可回避的问题:我们是否准备好迎接一个“智能不足”的世界?在智能体原生经济中,产品成功的钥匙不再是“写出最优雅的代码”,而是“设计出最清晰的意图表达系统”。LLM的参差不齐意味着我们永远需要人类的判断力来划定边界。而那些能够平衡“飞行”与“开路”、把握“可验证”与“不可验证”边界的人,将定义下一个十年。

这不是一个技术问题,而是关于我们如何理解“计算”本身。当计算从一个精确的、确定性的过程,变成一个概率的、自我组织的、充满不确定性的过程时,我们衡量“效率”和“创新”的标准也必须改变。LLM不只是让轮子转得更快——它正在重新发明轮子的形状。而大多数人还在用原来的尺子去量它的速度。