当LLM不再只是加速器:新计算范式的“不可逆”时刻
Andrej Karpathy在Sequoia Ascent 2026上提出,LLM的价值远超加速编码等旧流程,它创造了三类之前不存在或不应存在的功能。这个观点不是技术乐观主义的翻版,而是对当前AI叙事的一次根本性纠偏——我们可能正在经历计算史上最深刻的范式跃迁,而大多数人还将其误解为一场更高效的自动化。
核心观点:LLM的真正革命性不在于它让旧事物更快,而在于它让原本不可能或无需存在的事情变得可能,这一转变要求我们重新定义产品、技能和经济的底层逻辑。
每隔一段时间,技术界就会迎来一次“重新发明轮子”的时刻。但大多数时候,这种发明不过是对现有轮子的打磨、抛光、加装轴承——让它转得更快更顺。LLM的叙事在过去两年里正经历这种“轮子加速”的集体暗示:所有人都在谈论AI如何让程序员一天写两千行代码,如何让客服回复速度提升十倍,如何让文档摘要节省两小时。这些当然重要,但它们回避了一个令人不安的事实:如果LLM只是一个超级加速器,那它最终会撞上人类需求和注意力总量的天花板。
然而,Andrej Karpathy在Sequoia Ascent 2026的发言提出了一个截然不同的框架。他明确指出,LLM的真正爆发力在于三类新功能:第一类是“可以完全被LLM吞噬的应用”——比如一个输入图像、输出图像的纯AI应用,不需要一行传统代码;第二类是“用.md文件替代.sh脚本”——用自然语言描述安装步骤,让LLM理解并执行,彻底绕开传统编程的语法牢笼;第三类是“基于LLM的知识库”——对非结构化数据进行任意来源、任意格式的计算,这在经典编程中几乎不可能实现。这三个例子不是在讨论如何让旧工作变快,而是在划定新工作的边界。它们暗示了一个更深的命题:当某种技术能够重新定义“什么算是一个功能”时,它就不再是工具,而是新的计算范式。
这个转变的激进之处在于,它直接动摇了软件工程的根基。传统软件是模块化的、规则驱动的、层次分明的——我们编写精确的指令,机器机械地执行。LLM带来的则是分布式的、自我组织的、概率性的智能体:它不依赖你写的每一行条件判断,而是从数据、环境和交互中自行推导出行为。用Karpathy的话说,这不再是“Software 1.0”或“Software 2.0”的升级,而是一个混合范式——1.0的经典代码负责确定性逻辑,2.0的神经网络负责非确定性推理,而LLM作为中间层,将两者缝合在一起。更激进的观点来自Reddit上那篇题为《Toward Self-Organizing Neural Civilizations of Intelligence》的文章,它将当前AI智能体视为两种计算范式之间的“过渡妥协”:一边是传统软件工程,另一边是“神经智能”——后者最终可能发展到自我组织、自我重构的程度,完全摆脱人类设计的工作流。这种观点听起来像科幻,但它的逻辑线索是清晰的:一旦你承认LLM可以处理非结构化、不可编程的任务,你就打开了通向自我演进系统的大门。
反对者会说,这些“新功能”不过是旧功能的二次包装。一个由LLM驱动、没有传统代码的应用,本质上仍然是一个API调用和前端框架的组合;一个用自然语言写的安装脚本,最终还是要被解析成系统命令;一个知识库,底层仍然依赖向量数据库和检索算法。这些反驳有道理,但它们忽略了一个关键点:用户体验的范式转变和实现细节的连续性并不矛盾。人们使用电脑的每一次跃迁——从命令行到图形界面,从桌面到移动端——都不是因为底层硬件发生了质变,而是因为交互方式产生了根本性的重构。LLM带来的正是这种界面级重构:用户不再需要学习指令语法,不再需要理解模块依赖,不再需要辨别数据格式;他们只需要表达意图,然后让智能体去处理一切。就像安装软件时,你不再需要手写一个bash脚本去检测环境、下载依赖、配置路径——你只需要写一句话“在Ubuntu 22.04上安装Python 3.11”,LLM就能完成所有工作。这不是加速,这是消除“软件安装”这个本身就不该存在的认知负担。
这也解释了为什么“jaggedness”(参差不齐的能力分布)是当前LLM最令人困惑的特征。一个智能体可以优雅地重构十万行代码库,同时告诉你“去洗车店洗车”——这种矛盾在传统软件中不可能出现,因为代码的行为是一致的、可预测的。Karpathy将这种参差不齐归因于“可验证性”和“经济学”:那些拥有大量训练数据、高收入潜力的领域(如代码生成),被强化学习电路打磨得闪闪发光;而其他“长尾”任务则像在丛林中用砍刀开路。这个框架虽然不完美,但它给出了一个实用的行动指南:要充分利用LLM,你必须学会区分“在轨道上飞行”和“在丛林中开路”——前者可以放心地交给智能体,后者则需要你随时准备介入。
这个区分直接导向了Karpathy提到的第三个主题——“智能体原生经济”。他认为,未来的产品和服务将被分解为传感器、执行器和逻辑三个部分,并分布在1.0、2.0和3.0三种计算范式上。逻辑指的是传统的确定性计算,2.0是神经网络概率推理,3.0则是LLM驱动的自我组织智能。企业需要重新思考如何让信息对LLM“最大可读”——也就是以机器可理解的方式结构化知识,以便智能体能够自主决策和行动。这不仅仅是技术问题,更是组织架构和招聘策略的问题。智能体原生经济需要一种全新的工程师:他们既懂经典软件的严谨性,又懂神经网络的灵活性,还懂得如何设计提示词和智能体协作流程。这种人才目前在市场上极度稀缺,因为教育体系仍然在培养“纯后端工程师”或“纯数据科学家”,而不是这种混合型“智能体工程师”。
那么,这个“新计算范式”到底有多真实?反对意见认为,这不过是一场由资本推高的叙事泡沫。Sonar 4.0的发布、Claude Code的插件集成、各大模型的迭代更新——这些都被包装成“里程碑”,但实际体验仍然充满缺陷。LLM会产生幻觉,会执行错误的命令,会泄露隐私数据。更重要的是,它永远无法完全替代人类的判断力——尤其是在高风险决策中。这些批评是合理的。但真正的问题不是LLM是否完美,而是它是否已经打开了新的可能性空间,并且这个空间正在吸引越来越多的资源和人才。从Karpathy的发言到Reddit上的技术讨论,再到Sonar 4.0和Claude Code的实际产品更新,信号正在从分散走向收敛。也许我们正处于一个典型的“低估长期影响、高估短期影响”的时刻。但无论如何,产品逻辑的基石已经松动。
回到Karpathy的第一个例子:一个完全不需要传统代码的“menugen”应用。如果我们认真对待这个例子,就会发现它隐含了一个颠覆性结论:软件开发的“门槛”正在急剧降低。任何能够清晰描述问题的人——不管他们会不会编程——都可能成为“软件创造者”。这不是说程序员会被取代,而是说“编程”这个概念本身在扩展。未来的编程可能80%是用自然语言描述意图,20%是用传统代码处理那些需要精确定义的边界情况。这种转变将从根本上改变软件行业的供需结构、创新速度和竞争格局。
当然,我们不必立刻接受“自我组织的神经文明”这种宏大叙事。但我们可以接受一个更温和的版本:LLM正在让一些之前“不经济”或“不可能”的产品变得可行。知识库就是一个典型例子——在LLM之前,构建一个能够从任意来源、任意格式的数据中提取知识并回答问题的系统,需要昂贵的NLP管道和复杂的规则引擎。现在,一个简单的RAG(检索增强生成)架构就能实现80%的功能。这种“80%解决方案”的扩散,正在改变“什么值得做”的判断标准。
这就是为什么“LLM只是加速器”是一个危险的误解。它让我们忽略了那些正在发生但难以量化的变化:人们开始用自然语言做数据分析,用对话界面管理项目,用智能体调度任务。这些变化不是使原有流程更快,而是使原有流程变得多余。当“写一个SQL查询”被“问一个问题”取代时,不是因为SQL查询变快了,而是因为“查询”这个动作本身被重新定义了。
最终,Karpathy的讲话和围绕它的讨论指向了一个不可回避的问题:我们是否准备好迎接一个“智能不足”的世界?在智能体原生经济中,产品成功的钥匙不再是“写出最优雅的代码”,而是“设计出最清晰的意图表达系统”。LLM的参差不齐意味着我们永远需要人类的判断力来划定边界。而那些能够平衡“飞行”与“开路”、把握“可验证”与“不可验证”边界的人,将定义下一个十年。
这不是一个技术问题,而是关于我们如何理解“计算”本身。当计算从一个精确的、确定性的过程,变成一个概率的、自我组织的、充满不确定性的过程时,我们衡量“效率”和“创新”的标准也必须改变。LLM不只是让轮子转得更快——它正在重新发明轮子的形状。而大多数人还在用原来的尺子去量它的速度。
参考来源
- Toward Self-Organizing Neural Civilizations of Intelligence - https://www.reddit.com/r/IT4Research/comments/1t9labi/toward_selforganizing_neural_civilizations_of/
- [Final New Update]: TIFU by importing bees to Uruguay + 4-Year Update - https://www.reddit.com/r/BestofRedditorUpdates/comments/1t9s6kl/final_new_update_tifu_by_importing_bees_to/
- Fireside chat at Sequoia Ascent 2026 from a ~week ago. Some highlights:
- The first theme I tried to push on is that LLMs are about a lot more than just speeding up what existed before (e.g. coding). Three examples of new horizons:
- 1. menugen: an app that can be fully engulfed by LLMs, with no classical code needed: input an image, output an image and an LLM can natively do the thing.
- 2. install .md skills instead of install .sh scripts. Why create a complex Software 1.0 bash script for e.g. installing a piece of software if you can write the installation out in words and say "just show this to your LLM". The LLM is an advanced interpreter of English and can intelligently target installation to your setup, debug everything inline, etc.
- 3. LLM knowledge bases as an example of something that was *impossible* with classical code because it's computation over unstructured data (knowledge) from arbitrary sources and in arbitrary formats, including simply text articles etc.
- I pushed on these because in every new paradigm change, the obvious things are always in the realm of speeding up or somehow improving what existed, but here we have examples of functionality that either suddenly perhaps shouldn't even exist (1,2), or was fundamentally not possible before (3).
- The second (ongoing) theme is trying to explain the pattern of jaggedness in LLMs. How it can be true that a single artifact will simultaneously 1) coherently refactor a 100,000-line code base *and* 2) tell you to walk to the car wash to wash your car. I previously wrote about the source of this as having to do with verifiability of a domain, here I expand on this as having to also do with economics because revenue/TAM dictates what the frontier labs choose to package into training data distributions during RL. You're either in the data distribution (on the rails of the RL circuits) and flying or you're off-roading in the jungle with a machete, in relative terms. Still not 100% satisfied with this, but it's an ongoing struggle to build an accurate model of LLM capabilities if you wish to practically take advantage of their power while avoiding their pitfalls, which brings me to...
- Last theme is the agent-native economy. The decomposition of products and services into sensors, actuators and logic (split up across all of 1.0/2.0/3.0 computing paradigms), how we can make information maximally legible to LLMs, some words on the quickly emerging agentic engineering and its skill set, related hiring practices, etc., possibly even hints/dreams of fully neural computing handling the vast majority of computation with some help from (classical) CPU coprocessors. - https://nitter.net/karpathy/status/2049903821095354523#m