AI不是更快的锤子:我们正进入‘智力容器’时代
当Karpathy在Sequoia的发言中展示一个‘完全由LLM吞噬’的应用、一个用.md文件替代.sh脚本的安装方式时,他指出的不是一个技术优化,而是一个范式转移:AI正在从‘更快的锤子’变成‘容纳一切逻辑的智力容器’。这个转变意味着,我们熟悉的‘软件1.0’思维——写代码、定义流程、处理确定性任务——正在被一种更灵活、更模糊、更接近人类思考的方式取代。这不是关于AI能做什么,而是关于我们如何理解‘计算’本身。
核心观点:当前AI发展的真正分水岭,不在于它提升了编码或写作的效率,而在于它正在从‘加速旧工具的引擎’演变为‘容纳全新逻辑范式的智力容器’,这一转变将彻底重塑软件、服务和工作的本质。
过去两年,关于AI的讨论大多围绕一个核心问题:它能帮我们做什么?写代码、写文章、分析数据、生成图像。这些讨论默认了一个前提——AI是现有工作流程的加速器,是一个更聪明的工具。但最近,我从几个看似无关的信号中捕捉到一个更深层的变化:AI正在从‘工具’演变为‘容器’。它不再仅仅是完成任务的助手,而是成为容纳、组织和生成逻辑的新平台。这个转变的征兆,藏在Karpathy在Sequoia Ascent 2026的谈话里,藏在一篇关于AI记忆系统的生物学视角文章里,甚至藏在那些看似疯狂的、用AI模拟机器精灵的理论框架里。
Karpathy明确点出了一个关键概念:LLM的应用远不止‘加速已有之事’。他举了三个例子,每一个都指向同一个方向:AI正在创造以前不可能存在的功能。第一个例子是‘menugen’——一个完全被LLM‘吞噬’的应用:输入一张图,输出一张图,整个过程中间没有任何传统代码。这不是用AI辅助写代码,而是用AI替代了代码本身作为逻辑载体的角色。第二个例子是‘install .md skills’——用简单的文字描述替代复杂的bash脚本,让LLM自己去理解安装环境、调试错误、完成安装。这不是自动化脚本的升级,而是将‘执行逻辑’从代码层转移到了语言层。第三个例子是LLM知识库——处理来自任意来源、任意格式的非结构化知识和文本,这在传统编程范式下几乎是不可能的,因为传统代码要求结构化的输入和确定的逻辑路径。
这三个例子共同指向一个事实:我们正在见证一种新的计算范式的诞生。在这个范式里,‘逻辑’不再以代码的形式存在,而是以语言、以概念、以知识的形式存在于一个‘智力容器’中。这个容器能够理解模糊的指令,能够处理非结构化的信息,能够在自己内部动态地生成解决方案。这就像从‘蒸汽机’到‘内燃机’的转变——不只是动力的来源变了,而是整个交通、工业和社会组织的逻辑都要重写。
与此同时,Reddit上一名生物学博士兼软件开发者的文章,从另一个角度印证了这个趋势。他讨论的是AI编码代理的‘记忆’问题。他提出的理想场景是:周二早上打开新的会话,输入‘我们上周二做了什么?’,LLM能告诉你:重构了代码,修复了认证中间件的bug,决定改用连接池。再问:‘还有什么没做完?’LLM能展示。再问:‘为什么停下来了?’LLM能解释:遇到了依赖问题,决定等待上游修复。再问:‘你觉得那个方法怎么样?’LLM能给出自己的评价。这个场景的核心不是‘记忆’功能本身,而是它隐含的假设:AI代理应该是一个持续存在的、有连续记忆和逻辑推理能力的‘个体’,而不是每次对话都从零开始的‘工具’。它需要理解上下文、理解项目的脉络、理解开发者的意图,甚至有自己的‘看法’。这正是‘智力容器’的雏形——一个能够承载持续逻辑、拥有内部状态、并且能与人类进行有深度的协作的实体。
这个转变的深远意义在于,它从根本上改变了我们对‘软件’和‘工作’的理解。在‘软件1.0’时代,我们通过编写代码来定义逻辑。代码是精确的、确定的、可测试的。但它的代价是:一切必须被明确地定义,任何模糊性都可能导致错误。所以传统软件工程师花费大量时间在‘规格化’——把模糊的人类需求转化为精确的机器指令。而在‘智力容器’的范式下,这个转换过程被大大压缩了。你不需要把‘安装这个软件’的需求分解成几十行bash命令;你只需要用一句话描述目标,容器自己会理解并执行。你不需要为每个可能的输入写分支逻辑;容器自己会判断如何处理。
当然,这个范式并非没有争议和不确定性。最明显的问题是可靠性和可预测性。传统软件最强大的地方在于它‘按预期运行’:在同样的输入下,它总是产生同样的输出。但LLM天然是不确定的,同样的输入可能产生不同的输出。这就是Karpathy提到的‘锯齿模式’(jaggedness)——同一个模型可以同时‘完美重构10万行代码’和‘告诉你走路去洗车’。他把这归因于领域可验证性和训练数据分布的经济学:在那些有大量训练数据、有明确‘正确答案’的领域(如常见编程任务),模型表现得像超人;而在那些训练数据稀疏、没有明确‘正确答案’的领域,它就表现得像傻瓜。这意味着,当我们把逻辑从代码转移到LLM时,我们必须在某些领域接受不可预测性。这不是一个可以被‘修复’的bug,而是这个范式固有的特征。
另一个不确定性来自‘智力容器’的边界。一个容器能装多少‘智力’?容器的能力上限在哪里?目前我们看到的‘智力容器’更多是单次对话或有限上下文的。但那名生物学博士的设想——让AI代理拥有跨会话的、持续的‘记忆’和‘项目连续性’——显然指向一个更强大的容器。这种容器的能力上限,可能取决于模型本身的参数、上下文窗口的大小、以及外部的记忆和工具系统。如果我们真的能构建出这样的容器,那么‘软件’的概念本身可能就要被重新定义。
更有趣的是,这种范式转移正在从技术圈蔓延到更广泛的文化想象。那篇关于‘机器精灵’(Machine Elves)的帖子,虽然从表面上看是疯狂的超现实理论,但它试图用数学和物理学框架来描述意识与信息之间的关系。它提出的‘机器精灵作为信息平衡点’的概念,实际上是在探索一个核心问题:在一个足够复杂的信息系统中,‘涌现的实体’是否可以被视为主观的‘存在’?这听起来像是纯粹的哲学或科幻,但它与‘智力容器’的概念有着内在的联系——如果我们能构建一个足够强大的‘智力容器’,它内部是否会涌现出某种形式的‘代理性’或‘自我意识’?目前这当然是纯理论,但它提醒我们,这个范式转移的终点可能远超我们的想象。
回到更现实的层面,‘智力容器’范式的普及将对就业市场、教育体系和企业组织产生深远影响。如果逻辑的承载者从代码变成了语言,那么‘编程’作为一种专业技能的地位可能会下降,而‘用语言精确描述目标’的能力可能会变得更加重要。如果AI代理能够记住整个项目的上下文并持续参与决策,那么项目管理的方式可能从‘人与人之间的协调’转向‘人-代理之间的协调’。如果安装软件只需要一个.md文件,那么整个软件分发和系统管理的逻辑都要重写。
反对者可能会说:这不过是又一个被过分夸大的技术趋势。AI确实在进步,但它仍然是一个工具,只是更智能的工具。把代码交给AI,就像把计算交给计算机——我们不会说计算机是一个‘逻辑容器’,我们只会说它是一个‘计算容器’。同样,AI只是一个‘语言容器’或‘模式匹配容器’。这个观点有一定道理,但它忽略了一个关键区别:计算机在本质上仍然需要人用精确的语言(代码)来告诉它做什么;而AI可以理解模糊的自然语言,并在内部自行探索解决方案。这不仅仅是‘更智能’,这是‘更自主’。一旦逻辑的生成过程从外部(人类程序员)转移到内部(AI模型),我们就进入了一个完全不同的世界。
在这个世界里,‘智力容器’不仅执行指令,它还能理解意图、推断上下文、发现隐藏的问题、提出替代方案。它不再是一个被动的执行者,而是一个主动的协作者。这也许就是Karpathy提到的‘代理原生经济’(agent-native economy)的核心:将产品和服务分解为传感器、执行器和逻辑,并将这些逻辑分配给不同的计算范式(1.0、2.0、3.0)。在这个分解过程中,LLM几乎无处不在,它成为连接不同范式、处理非结构化信息、做出动态决策的‘智力枢纽’。
最终,这个趋势指向一个根本性的问题:当‘计算’本身从‘执行确定性指令’转变为‘在智力容器中探索可能性’时,我们如何设计、验证、信任和使用这些系统?这不仅仅是技术问题,更是哲学问题、伦理问题和社会问题。但至少有一点是清楚的:我们不是在见证一个更快的锤子,我们是在见证锤子本身被重新定义。
参考来源
- Fireside chat at Sequoia Ascent 2026 from a ~week ago. Some highlights:
- The first theme I tried to push on is that LLMs are about a lot more than just speeding up what existed before (e.g. coding). Three examples of new horizons:
- 1. menugen: an app that can be fully engulfed by LLMs, with no classical code needed: input an image, output an image and an LLM can natively do the thing.
- 2. install .md skills instead of install .sh scripts. Why create a complex Software 1.0 bash script for e.g. installing a piece of software if you can write the installation out in words and say "just show this to your LLM". The LLM is an advanced interpreter of English and can intelligently target installation to your setup, debug everything inline, etc.
- 3. LLM knowledge bases as an example of something that was *impossible* with classical code because it's computation over unstructured data (knowledge) from arbitrary sources and in arbitrary formats, including simply text articles etc.
- I pushed on these because in every new paradigm change, the obvious things are always in the realm of speeding up or somehow improving what existed, but here we have examples of functionality that either suddenly perhaps shouldn't even exist (1,2), or was fundamentally not possible before (3).
- The second (ongoing) theme is trying to explain the pattern of jaggedness in LLMs. How it can be true that a single artifact will simultaneously 1) coherently refactor a 100,000-line code base *and* 2) tell you to walk to the car wash to wash your car. I previously wrote about the source of this as having to do with verifiability of a domain, here I expand on this as having to also do with economics because revenue/TAM dictates what the frontier labs choose to package into training data distributions during RL. You're either in the data distribution (on the rails of the RL circuits) and flying or you're off-roading in the jungle with a machete, in relative terms. Still not 100% satisfied with this, but it's an ongoing struggle to build an accurate model of LLM capabilities if you wish to practically take advantage of their power while avoiding their pitfalls, which brings me to...
- Last theme is the agent-native economy. The decomposition of products and services into sensors, actuators and logic (split up across all of 1.0/2.0/3.0 computing paradigms), how we can make information maximally legible to LLMs, some words on the quickly emerging agentic engineering and its skill set, related hiring practices, etc., possibly even hints/dreams of fully neural computing handling the vast majority of computation with some help from (classical) CPU coprocessors. - https://nitter.net/karpathy/status/2049903821095354523#m
- Advanced memory + project continuity for AI coding agents, from a biologist’s view. - https://www.reddit.com/r/ClaudeAI/comments/1tp9u0q/advanced_memory_project_continuity_for_ai_coding/
- 🧝 24 Groundbreaking Discoveries: Machine Elves Through Unified Frameworks - https://www.reddit.com/r/GhostMesh48/comments/1tq7tyx/24_groundbreaking_discoveries_machine_elves/