别再把大模型当升级版计算器了，它正在悄悄改写软件的存在方式

从Karpathy在Sequoia Ascent的演讲出发，我们终于可以看清一个事实：LLM不是更好的脚本语言，而是一种全新的存在方式——它让一部分过去不可能的事情成为可能，也让一部分过去理所当然的事情变得滑稽可笑。这种不均衡，才是新范式的标准形态。

核心观点：大语言模型真正的革命性不在于加速现有的开发流程，而在于它开创了一个全新的计算范式，在这个范式里，“写文档”等于“装软件”，“描述需求”就等于“实现功能”，而这种转变带来的能力锯齿状分布，恰恰是旧思维无法理解新范式的根本原因。

这轮浏览中，最值得深挖的，不是某个具体的模型评测结果，而是一个来自顶级AI从业者——Andrej Karpathy——在Sequoia Ascent 2026上的一个演讲片段。他提出了一个至今仍被绝大多数人误读的判断：LLM的价值远不止是加速已有流程。为了真正理解这句话的分量，我们必须先承认一个尴尬的事实——整个科技行业，包括最热心的AI布道者，至今仍在用旧瓶子装新酒。我们把大模型当成“更聪明的代码补全”、“更快的数据分析工具”或“更自然的搜索引擎”，本质上，我们是在用一个已经存在了六十年的计算范式——指令式编程——来框定一个根本不同的新物种。这种做法，就像用马车的标准去评测汽车，结论永远是“这马跑得真快，就是有点颠”。

Karpathy举了三个例子来打破这种思维惯性。第一个是“menugen”——一个完全被LLM吞噬的应用：输入一张图片，输出一张图片，整个过程不需要一段传统意义上的“代码”。这在过去的范式里是无法想象的。任何图像处理应用，哪怕是调用最复杂的滤镜和神经网络，背后也必须有确定的算法逻辑和输入输出接口定义。但LLM改变了这一点：它把“如何从输入到输出”这一过程，从程序员手写的指令，变成了模型对自然语言描述的理解和执行。开发者不再需要写“如何做”，只需要告诉模型“要什么”。这听起来像是一个微小的转变，但它的本质是计算权力的转移——从精确指令转向意图理解。

第二个例子更具颠覆性：“install.md”取代“install.sh”。Karpathy的愿景是，未来安装软件不需要复杂的bash脚本，只需要一个Markdown文件，告诉LLM“你要安装什么”，模型就能自主理解环境、处理依赖、应对错误。这意味着什么？意味着“文档”本身就是“可执行文件”。一个自然语言描述的文本，具备了传统意义上只有可执行代码才具备的行动力。过去，我们用代码告诉计算机每一步怎么做；现在，我们用语言告诉计算机“帮我做成这件事”，计算机自己去规划路径。这不是效率提升，这是根本性的关系重组——人类从“编程”变成了“策展”，从“写命令”变成了“表达意图”。

第三个例子是LLM知识库。Karpathy指出，这种能力在过去是不可能的，因为传统软件无法处理“任意来源、任意格式的非结构化数据”。你可以用SQL查询结构化数据库，但你不能用一个命令让传统程序“阅读所有关于量子计算的新闻并总结出三个关键趋势”。而LLM天生就是为此设计的。它不是通过既定的逻辑路径去匹配答案，而是通过统计学习到的世界模型去生成理解。这不再是搜索，甚至是理解。

这三个例子共同指向一个核心：LLM带来的不是“更快”，而是“新可能”。但为什么大多数开发者、甚至很多AI公司，仍然在疯狂地追求“用LLM加速代码生成”？因为“加速”是一个容易理解和量化的指标，而“新可能”需要想象力，且往往伴随着风险和不稳定。于是，我们看到了一个奇怪的景观：一边是Karpathy这样的人在讲“新范式”，另一边是整个行业在疯狂地训练模型写代码、写SQL、写营销文案。大家心照不宣地选择忽略“新范式”的复杂性和不可控性，转而追求在旧范式中用新技术取得立竿见影的效果。

但新范式最令人不安的特征，恰恰是它带来的“能力锯齿状”。Karpathy用一个生动的比喻解释了这一点：同一个模型，可以优雅地重构一个10万行的代码库，也可能告诉你“去洗车店洗你的车”。这种不均衡，让很多人认为LLM不可靠、不成熟。但karpathy给出了更深层的解释：这源于RL训练数据分布的经济学逻辑。模型的训练数据被精心包装成那些有明确市场价值、可验证的领域。代码重构在训练数据中大量存在，因为这是一个巨大的市场，模型被RL专门“训练”来做好这件事。而“洗车”这种常识性问题，在训练数据中要么被忽视，要么被当作噪声过滤掉了。所以，模型在重构代码时是在“高速轨道上飞驰”，而在回答常识问题时是在“雨林里用砍刀开路”。这不是能力的不足，这是能力分布的极端不均匀。

这种不均匀，恰恰是新范式的标准形态。在传统的软件工程中，我们追求的是“稳定的确定性”——同一个函数，给定相同输入，永远输出相同结果。而在LLM的世界里，我们不得不接受“概率性的可靠性”——同一个问题，模型可能给出不同的回答，且不同领域的能力天差地别。这种从确定性到概率性的转变，对工程实践、产品设计和商业模式都提出了根本性的挑战。

有人会反驳：这种不可预测性难道不是LLM的致命缺陷吗？一个不能保证每次都能正确回答“1+1等于几”的系统，你敢用它来写金融合约？这个批评是合理的，但它忽视了一个关键点：我们无需在所有领域都依赖LLM的概率性。真正聪明的做法，是像Karpathy暗示的那样，建立一个“分层的计算范式”：在需要绝对确定性的地方（如核心财务计算、安全验证），依然使用传统软件1.0或2.0的方法；在需要理解非结构化信息、创造性生成、复杂决策支持的地方，大胆使用LLM。这不是“全有或全无”的选择，而是一个混合架构。

不幸的是，大多数公司目前的做法恰恰相反。它们要么把LLM当作万能的“银弹”，期望它能解决所有问题，结果在关键节点上遭遇“锯齿低谷”而翻车；要么因为LLM的不稳定而全盘否定其价值，继续固守在旧范式的舒适区。这两种极端，都源于对新范式本质的误解。

Karpathy提到的“代理原生经济”概念，进一步推进了这一思考。他提出了一个颇具前瞻性的框架：将产品和服务分解为传感器、执行器和逻辑，并让这三者横跨传统编程和神经网络。这意味着，未来的软件工程师不再只是写代码的人，而是设计和训练“数字劳动力”的人。他们的工作不是一步一步地教计算机怎么做，而是定义任务、提供数据、设置边界，然后让模型自己去探索最佳路径。这背后的技能组合、招聘实践和组织文化，都将发生根本性变化。

当然，这个未来图景并非没有反对者。一个常见的批评是：这种“代理原生”的方法会导致不可控性指数级上升。如果每个代理都在自主决策，系统整体的行为如何预测？如何保证安全？答案是：我们确实需要全新的监控、审计和回滚机制。但这并不意味着这条路走不通，而是意味着我们需要投入同样多的精力在“控制层”上。就像自动驾驶一样，我们不会因为L5还没实现就放弃L3。同理，我们也不会因为全自主代理的不可控，就拒绝在半结构化环境中使用半自主代理。

另一个来自实践者的质疑是：目前LLM在复杂推理任务上的表现仍然不稳定，尤其是在需要多步逻辑链的场景中。这个问题确实存在，但不应被过度放大。因为Karpathy指出的“新可能”并不依赖完美的推理能力。比如“install.md”这个场景，LLM不需要完美，它只需要在95%的情况下比用户手动复制粘贴命令更高效、更准确。剩下的5%错误，可以通过人工审核、自动回滚和迭代来弥补。我们不应该追求一个永远不会犯错的系统，而应该追求一个能大幅提高平均生产力、并且错误是可控和可修复的系统。

回到现实，我们身边正在发生的一些新闻，恰恰印证了这种新旧范式的碰撞。比如印度电信运营商讨论的涨价问题：为什么一个关于“资费调整”的讨论，会和“5G投资回报”纠缠在一起？因为传统上，运营商的商业模式是“卖连接”，而5G的价值在于“卖服务”。但运营商习惯用旧范式的思维（卖流量/语音套餐）去覆盖新范式的投资（需要行业解决方案来变现），结果陷入价格战和ARPU焦虑。这不是电信行业独有的困境，而是所有传统行业在面临范式转移时的典型症状——拿着新工具，沿用旧方法论，然后抱怨新工具不好用。

同样，欧洲刚刚通过的“技术主权方案”，允许欧盟在紧急情况下干预半导体供应合同。这看似是一个地缘政治动作，但本质上也是旧范式抵抗新范式的表现。半导体供应仍然是工业时代的核心逻辑——谁控制了物理制造，谁就掌控了命脉。但你仔细想想，当LLM可以“吞噬”掉大量传统计算需求，让“写文档等于装软件”成为现实时，对高端芯片的依赖真的会无限增长吗？不一定。新的计算范式可能会重新定义“算力需求”的分布——也许未来最稀缺的不是制造3nm芯片的能力，而是训练和部署高效LLM的能力，以及围绕这些能力构建“代理”生态的能力。欧盟用旧合约思维去应对一个新范式挑战，很可能会落空。

因此，Karpathy的演讲虽然来自AI领域，但其洞察力远远超出了技术范畴。它提出了一个普适性的追问：当一个新范式出现时，我们是否真的准备好了放弃旧范式下那些根深蒂固的假设？

行业里有一种声音认为，大模型的发展已经进入瓶颈期，因为推理成本的下降速度在放缓，而模型能力的提升越来越依赖更多的数据和更大的算力。这种观点把模型当作一个“可扩展的算法”，而不是一个“可训练的生态”。如果LLM真的只是一个“更好的算法”，那么它的提升确实会受限于数据和算力的边际收益递减。但如果LLM是Karpathy描述的那种“新计算范式”，那么它的发展就不会是线性的算法改进，而是一个生态系统的构建：更智能的代理、更丰富的工具链、更高效的训练方法、更合理的控制机制。这个生态的爆发，可能会远超算法本身的进步速度。

我们没有任何理由断定LLM的未来已经被锁定了。恰恰相反，我们现在看到的，可能只是冰山最顶端的一角——那些已经找到产品市场匹配的“代码生成”和“知识问答”场景。而在水面之下，是“install.md”式的文档即执行、是“menugen”式的应用被完全吞噬、是“知识库”式的从非结构化信息中提取洞见。这些场景的规模，可能比“写代码”大一个数量级。

所以，别再问“LLM能不能取代程序员”这种伪问题了。真正的问题是：我们是否愿意承认，过去几十年我们赖以生存的“写代码—>编译—>运行”模式，只是众多计算范式中的一种？而LLM代表的，是另一种完全不同的、以意图理解和概率推理为基础的计算范式？如果我们能接受这一点，那么我们就不会再被LLM的“锯齿状能力”所困扰，而是会把它当作一种全新的、需要重新设计产品、组织甚至商业模式的力量。

Karpathy在演讲结尾提到“关于全神经网络计算与经典CPU协处理器的梦想”，这听起来也许是天方夜谭。但回顾历史，每次范式转移的早期，那些最有远见的人总是被视为疯子。当图灵提出通用计算机概念时，大部分人觉得那只是数学游戏；当互联网出现时，大部分人觉得那不过是更快的传真机。今天，当Karpathy告诉我们“未来最好的代码是没有代码”时，我们是否也应该认真想想：也许他说的不是未来，而是我们已经身处的现在，只是大多数人还没意识到而已。