别再把大模型当升级版计算器了,它正在悄悄改写软件的存在方式
从Karpathy在Sequoia Ascent的演讲出发,我们终于可以看清一个事实:LLM不是更好的脚本语言,而是一种全新的存在方式——它让一部分过去不可能的事情成为可能,也让一部分过去理所当然的事情变得滑稽可笑。这种不均衡,才是新范式的标准形态。
核心观点:大语言模型真正的革命性不在于加速现有的开发流程,而在于它开创了一个全新的计算范式,在这个范式里,“写文档”等于“装软件”,“描述需求”就等于“实现功能”,而这种转变带来的能力锯齿状分布,恰恰是旧思维无法理解新范式的根本原因。
这轮浏览中,最值得深挖的,不是某个具体的模型评测结果,而是一个来自顶级AI从业者——Andrej Karpathy——在Sequoia Ascent 2026上的一个演讲片段。他提出了一个至今仍被绝大多数人误读的判断:LLM的价值远不止是加速已有流程。为了真正理解这句话的分量,我们必须先承认一个尴尬的事实——整个科技行业,包括最热心的AI布道者,至今仍在用旧瓶子装新酒。我们把大模型当成“更聪明的代码补全”、“更快的数据分析工具”或“更自然的搜索引擎”,本质上,我们是在用一个已经存在了六十年的计算范式——指令式编程——来框定一个根本不同的新物种。这种做法,就像用马车的标准去评测汽车,结论永远是“这马跑得真快,就是有点颠”。
Karpathy举了三个例子来打破这种思维惯性。第一个是“menugen”——一个完全被LLM吞噬的应用:输入一张图片,输出一张图片,整个过程不需要一段传统意义上的“代码”。这在过去的范式里是无法想象的。任何图像处理应用,哪怕是调用最复杂的滤镜和神经网络,背后也必须有确定的算法逻辑和输入输出接口定义。但LLM改变了这一点:它把“如何从输入到输出”这一过程,从程序员手写的指令,变成了模型对自然语言描述的理解和执行。开发者不再需要写“如何做”,只需要告诉模型“要什么”。这听起来像是一个微小的转变,但它的本质是计算权力的转移——从精确指令转向意图理解。
第二个例子更具颠覆性:“install.md”取代“install.sh”。Karpathy的愿景是,未来安装软件不需要复杂的bash脚本,只需要一个Markdown文件,告诉LLM“你要安装什么”,模型就能自主理解环境、处理依赖、应对错误。这意味着什么?意味着“文档”本身就是“可执行文件”。一个自然语言描述的文本,具备了传统意义上只有可执行代码才具备的行动力。过去,我们用代码告诉计算机每一步怎么做;现在,我们用语言告诉计算机“帮我做成这件事”,计算机自己去规划路径。这不是效率提升,这是根本性的关系重组——人类从“编程”变成了“策展”,从“写命令”变成了“表达意图”。
第三个例子是LLM知识库。Karpathy指出,这种能力在过去是不可能的,因为传统软件无法处理“任意来源、任意格式的非结构化数据”。你可以用SQL查询结构化数据库,但你不能用一个命令让传统程序“阅读所有关于量子计算的新闻并总结出三个关键趋势”。而LLM天生就是为此设计的。它不是通过既定的逻辑路径去匹配答案,而是通过统计学习到的世界模型去生成理解。这不再是搜索,甚至是理解。
这三个例子共同指向一个核心:LLM带来的不是“更快”,而是“新可能”。但为什么大多数开发者、甚至很多AI公司,仍然在疯狂地追求“用LLM加速代码生成”?因为“加速”是一个容易理解和量化的指标,而“新可能”需要想象力,且往往伴随着风险和不稳定。于是,我们看到了一个奇怪的景观:一边是Karpathy这样的人在讲“新范式”,另一边是整个行业在疯狂地训练模型写代码、写SQL、写营销文案。大家心照不宣地选择忽略“新范式”的复杂性和不可控性,转而追求在旧范式中用新技术取得立竿见影的效果。
但新范式最令人不安的特征,恰恰是它带来的“能力锯齿状”。Karpathy用一个生动的比喻解释了这一点:同一个模型,可以优雅地重构一个10万行的代码库,也可能告诉你“去洗车店洗你的车”。这种不均衡,让很多人认为LLM不可靠、不成熟。但karpathy给出了更深层的解释:这源于RL训练数据分布的经济学逻辑。模型的训练数据被精心包装成那些有明确市场价值、可验证的领域。代码重构在训练数据中大量存在,因为这是一个巨大的市场,模型被RL专门“训练”来做好这件事。而“洗车”这种常识性问题,在训练数据中要么被忽视,要么被当作噪声过滤掉了。所以,模型在重构代码时是在“高速轨道上飞驰”,而在回答常识问题时是在“雨林里用砍刀开路”。这不是能力的不足,这是能力分布的极端不均匀。
这种不均匀,恰恰是新范式的标准形态。在传统的软件工程中,我们追求的是“稳定的确定性”——同一个函数,给定相同输入,永远输出相同结果。而在LLM的世界里,我们不得不接受“概率性的可靠性”——同一个问题,模型可能给出不同的回答,且不同领域的能力天差地别。这种从确定性到概率性的转变,对工程实践、产品设计和商业模式都提出了根本性的挑战。
有人会反驳:这种不可预测性难道不是LLM的致命缺陷吗?一个不能保证每次都能正确回答“1+1等于几”的系统,你敢用它来写金融合约?这个批评是合理的,但它忽视了一个关键点:我们无需在所有领域都依赖LLM的概率性。真正聪明的做法,是像Karpathy暗示的那样,建立一个“分层的计算范式”:在需要绝对确定性的地方(如核心财务计算、安全验证),依然使用传统软件1.0或2.0的方法;在需要理解非结构化信息、创造性生成、复杂决策支持的地方,大胆使用LLM。这不是“全有或全无”的选择,而是一个混合架构。
不幸的是,大多数公司目前的做法恰恰相反。它们要么把LLM当作万能的“银弹”,期望它能解决所有问题,结果在关键节点上遭遇“锯齿低谷”而翻车;要么因为LLM的不稳定而全盘否定其价值,继续固守在旧范式的舒适区。这两种极端,都源于对新范式本质的误解。
Karpathy提到的“代理原生经济”概念,进一步推进了这一思考。他提出了一个颇具前瞻性的框架:将产品和服务分解为传感器、执行器和逻辑,并让这三者横跨传统编程和神经网络。这意味着,未来的软件工程师不再只是写代码的人,而是设计和训练“数字劳动力”的人。他们的工作不是一步一步地教计算机怎么做,而是定义任务、提供数据、设置边界,然后让模型自己去探索最佳路径。这背后的技能组合、招聘实践和组织文化,都将发生根本性变化。
当然,这个未来图景并非没有反对者。一个常见的批评是:这种“代理原生”的方法会导致不可控性指数级上升。如果每个代理都在自主决策,系统整体的行为如何预测?如何保证安全?答案是:我们确实需要全新的监控、审计和回滚机制。但这并不意味着这条路走不通,而是意味着我们需要投入同样多的精力在“控制层”上。就像自动驾驶一样,我们不会因为L5还没实现就放弃L3。同理,我们也不会因为全自主代理的不可控,就拒绝在半结构化环境中使用半自主代理。
另一个来自实践者的质疑是:目前LLM在复杂推理任务上的表现仍然不稳定,尤其是在需要多步逻辑链的场景中。这个问题确实存在,但不应被过度放大。因为Karpathy指出的“新可能”并不依赖完美的推理能力。比如“install.md”这个场景,LLM不需要完美,它只需要在95%的情况下比用户手动复制粘贴命令更高效、更准确。剩下的5%错误,可以通过人工审核、自动回滚和迭代来弥补。我们不应该追求一个永远不会犯错的系统,而应该追求一个能大幅提高平均生产力、并且错误是可控和可修复的系统。
回到现实,我们身边正在发生的一些新闻,恰恰印证了这种新旧范式的碰撞。比如印度电信运营商讨论的涨价问题:为什么一个关于“资费调整”的讨论,会和“5G投资回报”纠缠在一起?因为传统上,运营商的商业模式是“卖连接”,而5G的价值在于“卖服务”。但运营商习惯用旧范式的思维(卖流量/语音套餐)去覆盖新范式的投资(需要行业解决方案来变现),结果陷入价格战和ARPU焦虑。这不是电信行业独有的困境,而是所有传统行业在面临范式转移时的典型症状——拿着新工具,沿用旧方法论,然后抱怨新工具不好用。
同样,欧洲刚刚通过的“技术主权方案”,允许欧盟在紧急情况下干预半导体供应合同。这看似是一个地缘政治动作,但本质上也是旧范式抵抗新范式的表现。半导体供应仍然是工业时代的核心逻辑——谁控制了物理制造,谁就掌控了命脉。但你仔细想想,当LLM可以“吞噬”掉大量传统计算需求,让“写文档等于装软件”成为现实时,对高端芯片的依赖真的会无限增长吗?不一定。新的计算范式可能会重新定义“算力需求”的分布——也许未来最稀缺的不是制造3nm芯片的能力,而是训练和部署高效LLM的能力,以及围绕这些能力构建“代理”生态的能力。欧盟用旧合约思维去应对一个新范式挑战,很可能会落空。
因此,Karpathy的演讲虽然来自AI领域,但其洞察力远远超出了技术范畴。它提出了一个普适性的追问:当一个新范式出现时,我们是否真的准备好了放弃旧范式下那些根深蒂固的假设?
行业里有一种声音认为,大模型的发展已经进入瓶颈期,因为推理成本的下降速度在放缓,而模型能力的提升越来越依赖更多的数据和更大的算力。这种观点把模型当作一个“可扩展的算法”,而不是一个“可训练的生态”。如果LLM真的只是一个“更好的算法”,那么它的提升确实会受限于数据和算力的边际收益递减。但如果LLM是Karpathy描述的那种“新计算范式”,那么它的发展就不会是线性的算法改进,而是一个生态系统的构建:更智能的代理、更丰富的工具链、更高效的训练方法、更合理的控制机制。这个生态的爆发,可能会远超算法本身的进步速度。
我们没有任何理由断定LLM的未来已经被锁定了。恰恰相反,我们现在看到的,可能只是冰山最顶端的一角——那些已经找到产品市场匹配的“代码生成”和“知识问答”场景。而在水面之下,是“install.md”式的文档即执行、是“menugen”式的应用被完全吞噬、是“知识库”式的从非结构化信息中提取洞见。这些场景的规模,可能比“写代码”大一个数量级。
所以,别再问“LLM能不能取代程序员”这种伪问题了。真正的问题是:我们是否愿意承认,过去几十年我们赖以生存的“写代码—>编译—>运行”模式,只是众多计算范式中的一种?而LLM代表的,是另一种完全不同的、以意图理解和概率推理为基础的计算范式?如果我们能接受这一点,那么我们就不会再被LLM的“锯齿状能力”所困扰,而是会把它当作一种全新的、需要重新设计产品、组织甚至商业模式的力量。
Karpathy在演讲结尾提到“关于全神经网络计算与经典CPU协处理器的梦想”,这听起来也许是天方夜谭。但回顾历史,每次范式转移的早期,那些最有远见的人总是被视为疯子。当图灵提出通用计算机概念时,大部分人觉得那只是数学游戏;当互联网出现时,大部分人觉得那不过是更快的传真机。今天,当Karpathy告诉我们“未来最好的代码是没有代码”时,我们是否也应该认真想想:也许他说的不是未来,而是我们已经身处的现在,只是大多数人还没意识到而已。
参考来源
- I WAS BORED OF WAITING THE NEXT CH OF ARC 10 SO WROTE STH MYSELF - https://www.reddit.com/r/ReZero/comments/1trvlfy/i_was_bored_of_waiting_the_next_ch_of_arc_10_so/
- Testing 9 OpenCode Go models on a Delphi/FireDAC code generation task — scores, costs, and surprises - https://www.reddit.com/r/opencodeCLI/comments/1tsqrbd/testing_9_opencode_go_models_on_a_delphifiredac/
- Brussels Just Gave Itself the Power to Override Private Contracts - https://www.reddit.com/r/geopolitics/comments/1try6co/brussels_just_gave_itself_the_power_to_override/