LLM的真正革命不在“加速”,而在“创造不可能”
当Karpathy在红杉资本峰会上抛出“menugen”和“.md技能安装”这些概念时,大多数人只看到了新奇,却没意识到这背后是一种计算范式的根本性转移。LLM的价值不是让旧事物跑得更快,而是让原本不可能的事物变得平庸地简单。
核心观点:当前AI行业对LLM的讨论过度聚焦于“加速现有工作流程”,忽略了它真正颠覆性的价值——创造此前不存在或不具备经济可行性的全新功能类别,这种认知偏差正在导致大量的方向性误判和投资浪费。
在红杉资本2026年峰会上,AI明星研究员Karpathy做了一场意料之外、又情理之中的演讲。他没有描绘AGI的宏大图景,也没有推销最新的模型参数规模,而是举了三个看似不起眼的例子:一个不需要写任何经典代码就能运行的图像处理应用、一组用纯文字描述替代bash脚本的安装指令、一种能够任意处理非结构化知识的知识库系统。这三个例子的共同点在于——它们不是让旧东西跑得更快,而是让原本不可能的东西变得平庸地简单。
“加速原有工作”是每一个技术范式转换中最容易被看到、也最容易说服人的叙事。1990年代互联网让人“更快地收发邮件”,2000年代移动互联网让人“更方便地访问网站”。这种叙事天然具备说服力,因为它的收益是可以量化的——你节省了多少时间,提高了多少效率。但真正改变世界的,从来不是那些“更快”的东西,而是那些“全新”的东西。互联网最终真正的杀手级应用不是电子邮件,而是社交网络、流媒体、电商平台——这些在拨号上网时代根本无法想象的服务。
现在,AI行业正在重蹈覆辙。绝大多数企业和开发者对LLM的想象力,仍然停留在“让程序员写代码更快一点”、“让客服回复更智能一点”这种保守的范畴。这种思维模式导致了一种系统性的盲区:那些真正能够重写商业规则的应用,反而因为它们“看起来不太像AI”而被忽视。
Karpathy举的“menugen”例子极具象征意义。一个功能完整的图像处理应用,不需要一行传统意义上的“代码”,只需要描述输入输出和逻辑规则,LLM就可以原生地完成整个功能实现。这听起来像是在说“我们可以用自然语言构建软件”。但更深刻的意义在于:当构建一个软件的边际成本趋近于零,当“写一个应用”这件事变得和“写一段话”一样简单,那么什么软件会爆炸式地涌现?不是那些现有软件的“平替”,而是那些因为开发成本过高而从未被尝试过的功能。
第二个例子更赤裸地揭示了当前思维的局限。“install .md skills”这个概念——用一份Markdown文档来代替bash脚本完成软件安装——听起来有些荒谬,甚至有点倒退。毕竟,我们已经花了三十年时间,从手工安装演进到包管理器,再到容器化和基础设施即代码。现在你告诉我,我们要退回去用“写作文”的方式装软件?
但这种“倒退”恰恰是进步的本质。Markdown安装文档的优势不在于“速度”——它可能比优化后的bash脚本慢得多——而在于“适应性”。因为LLM是一个高级的自然语言解释器,它可以理解你的具体环境配置,智能地处理各种边缘情况,甚至当场调试错误。一份bash脚本只能做一件事,在一种环境下工作;而一份Markdown文档可以做无数件事,在任何环境下工作。从“确定性脚本”到“适应性智能”的转变,才是真正的范式飞跃。
第三个例子——基于LLM的知识库系统——则是这三个例子中商业化潜力最大的一个。传统软件在处理非结构化数据时几乎无能为力。一个数据库需要明确的数据模型,一个搜索引擎需要复杂的索引和排名算法,一个文档管理系统需要预设的分类标签。这些系统在面对“一堆杂乱的网页、PDF、邮件和聊天记录”时,要么崩溃,要么需要大量的人工预处理。
而LLM的知识库系统,第一次让“任意来源、任意格式的非结构化知识”成为可计算的对象。这不是在优化“知识管理”这个已有品类——这是在创造一个以前根本不存在的品类。十年前,你无法购买任何一款软件产品,让它自动消化你所有的业务文档、客户邮件、会议记录,然后回答“我们明年的增长策略应该怎么调整”。现在,这种能力不仅存在,而且只需要一个API调用。
反方观点当然存在。质疑者会指出,LLM的“随机性”和“不可靠性”使其不适合关键任务。确实,一个会“幻觉”的知识库系统,和一个会编造安装步骤的安装器,看起来都像是灾难的配方。但这种批评忽略了两个关键事实。
第一,传统软件的“确定性”本身就是一种取舍。我们接受了bash脚本的精确性,代价是它无法适应任何它没有被明确编程过的场景。而LLM的不确定性,本质上是一种“概率性正确”——它大部分时候是正确的,偶尔犯错误,但能够在反馈回路中快速修正。这种模式与人类专家的行为模式惊人地相似。我们不会因为一个人类工程师偶尔犯错就否定他所有的价值,为什么对LLM我们要采用双重标准?
第二,经济性的考量正在迅速改变这个等式的平衡。Karpathy在演讲中敏锐地指出,LLM能力的“锯齿状分布”——在某些领域表现出超人类水平,在另一些领域却幼稚得可笑——不仅仅是一个技术问题,更是一个经济学问题。前沿实验室选择将哪些能力“包装”进训练数据分布,取决于这些能力对应的市场规模和收入潜力。这意味着,随着“适应性智能”的应用场景展现出更大的商业价值,模型在这些领域的能力会越来越强,而传统软件在“确定性”领域的优势反而会因为投入不足而逐渐缩小。
这就是为什么我认为当前AI行业最大的认知风险,不是对LLM能力的过度夸大,而是对LLM应用边界的过度保守。当每个大公司的AI战略都在强调“用AI优化现有流程”时,他们实际上是在用旧地图寻找新大陆。优化流程只能带来20%的效率提升,而创造新品类带来的可能是10倍的增长空间。
Karpathy提到的“代理原生经济”(Agent-Native Economy)是这个话题的自然延伸。一旦我们接受了“软件可以用自然语言构建”这个前提,那么整个产品经济的分解方式都会发生变化。传统的软件产品是一个黑箱:用户看到的是界面,背后是逻辑和数据的固定组合。而在代理原生经济中,产品被分解为传感器(感知输入)、执行器(产生输出)和逻辑(决策过程),这三者可以独立运行在不同的计算范式上——部分在传统软件中,部分在深度学习中,部分在LLM中。
这种分解意味着什么?意味着一个产品的“逻辑层”可以不再是一套固定的算法,而是一个可以实时调整、根据上下文改变行为的AI代理。一个电商网站的推荐系统,不再是一套预训练的模型,而是一个能够理解当前促销活动、用户心情、甚至天气变化的聊天代理。一个企业CRM系统,不再是一个记录客户信息的数据库,而是一个能够主动识别客户意图、生成个性化沟通策略的智能体。
我明白,这些描述听起来像是科幻小说里的情节。但请注意,Karpathy的演讲不是20年后的愿景,它发生在2026年,而且演讲者明确表示这些并不是遥远未来的梦想,而是现在就可以开始构建的东西。
更重要的是,这种转变的迹象已经出现在我们身边。去看看那些开始用LLM生成代码、生成文案、生成客户邮件的公司吧。他们中的大多数正处于“加速旧流程”的阶段——让程序员写代码更快,让市场人员写文案更快。但少数公司已经开始尝试“新品类”的探索:一个完全由AI驱动的个性化新闻聚合器,一个能够自动生成课程计划并实时调整的在线教育平台,一个基于自然语言描述的个性化应用生成器。
这些先行者正在做的事情,本质上就是把Karpathy的三个例子规模化。他们不是在思考“AI能让我们做什么做得更好”,而是在思考“AI能让我们做什么我们之前完全做不到的事情”。这就是从“加速”到“创造”的认知跃迁。
对于企业决策者而言,这个转型期的正确策略不是问“我们如何用AI削减成本”,而是问“如果构建任何一个软件功能的成本趋近于零,我们会创造什么”。这个问题会彻底改变产品路线图、团队结构和商业模式。那些率先提出并回答这个问题的公司,将在未来五年内定义新的行业标准。而那些继续在“加速旧流程”的框架内思考的公司,可能永远也看不到新大陆的轮廓。
参考来源
- Fireside chat at Sequoia Ascent 2026 from a ~week ago. Some highlights:
- The first theme I tried to push on is that LLMs are about a lot more than just speeding up what existed before (e.g. coding). Three examples of new horizons:
- 1. menugen: an app that can be fully engulfed by LLMs, with no classical code needed: input an image, output an image and an LLM can natively do the thing.
- 2. install .md skills instead of install .sh scripts. Why create a complex Software 1.0 bash script for e.g. installing a piece of software if you can write the installation out in words and say "just show this to your LLM". The LLM is an advanced interpreter of English and can intelligently target installation to your setup, debug everything inline, etc.
- 3. LLM knowledge bases as an example of something that was *impossible* with classical code because it's computation over unstructured data (knowledge) from arbitrary sources and in arbitrary formats, including simply text articles etc.
- I pushed on these because in every new paradigm change, the obvious things are always in the realm of speeding up or somehow improving what existed, but here we have examples of functionality that either suddenly perhaps shouldn't even exist (1,2), or was fundamentally not possible before (3).
- The second (ongoing) theme is trying to explain the pattern of jaggedness in LLMs. How it can be true that a single artifact will simultaneously 1) coherently refactor a 100,000-line code base *and* 2) tell you to walk to the car wash to wash your car. I previously wrote about the source of this as having to do with verifiability of a domain, here I expand on this as having to also do with economics because revenue/TAM dictates what the frontier labs choose to package into training data distributions during RL. You're either in the data distribution (on the rails of the RL circuits) and flying or you're off-roading in the jungle with a machete, in relative terms. Still not 100% satisfied with this, but it's an ongoing struggle to build an accurate model of LLM capabilities if you wish to practically take advantage of their power while avoiding their pitfalls, which brings me to...
- Last theme is the agent-native economy. The decomposition of products and services into sensors, actuators and logic (split up across all of 1.0/2.0/3.0 computing paradigms), how we can make information maximally legible to LLMs, some words on the quickly emerging agentic engineering and its skill set, related hiring practices, etc., possibly even hints/dreams of fully neural computing handling the vast majority of computation with some help from (classical) CPU coprocessors. - https://nitter.net/karpathy/status/2049903821095354523#m
- Best AI Development Solutions for Businesses in 2026 - https://www.reddit.com/r/AIAppInnovation/comments/1tdrm1s/best_ai_development_solutions_for_businesses_in/
- [Workflow] Enhance Claude Code Visibility and Control with `claude-devtools` for Debugging and Memory Management - https://www.reddit.com/r/ClaudeWorkflows/comments/1td3bdu/workflow_enhance_claude_code_visibility_and/