当Karpathy在红杉资本峰会上抛出“menugen”和“.md技能安装”这些概念时,大多数人只看到了新奇,却没意识到这背后是一种计算范式的根本性转移。LLM的价值不是让旧事物跑得更快,而是让原本不可能的事物变得平庸地简单。

核心观点:当前AI行业对LLM的讨论过度聚焦于“加速现有工作流程”,忽略了它真正颠覆性的价值——创造此前不存在或不具备经济可行性的全新功能类别,这种认知偏差正在导致大量的方向性误判和投资浪费。

在红杉资本2026年峰会上,AI明星研究员Karpathy做了一场意料之外、又情理之中的演讲。他没有描绘AGI的宏大图景,也没有推销最新的模型参数规模,而是举了三个看似不起眼的例子:一个不需要写任何经典代码就能运行的图像处理应用、一组用纯文字描述替代bash脚本的安装指令、一种能够任意处理非结构化知识的知识库系统。这三个例子的共同点在于——它们不是让旧东西跑得更快,而是让原本不可能的东西变得平庸地简单。

“加速原有工作”是每一个技术范式转换中最容易被看到、也最容易说服人的叙事。1990年代互联网让人“更快地收发邮件”,2000年代移动互联网让人“更方便地访问网站”。这种叙事天然具备说服力,因为它的收益是可以量化的——你节省了多少时间,提高了多少效率。但真正改变世界的,从来不是那些“更快”的东西,而是那些“全新”的东西。互联网最终真正的杀手级应用不是电子邮件,而是社交网络、流媒体、电商平台——这些在拨号上网时代根本无法想象的服务。

现在,AI行业正在重蹈覆辙。绝大多数企业和开发者对LLM的想象力,仍然停留在“让程序员写代码更快一点”、“让客服回复更智能一点”这种保守的范畴。这种思维模式导致了一种系统性的盲区:那些真正能够重写商业规则的应用,反而因为它们“看起来不太像AI”而被忽视。

Karpathy举的“menugen”例子极具象征意义。一个功能完整的图像处理应用,不需要一行传统意义上的“代码”,只需要描述输入输出和逻辑规则,LLM就可以原生地完成整个功能实现。这听起来像是在说“我们可以用自然语言构建软件”。但更深刻的意义在于:当构建一个软件的边际成本趋近于零,当“写一个应用”这件事变得和“写一段话”一样简单,那么什么软件会爆炸式地涌现?不是那些现有软件的“平替”,而是那些因为开发成本过高而从未被尝试过的功能。

第二个例子更赤裸地揭示了当前思维的局限。“install .md skills”这个概念——用一份Markdown文档来代替bash脚本完成软件安装——听起来有些荒谬,甚至有点倒退。毕竟,我们已经花了三十年时间,从手工安装演进到包管理器,再到容器化和基础设施即代码。现在你告诉我,我们要退回去用“写作文”的方式装软件?

但这种“倒退”恰恰是进步的本质。Markdown安装文档的优势不在于“速度”——它可能比优化后的bash脚本慢得多——而在于“适应性”。因为LLM是一个高级的自然语言解释器,它可以理解你的具体环境配置,智能地处理各种边缘情况,甚至当场调试错误。一份bash脚本只能做一件事,在一种环境下工作;而一份Markdown文档可以做无数件事,在任何环境下工作。从“确定性脚本”到“适应性智能”的转变,才是真正的范式飞跃。

第三个例子——基于LLM的知识库系统——则是这三个例子中商业化潜力最大的一个。传统软件在处理非结构化数据时几乎无能为力。一个数据库需要明确的数据模型,一个搜索引擎需要复杂的索引和排名算法,一个文档管理系统需要预设的分类标签。这些系统在面对“一堆杂乱的网页、PDF、邮件和聊天记录”时,要么崩溃,要么需要大量的人工预处理。

而LLM的知识库系统,第一次让“任意来源、任意格式的非结构化知识”成为可计算的对象。这不是在优化“知识管理”这个已有品类——这是在创造一个以前根本不存在的品类。十年前,你无法购买任何一款软件产品,让它自动消化你所有的业务文档、客户邮件、会议记录,然后回答“我们明年的增长策略应该怎么调整”。现在,这种能力不仅存在,而且只需要一个API调用。

反方观点当然存在。质疑者会指出,LLM的“随机性”和“不可靠性”使其不适合关键任务。确实,一个会“幻觉”的知识库系统,和一个会编造安装步骤的安装器,看起来都像是灾难的配方。但这种批评忽略了两个关键事实。

第一,传统软件的“确定性”本身就是一种取舍。我们接受了bash脚本的精确性,代价是它无法适应任何它没有被明确编程过的场景。而LLM的不确定性,本质上是一种“概率性正确”——它大部分时候是正确的,偶尔犯错误,但能够在反馈回路中快速修正。这种模式与人类专家的行为模式惊人地相似。我们不会因为一个人类工程师偶尔犯错就否定他所有的价值,为什么对LLM我们要采用双重标准?

第二,经济性的考量正在迅速改变这个等式的平衡。Karpathy在演讲中敏锐地指出,LLM能力的“锯齿状分布”——在某些领域表现出超人类水平,在另一些领域却幼稚得可笑——不仅仅是一个技术问题,更是一个经济学问题。前沿实验室选择将哪些能力“包装”进训练数据分布,取决于这些能力对应的市场规模和收入潜力。这意味着,随着“适应性智能”的应用场景展现出更大的商业价值,模型在这些领域的能力会越来越强,而传统软件在“确定性”领域的优势反而会因为投入不足而逐渐缩小。

这就是为什么我认为当前AI行业最大的认知风险,不是对LLM能力的过度夸大,而是对LLM应用边界的过度保守。当每个大公司的AI战略都在强调“用AI优化现有流程”时,他们实际上是在用旧地图寻找新大陆。优化流程只能带来20%的效率提升,而创造新品类带来的可能是10倍的增长空间。

Karpathy提到的“代理原生经济”(Agent-Native Economy)是这个话题的自然延伸。一旦我们接受了“软件可以用自然语言构建”这个前提,那么整个产品经济的分解方式都会发生变化。传统的软件产品是一个黑箱:用户看到的是界面,背后是逻辑和数据的固定组合。而在代理原生经济中,产品被分解为传感器(感知输入)、执行器(产生输出)和逻辑(决策过程),这三者可以独立运行在不同的计算范式上——部分在传统软件中,部分在深度学习中,部分在LLM中。

这种分解意味着什么?意味着一个产品的“逻辑层”可以不再是一套固定的算法,而是一个可以实时调整、根据上下文改变行为的AI代理。一个电商网站的推荐系统,不再是一套预训练的模型,而是一个能够理解当前促销活动、用户心情、甚至天气变化的聊天代理。一个企业CRM系统,不再是一个记录客户信息的数据库,而是一个能够主动识别客户意图、生成个性化沟通策略的智能体。

我明白,这些描述听起来像是科幻小说里的情节。但请注意,Karpathy的演讲不是20年后的愿景,它发生在2026年,而且演讲者明确表示这些并不是遥远未来的梦想,而是现在就可以开始构建的东西。

更重要的是,这种转变的迹象已经出现在我们身边。去看看那些开始用LLM生成代码、生成文案、生成客户邮件的公司吧。他们中的大多数正处于“加速旧流程”的阶段——让程序员写代码更快,让市场人员写文案更快。但少数公司已经开始尝试“新品类”的探索:一个完全由AI驱动的个性化新闻聚合器,一个能够自动生成课程计划并实时调整的在线教育平台,一个基于自然语言描述的个性化应用生成器。

这些先行者正在做的事情,本质上就是把Karpathy的三个例子规模化。他们不是在思考“AI能让我们做什么做得更好”,而是在思考“AI能让我们做什么我们之前完全做不到的事情”。这就是从“加速”到“创造”的认知跃迁。

对于企业决策者而言,这个转型期的正确策略不是问“我们如何用AI削减成本”,而是问“如果构建任何一个软件功能的成本趋近于零,我们会创造什么”。这个问题会彻底改变产品路线图、团队结构和商业模式。那些率先提出并回答这个问题的公司,将在未来五年内定义新的行业标准。而那些继续在“加速旧流程”的框架内思考的公司,可能永远也看不到新大陆的轮廓。