LLM不是加速器:从Sequoia Ascent 2026看人工智能的范式革命
在Sequoia Ascent 2026峰会上,Karpathy提出了三个令人深思的案例:menugen、.md技能安装和LLM知识库。这些不是对现有工具的优化,而是开辟了全新的功能疆域。当LLM能同时重构一个十万行代码库和告诉你“去洗车”时,我们面对的是一种全新的智能形态,需要全新的经济学和工程学视角来理解。
核心观点:大语言模型真正的价值不在于加速现有流程,而在于创造了前所未有的全新可能性,如全AI原生应用、自然语言技能安装和不可计算的知识库,这要求我们重新定义对AI能力的理解。
当大语言模型成为科技界最炙手可热的话题时,大多数讨论都聚焦于一个核心叙事:LLM将加速一切。从代码生成到文档处理,从客户服务到数据分析,似乎所有工作都将在AI的推动下变得更高效。但2026年Sequoia Ascent峰会上的一场炉边谈话,却提出了一个更具颠覆性的观点:LLM的真正革命性,不在于它能多快地完成我们已经在做的事情,而在于它能够做那些我们从未想过可能完成的事情。
这个观点来自一位在AI领域深耕多年的研究者Karpathy。他举了三个例子:menugen——一个可以被LLM完全吞噬的应用,从输入到输出完全由AI驱动,无需一行传统代码;用.md文件替代.sh脚本——你不再需要编写复杂的安装脚本,只需要用自然语言描述安装过程,然后告诉你的LLM去执行;以及LLM知识库——这在大语言模型出现之前是不可能实现的,因为它需要对非结构化数据进行计算,而传统代码只能处理结构化数据。
这三个例子之所以如此重要,是因为它们清晰地划出了一条界线:一边是“加速已有流程”,另一边是“创造全新可能”。绝大多数科技公司目前仍停留在前者的思维模式中,他们试图用LLM来优化现有的产品和工作流程,却忽略了更根本的机会——重新定义什么是可能的。
让我们深入分析menugen这个案例。在传统软件开发中,一个图像处理应用需要复杂的算法和大量的手写代码。但在LLM的世界里,你只需要提供一个图像输入,AI就能理解你的意图并生成相应的输出。这不是简单的“更快更好”,而是从根本上改变了软件开发的范式。开发者不再需要思考“如何实现这个功能”,而是需要思考“我想要什么功能”。从解决问题到定义问题,这一转变意义深远。
同样,用.md文件替代.sh脚本也暗示了一个可能更深刻的趋势。安装软件一直是一个令人头疼的问题,因为不同用户的系统环境千差万别。传统脚本试图用条件判断来覆盖所有可能的情况,但总是力不从心。而自然语言描述则具有天然的灵活性:LLM可以根据用户的具体环境智能调整安装步骤,处理错误,甚至自行调试。这不仅仅是更聪明的安装脚本,而是一种全新的软件分发方式。
当然,Karpathy也坦诚地讨论了LLM的“锯齿状”能力模式:同一个模型可以出色地重构一个十万行代码库,同时也会建议你“开车去洗车”。这种不一致性源于训练数据的分布:模型在某些领域(如代码重构)经过强化学习路径的充分训练,表现优异;而在其他领域(如常识推理)则像在丛林中挥刀开路。这引出了一个关键问题:我们如何理解并利用这种不均衡的能力?
批评者可能会指出,这些“新可能性”的实用价值仍有待验证。menugen是否真能取代传统的图像处理软件?.md安装在没有LLM的系统上是否完全失效?LLM知识库的准确性和可靠性如何保证?这些质疑并非空穴来风。在商业应用中,稳定性、可预测性和可控性仍然是关键考量因素。一个偶尔建议你去洗车的系统,很难被信任来处理关键任务。
但更值得关注的是,Karpathy提出的“代理原生经济”概念。他认为,未来产品和服务将被分解为传感器、执行器和逻辑三个部分,而这些逻辑可以在1.0、2.0和3.0计算范式之间灵活分布。这意味着,我们需要重新设计信息结构,使其对LLM更加“可读”。同时,一种全新的“代理工程”技能正在涌现,相应的招聘实践和组织架构也将随之改变。
保守主义者可能会认为,这不过是又一个技术乌托邦的幻想。毕竟,我们对AI的能力边界还没有充分理解,安全性和伦理问题也远未解决。更不用说,将大量决策权交给一个仍然不可预测的系统,可能带来的风险。但历史告诉我们,每一次范式革命都伴随着这样的疑虑。就像早期云计算面临的安全担忧和早期互联网面临的商业化质疑一样,这些障碍最终都被克服,或者至少被适应了。
真正有趣的是,Karpathy暗示了一个更大胆的未来:或许未来绝大多数计算将由“全神经计算”完成,传统CPU只作为协处理器存在。这意味着,当前的硬件生态可能面临根本性的重构。对于投资者和创业者来说,这既是巨大的机遇,也是潜在的颠覆。那些布局传统算力优化的公司,可能突然发现自己的技术栈已经过时。
回到最初的问题:LLM到底意味着什么?是加速器还是新大陆?我的判断是,两者兼具,但后者的意义远超前者。加速现有流程带来的收益是线性的,而创造全新可能性带来的变革是指数级的。那些只看到加速器作用的企业,可能会在不知不觉中被那些拥抱新范式的新玩家所超越。
这并不意味着我们应该盲目追逐每一个AI新概念。相反,我们需要保持清醒:LLM的能力边界是真实存在的,它的不可预测性也是一个需要认真对待的问题。但关键在于,我们不能因为存在不确定性就拒绝探索这些新可能。在快速变化的技术环境中,最大的风险不是犯错误,而是错过方向。
所以,对于所有正在观望或小规模尝试AI的企业,我的建议是:不要太快满足于用LLM让你的流程变快10%。花点时间去思考,哪些事情是你以前不敢想的,但现在有了LLM就变成了可能。也许,那些正是你下一个增长的引擎。
参考来源
- Fireside chat at Sequoia Ascent 2026 from a ~week ago. Some highlights:
- The first theme I tried to push on is that LLMs are about a lot more than just speeding up what existed before (e.g. coding). Three examples of new horizons:
- 1. menugen: an app that can be fully engulfed by LLMs, with no classical code needed: input an image, output an image and an LLM can natively do the thing.
- 2. install .md skills instead of install .sh scripts. Why create a complex Software 1.0 bash script for e.g. installing a piece of software if you can write the installation out in words and say "just show this to your LLM". The LLM is an advanced interpreter of English and can intelligently target installation to your setup, debug everything inline, etc.
- 3. LLM knowledge bases as an example of something that was *impossible* with classical code because it's computation over unstructured data (knowledge) from arbitrary sources and in arbitrary formats, including simply text articles etc.
- I pushed on these because in every new paradigm change, the obvious things are always in the realm of speeding up or somehow improving what existed, but here we have examples of functionality that either suddenly perhaps shouldn't even exist (1,2), or was fundamentally not possible before (3).
- The second (ongoing) theme is trying to explain the pattern of jaggedness in LLMs. How it can be true that a single artifact will simultaneously 1) coherently refactor a 100,000-line code base *and* 2) tell you to walk to the car wash to wash your car. I previously wrote about the source of this as having to do with verifiability of a domain, here I expand on this as having to also do with economics because revenue/TAM dictates what the frontier labs choose to package into training data distributions during RL. You're either in the data distribution (on the rails of the RL circuits) and flying or you're off-roading in the jungle with a machete, in relative terms. Still not 100% satisfied with this, but it's an ongoing struggle to build an accurate model of LLM capabilities if you wish to practically take advantage of their power while avoiding their pitfalls, which brings me to...
- Last theme is the agent-native economy. The decomposition of products and services into sensors, actuators and logic (split up across all of 1.0/2.0/3.0 computing paradigms), how we can make information maximally legible to LLMs, some words on the quickly emerging agentic engineering and its skill set, related hiring practices, etc., possibly even hints/dreams of fully neural computing handling the vast majority of computation with some help from (classical) CPU coprocessors. - https://nitter.net/karpathy/status/2049903821095354523#m
- (Selling) 4K Codes – Prices Firm | 2/$6, 2/$8, 2/$10, 2/$12 | Bundles & New Releases | HD in Separate Post | PPFF/CashApp/Venmo | - https://www.reddit.com/r/DigitalCodeSELL/comments/1trp4bm/selling_4k_codes_prices_firm_26_28_210_212/
- "Is this a rich man's hobby?" Ogoniff asked, his voice sounding like a YouTube processing error. - https://www.reddit.com/r/Star_Light_Links/comments/1trvl0n/is_this_a_rich_mans_hobby_ogoniff_asked_his_voice/