当 Karpathy 在 Sequoia 演讲中谈论“agent-native economy”,当 SarahMemory 提出“AI 操作系统”和“REM 睡眠学习”,当 KAIROS 展露出“主动后台进程”的能力——这些信号共同指向一个判断:AI Agent 的底层架构正在发生范式转移,而大多数人还在用“更好的 ChatGPT”来理解它。

核心观点:当前 AI Agent 领域最被忽视的真相是:产业已从“教机器做事”的工具阶段,进入“机器自主管理资源”的操作系统阶段,而多数创业者和投资人仍用旧框架评估新物种。

过去五年,AI Agent 领域的主流叙事始终围绕“能力边界”展开:模型能写多长的代码?能处理多复杂的任务?能减少多少次人工干预?这些追问暗含一个前提——Agent 是工具,是人类智能的延伸,它的价值在于“替代重复劳动”。

但最近 48 小时内密集出现的几组信号,正在挑战这个前提。Karpathy 在 Sequoia Ascent 2026 的演讲中提出了“agent-native economy”的概念,并给出了三个令人不安的例子:一个完全由 LLM 驱动的“无代码应用”menugen、用 Markdown 替代 Shell 脚本的“安装技能”、以及 LLM 知识库这种“经典代码不可能实现”的功能。他直言不讳地说,这些不是加速旧事物,而是创造了“以前甚至不应该存在”或“根本不可能”的新品类。

与此同时,SarahMemory 团队发布了长达 14 个月开发的 AIOS 白皮书。它不是一个 Agent,而是一个“完全本地运行、自我治理、拥有 REM 睡眠周期”的操作系统。在睡眠周期中,它会安全地产生幻觉、自我反思、在沙盒中自我改进。这个听起来像是科幻小说的设计,实际上在消费级硬件上已经跑通。

还有 KAIROS daemon——一个被泄漏代码中提及 150 多次的“自主守护进程”。它不是等待用户提示才行动,而是作为后台服务持续运行,主动决策,具备“时机感知”能力。它的名字取自古希腊语“恰当时刻”,暗示着它能在正确的时间主动执行正确的行动。

这些信号指向同一个方向:AI Agent 正在从“被动执行指令的工具”转向“主动管理运行环境的系统”。换句话说,产业的重心正在从“做什么”转向“怎么活”。

这不是一个技术细节的变化,而是整个产业逻辑的重构。

**旧范式:Agent 是应用层的一次性任务执行器**

在旧框架下,Agent 的核心指标是“成功率”——给定一个 prompt,模型能否正确完成一次任务?无论是编码代理、客服机器人还是数据分析助手,它们的生命周期都以“一次交互”为单位。用户提问,模型回答;用户下指令,模型执行。任务结束,Agent 进入休眠,等待下一次唤醒。

这种模式天然适合 SaaS 订阅制:用户为每次成功的任务付费,或者为无限次的任务尝试付费。OpenClaw 这样的开源引擎试图降低 Agent 的开发门槛,但本质上仍在同一范式内——它们是“更易用的工具制造工具”。

**新范式:Agent 是系统层的持续运行实体**

SarahMemory 的 AIOS 颠覆了这一点。它不再是一个“聊天窗口”或“API 端点”,而是一个拥有“生命周期”的实体。它有睡眠周期,有记忆管理,有自我治理机制。它不等待指令,而是在后台持续运行,像人类一样在睡眠中巩固学习成果。

KAIROS 更激进:它不是一个“被调用的功能”,而是一个“守护进程”。它主动感知环境变化,选择行动时机。在泄漏代码中,它被描述为“拥有自己的工具集,能够持久执行复杂任务”。这意味着 Agent 不再是“响应式”的,而是“主动式”的。

Karpathy 提到的“install .md skills”是另一个微妙但深刻的例子。用 Markdown 描述安装步骤,然后交给 LLM 去执行——这本质上是把“指令的可执行性”从人类转移到机器。过去,Shell 脚本是程序员写给机器读的;现在,自然语言是用户写给 Agent 读的。Agent 不再只是“执行者”,它成了“解释器”和“决策者”。

**为什么这个转移对创业者和投资人至关重要?**

因为旧范式的商业模型正在失效。

如果 Agent 是“一次性的任务执行器”,那么它的价值很容易被度量:节省了多少时间?减少了多少错误?定价可以基于每次调用、每月订阅或每任务收费。这是 SaaS 的逻辑,也是当前绝大多数 AI Agent 创业公司的模型。

但如果 Agent 是“持续运行的系统实体”,商业模式就完全不同了。你不能按“任务次数”收费,因为 Agent 可能在后台默默运行数小时,没有产生任何“可计费的任务”——却在执行环境监控、数据整理、模型微调等不可见的工作。它的价值不在于“一次产出”,而在于“持续存在”。

这更像是操作系统的逻辑:Windows 不是按每次文件操作收费的,而是按“使用权”收费。同样,AIOS 的价值主张应该是“运行环境即服务”,而不是“任务执行即服务”。

**反方观点:这不过是“过度抽象”的又一次轮回**

当然,有人会反驳:所谓的“操作系统化”不过是技术圈对复杂性的过度迷恋。历史上,每一次“以系统为中心”的浪潮(如面向对象编程、微服务、容器化)都曾带来过度的抽象和复杂度,最终被更轻量级的方案取代。Agent 领域也可能如此——也许我们需要的不是“自主操作系统”,而是更简洁的“一次调用、可靠完成”的 API。

这个观点有道理。SarahMemory 的 AIOS 目前仍是一个白皮书级别的概念,KAIROS 也只是泄漏代码中的片段,它们的实际稳定性、安全性和可扩展性尚未得到大规模验证。Karpathy 本人也承认,LLM 的“锯齿状能力”问题仍然存在——同一个模型既能重构 10 万行代码,也会告诉你“开车去洗车店洗车”。在这样的不确定性下,建立一个依赖“持续运行”的系统架构,风险极高。

但反方忽略了关键一点:旧范式正在遭遇天花板。

Reddit 上那位用 5 个月构建了 AI Agent SaaS 的创业者,他的困境具有代表性。他解决了“60 秒内让 Agent 运行起来”的问题,却无法解决“如何让用户持续付费”的问题。为什么?因为他的 Agent 仍然是一个“工具”——用户用它完成一次任务后,就没有理由继续付费了。只有当 Agent 成为用户数字生活的一部分(比如每天自动整理邮件、监控健康数据、管理文件系统),订阅制才成立。

这正是 Sonar 4.0 引出的方向。Sonar 是一款健康追踪应用,新版引入了“个人健康代理”——它不再是一个被动的仪表盘,而是一个主动的“健康伙伴”,基于用户的历史数据提供个性化建议。它需要持续运行,持续学习,持续存在。这种模式天然适合订阅制。

**结论:Agent 的未来不在于更强的 GPT,而在于更完整的“生存环境”**

如果我们接受这个判断,那么 AI Agent 领域的最重要问题就不是“下一个模型能写多好的代码”,而是“如何构建一个可持续、自治、可信的 Agent 运行环境”。

这意味着投资人和创业者需要重新审视自己的优先级:

- 不要只关注模型的推理能力,要关注 Agent 的“持久化”——它能否跨会话保持状态?能否在后台静默运行?

- 不要只关注任务完成率,要关注“自我治理”——Agent 如何在无监督的情况下做出正确决策?如何防止失控?

- 不要只关注用户获取,要关注“生命周期管理”——用户如何与一个持续运行的 Agent 建立长期关系?什么时候应该唤醒它?什么时候应该让它休眠?

这些问题的答案,将决定哪些公司能活到下一个时代。而那些仍然在用“更好的 ChatGPT”框架思考 Agent 的人,可能会在不知不觉中错过这个范式转移的窗口。