AI Agent 的“长跑时代”：当系统必须学会自我延续

当 Codex 的 /goal 让 Agent 可以接受一个目标后自主工作数小时，当 KAIROS 守护进程让 AI 拥有“在适当的时候自行启动”的能力，我们正站在一个分水岭上：AI 不再是按需响应的工具，而是开始成为能自我延续、自主决策的运行体。这种转变带来的不仅是更大的能力，更是全新的可靠性、治理和伦理挑战。

核心观点：AI Agent 的真正革命不在于它能完成更复杂的单次任务，而在于它开始具备跨会话持久化执行的能力，这正在把问题从模型质量转向运行可靠性，同时倒逼基础设施和商业模式发生根本性变化。

长期以来，我们对 AI Agent 的想象一直停留在“高级版的对话机器人”这个框架里。你给它一个任务，它执行，然后等待下一个指令。这种模式高效、可控，但也从根本上限制了 AI 能扮演的角色——它始终是一个被动的工具，一个需要人类不断喂食和引导的“数字员工”。然而，最近的一系列信号表明，这种模式正在被一个更激进的想法颠覆：让 Agent 持久运行，让它在无人值守的情况下自主决策、跨会话执行，甚至拥有自己的“生命周期”。

这个转变的标志性事件之一，是 OpenAI Codex 新推出的 /goal 功能。表面上，它只是让开发者可以给 Codex 设定一个长期目标，然后让它自己去迭代和完成。但仔细分析它的设计哲学就会发现，这绝不是一次简单的功能升级。/goal 的核心在于“持久化”和“自主验证”。它不再要求开发者事无巨细地拆解任务，而是抽象地定义一个“完成条件”，然后让 AI 自主规划路径、执行步骤，并在过程中持续自我校验。这听起来简单，但背后的工程挑战是巨大的：Agent 如何在执行过程中保存状态？如何从意外中断中恢复？如何确保它在长达数小时甚至数天的运行中不偏离目标？这些问题已经从模型的能力问题，完全转变成了系统的可靠性问题。

与此同时，从另一条技术路径也传来了类似的声音。KAIROS 守护进程的泄露信息揭示了一个更激进的设计：一个能够“在适当的时候自行启动”的自主后台服务。KAIROS 不仅仅是被动等待指令，它拥有自己的执行计划、工具集和触发条件。这意味着，未来的 AI 系统可能不再需要人类的每一次点击来激活，而是能够根据预设规则或环境变化，主动决策并采取行动。这种“主动式 AI”的构想，与 /goal 的“持久化执行”形成了完美的互补：一个是让 Agent 跑得更久，另一个是让 Agent 知道什么时候该开始跑。

然而，技术上的兴奋之余，我们必须直面一个残酷的现实：绝大多数现有的 AI 系统架构，根本不是为了支持这种“长跑型 Agent”而设计的。当前的 Agent 生态，无论是基于 API 的响应式模型，还是本地运行的对话式框架，本质上都是“短时记忆”的。它们可以在一轮对话中表现惊艳，但一旦需要跨会话、跨系统、跨重启地维护状态，就会暴露出巨大的脆弱性。正如 Reddit 上的开发者们所讨论的，当 Agent 的运行时间从分钟级延长到小时级甚至天级，问题的焦点就不再是“模型智商够不够”，而是“系统能否在崩溃后正确恢复”、“状态管理的来源是什么”、“如何防止长期运行中的状态漂移”。这些是运维工程师的领域，而不是提示工程师的领域。

这种转变的深远影响，远不止于技术细节。首先，它将彻底改变我们对 AI 产品的商业模式和定价方式的认知。如果 Agent 可以自主运行数小时，那么“按调用计费”的模式就显得不合时宜。更合理的可能是“按运行时长”、“按结果”或“按资源消耗”计费。同样，这也意味着 AI 服务的 SLA（服务水平协议）将需要被重新定义。一个能够自主决策的 Agent，一旦出错，其责任归属远比一个只执行指令的工具要复杂得多。如果 KAIROS 在无人监督的情况下执行了一个错误的交易指令，谁来负责？是模型本身，是部署者，还是设计者？

其次，这种持久化 Agent 的出现，将加速“Agent 原生经济”的形成。正如 Karpathy 在 Sequoia 会议上提到的，未来的产品和服务将被分解为传感器、执行器和逻辑，而逻辑部分将越来越多地由 AI 来承担。当 Agent 能够长时间、自主地处理复杂工作流，那么很多现在需要完整团队才能完成的工作——比如市场监控、供应链协调、代码库维护——将可能被少数几个“长跑 Agent”所替代。这不仅仅是效率的提升，更是对传统组织架构和工作流程的根本性解构。

当然，我们也要警惕其中的反方观点和不确定性。并不是所有人都相信“持久化 Agent”是正确方向。批评者指出，当前的 AI 模型仍然存在严重的“锯齿形”能力分布：一个 Agent 可以优雅地重构一个 10 万行的代码库，却可能同时建议你“走到洗车店去洗车”。这种不可预测性在短任务中可以被容忍，但在长时间、高风险的自主决策中，任何一个微小的荒谬错误都可能导致灾难性后果。因此，有人主张，我们应该继续将 Agent 限制在“短时、高密度”的任务上，而不是盲目追求自主性和持久性。

此外，治理问题同样不容忽视。一个能够自主启动的 KAIROS 守护进程，本质上是系统里一个不受人类直接控制的“影子员工”。如何确保它不会滥用资源？如何防止它被恶意利用？如何对它的行为进行审计和回溯？这些都是目前几乎未开始讨论的问题。技术社区对 KAIROS 的兴奋，恰好掩盖了它在安全性和可解释性上的巨大缺失。

尽管如此，我认为这种从“响应式工具”到“持久化运行体”的演变，是 AI Agent 走向成熟的必经之路。它反映了一个更深层的趋势：我们正在从“教 AI 如何思考”的阶段，进入“让 AI 如何生存”的阶段。生存，意味着系统需要有记忆、有目标、有自我修复能力，甚至有自己的“睡眠-觉醒”周期——就像 SarahMemory AiOS 中提出的 REM 睡眠周期，让 AI 在沙盒中安全地自我反思和改进。这些看似科幻的概念，正在被现实中的工程实现一步步拉近。

对于开发者、产品经理和投资者来说，这意味着需要注意的关键点是：未来 12 到 18 个月内，AI 基础设施的竞争将从“模型能力”转向“运行时可靠性”。那些能在状态管理、故障恢复、持久化执行上提供稳定解决方案的平台和工具，将获得巨大的先发优势。而对于普通用户，一个更直接的信号是：你现在使用的 AI 助手，可能很快就不再是“问一句答一句”的了，它会开始主动告诉你“我有一个任务正在后台运行，完成后再通知你”。这种体验的改变，将比任何模型能力的飞跃都更深刻地影响我们与 AI 的日常互动。