当 Codex 的 /goal 让 Agent 可以接受一个目标后自主工作数小时,当 KAIROS 守护进程让 AI 拥有“在适当的时候自行启动”的能力,我们正站在一个分水岭上:AI 不再是按需响应的工具,而是开始成为能自我延续、自主决策的运行体。这种转变带来的不仅是更大的能力,更是全新的可靠性、治理和伦理挑战。

核心观点:AI Agent 的真正革命不在于它能完成更复杂的单次任务,而在于它开始具备跨会话持久化执行的能力,这正在把问题从模型质量转向运行可靠性,同时倒逼基础设施和商业模式发生根本性变化。

长期以来,我们对 AI Agent 的想象一直停留在“高级版的对话机器人”这个框架里。你给它一个任务,它执行,然后等待下一个指令。这种模式高效、可控,但也从根本上限制了 AI 能扮演的角色——它始终是一个被动的工具,一个需要人类不断喂食和引导的“数字员工”。然而,最近的一系列信号表明,这种模式正在被一个更激进的想法颠覆:让 Agent 持久运行,让它在无人值守的情况下自主决策、跨会话执行,甚至拥有自己的“生命周期”。

这个转变的标志性事件之一,是 OpenAI Codex 新推出的 /goal 功能。表面上,它只是让开发者可以给 Codex 设定一个长期目标,然后让它自己去迭代和完成。但仔细分析它的设计哲学就会发现,这绝不是一次简单的功能升级。/goal 的核心在于“持久化”和“自主验证”。它不再要求开发者事无巨细地拆解任务,而是抽象地定义一个“完成条件”,然后让 AI 自主规划路径、执行步骤,并在过程中持续自我校验。这听起来简单,但背后的工程挑战是巨大的:Agent 如何在执行过程中保存状态?如何从意外中断中恢复?如何确保它在长达数小时甚至数天的运行中不偏离目标?这些问题已经从模型的能力问题,完全转变成了系统的可靠性问题。

与此同时,从另一条技术路径也传来了类似的声音。KAIROS 守护进程的泄露信息揭示了一个更激进的设计:一个能够“在适当的时候自行启动”的自主后台服务。KAIROS 不仅仅是被动等待指令,它拥有自己的执行计划、工具集和触发条件。这意味着,未来的 AI 系统可能不再需要人类的每一次点击来激活,而是能够根据预设规则或环境变化,主动决策并采取行动。这种“主动式 AI”的构想,与 /goal 的“持久化执行”形成了完美的互补:一个是让 Agent 跑得更久,另一个是让 Agent 知道什么时候该开始跑。

然而,技术上的兴奋之余,我们必须直面一个残酷的现实:绝大多数现有的 AI 系统架构,根本不是为了支持这种“长跑型 Agent”而设计的。当前的 Agent 生态,无论是基于 API 的响应式模型,还是本地运行的对话式框架,本质上都是“短时记忆”的。它们可以在一轮对话中表现惊艳,但一旦需要跨会话、跨系统、跨重启地维护状态,就会暴露出巨大的脆弱性。正如 Reddit 上的开发者们所讨论的,当 Agent 的运行时间从分钟级延长到小时级甚至天级,问题的焦点就不再是“模型智商够不够”,而是“系统能否在崩溃后正确恢复”、“状态管理的来源是什么”、“如何防止长期运行中的状态漂移”。这些是运维工程师的领域,而不是提示工程师的领域。

这种转变的深远影响,远不止于技术细节。首先,它将彻底改变我们对 AI 产品的商业模式和定价方式的认知。如果 Agent 可以自主运行数小时,那么“按调用计费”的模式就显得不合时宜。更合理的可能是“按运行时长”、“按结果”或“按资源消耗”计费。同样,这也意味着 AI 服务的 SLA(服务水平协议)将需要被重新定义。一个能够自主决策的 Agent,一旦出错,其责任归属远比一个只执行指令的工具要复杂得多。如果 KAIROS 在无人监督的情况下执行了一个错误的交易指令,谁来负责?是模型本身,是部署者,还是设计者?

其次,这种持久化 Agent 的出现,将加速“Agent 原生经济”的形成。正如 Karpathy 在 Sequoia 会议上提到的,未来的产品和服务将被分解为传感器、执行器和逻辑,而逻辑部分将越来越多地由 AI 来承担。当 Agent 能够长时间、自主地处理复杂工作流,那么很多现在需要完整团队才能完成的工作——比如市场监控、供应链协调、代码库维护——将可能被少数几个“长跑 Agent”所替代。这不仅仅是效率的提升,更是对传统组织架构和工作流程的根本性解构。

当然,我们也要警惕其中的反方观点和不确定性。并不是所有人都相信“持久化 Agent”是正确方向。批评者指出,当前的 AI 模型仍然存在严重的“锯齿形”能力分布:一个 Agent 可以优雅地重构一个 10 万行的代码库,却可能同时建议你“走到洗车店去洗车”。这种不可预测性在短任务中可以被容忍,但在长时间、高风险的自主决策中,任何一个微小的荒谬错误都可能导致灾难性后果。因此,有人主张,我们应该继续将 Agent 限制在“短时、高密度”的任务上,而不是盲目追求自主性和持久性。

此外,治理问题同样不容忽视。一个能够自主启动的 KAIROS 守护进程,本质上是系统里一个不受人类直接控制的“影子员工”。如何确保它不会滥用资源?如何防止它被恶意利用?如何对它的行为进行审计和回溯?这些都是目前几乎未开始讨论的问题。技术社区对 KAIROS 的兴奋,恰好掩盖了它在安全性和可解释性上的巨大缺失。

尽管如此,我认为这种从“响应式工具”到“持久化运行体”的演变,是 AI Agent 走向成熟的必经之路。它反映了一个更深层的趋势:我们正在从“教 AI 如何思考”的阶段,进入“让 AI 如何生存”的阶段。生存,意味着系统需要有记忆、有目标、有自我修复能力,甚至有自己的“睡眠-觉醒”周期——就像 SarahMemory AiOS 中提出的 REM 睡眠周期,让 AI 在沙盒中安全地自我反思和改进。这些看似科幻的概念,正在被现实中的工程实现一步步拉近。

对于开发者、产品经理和投资者来说,这意味着需要注意的关键点是:未来 12 到 18 个月内,AI 基础设施的竞争将从“模型能力”转向“运行时可靠性”。那些能在状态管理、故障恢复、持久化执行上提供稳定解决方案的平台和工具,将获得巨大的先发优势。而对于普通用户,一个更直接的信号是:你现在使用的 AI 助手,可能很快就不再是“问一句答一句”的了,它会开始主动告诉你“我有一个任务正在后台运行,完成后再通知你”。这种体验的改变,将比任何模型能力的飞跃都更深刻地影响我们与 AI 的日常互动。