AI Agent 的“长跑时代”:当系统必须学会自我延续
当 Codex 的 /goal 让 Agent 可以接受一个目标后自主工作数小时,当 KAIROS 守护进程让 AI 拥有“在适当的时候自行启动”的能力,我们正站在一个分水岭上:AI 不再是按需响应的工具,而是开始成为能自我延续、自主决策的运行体。这种转变带来的不仅是更大的能力,更是全新的可靠性、治理和伦理挑战。
核心观点:AI Agent 的真正革命不在于它能完成更复杂的单次任务,而在于它开始具备跨会话持久化执行的能力,这正在把问题从模型质量转向运行可靠性,同时倒逼基础设施和商业模式发生根本性变化。
长期以来,我们对 AI Agent 的想象一直停留在“高级版的对话机器人”这个框架里。你给它一个任务,它执行,然后等待下一个指令。这种模式高效、可控,但也从根本上限制了 AI 能扮演的角色——它始终是一个被动的工具,一个需要人类不断喂食和引导的“数字员工”。然而,最近的一系列信号表明,这种模式正在被一个更激进的想法颠覆:让 Agent 持久运行,让它在无人值守的情况下自主决策、跨会话执行,甚至拥有自己的“生命周期”。
这个转变的标志性事件之一,是 OpenAI Codex 新推出的 /goal 功能。表面上,它只是让开发者可以给 Codex 设定一个长期目标,然后让它自己去迭代和完成。但仔细分析它的设计哲学就会发现,这绝不是一次简单的功能升级。/goal 的核心在于“持久化”和“自主验证”。它不再要求开发者事无巨细地拆解任务,而是抽象地定义一个“完成条件”,然后让 AI 自主规划路径、执行步骤,并在过程中持续自我校验。这听起来简单,但背后的工程挑战是巨大的:Agent 如何在执行过程中保存状态?如何从意外中断中恢复?如何确保它在长达数小时甚至数天的运行中不偏离目标?这些问题已经从模型的能力问题,完全转变成了系统的可靠性问题。
与此同时,从另一条技术路径也传来了类似的声音。KAIROS 守护进程的泄露信息揭示了一个更激进的设计:一个能够“在适当的时候自行启动”的自主后台服务。KAIROS 不仅仅是被动等待指令,它拥有自己的执行计划、工具集和触发条件。这意味着,未来的 AI 系统可能不再需要人类的每一次点击来激活,而是能够根据预设规则或环境变化,主动决策并采取行动。这种“主动式 AI”的构想,与 /goal 的“持久化执行”形成了完美的互补:一个是让 Agent 跑得更久,另一个是让 Agent 知道什么时候该开始跑。
然而,技术上的兴奋之余,我们必须直面一个残酷的现实:绝大多数现有的 AI 系统架构,根本不是为了支持这种“长跑型 Agent”而设计的。当前的 Agent 生态,无论是基于 API 的响应式模型,还是本地运行的对话式框架,本质上都是“短时记忆”的。它们可以在一轮对话中表现惊艳,但一旦需要跨会话、跨系统、跨重启地维护状态,就会暴露出巨大的脆弱性。正如 Reddit 上的开发者们所讨论的,当 Agent 的运行时间从分钟级延长到小时级甚至天级,问题的焦点就不再是“模型智商够不够”,而是“系统能否在崩溃后正确恢复”、“状态管理的来源是什么”、“如何防止长期运行中的状态漂移”。这些是运维工程师的领域,而不是提示工程师的领域。
这种转变的深远影响,远不止于技术细节。首先,它将彻底改变我们对 AI 产品的商业模式和定价方式的认知。如果 Agent 可以自主运行数小时,那么“按调用计费”的模式就显得不合时宜。更合理的可能是“按运行时长”、“按结果”或“按资源消耗”计费。同样,这也意味着 AI 服务的 SLA(服务水平协议)将需要被重新定义。一个能够自主决策的 Agent,一旦出错,其责任归属远比一个只执行指令的工具要复杂得多。如果 KAIROS 在无人监督的情况下执行了一个错误的交易指令,谁来负责?是模型本身,是部署者,还是设计者?
其次,这种持久化 Agent 的出现,将加速“Agent 原生经济”的形成。正如 Karpathy 在 Sequoia 会议上提到的,未来的产品和服务将被分解为传感器、执行器和逻辑,而逻辑部分将越来越多地由 AI 来承担。当 Agent 能够长时间、自主地处理复杂工作流,那么很多现在需要完整团队才能完成的工作——比如市场监控、供应链协调、代码库维护——将可能被少数几个“长跑 Agent”所替代。这不仅仅是效率的提升,更是对传统组织架构和工作流程的根本性解构。
当然,我们也要警惕其中的反方观点和不确定性。并不是所有人都相信“持久化 Agent”是正确方向。批评者指出,当前的 AI 模型仍然存在严重的“锯齿形”能力分布:一个 Agent 可以优雅地重构一个 10 万行的代码库,却可能同时建议你“走到洗车店去洗车”。这种不可预测性在短任务中可以被容忍,但在长时间、高风险的自主决策中,任何一个微小的荒谬错误都可能导致灾难性后果。因此,有人主张,我们应该继续将 Agent 限制在“短时、高密度”的任务上,而不是盲目追求自主性和持久性。
此外,治理问题同样不容忽视。一个能够自主启动的 KAIROS 守护进程,本质上是系统里一个不受人类直接控制的“影子员工”。如何确保它不会滥用资源?如何防止它被恶意利用?如何对它的行为进行审计和回溯?这些都是目前几乎未开始讨论的问题。技术社区对 KAIROS 的兴奋,恰好掩盖了它在安全性和可解释性上的巨大缺失。
尽管如此,我认为这种从“响应式工具”到“持久化运行体”的演变,是 AI Agent 走向成熟的必经之路。它反映了一个更深层的趋势:我们正在从“教 AI 如何思考”的阶段,进入“让 AI 如何生存”的阶段。生存,意味着系统需要有记忆、有目标、有自我修复能力,甚至有自己的“睡眠-觉醒”周期——就像 SarahMemory AiOS 中提出的 REM 睡眠周期,让 AI 在沙盒中安全地自我反思和改进。这些看似科幻的概念,正在被现实中的工程实现一步步拉近。
对于开发者、产品经理和投资者来说,这意味着需要注意的关键点是:未来 12 到 18 个月内,AI 基础设施的竞争将从“模型能力”转向“运行时可靠性”。那些能在状态管理、故障恢复、持久化执行上提供稳定解决方案的平台和工具,将获得巨大的先发优势。而对于普通用户,一个更直接的信号是:你现在使用的 AI 助手,可能很快就不再是“问一句答一句”的了,它会开始主动告诉你“我有一个任务正在后台运行,完成后再通知你”。这种体验的改变,将比任何模型能力的飞跃都更深刻地影响我们与 AI 的日常互动。
参考来源
- Codex `/goal` is quietly a big deal for long-running agent work — especially with OpenClaw + Codex OAuth - https://www.reddit.com/r/OpenClawInstall/comments/1t6wll2/codex_goal_is_quietly_a_big_deal_for_longrunning/
- Fireside chat at Sequoia Ascent 2026 from a ~week ago. Some highlights:
- The first theme I tried to push on is that LLMs are about a lot more than just speeding up what existed before (e.g. coding). Three examples of new horizons:
- 1. menugen: an app that can be fully engulfed by LLMs, with no classical code needed: input an image, output an image and an LLM can natively do the thing.
- 2. install .md skills instead of install .sh scripts. Why create a complex Software 1.0 bash script for e.g. installing a piece of software if you can write the installation out in words and say "just show this to your LLM". The LLM is an advanced interpreter of English and can intelligently target installation to your setup, debug everything inline, etc.
- 3. LLM knowledge bases as an example of something that was *impossible* with classical code because it's computation over unstructured data (knowledge) from arbitrary sources and in arbitrary formats, including simply text articles etc.
- I pushed on these because in every new paradigm change, the obvious things are always in the realm of speeding up or somehow improving what existed, but here we have examples of functionality that either suddenly perhaps shouldn't even exist (1,2), or was fundamentally not possible before (3).
- The second (ongoing) theme is trying to explain the pattern of jaggedness in LLMs. How it can be true that a single artifact will simultaneously 1) coherently refactor a 100,000-line code base *and* 2) tell you to walk to the car wash to wash your car. I previously wrote about the source of this as having to do with verifiability of a domain, here I expand on this as having to also do with economics because revenue/TAM dictates what the frontier labs choose to package into training data distributions during RL. You're either in the data distribution (on the rails of the RL circuits) and flying or you're off-roading in the jungle with a machete, in relative terms. Still not 100% satisfied with this, but it's an ongoing struggle to build an accurate model of LLM capabilities if you wish to practically take advantage of their power while avoiding their pitfalls, which brings me to...
- Last theme is the agent-native economy. The decomposition of products and services into sensors, actuators and logic (split up across all of 1.0/2.0/3.0 computing paradigms), how we can make information maximally legible to LLMs, some words on the quickly emerging agentic engineering and its skill set, related hiring practices, etc., possibly even hints/dreams of fully neural computing handling the vast majority of computation with some help from (classical) CPU coprocessors. - https://nitter.net/karpathy/status/2049903821095354523#m
- 从三次元小马到二次元马娘,于谦穿越异次元训练赛马娘?【多新鲜呐ep22丨于谦的视频播客】 - https://www.bilibili.com/video/BV1Y198BkEJL