AI Agent 的最后一公里：为什么“能启动”不等于“能完成”

从 Hermes Agent Tenacity 强调的“完成任务”到 Codex /goal 的持久目标机制，再到 KAIROS 的自主守护进程，AI Agent 正在经历一场从“一次性交互”到“长周期自主执行”的范式转变。但这背后隐藏着工程化的巨大鸿沟，而硅谷似乎还在迷恋启动的魔法。

核心观点：当前 AI Agent 的核心瓶颈不是启动任务的能力，而是持续自主完成长周期任务的工程化能力，这决定了 AI Agent 能否从演示玩具升级为可靠的生产力工具。

当整个行业还在为 AI Agent 能够“理解指令”、“编写代码”而兴奋不已时，一个更隐蔽也更致命的问题正在浮现：它能把事情做完吗？你给一个 AI Agent 下达“帮我分析上季度销售数据并生成一份报告”的任务，它可能在 30 秒内写出一段漂亮的代码框架，然后在接下来的 30 分钟里因为数据库连接超时、数据格式不匹配、或者报告模板的一个字段缺失而陷入无限循环，最终吐出半成品。这不是个别案例，而是当前几乎所有 AI Agent 框架的普遍症候。我们正在把大量的算力和注意力投入到让 Agent 变得更“聪明”上，却忽视了让它变得更“可靠”——尤其是在面对长周期、多步骤、需要持久记忆和上下文管理的任务时。

这一轮浏览的材料中，多个信号不约而同地指向了同一个痛点上。Hermes Agent Tenacity 的更新说明里，核心卖点不是更强大的模型，而是“完成任务”（Finishing Tasks）。它通过引入目标循环（goal loops）、多智能体看板（multi-agent Kanban）和会话恢复（session recovery）等工程手段，试图解决的恰恰是那些“开始得很漂亮、结束得很潦草”的问题。无独有偶，Codex 的 `/goal` 功能被描述为“长期运行代理工作的低调大事”。它的核心创新是让用户将一个“持久目标”（durable objective）交给 Agent，并定义好“完成”的验证条件，然后 Agent 可以跨轮次持续工作，直到达到可验证的终止状态。这种设计思路与传统的“一问一答”式交互形成了本质区别，它是在尝试构建一种新的工作契约：用户不再需要事无巨细地监督每一步的中间产出，而是把信任放在 Agent 执行目标的能力上。

更耐人寻味的是 KAIROS 守护进程的泄露信息。它被描述为一个“主动的、自主的后台进程”，不同于标准的 Claude Code 那样等待用户输入，KAIROS 会主动监测环境变化、自主决定执行时机，甚至能够自我管理资源。这些设计细节表明，一些前沿探索者已经开始意识到，真正的 Agent 不应该是一个被动的“函数调用器”，而应该是一个持久的、具备自我意识和环境感知能力的“守护者”。它与之前的 SarahMemory AiOS 的白皮书中所描述的“自主操作系统”理念不谋而合——后者甚至引入了类似 REM 睡眠的机制，让 AI 在沙盒中自主反思和进化。这些项目虽然处于不同阶段，但它们的共同关注点已经偏离了“AI 能做什么”，转向了“AI 能持续、可靠地做什么”。

然而，这种从“启动”到“闭环”的转变，面临的不仅是技术挑战，更是理念和商业模式上的冲突。一个明显的矛盾在于，当前主流的 AI 服务计价模式——按 token 计费、按请求量计费——与长周期 Agent 的执行模式是根本矛盾的。如果你要一个 Agent 运行三天来完成一个复杂的市场调研，按照当前的计费方式，光是中间过程的 token 消耗就可能让你破产。这迫使开发者要么将任务切分成极小的片段，人为增加交互次数；要么让 Agent 在本地运行，以规避云端成本。这也解释了为什么 Hermes Agent Tenacity 强调“免费”，以及 SarahMemory AiOS 坚持“完全本地运行”——它们都在试图绕开这个经济上的死结。但这种绕开会带来新的问题：本地算力是否足够支撑复杂的 Agent 工作流？本地运行的模型能力是否足以应对开放世界的任务？

反对者可能会说，当前的模型能力本身还不足以支撑真正长周期的自主任务。即便有了 `/goal` 这样的机制，LLM 的幻觉、对指令的漂移、以及对复杂环境的适应性，都可能在执行过程中累积错误，最终导致任务失败。这确实是核心难题。安德烈·卡帕西（Andrej Karpathy）在那场与红杉资本的炉边谈话中，提到了一个精妙的比喻——LLM 的能力分布是“锯齿形”的：它既能优雅地重构一个 10 万行的代码库，也会告诉你走到洗车房去洗车。这种不均衡性源于训练数据的分布：模型在那些“可验证”的、有明确对错的领域（如编程）表现得极为出色，但在那些需要常识、物理世界知识或者长期规划的领域，它就像在没有地图的丛林里挥刀开路。

因此，解决“完成能力”问题的关键，可能不在于让模型本身变得无所不能，而在于构建一个能够容忍模型不完美、并能动态纠偏的工程系统。这正是 KAIROS 守护进程和 Hermes Agent 的多智能体看板所尝试的方向。他们不是在寻找一个不会犯错的超级智能，而是在设计一套工作流引擎和调度机制，让多个 Agent 可以互相校验、备份、恢复。例如，如果主 Agent 在执行一个长期任务时“迷路”了，另一个监控 Agent 可以检测到它偏离了原始目标，并触发恢复流程。这种“系统工程”思维，比单纯追求模型参数的增长，更贴近当下的现实需求。

回到商业层面，那些能够率先解决“完成能力”问题的 AI Agent 产品，将获得巨大的竞争优势。当前市场上，大量 AI SaaS 产品面临一个尴尬局面：用户注册后，尝试了一两次，发现 Agent 要么无法完成任务，要么需要大量的人工介入，于是流失。文章开头提到的那些“5 个月才上线”的独立开发者，面临的正是这种困境。他们用“60 秒内启动 Agent”作为卖点，但真正决定用户是否长期付费的，是 Agent 能否在接下来的 60 天内持续可靠地完成任务。如果产品团队继续沉迷于“演示效果”，而忽略了背后复杂的工程化工作——包括状态管理、错误恢复、资源调度、持久记忆——那么再华丽的 Demo 也只会是昙花一现。

最后，我们应当警惕一种过度乐观的叙事，即认为只要模型继续变大、能力增强，所有工程问题都会自动消解。这种线性外推的思维极其危险。现实世界中的任务，无论是 IT 基础设施管理、企业报告生成，还是复杂的金融分析，其价值恰恰体现在那些枯燥的、非线性的、需要反复试错的边缘情况里。一个 Agent 能写出一流的分析报告，但如果它无法处理一个简单的、异常格式的 CSV 文件，它的价值就大打折扣。硅谷需要更多地关注那个“丑陋”的中间层：系统的韧性、工程化的深度、以及对失败场景的优雅处理。这或许不如一个能写诗的大模型来得性感，但它才是决定 AI Agent 能否走出实验室、真正接管我们日常工作的关键所在。