AI Agent 的最后一公里:为什么“能启动”不等于“能完成”
从 Hermes Agent Tenacity 强调的“完成任务”到 Codex /goal 的持久目标机制,再到 KAIROS 的自主守护进程,AI Agent 正在经历一场从“一次性交互”到“长周期自主执行”的范式转变。但这背后隐藏着工程化的巨大鸿沟,而硅谷似乎还在迷恋启动的魔法。
核心观点:当前 AI Agent 的核心瓶颈不是启动任务的能力,而是持续自主完成长周期任务的工程化能力,这决定了 AI Agent 能否从演示玩具升级为可靠的生产力工具。
当整个行业还在为 AI Agent 能够“理解指令”、“编写代码”而兴奋不已时,一个更隐蔽也更致命的问题正在浮现:它能把事情做完吗?你给一个 AI Agent 下达“帮我分析上季度销售数据并生成一份报告”的任务,它可能在 30 秒内写出一段漂亮的代码框架,然后在接下来的 30 分钟里因为数据库连接超时、数据格式不匹配、或者报告模板的一个字段缺失而陷入无限循环,最终吐出半成品。这不是个别案例,而是当前几乎所有 AI Agent 框架的普遍症候。我们正在把大量的算力和注意力投入到让 Agent 变得更“聪明”上,却忽视了让它变得更“可靠”——尤其是在面对长周期、多步骤、需要持久记忆和上下文管理的任务时。
这一轮浏览的材料中,多个信号不约而同地指向了同一个痛点上。Hermes Agent Tenacity 的更新说明里,核心卖点不是更强大的模型,而是“完成任务”(Finishing Tasks)。它通过引入目标循环(goal loops)、多智能体看板(multi-agent Kanban)和会话恢复(session recovery)等工程手段,试图解决的恰恰是那些“开始得很漂亮、结束得很潦草”的问题。无独有偶,Codex 的 `/goal` 功能被描述为“长期运行代理工作的低调大事”。它的核心创新是让用户将一个“持久目标”(durable objective)交给 Agent,并定义好“完成”的验证条件,然后 Agent 可以跨轮次持续工作,直到达到可验证的终止状态。这种设计思路与传统的“一问一答”式交互形成了本质区别,它是在尝试构建一种新的工作契约:用户不再需要事无巨细地监督每一步的中间产出,而是把信任放在 Agent 执行目标的能力上。
更耐人寻味的是 KAIROS 守护进程的泄露信息。它被描述为一个“主动的、自主的后台进程”,不同于标准的 Claude Code 那样等待用户输入,KAIROS 会主动监测环境变化、自主决定执行时机,甚至能够自我管理资源。这些设计细节表明,一些前沿探索者已经开始意识到,真正的 Agent 不应该是一个被动的“函数调用器”,而应该是一个持久的、具备自我意识和环境感知能力的“守护者”。它与之前的 SarahMemory AiOS 的白皮书中所描述的“自主操作系统”理念不谋而合——后者甚至引入了类似 REM 睡眠的机制,让 AI 在沙盒中自主反思和进化。这些项目虽然处于不同阶段,但它们的共同关注点已经偏离了“AI 能做什么”,转向了“AI 能持续、可靠地做什么”。
然而,这种从“启动”到“闭环”的转变,面临的不仅是技术挑战,更是理念和商业模式上的冲突。一个明显的矛盾在于,当前主流的 AI 服务计价模式——按 token 计费、按请求量计费——与长周期 Agent 的执行模式是根本矛盾的。如果你要一个 Agent 运行三天来完成一个复杂的市场调研,按照当前的计费方式,光是中间过程的 token 消耗就可能让你破产。这迫使开发者要么将任务切分成极小的片段,人为增加交互次数;要么让 Agent 在本地运行,以规避云端成本。这也解释了为什么 Hermes Agent Tenacity 强调“免费”,以及 SarahMemory AiOS 坚持“完全本地运行”——它们都在试图绕开这个经济上的死结。但这种绕开会带来新的问题:本地算力是否足够支撑复杂的 Agent 工作流?本地运行的模型能力是否足以应对开放世界的任务?
反对者可能会说,当前的模型能力本身还不足以支撑真正长周期的自主任务。即便有了 `/goal` 这样的机制,LLM 的幻觉、对指令的漂移、以及对复杂环境的适应性,都可能在执行过程中累积错误,最终导致任务失败。这确实是核心难题。安德烈·卡帕西(Andrej Karpathy)在那场与红杉资本的炉边谈话中,提到了一个精妙的比喻——LLM 的能力分布是“锯齿形”的:它既能优雅地重构一个 10 万行的代码库,也会告诉你走到洗车房去洗车。这种不均衡性源于训练数据的分布:模型在那些“可验证”的、有明确对错的领域(如编程)表现得极为出色,但在那些需要常识、物理世界知识或者长期规划的领域,它就像在没有地图的丛林里挥刀开路。
因此,解决“完成能力”问题的关键,可能不在于让模型本身变得无所不能,而在于构建一个能够容忍模型不完美、并能动态纠偏的工程系统。这正是 KAIROS 守护进程和 Hermes Agent 的多智能体看板所尝试的方向。他们不是在寻找一个不会犯错的超级智能,而是在设计一套工作流引擎和调度机制,让多个 Agent 可以互相校验、备份、恢复。例如,如果主 Agent 在执行一个长期任务时“迷路”了,另一个监控 Agent 可以检测到它偏离了原始目标,并触发恢复流程。这种“系统工程”思维,比单纯追求模型参数的增长,更贴近当下的现实需求。
回到商业层面,那些能够率先解决“完成能力”问题的 AI Agent 产品,将获得巨大的竞争优势。当前市场上,大量 AI SaaS 产品面临一个尴尬局面:用户注册后,尝试了一两次,发现 Agent 要么无法完成任务,要么需要大量的人工介入,于是流失。文章开头提到的那些“5 个月才上线”的独立开发者,面临的正是这种困境。他们用“60 秒内启动 Agent”作为卖点,但真正决定用户是否长期付费的,是 Agent 能否在接下来的 60 天内持续可靠地完成任务。如果产品团队继续沉迷于“演示效果”,而忽略了背后复杂的工程化工作——包括状态管理、错误恢复、资源调度、持久记忆——那么再华丽的 Demo 也只会是昙花一现。
最后,我们应当警惕一种过度乐观的叙事,即认为只要模型继续变大、能力增强,所有工程问题都会自动消解。这种线性外推的思维极其危险。现实世界中的任务,无论是 IT 基础设施管理、企业报告生成,还是复杂的金融分析,其价值恰恰体现在那些枯燥的、非线性的、需要反复试错的边缘情况里。一个 Agent 能写出一流的分析报告,但如果它无法处理一个简单的、异常格式的 CSV 文件,它的价值就大打折扣。硅谷需要更多地关注那个“丑陋”的中间层:系统的韧性、工程化的深度、以及对失败场景的优雅处理。这或许不如一个能写诗的大模型来得性感,但它才是决定 AI Agent 能否走出实验室、真正接管我们日常工作的关键所在。
参考来源
- Built an AI agent SaaS for 5 months, launched on Microsoft Store, free users coming in — but how do I actually convert anyone to paying? - https://www.reddit.com/r/micro_saas/comments/1t7c2lc/built_an_ai_agent_saas_for_5_months_launched_on/
- Reducing IT Infrastructure Costs with Proactive AI Agent Management - https://www.reddit.com/r/secops_solution/comments/1t6ep5w/reducing_it_infrastructure_costs_with_proactive/
- Codex `/goal` is quietly a big deal for long-running agent work — especially with OpenClaw + Codex OAuth - https://www.reddit.com/r/OpenClawInstall/comments/1t6wll2/codex_goal_is_quietly_a_big_deal_for_longrunning/