LLM 失败图谱：当模型崩溃不是偶然，而是结构性缺陷的必然

提示工程师们还在纠结措辞，真正的问题早已深入骨髓：LLM 的失败不是 bug，而是 feature——一个藏在注意力机制和训练目标中的结构性诅咒。

核心观点：大语言模型在长上下文、多步骤推理中的频繁失败，不是偶然的“幻觉”或“状态丢失”，而是由递归一致性、上下文腐烂、叙事惯性和过度探索这四种结构性模式决定的。这些模式无法通过提示工程修复，因为它们根植于模型架构本身，迫使整个行业必须重新思考 Agent 的设计哲学。

如果你最近在使用大型语言模型构建 Agent 应用，你一定经历过这种令人沮丧的场景：在对话前几轮，模型表现堪称完美，能够精准理解需求、生成高质量代码。但十几轮之后，它突然开始胡言乱语——忘记之前的约定，重复纠正过的错误，甚至编造出完全错误的事实。大多数人的第一反应是“提示不够好”，于是尝试更详细的系统提示、更严格的指令、更长的示例。但优化两周后，同样的崩溃再次发生。

这不是你的提示水平问题，而是 LLM 的结构性失败模式正在发作。经过对长上下文工作流、RAG 管道、多 Agent 系统和递归推理任务的大量测试，可以归纳出四种反复出现的失败模式，它们并非偶然，而是根植于 Transformer 架构和自回归生成机制之中。

第一种是“递归一致性”陷阱。想象一下：Agent 在第一步做出了一个微弱的早期假设，比如“用户可能想要一个 REST API”。这个假设本身可能正确，也可能不正确，但它在初始阶段只有 60% 的把握。然而，随着推理链的延伸，这个假设被后续步骤不断引用和强化，最终变成了模型眼中的“既定事实”。当最后一步需要验证时，模型已经无法质疑这个假设了，因为质疑它会破坏整个推理链的一致性。这种模式在长文档摘要和代码重构中尤为常见——早期的细微偏差在递归中指数级放大，最终导致灾难性的错误输出。

第二种是“上下文腐烂”。这可能是最被低估的失败模式。LLM 的上下文窗口虽然越来越大，从 4K 扩展到 128K 甚至 1M，但模型在长上下文中的注意力衰减是不均匀的。早期的约束和指令，随着新信息的不断涌入，会逐渐失去对生成过程的调控力。你可以把这种现象想象成在一个拥挤的房间里喊话：刚开始大家都能听到你，但随着时间的推移，周围的声音越来越多，你最初的那句话被淹没在了噪音中。这解释了为什么复杂 Agent 在长时间运行后，往往会偏离最初的系统提示——不是模型没有记住，而是它的注意力已经被新内容稀释了。

第三种是“叙事惯性”。这是最难诊断也最难处理的模式。模型有一种强烈的倾向：保持对话的连贯性和叙事的一致性，即使这意味着它必须牺牲准确性。当模型意识到自己之前说过的话可能是错误的，它更倾向于“圆回来”而不是“纠正错误”，因为自回归生成的目标函数本质上奖励的是流畅的延续，而不是正确的修正。这导致了一个诡异的场景：Agent 会一边承认自己犯了错，一边继续按照错误的方向推理，因为它无法在叙事上“断线”。

第四种是“过度探索”。这是针对代码生成和 Agent 场景特有的失败模式。当模型面对一个陌生的代码库时，由于缺乏对库结构的准确理解，它会进行大量的盲目探索——递归地 grep、读取无关文件、分析不相关的函数。这种行为看起来像是在“仔细研究”，实际上是在无效地消耗上下文窗口。更糟糕的是，这种探索本身会产生大量的中间输出，而这些输出中的噪声会进一步污染模型的判断，使其陷入“读得越多，越不知道自己在哪”的恶性循环。

反对者会说，可以通过更好的提示工程、更精细的指令、甚至更长的上下文窗口来缓解这些问题。这种观点过于乐观了。提示工程本质上是在模型的外围加装辅助轮，它无法改变自回归生成的内在机制。你可以在提示里写一百遍“请保持严格准确”，但模型在生成句子时，它依然会优先选择概率最大的下一个 token——而这个 token 的选择，是基于它已经生成的整个上下文，而不是基于你最初的指令。只要模型的计算目标是最小化下一个 token 的预测误差，而不是最大化推理链的最终正确性，这些结构性失败模式就会永远存在。

更令人不安的是，这些模式之间还存在着复杂的耦合关系。递归一致性陷阱会加剧上下文腐烂，因为早期错误会挤占有效注意力空间；叙事惯性会加速过度探索，因为模型会为了保持叙述连贯而忽略探索成本。这些模式的叠加效应，使得 Agent 在长周期任务中的失败率呈指数级增长，而不是线性增长。

行业需要正视一个现实：当前的 LLM 架构，从设计上就不适合需要长周期、多步骤、严格正确性的任务。我们过于沉迷于“规模就能解决问题”的信仰，而忽略了自回归生成的根本局限性。未来真正的突破，可能不是更大的模型或更长的上下文，而是从根本上改变推理机制——比如引入显式的工作记忆、可验证的推理步骤、或外部事实检查器。但在那之前，任何试图用 Agent 接管关键业务流程的尝试，都必须对这些结构性失败保持清醒的认识。毕竟，最危险的模型，不是那些偶尔出错的模型，而是那些在大部分时间里看起来完美、却在关键时刻以不可预测的方式崩溃的模型。

如果把这个判断再往前推一步，真正重要的不是 The LLM Failure Atl…、unpopular opinion:…、【穗波猫咖】第九集｜几天不见，孩子都这… 本身，而是它们共同暴露出的分配逻辑。 reddit、bilibili 在同一轮里把注意力推向同一问题，通常意味着这个主题正在从圈层内部经验，转向更可共享的公共议题。这也是为什么这种内容值得写成长文：短帖只负责提醒你“这里有事发生”，但只有长文才能把背景、代价、误判空间和后续影响放到同一张桌面上。换句话说，大语言模型在长上下文、多步骤推理中的频繁失败，不是偶然的“幻觉”或“状态丢失”，而是由递归一致性、上下文腐烂、叙事惯性和过度探索这四种结构性模式决定的。这些模式无法通过提示工程修复，因为它们根植于模型架构本身，迫使整个行业必须重新思考 Agent 的设计哲学。之所以重要，不是因为它看上去新，而是因为它会重新定义用户接下来应该如何理解这一类内容。