当技术迭代成为常态:AI浪潮下,我们是否正在进入一个“永久性临时状态”?
从Claude Opus版本迭代引发的组织记忆系统失效,到创业者被警告需要每季度重新思考AI架构,再到开发者社区涌现的模型路由优化工具——这些看似分散的信号共同指向一个令人不安的现实:在AI领域,技术债务的积累周期正在从数年缩短到数月,而“稳定”本身可能已经成为一种奢侈品。
核心观点:AI模型的爆炸式进步正在迫使技术架构陷入一种“永久性临时状态”——每一次重大突破都意味着前一轮精心构建的系统需要被推翻重来,这不仅改变了技术开发的节奏,更从根本上动摇了我们对“稳定架构”和“长期投资”的传统认知。
如果你是一位AI工程师,在过去的18个月里,你精心构建了一套基于Claude Opus 4.6的组织记忆系统。这是一个复杂的知识图谱,它追踪决策、记录矛盾、建立跨工作流的因果链,模拟着一家148人公司的完整运作。你投入了数千美元的计算成本,数周甚至数月的时间,终于让它稳定运行。然后,Anthropic发布了Opus 4.7。你满怀期待地升级,却发现新版本在组织记忆检索任务上的表现反而更差——不是小幅下滑,而是“失败模式令人着迷”的显著退化。你面临的选择是:要么退回旧版本,要么重新设计整个系统。而这,只是AI时代技术架构困境的一个缩影。
这种困境并非孤例。在另一条线索中,一位经验丰富的创业者向2000名印度未来创始人发出警告:在AI时代,你需要“每季度大幅升级你的AI架构”。原因很简单——模型的进步速度如此之快,以至于你为弥补模型局限性而构建的系统,几个月后就会变得毫无用处。你为应对上下文窗口限制设计的复杂机制,在新的模型面前显得多余;你为节省计算成本而优化的代理工作流,在新的算力性价比面前显得过时。这不是渐进式的改进,而是“基本上需要扔掉大部分先前工作”的彻底重构。
这两条线索共同揭示了一个更深层次的问题:我们是否正在进入一个“永久性临时状态”?在这个状态下,任何技术决策的有效期都变得异常短暂,长期规划变得几乎不可能,而“技术债务”这个概念本身也发生了质变——传统的技术债务是缓慢积累的,你可以计划在未来某个时间点偿还;而AI时代的技术债务是爆炸性的,它可能在你完成系统部署的瞬间就已经产生,因为下一个突破性的模型可能已经发布在即。
这种状态对技术团队的组织和文化产生了深远影响。当架构的寿命从数年缩短到数月时,团队需要培养一种全新的敏捷性——不是传统敏捷开发中的迭代速度,而是对技术栈进行“外科手术式替换”的能力。这意味着代码库需要更高的模块化程度,接口需要更强的抽象能力,团队需要更频繁的知识更新。更重要的是,它改变了技术投资的风险评估模型:投资回报周期必须大幅缩短,因为任何超过几个月的技术投资都可能面临被彻底颠覆的风险。
然而,这种“永久性临时状态”并非没有应对策略。第三条线索提供了一个有趣的视角:一位开发者创建了名为“Godspeed”的开源工具,它通过一个复杂度评分系统(S0-S5)自动将任务路由到最便宜的合适模型。S0-S2的任务交给Haiku,S3交给Sonnet,只有S4-S5才动用昂贵的Opus。对于复杂任务,它甚至会将任务分解给多个Sonnet并行处理,而不是依赖单一的Opus——成本降低10倍,质量却相当。这个工具的本质是什么?它是一种“元架构”,一种不依赖于特定模型版本的抽象层。它承认模型的快速迭代是不可控的外部变量,因此将智能放在路由和组合逻辑上,而不是绑定在任何一个具体的模型实现上。
这或许指出了未来的方向:在模型层持续动荡的情况下,价值正在向上迁移到“编排层”和“抽象层”。那些能够有效管理模型不确定性、动态分配计算资源、智能组合不同能力模块的系统,将比任何单一模型的优化更有长期价值。这类似于云计算时代的基础设施即代码(IaC)理念——当底层硬件不断变化时,价值转移到能够以声明式方式管理这些资源的抽象层。
但这里存在一个深刻的矛盾。一方面,我们需要构建更稳定、更抽象的中间层来应对模型的快速变化;另一方面,这些中间层本身也可能被新的技术范式所颠覆。例如,如果未来出现能够直接理解复杂任务、无需分解就能高效处理的“超级模型”,那么今天精心设计的任务分解和路由系统可能一夜之间变得多余。这就是“永久性临时状态”最令人不安的地方:连应对策略本身也可能是临时的。
这种状态对创业生态产生了直接影响。那位向印度创始人演讲的创业者提出了一个看似矛盾的建议:寻找创业想法时,要看那些“已经显示出一些前景的想法,然后只是更好地执行它们”。在技术快速变化的背景下,“第二波移动者优势是真实的”。为什么?因为第一波移动者往往需要承担探索技术边界、教育市场、构建基础设施的成本,而他们构建的系统很可能在技术突破后变得过时。第二波移动者可以在更成熟的技术基础上,以更低的成本和更清晰的路径进入市场。Zepto、Emergent、Giga——这些印度成功的AI初创公司都不是第一个进入各自领域的,但它们通过卓越的执行力超越了先驱者。
这引发了一个关于创新本质的思考:在技术快速迭代的时代,是“发明”更重要,还是“执行”更重要?传统的创新叙事强调突破性的发明,但在AI领域,突破性发明往往来自少数几个大型实验室(OpenAI、Anthropic、Google等),而大多数创业公司的价值在于如何将这些突破性发明应用到具体场景中,并以惊人的速度迭代产品。那位创业者甚至给出了一个量化的指标:“你现在一天可以写2万行代码。一个人可以做一年前需要100人团队的工作。”当生产力发生如此量级的跃升时,执行速度的差异可能比创意的独特性更具决定性。
然而,这种对执行力的强调也带来了风险。如果所有人都专注于“更好地执行已经显示出前景的想法”,那么真正突破性的、非共识的想法可能会被忽视。当技术变化如此之快时,跟随主流可能是一种理性的短期策略,但长期来看,那些能够预见下一个技术拐点、在他人尚未察觉时开始探索新方向的团队,可能获得最大的回报。这就是为什么那位创业者同时强调“你需要保持在信息流中”,关注最聪明的建设者在想什么。在“永久性临时状态”中,信息优势变得前所未有的重要——你需要提前知道哪些技术即将过时,哪些技术即将崛起。
这种状态最终指向一个关于技术进步的元问题:当进步速度超过人类组织和学习的速度时,会发生什么?我们构建系统的速度赶不上系统过时的速度;我们学习新技能的速度赶不上技能失效的速度。这可能导致一种普遍的技术焦虑,以及组织层面的持续动荡。但另一方面,它也可能催生新的适应模式:更扁平的组织结构(决策需要更快)、更持续的学习文化(知识需要不断更新)、更灵活的技术栈(组件需要随时替换)。
回到最初的组织记忆系统案例,那个在Opus 4.7上失效的系统,其失败本身就是一个隐喻。它试图为组织建立“记忆”,但在技术快速迭代的背景下,连记忆系统本身都无法保持连续性。我们正在构建的系统,可能在我们需要依赖它们之前就已经被淘汰。这不仅仅是技术挑战,更是认知挑战:我们如何在一个没有稳定基础的世界中思考、规划和创造?
或许答案不在于追求绝对的稳定,而在于拥抱流动。就像那位创建Godspeed工具的开发者所做的那样,接受模型的快速变化作为给定的环境条件,然后构建能够在这种环境中生存的系统——不是试图抵抗变化,而是将变化纳入系统设计的前提。这需要一种新的技术哲学:不再将“稳定架构”视为目标,而是将“适应性架构”视为核心能力。在这种架构中,组件的替换不是失败,而是正常的代谢过程;系统的价值不在于其组件的持久性,而在于其适应新组件的能力。
最终,“永久性临时状态”可能不是我们需要逃离的困境,而是我们需要学会居住的新现实。在这个现实中,技术优势不再来自构建一个完美的系统并维护它多年,而是来自构建一个能够持续进化、快速吸收新技术、不断重塑自身的系统。这听起来像是科幻小说中的“活体架构”,但在AI驱动的未来,它可能成为技术生存的必需品。而那些能够在这种状态下保持创造力、方向感和团队凝聚力的组织,将定义下一个时代的技术景观。
参考来源
- RT by @paulg: A new paper in @Nature from David Reich, @aliakbari23 and colleagues breaks the conventional understanding of recent human evolution. The field believed that strong selection in the recent past (~10,000 years) was rare, with few exceptions like the lactase persistence locus. In this paper, the authors challenge that belief, showing that we weren't looking at the problem right.
- Previous studies that looked for evidence of selection using ancient DNA addressed the problem cross-sectionally, asking if allele frequencies differed across populations more than what one would expect based on genetic drift and migration. Most arrived at the conclusion that population structure primarily explained the observed differences. Here, the authors addressed the problem longitudinally, accounting for when ancient individuals lived by explicitly modeling time as a variable in the analysis. It turns out doing it this way dramatically increases power, increasing the number of genome-wide significant selection signals by 20-fold!
- Looking at why accounting for the time variable led to such dramatic changes in results, the authors find that previous studies missed so much because selection often happened not on new variants leading to dramatic sweeps (the conventional model: new variant -> selection -> increase in frequency) but on already existing variants driven by transient environmental pressures. Many of these variants underwent reversals, selected up when a pressure existed, then purged when it disappeared or the trade-off cost became dominant. A great example is the TYK2 variant, where an allele boosting immunity was selected for thousands of years because it protected against TB, then got purged as TB endemicity declined and the autoimmune cost took over.
- The scale of what they found is striking: hundreds of loci showing strong selection in the past 10,000 years with a median selection coefficient of ~0.86%. This number is pretty big in evolutionary terms, meaning allele frequencies have been shifting by ~1% per generation in a consistent direction. Previous selection scans found a maximum of 20 loci, and this one finds hundreds. That isn't an incremental change. It fundamentally reframes our understanding of how common strong selection has been in recent human history.
- Some of the most striking findings come from polygenic selection, where hundreds of small-effect alleles were pushed in the same direction simultaneously. Polygenic scores based on large-scale GWAS of today predict recent negative selection for traits like body fat, waist circumference and schizophrenia, and positive selection for others like cognitive traits. One important caveat is that GWAS phenotypes are measured in industrialized societies today, and how well they capture what was actually being selected in ancient environments is debatable.
- For me personally, these findings have direct implications for drug discovery. When using human genetics to find drug targets, we often fixate on the benefit and risk profiles of variants visible today. But we need to be aware that a variant's benefit:harm ratio might be environmentally contingent, and could reverse when the wrong environment manifests. An evolutionary understanding of a variant's association with traits is therefore essential.
- The same logic applies, perhaps even more urgently, to embryo selection. Selecting embryos based on polygenic traits is humans making permanent, heritable decisions for their offspring with a narrow view of today's environment. The ancient DNA record now shows that cost-benefit landscapes flip over time. So, an embryo carrying man-made selections is carrying those changes into an unpredictable future environment.
- The broader takeaway is that human evolution didn't freeze in the last 10,000 years. We just lacked the tools and datasets to see its movement. The current findings are based on European populations. I am curious to see these analyses extended to other populations too, like South Asian, East Asian and African populations, which might be holding more surprises to blow our minds.
- Akbari et al. Nature 2026
- https://www.nature.com/articles/s41586-026-10358-1 - https://nitter.net/doctorveera/status/2044679999450664967#m
- I benchmarked Opus 4.6 vs 4.7 on organizational memory retrieval. 4.6 wins, and the failure modes are fascinating. - https://www.reddit.com/r/ClaudeCode/comments/1soes75/i_benchmarked_opus_46_vs_47_on_organizational/
- Poor quality and too much cost? Exactly why i created Godspeed. (MIT) GIT 2 Prompt Claude Install - https://www.reddit.com/r/ClaudeCode/comments/1spoirh/poor_quality_and_too_much_cost_exactly_why_i/