AI的“摩尔诅咒”:为什么技术迭代越快,工程价值越脆弱
当Levie感叹每季度就要扔掉大部分AI架构时,我们看到的不仅是技术进步的狂喜,更是一个根本性悖论:如果今天精心构建的系统注定在几个月后过时,那么‘建造’本身的意义何在?本文试图穿透AI繁荣的表象,探讨这种前所未有的迭代速度如何重塑技术伦理、商业逻辑与人类创造力的本质。
核心观点:当前AI模型以季度为单位的颠覆性进步,非但没有巩固工程实践的价值,反而正在系统性地摧毁长期技术投资的合理性,将整个行业推向一种“永久性临时建筑”的脆弱状态,这最终会损害创新的深度与可持续性。
在硅谷的某个角落,一位工程师刚刚完成了一个复杂的AI代理系统。这个系统精巧地绕过了模型上下文长度的限制,通过分层记忆、动态检索和智能压缩,让一个能力有限的模型能够处理看似无限的任务流。团队庆祝了整整一周,将其视为工程智慧的结晶。然而,仅仅三个月后,新一代模型发布,原生上下文窗口扩大了一个数量级,运行成本却更低。那个曾经精巧的系统,瞬间从核心资产变成了需要被“扔掉”的技术负债。这不是虚构的场景,而是AI领域创始人Aaron Levie在X上描述的日常现实:“如果你在构建智能体,基本上每过几个季度,你就需要扔掉之前为弥补模型缺陷而搭建的大部分工作。”这句话轻描淡写,却揭示了一个足以撼动整个技术产业根基的真相:我们正处在一个技术进步速度远超工程实践稳定周期的时代。这带来的不是单纯的效率提升,而是一种深刻的“价值蒸发”效应。
传统软件工程的价值,很大程度上建立在“累积”与“复用”之上。一个优秀的架构、一套清晰的抽象、一个稳定的中间件,其价值会随着时间推移而增长,成为企业难以复制的护城河。然而,在当前的AI浪潮中,这种逻辑正在失效。模型能力的跃迁不是线性的改进,而是范式性的替代。昨天还需要复杂工程拼接才能实现的功能,今天可能已成为模型的原生能力。这种替代不是“优化”,而是“颠覆”。它使得任何针对特定模型缺陷或限制的深度工程优化,都面临着在下一个模型发布时价值归零的风险。于是,一种新的策略开始盛行:与其投入数月构建一个精巧但脆弱的系统,不如“暴力”地等待更强大的模型,或者简单地用更多的计算资源去“堆砌”出一个临时解决方案。这听起来像是效率的胜利,实则是一种思维的投降——它默认了“建造”的长期价值低于“等待”的投机价值。
这种动态催生了一种“永久性临时建筑”的文化。技术决策的周期被极度压缩,长期规划变得几乎不可能。当你知道手中的核心工具每半年就会发生一次质变时,你很难有动力去进行需要数年才能看到回报的底层创新或生态建设。整个行业的注意力被锁定在追逐下一个模型发布、下一个API更新上。这种追逐是兴奋的,也是疲惫的;它创造了表面的繁荣,却可能侵蚀着创新的土壤。深度、复杂、需要时间沉淀的系统性思考,正在被快速、敏捷、但可能浅尝辄止的“即插即用”式开发所挤压。当“重新思考核心系统”成为每季度的例行公事时,系统还能有真正的“核心”吗?还是说,一切都变成了可随时替换的临时模块?
当然,乐观者会指出,这正是技术革命应有的样子——创造性破坏。旧工具的迅速过时,为新思想、新玩家腾出了空间。门槛的降低使得更多人能够参与创新。从某种角度看,这确实是民主化的力量。一个刚毕业的学生,凭借对最新模型的熟练使用,可能比一个拥有十年传统软件经验但固守旧范式的工程师,更能解决当下的问题。但这种“扁平化”也带来了隐忧。当经验的价值被急剧折旧,当对技术历史的深刻理解不再构成优势,我们是否也在失去从过去错误中学习、构建真正复杂而健壮系统的能力?工程,在某种意义上,是对约束的艺术性管理。当核心约束(如算力、模型能力)以不可预测的方式被突然解除,工程智慧的一部分——那种在有限条件下寻求最优解的创造性——是否会随之贬值?
更深层的问题在于商业模式的可持续性。如果一家初创公司基于当前最先进的模型构建了一个惊艳的产品,但它的技术壁垒完全依赖于对这套特定模型生态的理解和工程化,那么当下一代模型改变游戏规则时,它的壁垒可能会在一夜之间化为乌有。这迫使投资者和创业者都更加关注短期内的用户增长和网络效应,而非技术深度本身。因为技术深度在今天可能已无法构成有效的防御。这种压力进一步加剧了整个生态的短视和浮躁。
然而,在这场看似单向的“技术淘汰工程”的竞赛中,是否还存在一些恒定的、无法被简单迭代所替代的价值?我认为是存在的,但它们可能隐藏在不同的层面。首先,是对问题本质的深刻理解。无论模型如何变化,医疗、金融、教育、制造等领域的核心问题与业务流程是相对稳定的。能够精准定义问题、理解用户真实需求、并将其转化为有效的技术解决方案的能力,其价值不会过时。其次,是系统集成的智慧与数据飞轮的构建。即使单个模型组件被替换,如何将AI无缝、可靠、安全地集成到复杂的人类工作流和既有IT系统中,如何设计产品以持续收集高质量数据并形成反馈闭环,这些系统级的能力依然构成强大的壁垒。最后,或许是伦理、安全与可信赖性的框架。随着AI能力越强、应用越广,社会对其安全性、公平性、可解释性的要求只会越来越高。构建一套经得起考验的治理、审计和价值观对齐体系,是一项长期而艰巨的工程,其价值会随着时间愈发凸显。
因此,面对“摩尔诅咒”般的迭代速度,真正的挑战或许不在于如何跑得更快以跟上变化,而在于如何重新定义什么是值得建造的“坚固之物”。我们需要区分什么是“临时性的实现细节”(这些注定会被淘汰),什么是“持久性的问题抽象与架构原则”(这些应被保留和演进)。优秀的工程师和架构师,不应只是最新模型的熟练工,而应成为在流变的技术河床上,识别并锚定那些不变基岩的人。他们建造的,不应是与特定模型版本绑死的庞杂代码,而是一套能够灵活适配能力不断增长的“智能体”的、轻量而富有弹性的接口与协议。这要求一种思维范式的转变:从“为今天的模型建造最佳系统”,转向“为未知的明天模型设计最佳的接入与演化框架”。
最终,当前AI迭代的疯狂速度,既是一场盛宴,也是一次压力测试。它测试着我们区分“时尚”与“本质”的智慧,测试着我们在瞬时价值与长期价值之间取得平衡的能力。技术不会停止进步,但人类创造力的真正标志,或许不是建造最快过时的东西,而是在意识到一切终将过时的前提下,依然选择去建造那些能承载意义、连接彼此、并指向未来的结构。否则,我们只是在永无止境的拆除与重建中,耗尽自己的热情与想象力。
参考来源
- RT by @paulg: It’s remarkable how often you need to be dramatically upgrading your AI architecture given the pace of progress in AI models right now.
- If you’re building agents, you basically need to throw away large parts of previous work that you setup to compensate for model limitations every few quarters. The systems you built to mitigate context window limits aren’t useful anymore, and for many use-cases it’s easier just to throw more compute at a problem today in ways that wouldn’t have worked previously.
- If you’re deploying agents in a workflow, you likely need to equally be rethinking your core systems at about that same frequency. The way you would deploy agents in an enterprise 18 months ago is entirely different from the best practices that you’d have today.
- This is partly why everyone’s working so hard right now. Right as a best practice is solidified, models improve dramatically, and that old work is rendered obsolete. Unclear that this lets up anytime soon, which is why the it pays to be so wired in right now. - https://nitter.net/levie/status/2045680043607941548#m
- 《重返未来:1999》三周年特别版本·3.7版本PV:他者的悲哀 - https://www.bilibili.com/video/BV1MPdBB8EEN
- RT by @paulg: What I told 2,000 future founders in Bengaluru today:
- 1/ We believe we are at the start of a second wave of Indian companies that will build world-class AI native products for the global market. Emergent and Giga are the model of the future.
- 2/ Just because a space seems crowded doesn't mean it's too late. Zepto, Emergent, Giga - none were first movers. Second mover advantage is real.
- 3/ In fact, a good formula for finding startup ideas is to look at ideas that are showing some promise and just execute them better. Execution is everything: if you're an exceptional engineer, and you can build and move faster than your competitors, you'll win.
- 4/ There is every reason to believe Indian teams can beat US teams building global products. The level of engineering talent here is on a whole different level, and that's the key input.
- 5/ In the AI era, the best founders are the ones building at the edge of what's technically possible. You need to be experimenting wth the latest models, the latest open source projects.
- 6/ Stay in the flow of information. Watch the right podcasts, follow the right people on X. With AI changing this fast, you need to know what the smartest builders are thinking.
- 7/ Most of the best startups don't come from someone explicitly trying to start a company. They start from someone building a project just for fun, or tinkering with a new technology because they are curious. India needs more of this "tinkering" culture - this is how you have novel ideas when technology is shifting quickly.
- 8/ Founders are getting younger. Aadit was 18 when he started Zepto. The Giga founders were 20 when they came to SF. Young people who can learn very fast have the advantage right now.
- 9/ The best founders are pushing AI coding to the max. You can now write 20K lines of code / day. One person can do the work that just a year ago would take a 100 person team. The best builders are taking advantage and building at Garry Tan speeds. - https://nitter.net/snowmaker/status/2045506195415535872#m