每个团队都在给自己的 Agent 塞入记忆,却很少有人意识到,那把名为“tenant_id”的锁,在 AI 面前可能脆弱得像一张纸。

核心观点:当前 AI Agent 领域对“记忆”功能的狂热追求,正在制造一种新型系统漏洞:多租户环境下基于向量数据库的隔离方案,本质上只是脆弱的元数据过滤,它既无法抵御内部攻击,也无法应对模型本身的认知偏差,这将导致比传统数据泄露更隐蔽、更难追溯的灾难性后果。

在 AI Agent 的叙事里,“记忆”已经从一个技术选项变成了必备能力。没有记忆的 Agent 是白痴,记不住用户偏好的 Agent 是废物,这几乎成了行业共识。于是我们看到,从个人工具到企业级 SaaS,几乎每个 Agent 都在拼命往自己的架构里植入记忆模块——向量数据库、长期上下文、RAG 管道,技术栈越来越复杂,但一个根本性的问题却被系统性忽略了:这些所谓的“记忆”,究竟是谁的记忆?又由谁来确保它们不被偷看、篡改或劫持?

目前行业里最主流的做法,是将所有用户的记忆数据塞进一个共享的向量数据库,然后在每条记录上打一个 tenant_id 标签,查询时加上 WHERE 条件过滤。开发者们心安理得地称之为“多租户隔离”。但这种隔离的实质,不过是一个元数据字段——它既不是物理隔离,也不是加密隔离,而是逻辑隔离。在传统数据库场景中,这种隔离已经漏洞百出:SQL 注入、权限提升、错误配置,任何一个缺陷都可能导致全量数据泄露。而放在 AI Agent 的语境下,风险被指数级放大,因为向量数据库的查询机制本身就不是为安全设计的。

传统数据库的访问控制建立在精确匹配的基础上——如果你没有权限,你就无法 SELECT 那条记录。但向量数据库的逻辑是“相似度检索”,它不是去精确匹配一个 ID,而是去寻找“最相关的”内容嵌入。这就意味着,攻击者不需要直接查询某个特定用户的记忆,他只需要构造一个巧妙的嵌入向量,就能让模型在检索时“意外”地返回其他用户的敏感信息。这种攻击不需要 SQL 注入,不需要破解密码,只需要理解向量空间的数学结构。

更令人担忧的是,这种漏洞并非理论上的。已经有研究者和安全工程师开始揭露这类问题:当多租户 Agent 在同一个模型实例上运行,且共享上下文窗口时,模型本身的注意力机制会导致跨租户的信息泄漏。Agent 在回答一个用户的问题时,可能会因为上下文中的嵌入式记忆块,而错误地引用另一个用户的隐私数据。这甚至不需要恶意攻击——它只是模型在处理上下文时的自然行为,而开发者们却天真地以为一个 WHERE 子句就能挡住一切。

当然,会有反对者说,这种担忧是过度的。毕竟,在传统 SaaS 中,多租户共享数据库是常态,十几年来也没出大乱子。为什么到了 AI 这里就要大惊小怪?这种观点看似有理,实则忽略了两个关键区别。第一,传统 API 的调用是明确且可审计的——用户请求什么资源,返回什么资源,日志一清二楚。但 Agent 的“思考”过程是黑箱,你无法确定模型在生成回答时,是否读取了不该读的记忆块。第二,传统数据库的攻击成本很高,你需要找到 SQL 注入点或配置漏洞,而向量数据库的嵌入空间是连续且开放的,攻击面天然更大。

更棘手的是,即便开发者意识到了这个问题,现有的工程方案也远未成熟。物理隔离每个用户的向量数据库,成本极高,且会破坏 Agent 的共享知识能力。加密存储则会影响相似度检索的效率,让记忆功能本身变得鸡肋。同态加密理论上可行,但计算开销大到无法商用。于是,整个行业陷入了一种尴尬的处境:大家都在赶着上记忆功能,却没有人愿意为安全买单。

这不仅仅是技术债务,更是一种认知偏差。开发者们习惯于将“记忆”视为一种存储技术,就像文件系统或数据库一样,以为加个权限控制就万事大吉。但他们没有意识到,AI Agent 的记忆不是静态的、按需访问的;它是动态的、关联的、被模型主动检索和使用的。当记忆成为模型推理的一部分,安全就不再是数据库管理员的事,而变成了模型行为本身的问题。

这种风险在金融、医疗、法律等高度监管的行业尤为致命。想象一个场景:一家医院的 AI 助手记录了患者 A 的病史,但 Agent 在回答患者 B 的问题时,因为向量检索的模糊性,误将 A 的诊断结果作为参考信息输出给了 B。这在法律上构成严重的 HIPAA 违规,而在技术上,你甚至无法证明这一切是“意外”还是“设计缺陷”。

行业需要尽快承认:当前基于元数据过滤的多租户 Agent 记忆方案,不是安全的,只是暂时没被攻破。这种脆弱的安全模型,就像在台风中修了一道竹篱笆,看起来有边界,实则一推就倒。真正可靠的方案,要么是强制性的端到端加密并放弃相似度检索(这会牺牲功能),要么是物理隔离每个租户的推理环境(这会牺牲效率),要么是研发全新的隐私保护检索协议(这会牺牲时间)。但无论选择哪条路,都不应该继续假装 WHERE 子句就够用了。

最终,这不仅仅是技术问题,更是信任问题。如果 AI Agent 要成为未来十年企业级软件的核心入口,用户必须确信他们的记忆是安全的。但现实是,行业正在用最廉价的方式构建最核心的能力,而这种廉价,终将以数据泄露的形式付出代价。到那时,我们或许会怀念那个没有记忆的、单纯的、笨拙的 AI——至少它不会出卖你。

如果把这个判断再往前推一步,真正重要的不是 COMMENT: If Fulton…、「秦彻·爱猫及喵」PV公开——在N10…、Raven Software rele… 本身,而是它们共同暴露出的分配逻辑。 reddit、bilibili 在同一轮里把注意力推向同一问题,通常意味着这个主题正在从圈层内部经验,转向更可共享的公共议题。 这也是为什么这种内容值得写成长文:短帖只负责提醒你“这里有事发生”,但只有长文才能把背景、代价、误判空间和后续影响放到同一张桌面上。 换句话说,当前 AI Agent 领域对“记忆”功能的狂热追求,正在制造一种新型系统漏洞:多租户环境下基于向量数据库的隔离方案,本质上只是脆弱的元数据过滤,它既无法抵御内部攻击,也无法应对模型本身的认知偏差,这将导致比传统数据泄露更隐蔽、更难追溯的灾难性后果。 之所以重要,不是因为它看上去新,而是因为它会重新定义用户接下来应该如何理解这一类内容。