AI 时代的反直觉：最想让你依赖它的公司，也最不得不限制你

在互联网时代，用户是平台最稀缺的资源。谁能吸引用户，谁能让用户停留更久、点击更多、消费更多内容，谁就拥有更强的商业化能力。因此，互联网公司的产品逻辑几乎都是围绕“延长使用时间”展开的：推荐算法、信息流、点赞反馈、消息提醒、用户画像、行为追踪，最终都服务于同一个目标：让用户持续关注、持续使用。

但到了 AI 时代，事情发生了微妙而深刻的变化。

AI 公司当然也希望用户使用自己的产品，甚至希望用户形成依赖。但它们面对的核心约束不再只是“如何吸引用户”，而是“如何控制用户”。因为在大模型时代，用户每一次提问、每一次生成、每一次长上下文对话、每一次图片或视频处理，背后都对应着真实的推理成本。GPU、显存、电力、带宽、模型调度、服务器资源，都会随着使用量上升而迅速消耗。

这就是 AI 时代和互联网时代最大的不同之一：互联网产品通常希望你无限使用，而 AI 产品在很多时候不得不阻止你继续使用。

互联网时代的稀缺资源是注意力，AI 时代的稀缺资源是算力。

注意力经济的产品设计，是把用户拉回来。算力经济的产品设计，却经常表现为把用户挡在门外。用户刚刚开始深入使用一个模型，刚刚把它纳入工作流，刚刚形成“我可以依赖它”的习惯，却突然遇到限额、降级、排队、冷却时间、订阅墙。这种体验不是偶然的产品瑕疵，而是当前 AI 商业模式的结构性矛盾。

AI 公司一方面要教育用户：你应该用 AI，你的工作、学习、创作、编程、搜索都可以交给 AI。另一方面，它们又必须对用户说：你不能用太多，至少不能以这个价格用太多。

这是一种非常反直觉的关系。

在传统互联网服务里，边际成本相对较低。多一个用户刷信息流、多看几条内容、多停留十分钟，平台当然也有服务器成本，但这些成本通常可以被广告、数据、网络效应和规模化基础设施摊薄。用户越活跃，平台越容易赚钱。

而 AI 推理不同。尤其是高质量模型，每一次调用都有明确成本。复杂问题、长文本、多模态输入、代码执行、智能体任务，成本会进一步放大。一个重度用户可能远远超过订阅费本身带来的收入。于是，AI 公司不得不设计各种限制机制：免费额度、付费额度、模型限额、速率限制、上下文限制、高峰期降级、不同模型分层。

这意味着 AI 产品的商业逻辑里存在一个天然冲突：它越好用，用户越想用；用户越想用，公司成本越高；成本越高，公司越必须限制用户；限制越多，用户体验越受损。

“Rate limits remaining 0%”这样的提示，其实就是这个时代的一个象征。它不是简单的技术提示，而是 AI 产品经济学的外化。用户被鼓励进入 AI 工作流，却又在关键时刻被限额拦住。这种体验会让用户产生一种新的不安全感：我不是不想使用 AI，而是 AI 不一定允许我持续使用它。

从这个角度看，AI 公司确实在某种意义上“推开用户”。不是因为它们不需要用户，而是因为当前的算力结构决定了它们不能像互联网公司那样无条件拥抱用户的无限使用。

这也解释了为什么 AI 时代的产品分层会比互联网时代更加明显。免费用户会被严格限制，普通订阅用户会遇到高峰限制，高级用户会被引导到更贵的套餐，企业用户和 API 用户则进入按量计费体系。未来 AI 服务很可能越来越像电力、水、云计算，而不是传统互联网应用：你可以用，但用多少、用多强、什么时候用，都要和成本直接挂钩。

这会带来一个重要结果：AI 的普及速度不只取决于模型能力，也取决于推理成本下降的速度。

如果算力成本不能持续下降，AI 就会长期停留在“强大但受限”的状态。用户知道它有用，但不能随时放开使用；企业知道它能提高效率，但必须精打细算；开发者知道它可以改变产品形态，但必须考虑每一次调用的成本。AI 的想象力会被算力账单牢牢牵住。

真正的拐点，可能不是某个模型又聪明了多少，而是某一天高质量推理变得足够便宜。只有当 AI 调用的边际成本大幅下降，AI 公司才有可能像互联网公司一样鼓励用户“尽管用”。那时，AI 才会真正从稀缺服务变成基础设施。

因此，未来竞争的核心不只是模型参数、排行榜分数或产品界面，而是整个推理成本体系：芯片、数据中心、模型压缩、蒸馏、小模型、本地运行、缓存、路由、多模型协同、端侧计算。谁能用更低成本提供足够好的智能，谁就能突破当前 AI 产品最尴尬的限制：既想让用户依赖，又害怕用户真的太依赖。

互联网时代，平台想尽办法让你不要离开。

AI 时代，最先进的产品有时会对你说：今天先到这里。