AI 的「成本」，正在把所有人都拖下水

文章来源：08ai导航网发布时间：2025-08-06 16:55:43

想象一下，你开了家AI公司，心里清楚得很：用户最多只肯掏20美元一个月。

行，你心想，这不就是风投圈的经典剧本嘛——先亏本赚吆喝，用利润换增长。你也把什么获客成本、用户终身价值之类的黑话算得明明白白。

但好戏登场了：你肯定看过那张刷屏的a16z神图，说大模型的成本正以每年10倍的速度跳水。

于是你盘算着：今年我20美元/月能打平，等明年模型便宜10倍，Boom！90%的利润率到手。亏损只是暂时的，盈利是必然的。

这套算盘，简单到刚入行的投资经理都能一眼看懂：

这策略听着没毛病：“大模型推理成本每半年降3倍，我们死不了。”

然而18个月过去了，利润率还是负得触目惊心……有些公司已经倒闭清算，连Anthropic（Claude的公司）本周都不得不撤回了他们最初那个“200美元/月不限量”的旗舰套餐。

所有公司，依旧在流血。

模型的确变便宜了——GPT-3.5的价格只有过去的十分之一。但不知怎的，利润反而更差了。

事情不对劲了，对吧？

01没人想要昨天的报纸

GPT-3.5是便宜了10倍。但它现在的吸引力，就像在iPhone15发布会现场兜售诺基亚。

当一个新模型顶着“地表最强”（SOTA）的光环发布时，99%的需求会瞬间涌向它。用户对他们付费的产品，也是同样的期待。

现在，我们来看看那些“地表最强”模型——也就是在任何时间点都占据99%需求的模型的真实定价历史：

发现什么了吗？

当GPT-4以60美元的“天价”发布时，尽管上一代王者GPT-3.5已经便宜了26倍，但所有人还是扑向了GPT-4。

当Claude3Opus以同样的价格登场时，即便GPT-4已经降价，人们还是纷纷“叛逃”。

所谓的“成本下降10倍”是真的，但仅限于那些跟“小霸王学习机”一个年代感的旧模型。

所以，“成本会下降”这个策略的第一个支柱就塌了：市场的需求永远只追逐“当下最好的那款模型”。而最好的模型，价格永远都差不多，因为它就代表了今天顶尖算力所能达到的成本极限。

这就像指着一辆95年的老本田说“这车现在真便宜！”，完全没抓住重点。是，那辆特定的车是便宜了。但2025款的丰田凯美瑞，建议零售价还是3万美元。

当你花时间与一个AI相处时——无论是编程、写作还是思考——你总是本能地追求最高质量。没人会打开Claude然后想：“要不……我换个烂点的版本，帮老板省点钱？”

我们是认知上的“贪婪”生物。我们想要能搞到手的最好的“大脑”，尤其是在天平的另一端是我们自己宝贵的时间。

02模型的“胃口”，比我们想的要大得多

“好吧，那也还能接受，对吧？我们永远保持收支平衡不就行了？”

呵，少年，你还是太天真了。

虽然每一代顶尖模型的“单价”（pertoken）没有变得更贵，但另一件更可怕的事情发生了。

它们消耗的“算力单位”（token）数量，发生了核爆炸。

过去，你问ChatGPT一个问题，它回你一句话。现在，一个“深度研究”任务，它会花3分钟做计划，20分钟阅读资料，再花5分钟为你重写报告。而最新的Claude3Opus，你跟它说句“你好”，它都能自己“思考”上20分钟。

模型的进化，带来了一个谁也没预料到的结果：AI能完成的任务的“长度”，每六个月就翻一番。过去返回1000个token的任务，现在能返回10万个。

把这个趋势推演下去，数学模型会变得相当疯狂：

今天，一个20分钟的“深度研究”任务成本大约是1美元。到2027年，我们将拥有可以连续运行24小时而“不掉线”的智能体（Agent）……再结合顶尖模型那雷打不动的价格？

这意味着，一个用户，一天，光是一个任务，就要花掉72美元。而且，你还能同时开好几个。

一旦我们能部署这种可以异步运行24小时的智能体，我们就不会只给它一个指令然后傻等。我们会成批地下达任务。整个“AI工人大军”会并行解决问题，烧起token来，就像烧柴火一样。

显而易见——我必须强调这一点——每月20美元的订阅费，连一个用户每天跑一次1美元的“深度研究”任务都撑不住。但这恰恰是我们正在狂奔的方向。模型能力的每一次提升，都意味着它们能有意义地、在同一时间消耗掉更多算力。

这就像你费老大劲儿，造了个更省油的发动机，结果转头就用它去驱动一辆巨无霸卡车。没错，每加仑油是能跑更远了，但你现在要用掉比以前多50倍的油。

这就是那个把无数AI公司逼入绝境的“成本陷阱”——任何采用“固定月费+高强度算力消耗”商业模式的创业公司，都感觉自己正被人用枪指着脑袋。

03Anthropic的悲壮尝试

Claude那个“不限量”套餐的实验，是我们见过应对这场风暴的最精妙尝试。他们几乎用尽了所有招数，但最终还是被碾得粉碎。

他们的剧本，说实话非常聪明：

尽管有这么多天才的工程设计，token的消耗量还是如超新星爆发一般。

一百亿个tokens。一个月。

这相当于一个人在一个月里读了125万遍《战争与和平》。

怎么做到的？即便是连续跑10-20分钟的任务，怎么能消耗掉这么多？

事实证明，10-20分钟的连续运行，刚好足够让用户发现“for循环”的妙用。一旦token的消耗与用户在屏幕前的时间脱钩，物理定律就开始接管一切了。

让Claude执行一个任务，检查自己的工作，重构，优化，再来一遍……直到公司破产。

用户在一夜之间，从聊天者变成了API的指挥官，在Anthropic的服务器上7x24小时地跑着代码转换引擎。从聊天到智能体（Agent）的进化，一夜之间就完成了。消耗量暴增1000倍。这不是渐变，是相变。

所以Anthropic撤回了“不限量”。他们本可以试试2000美元/月，但教训不在于他们收费不够高，而在于：

在这个新世界里，任何订阅制的“固定价格”，都无法承载“不限量”的使用。

这盘数，已经从根本上算不通了。

04所有人的“囚徒困境”

这就把其他所有人都推到了一个绝境。

每家AI公司都知道，按使用量计费能救命。他们也知道，这会要了他们的命。当你老老实实地按$0.01/1ktokens收费时，你那被风投喂饱的竞争对手，正用20美元/月“不限量”的口号抢走你所有用户。

猜猜用户会去哪？

经典的囚徒困境：

所以，每个人都选择了“背叛”。每个人都在补贴那些“超级用户”。每个人都在画着那条漂亮的“曲棍球杆式”增长曲线。每个人也最终都会发布那篇“关于定价的重要更新”的公告。

那些头部的AI编程公司，他们都懂这笔账。他们选择了要今天的增长，明天的利润，以及未来的破产——但那是下一任CEO要头疼的事。

说实话？这可能是对的。在圈地运动中，市场份额比利润率更重要。只要VC们还愿意继续开支票来掩盖这糟糕的单位经济模型……

不信？去问问Jasper（曾经的AI写作独角兽），当音乐停止时会发生什么。

05如何逃离这场“死亡挤压”？

难道就真的无路可逃了吗？

有三条路可走：

1.从第一天起就按使用量计费

没有补贴，没有“先圈人后变现”，只有诚实的经济模型。理论上很美。

但现实是，你找一个正在爆发式增长的、面向消费者的、按量计费的AI公司给我看看？消费者讨厌计价器。他们宁愿为“无限”多付钱，也不愿收到一张意料之外的账单。所有成功的消费者订阅服务——Netflix、Spotify、ChatGPT——都是固定费率。计价器一开，增长就死。

2.用超高的“转换成本”来锁定高利润

这就是Devin（那个爆火的AI程序员）正在赌的。他们最近宣布了与花旗和高盛的合作，向这两家公司的数万名软件工程师部署Devin。

问个问题：你宁愿从高盛那里拿到1000万美元的年收入，还是从50万个开发者那里拿到5亿美元？

答案显而易见：那1000万美元意味着长达六个月的部署、合规审查、安全审计和采购地狱。这种合同极难赢得——但一旦赢了，就几乎不可能流失。

当竞争对手出现时，你已经深深地嵌入了对方的官僚体系中，换掉你的成本高到让CFO宁愿去死。因为转换成本足够高，客户对价格也就不那么敏感了，这才能带来80-90%的惊人利润。

3.垂直整合：在基础设施上赚钱

这是Replit的玩法：把AI编程助手和应用托管、数据库管理、部署监控等服务打包在一起。我在每个token上都亏钱，但我从新一代开发者使用的其他所有服务层上把钱赚回来。

把AI当作“钩子”，用来拉动其他能跟AWS竞争的服务的消费。你卖的不是AI算力，你卖的是算力之外的一切。AI只是你的市场营销费用。

这招的绝妙之处在于，代码生成天然地会创造对托管、数据库、监控的需求。让OpenAI和Anthropic去把AI算力的价格卷到零吧，你拥有了除此之外的一切。

至于那些还在玩“固定费率、不惜一切代价增长”游戏的公司？

他们是行尸走肉。只是葬礼定在了今年第四季度，而且会办得非常风光。

06前路何方

我总能看到创始人们指着那句“明年的模型会便宜10倍！”的口号，仿佛抓住了救命稻草。

是啊，没错。

但你的用户，会对它有20倍的期待。

终点线，正在以比你奔跑更快的速度远离你。

即使是像Anthropic这样拥有全球最顶级应用层的公司，也无法让“固定月费+不限量使用”的模式运转下去。

虽然“早起的鸟儿有虫吃”这句老话没错，但如果你只是起得早，却没有任何计划，那你也只是第一个赶到墓地而已。

这个世界，不会再有谷歌开出24亿美元的支票来收购一个负利润的公司了。当你的云服务账单已经超过了你的总收入时，根本不存在“以后再想办法”这回事。

那么，在这个世界里，你到底该如何建立一家公司？

答案，或许是成为一个“新云商”（Neocloud）——但这是后话了。

不过，至少，明年的模型，确实会便宜10倍的。:)

本文编译自HackingNews热榜文章《tokensaregettingmoreexpensive》。

原文链接：https://ethanding.substack.com/p/ai-subscriptions-get-short-squeezed

上一篇: 黄仁勋预言成真，AI智能体成GitHub主力，一天顶人类一年

「软件正在吞噬世界，但AI将吞噬软件。」—英伟达CEO黄仁勋的预言正加速照进现实。