首页 > AI教程资讯

AI 的「成本」,正在把所有人都拖下水

文章来源:08ai导航网发布时间:2025-08-06 16:55:43

想象一下,你开了家AI公司,心里清楚得很:用户最多只肯掏20美元一个月。

行,你心想,这不就是风投圈的经典剧本嘛——先亏本赚吆喝,用利润换增长。你也把什么获客成本、用户终身价值之类的黑话算得明明白白。

但好戏登场了:你肯定看过那张刷屏的a16z神图,说大模型的成本正以每年10倍的速度跳水。

于是你盘算着:今年我20美元/月能打平,等明年模型便宜10倍,Boom!90%的利润率到手。亏损只是暂时的,盈利是必然的。

这套算盘,简单到刚入行的投资经理都能一眼看懂:

这策略听着没毛病:“大模型推理成本每半年降3倍,我们死不了。”

然而18个月过去了,利润率还是负得触目惊心……有些公司已经倒闭清算,连Anthropic(Claude的公司)本周都不得不撤回了他们最初那个“200美元/月不限量”的旗舰套餐。

所有公司,依旧在流血。

模型的确变便宜了——GPT-3.5的价格只有过去的十分之一。但不知怎的,利润反而更差了。

事情不对劲了,对吧?

01没人想要昨天的报纸

GPT-3.5是便宜了10倍。但它现在的吸引力,就像在iPhone15发布会现场兜售诺基亚。

当一个新模型顶着“地表最强”(SOTA)的光环发布时,99%的需求会瞬间涌向它。用户对他们付费的产品,也是同样的期待。

现在,我们来看看那些“地表最强”模型——也就是在任何时间点都占据99%需求的模型的真实定价历史:

发现什么了吗?

当GPT-4以60美元的“天价”发布时,尽管上一代王者GPT-3.5已经便宜了26倍,但所有人还是扑向了GPT-4。

当Claude3Opus以同样的价格登场时,即便GPT-4已经降价,人们还是纷纷“叛逃”。

所谓的“成本下降10倍”是真的,但仅限于那些跟“小霸王学习机”一个年代感的旧模型。

所以,“成本会下降”这个策略的第一个支柱就塌了:市场的需求永远只追逐“当下最好的那款模型”。而最好的模型,价格永远都差不多,因为它就代表了今天顶尖算力所能达到的成本极限。

这就像指着一辆95年的老本田说“这车现在真便宜!”,完全没抓住重点。是,那辆特定的车是便宜了。但2025款的丰田凯美瑞,建议零售价还是3万美元。

当你花时间与一个AI相处时——无论是编程、写作还是思考——你总是本能地追求最高质量。没人会打开Claude然后想:“要不……我换个烂点的版本,帮老板省点钱?”

我们是认知上的“贪婪”生物。我们想要能搞到手的最好的“大脑”,尤其是在天平的另一端是我们自己宝贵的时间。

02模型的“胃口”,比我们想的要大得多

“好吧,那也还能接受,对吧?我们永远保持收支平衡不就行了?”

呵,少年,你还是太天真了。

虽然每一代顶尖模型的“单价”(pertoken)没有变得更贵,但另一件更可怕的事情发生了。

它们消耗的“算力单位”(token)数量,发生了核爆炸。

过去,你问ChatGPT一个问题,它回你一句话。现在,一个“深度研究”任务,它会花3分钟做计划,20分钟阅读资料,再花5分钟为你重写报告。而最新的Claude3Opus,你跟它说句“你好”,它都能自己“思考”上20分钟。

模型的进化,带来了一个谁也没预料到的结果:AI能完成的任务的“长度”,每六个月就翻一番。过去返回1000个token的任务,现在能返回10万个。

把这个趋势推演下去,数学模型会变得相当疯狂:

今天,一个20分钟的“深度研究”任务成本大约是1美元。到2027年,我们将拥有可以连续运行24小时而“不掉线”的智能体(Agent)……再结合顶尖模型那雷打不动的价格?

这意味着,一个用户,一天,光是一个任务,就要花掉72美元。而且,你还能同时开好几个。

一旦我们能部署这种可以异步运行24小时的智能体,我们就不会只给它一个指令然后傻等。我们会成批地下达任务。整个“AI工人大军”会并行解决问题,烧起token来,就像烧柴火一样。

显而易见——我必须强调这一点——每月20美元的订阅费,连一个用户每天跑一次1美元的“深度研究”任务都撑不住。但这恰恰是我们正在狂奔的方向。模型能力的每一次提升,都意味着它们能有意义地、在同一时间消耗掉更多算力。

这就像你费老大劲儿,造了个更省油的发动机,结果转头就用它去驱动一辆巨无霸卡车。没错,每加仑油是能跑更远了,但你现在要用掉比以前多50倍的油。

这就是那个把无数AI公司逼入绝境的“成本陷阱”——任何采用“固定月费+高强度算力消耗”商业模式的创业公司,都感觉自己正被人用枪指着脑袋。

03Anthropic的悲壮尝试

Claude那个“不限量”套餐的实验,是我们见过应对这场风暴的最精妙尝试。他们几乎用尽了所有招数,但最终还是被碾得粉碎。

他们的剧本,说实话非常聪明:

尽管有这么多天才的工程设计,token的消耗量还是如超新星爆发一般。

一百亿个tokens。一个月。

这相当于一个人在一个月里读了125万遍《战争与和平》。

怎么做到的?即便是连续跑10-20分钟的任务,怎么能消耗掉这么多?

事实证明,10-20分钟的连续运行,刚好足够让用户发现“for循环”的妙用。一旦token的消耗与用户在屏幕前的时间脱钩,物理定律就开始接管一切了。

让Claude执行一个任务,检查自己的工作,重构,优化,再来一遍……直到公司破产。

用户在一夜之间,从聊天者变成了API的指挥官,在Anthropic的服务器上7x24小时地跑着代码转换引擎。从聊天到智能体(Agent)的进化,一夜之间就完成了。消耗量暴增1000倍。这不是渐变,是相变。

所以Anthropic撤回了“不限量”。他们本可以试试2000美元/月,但教训不在于他们收费不够高,而在于:

在这个新世界里,任何订阅制的“固定价格”,都无法承载“不限量”的使用。

这盘数,已经从根本上算不通了。

04所有人的“囚徒困境”

这就把其他所有人都推到了一个绝境。

每家AI公司都知道,按使用量计费能救命。他们也知道,这会要了他们的命。当你老老实实地按$0.01/1ktokens收费时,你那被风投喂饱的竞争对手,正用20美元/月“不限量”的口号抢走你所有用户。

猜猜用户会去哪?

经典的囚徒困境:

所以,每个人都选择了“背叛”。每个人都在补贴那些“超级用户”。每个人都在画着那条漂亮的“曲棍球杆式”增长曲线。每个人也最终都会发布那篇“关于定价的重要更新”的公告。

那些头部的AI编程公司,他们都懂这笔账。他们选择了要今天的增长,明天的利润,以及未来的破产——但那是下一任CEO要头疼的事。

说实话?这可能是对的。在圈地运动中,市场份额比利润率更重要。只要VC们还愿意继续开支票来掩盖这糟糕的单位经济模型……

不信?去问问Jasper(曾经的AI写作独角兽),当音乐停止时会发生什么。

05如何逃离这场“死亡挤压”?

难道就真的无路可逃了吗?

有三条路可走:

1.从第一天起就按使用量计费

没有补贴,没有“先圈人后变现”,只有诚实的经济模型。理论上很美。

但现实是,你找一个正在爆发式增长的、面向消费者的、按量计费的AI公司给我看看?消费者讨厌计价器。他们宁愿为“无限”多付钱,也不愿收到一张意料之外的账单。所有成功的消费者订阅服务——Netflix、Spotify、ChatGPT——都是固定费率。计价器一开,增长就死。

2.用超高的“转换成本”来锁定高利润

这就是Devin(那个爆火的AI程序员)正在赌的。他们最近宣布了与花旗和高盛的合作,向这两家公司的数万名软件工程师部署Devin。

问个问题:你宁愿从高盛那里拿到1000万美元的年收入,还是从50万个开发者那里拿到5亿美元?

答案显而易见:那1000万美元意味着长达六个月的部署、合规审查、安全审计和采购地狱。这种合同极难赢得——但一旦赢了,就几乎不可能流失。

当竞争对手出现时,你已经深深地嵌入了对方的官僚体系中,换掉你的成本高到让CFO宁愿去死。因为转换成本足够高,客户对价格也就不那么敏感了,这才能带来80-90%的惊人利润。

3.垂直整合:在基础设施上赚钱

这是Replit的玩法:把AI编程助手和应用托管、数据库管理、部署监控等服务打包在一起。我在每个token上都亏钱,但我从新一代开发者使用的其他所有服务层上把钱赚回来。

把AI当作“钩子”,用来拉动其他能跟AWS竞争的服务的消费。你卖的不是AI算力,你卖的是算力之外的一切。AI只是你的市场营销费用。

这招的绝妙之处在于,代码生成天然地会创造对托管、数据库、监控的需求。让OpenAI和Anthropic去把AI算力的价格卷到零吧,你拥有了除此之外的一切。

至于那些还在玩“固定费率、不惜一切代价增长”游戏的公司?

他们是行尸走肉。只是葬礼定在了今年第四季度,而且会办得非常风光。

06前路何方

我总能看到创始人们指着那句“明年的模型会便宜10倍!”的口号,仿佛抓住了救命稻草。

是啊,没错。

但你的用户,会对它有20倍的期待。

终点线,正在以比你奔跑更快的速度远离你。

即使是像Anthropic这样拥有全球最顶级应用层的公司,也无法让“固定月费+不限量使用”的模式运转下去。

虽然“早起的鸟儿有虫吃”这句老话没错,但如果你只是起得早,却没有任何计划,那你也只是第一个赶到墓地而已。

这个世界,不会再有谷歌开出24亿美元的支票来收购一个负利润的公司了。当你的云服务账单已经超过了你的总收入时,根本不存在“以后再想办法”这回事。

那么,在这个世界里,你到底该如何建立一家公司?

答案,或许是成为一个“新云商”(Neocloud)——但这是后话了。

不过,至少,明年的模型,确实会便宜10倍的。:)

本文编译自HackingNews热榜文章《tokensaregettingmoreexpensive》。

原文链接:https://ethanding.substack.com/p/ai-subscriptions-get-short-squeezed