文章来源:08ai导航网发布时间:2025-08-06 16:55:43
想象一下,你开了家AI公司,心里清楚得很:用户最多只肯掏20美元一个月。
行,你心想,这不就是风投圈的经典剧本嘛——先亏本赚吆喝,用利润换增长。你也把什么获客成本、用户终身价值之类的黑话算得明明白白。
但好戏登场了:你肯定看过那张刷屏的a16z神图,说大模型的成本正以每年10倍的速度跳水。
于是你盘算着:今年我20美元/月能打平,等明年模型便宜10倍,Boom!90%的利润率到手。亏损只是暂时的,盈利是必然的。
这套算盘,简单到刚入行的投资经理都能一眼看懂:
这策略听着没毛病:“大模型推理成本每半年降3倍,我们死不了。”
然而18个月过去了,利润率还是负得触目惊心……有些公司已经倒闭清算,连Anthropic(Claude的公司)本周都不得不撤回了他们最初那个“200美元/月不限量”的旗舰套餐。
所有公司,依旧在流血。
模型的确变便宜了——GPT-3.5的价格只有过去的十分之一。但不知怎的,利润反而更差了。
事情不对劲了,对吧?
GPT-3.5是便宜了10倍。但它现在的吸引力,就像在iPhone15发布会现场兜售诺基亚。
当一个新模型顶着“地表最强”(SOTA)的光环发布时,99%的需求会瞬间涌向它。用户对他们付费的产品,也是同样的期待。
现在,我们来看看那些“地表最强”模型——也就是在任何时间点都占据99%需求的模型的真实定价历史:
发现什么了吗?
当GPT-4以60美元的“天价”发布时,尽管上一代王者GPT-3.5已经便宜了26倍,但所有人还是扑向了GPT-4。
当Claude3Opus以同样的价格登场时,即便GPT-4已经降价,人们还是纷纷“叛逃”。
所谓的“成本下降10倍”是真的,但仅限于那些跟“小霸王学习机”一个年代感的旧模型。
所以,“成本会下降”这个策略的第一个支柱就塌了:市场的需求永远只追逐“当下最好的那款模型”。而最好的模型,价格永远都差不多,因为它就代表了今天顶尖算力所能达到的成本极限。
这就像指着一辆95年的老本田说“这车现在真便宜!”,完全没抓住重点。是,那辆特定的车是便宜了。但2025款的丰田凯美瑞,建议零售价还是3万美元。
当你花时间与一个AI相处时——无论是编程、写作还是思考——你总是本能地追求最高质量。没人会打开Claude然后想:“要不……我换个烂点的版本,帮老板省点钱?”
我们是认知上的“贪婪”生物。我们想要能搞到手的最好的“大脑”,尤其是在天平的另一端是我们自己宝贵的时间。
“好吧,那也还能接受,对吧?我们永远保持收支平衡不就行了?”
呵,少年,你还是太天真了。
虽然每一代顶尖模型的“单价”(pertoken)没有变得更贵,但另一件更可怕的事情发生了。
它们消耗的“算力单位”(token)数量,发生了核爆炸。
过去,你问ChatGPT一个问题,它回你一句话。现在,一个“深度研究”任务,它会花3分钟做计划,20分钟阅读资料,再花5分钟为你重写报告。而最新的Claude3Opus,你跟它说句“你好”,它都能自己“思考”上20分钟。
模型的进化,带来了一个谁也没预料到的结果:AI能完成的任务的“长度”,每六个月就翻一番。过去返回1000个token的任务,现在能返回10万个。
把这个趋势推演下去,数学模型会变得相当疯狂:
今天,一个20分钟的“深度研究”任务成本大约是1美元。到2027年,我们将拥有可以连续运行24小时而“不掉线”的智能体(Agent)……再结合顶尖模型那雷打不动的价格?
这意味着,一个用户,一天,光是一个任务,就要花掉72美元。而且,你还能同时开好几个。
一旦我们能部署这种可以异步运行24小时的智能体,我们就不会只给它一个指令然后傻等。我们会成批地下达任务。整个“AI工人大军”会并行解决问题,烧起token来,就像烧柴火一样。
显而易见——我必须强调这一点——每月20美元的订阅费,连一个用户每天跑一次1美元的“深度研究”任务都撑不住。但这恰恰是我们正在狂奔的方向。模型能力的每一次提升,都意味着它们能有意义地、在同一时间消耗掉更多算力。
这就像你费老大劲儿,造了个更省油的发动机,结果转头就用它去驱动一辆巨无霸卡车。没错,每加仑油是能跑更远了,但你现在要用掉比以前多50倍的油。
这就是那个把无数AI公司逼入绝境的“成本陷阱”——任何采用“固定月费+高强度算力消耗”商业模式的创业公司,都感觉自己正被人用枪指着脑袋。
Claude那个“不限量”套餐的实验,是我们见过应对这场风暴的最精妙尝试。他们几乎用尽了所有招数,但最终还是被碾得粉碎。
他们的剧本,说实话非常聪明:
尽管有这么多天才的工程设计,token的消耗量还是如超新星爆发一般。
一百亿个tokens。一个月。
这相当于一个人在一个月里读了125万遍《战争与和平》。
怎么做到的?即便是连续跑10-20分钟的任务,怎么能消耗掉这么多?
事实证明,10-20分钟的连续运行,刚好足够让用户发现“for循环”的妙用。一旦token的消耗与用户在屏幕前的时间脱钩,物理定律就开始接管一切了。
让Claude执行一个任务,检查自己的工作,重构,优化,再来一遍……直到公司破产。
用户在一夜之间,从聊天者变成了API的指挥官,在Anthropic的服务器上7x24小时地跑着代码转换引擎。从聊天到智能体(Agent)的进化,一夜之间就完成了。消耗量暴增1000倍。这不是渐变,是相变。
所以Anthropic撤回了“不限量”。他们本可以试试2000美元/月,但教训不在于他们收费不够高,而在于:
在这个新世界里,任何订阅制的“固定价格”,都无法承载“不限量”的使用。
这盘数,已经从根本上算不通了。
这就把其他所有人都推到了一个绝境。
每家AI公司都知道,按使用量计费能救命。他们也知道,这会要了他们的命。当你老老实实地按$0.01/1ktokens收费时,你那被风投喂饱的竞争对手,正用20美元/月“不限量”的口号抢走你所有用户。
猜猜用户会去哪?
经典的囚徒困境:
所以,每个人都选择了“背叛”。每个人都在补贴那些“超级用户”。每个人都在画着那条漂亮的“曲棍球杆式”增长曲线。每个人也最终都会发布那篇“关于定价的重要更新”的公告。
那些头部的AI编程公司,他们都懂这笔账。他们选择了要今天的增长,明天的利润,以及未来的破产——但那是下一任CEO要头疼的事。
说实话?这可能是对的。在圈地运动中,市场份额比利润率更重要。只要VC们还愿意继续开支票来掩盖这糟糕的单位经济模型……
不信?去问问Jasper(曾经的AI写作独角兽),当音乐停止时会发生什么。
难道就真的无路可逃了吗?
有三条路可走:
1.从第一天起就按使用量计费
没有补贴,没有“先圈人后变现”,只有诚实的经济模型。理论上很美。
但现实是,你找一个正在爆发式增长的、面向消费者的、按量计费的AI公司给我看看?消费者讨厌计价器。他们宁愿为“无限”多付钱,也不愿收到一张意料之外的账单。所有成功的消费者订阅服务——Netflix、Spotify、ChatGPT——都是固定费率。计价器一开,增长就死。
2.用超高的“转换成本”来锁定高利润
这就是Devin(那个爆火的AI程序员)正在赌的。他们最近宣布了与花旗和高盛的合作,向这两家公司的数万名软件工程师部署Devin。
问个问题:你宁愿从高盛那里拿到1000万美元的年收入,还是从50万个开发者那里拿到5亿美元?
答案显而易见:那1000万美元意味着长达六个月的部署、合规审查、安全审计和采购地狱。这种合同极难赢得——但一旦赢了,就几乎不可能流失。
当竞争对手出现时,你已经深深地嵌入了对方的官僚体系中,换掉你的成本高到让CFO宁愿去死。因为转换成本足够高,客户对价格也就不那么敏感了,这才能带来80-90%的惊人利润。
3.垂直整合:在基础设施上赚钱
这是Replit的玩法:把AI编程助手和应用托管、数据库管理、部署监控等服务打包在一起。我在每个token上都亏钱,但我从新一代开发者使用的其他所有服务层上把钱赚回来。
把AI当作“钩子”,用来拉动其他能跟AWS竞争的服务的消费。你卖的不是AI算力,你卖的是算力之外的一切。AI只是你的市场营销费用。
这招的绝妙之处在于,代码生成天然地会创造对托管、数据库、监控的需求。让OpenAI和Anthropic去把AI算力的价格卷到零吧,你拥有了除此之外的一切。
至于那些还在玩“固定费率、不惜一切代价增长”游戏的公司?
他们是行尸走肉。只是葬礼定在了今年第四季度,而且会办得非常风光。
我总能看到创始人们指着那句“明年的模型会便宜10倍!”的口号,仿佛抓住了救命稻草。
是啊,没错。
但你的用户,会对它有20倍的期待。
终点线,正在以比你奔跑更快的速度远离你。
即使是像Anthropic这样拥有全球最顶级应用层的公司,也无法让“固定月费+不限量使用”的模式运转下去。
虽然“早起的鸟儿有虫吃”这句老话没错,但如果你只是起得早,却没有任何计划,那你也只是第一个赶到墓地而已。
这个世界,不会再有谷歌开出24亿美元的支票来收购一个负利润的公司了。当你的云服务账单已经超过了你的总收入时,根本不存在“以后再想办法”这回事。
那么,在这个世界里,你到底该如何建立一家公司?
答案,或许是成为一个“新云商”(Neocloud)——但这是后话了。
不过,至少,明年的模型,确实会便宜10倍的。:)
本文编译自HackingNews热榜文章《tokensaregettingmoreexpensive》。
原文链接:https://ethanding.substack.com/p/ai-subscriptions-get-short-squeezed
相关攻略 更多
最新资讯 更多
AI 的「成本」,正在把所有人都拖下水
更新时间:2025-08-06
黄仁勋预言成真,AI智能体成GitHub主力,一天顶人类一年
更新时间:2025-08-06
谢赛宁「踩雷」背后,竟藏着科研圈更黑真相:Science实锤论文造假+AI滥用
更新时间:2025-08-06
今年 AI 圈最抓马宫斗还没完,Windsurf 华人新东家要求 996,不干就走人
更新时间:2025-08-06
英伟达最新研究:小模型才是智能体的未来
更新时间:2025-08-06
苹果AI乱局:库克越重视,业务越混乱?
更新时间:2025-08-06
AI时代,算法挑拨离间所有人的关系
更新时间:2025-08-06
赛博沙盒:如何与AI共创未来
更新时间:2025-08-06
大模型、机器人、Agent扎堆亮相……WAIC2025「氪话未来」直播间藏着多少AI「未来答案」?
更新时间:2025-08-06
AI竞技场,归根到底只是一门生意
更新时间:2025-08-06