今天巴克莱一篇对比谷歌和微软在推理流量上token消耗的对比,异常有酷好,以致有些出乎投资者预感外的实验。“免费”带来需求暴增,何况推理成本比预期的低不少。
1.AI推理畛域的都备向上
Alphabet在1Q25共推理≈634万亿(634T)tokens,而Microsoft约100T;到2025年4月,月度推理量已升至480T,较一年前的9.7T激增50倍,透露Google在AI推理流量上具备6倍于Azure/ChatGPT的畛域上风。
2.增长驱能源——免费AI家具而非付费订阅
推理量暴涨主要来自Search的AIOverviews等免费场景;GoogleSearch用户基数约为ChatGPT的5–6倍,免费AItoken增速(50×)远超付费大模子收入增速(3–4×),突显Google先以用户与数据壁垒为先、后续再寻求变现。
3.成本冲击被高估:推理奢华仅占搜索收入≈1%
按Gemini2.5费率估算,1Q25推理成本约7.5亿好意思元,仅占搜索收入的≈1%(占COGS+Opex1.6%);即便token按4倍速率不时攀升,也仍低于搜索中枢基础身手成本(≈18%收入),缓解商场对利润率下滑的担忧。
4.老本开支结构:试验为主,推理仅用≈10%
GoogleAI盘算CAPEX中约90%仍投向试验与新模子,推理对应的芯片CAPEX在1Q25仅6.2%(≈6亿好意思元)。若按480T月度run-rate估算,2Q25推理CAPEX也仅升至≈14%,透露资金仍主要押注恒久模子演进。
5.硬件后果:≈27万颗TPUv6即可扶植现存推理
摄取50/50Pro与Flash模子、15