①H系列算力租金普涨,从去年10月至今,H100租金涨幅约为20-30%; ②原材料涨价的同时,市场需求也颇为旺盛,Token调用量持续激增带动算力需求攀升; ③当前形势下,云厂商、模型厂商多次宣布涨价,和大厂强绑定的Neocloud也掌握了GPU合同协商主动权。
财联社4月16日讯(记者 付静)眼下,“Token经济学”成为热议话题。Token调用量快速增长,导致与其强绑定的算力硬件需求持续攀升。“算力是强需求,而且是全球性的,H100涨价也不是个例。”日前,一位算力供应链人士向财联社记者这样介绍目前的市场情况。
半导体研究机构SemiAnalysis本月发布的一组数据显示,H100一年期GPU租赁合同价格从2025年10月的每GPU每小时1.70美元的低点飙升至2026年3月的每GPU每小时2.35美元,涨幅近40%。
不过,多位接受财联社记者采访的算力业内人士表示,“租金确实在上涨,但是(涨幅)应该没这么高,从去年10月到现在,H100租金涨幅大概在20-30%。”
“正常的租赁价是五六万,最低的时候都到四五万了,现在加上机柜以后大概八、九万。”前述算力供应链人士告诉财联社记者。
算力资源信息共享平台柏林云负责人也对财联社记者表示,“H100租金最近在8万多的较多。”
SemiAnalysis同时还在报告中分析,“许多推理工作负载,如大型专家混合(MoE)推理,在最新的大型全球规模系统(如GB300 NVL72)上运行效果佳,而训练工作负载在H100上性价比最佳。即使是较旧的显卡,需求也居高不下。”
一家算力租赁企业负责人向财联社记者介绍,不只H100,H系列的租金出现了普涨。
财联社记者查阅SemiAnalysis网站了解到,该机构询问的GPU供应商中,有一半称H系列“无货”,大部分称没有租赁即将到期的H卡,部分H100合同的续费期限长达4年(期限为4-5年的合同一般是长期合同);2026年8-9月之前所有即将上线的Blackwell系列产能也已被预订一空。
柏林云负责人也给财联社记者提供了一组最新的算力资源价格趋势,“一台在2025年2月以245万采购的H200,用了一年多后,目前价值接近300万。”
她提到,服务器价格上涨,主要是因为包括内存、硬盘、GPU、CPU、光模块在内的核心组成部分都在涨,“不仅是内存(在涨价),内存只是涨幅大。”
今年1月财联社曾报道,不仅原材料涨价,市场需求也颇为旺盛,因此市场屡屡传出货源告急的消息,供需极度失衡,算力从业者坦言“很痛苦,我们现在每天都心惊肉跳,因为买不到货,现在大家手上都没东西租了,都只有一点点零零散散的东西。”
而Token调用量持续激增,则进一步促进了算力需求攀升。
3月,国家数据局局长刘烈宏在中国发展高层论坛2026年会上透露,2024年初,中国日均Token调用量为1000亿,到2025年底,跃升至100万亿,今年3月,已突破140万亿,两年增长超千倍。
有分析人士告诉财联社记者,今年推动Token使用量大幅增长的,一方面主要是用户基于Seedance、Nano Banana等产品大规模生成的图像和视频;另一方面是包括“龙虾”在内要执行多步工作流的智能体,它们通常高并发运行,且需持续迭代。
“智能体可能让Token耗费量增长了10倍都不止。”一家AI公司的创始人告诉财联社记者。
“还有一个问题就是,国内大厂租服务器过去,变成直接卖模型或者Token,它这个价格涨幅是好几倍的。所以对比下来硬件20-30%涨幅不算多,还是因为供不应求、严重缺货。”前述算力供应链人士告诉财联社记者。
“听说很多企业项目因为硬件成本涨价,暂时用云服务器的方式先满足客户业务需求。”另有接近国内几家云大厂的算力从业者向财联社记者介绍,也正因此,“几家云厂商也坐不住了,涨价了。”
“Token供不应求是客观存在,特别是智谱等模型厂家,自己没有云基础设施,折扣空间很小,他们目前主要卡在供这个环节,而阿里、字节等相对好一些。”一位Token聚合平台创业者告诉财联社记者。
公开信息显示,3月11日,腾讯云官宣AI模型涨价,混元系列模型Tencent HY2.0 Instruct、Tencent HY2.0 Think服务涨价,不论输入或输出价涨幅普遍在4倍以上。3月18日阿里云公告,因全球AI需求爆发、供应链涨价,阿里云AI算力、存储等产品最高涨价34%。同日,百度智能云公告,AI算力相关产品上调约5%-30%。
本月,涨价趋势仍在延续。4月9日,腾讯云正式发布价格调整公告,宣布将于5月9日起对AI算力、容器服务TKE-原生节点及弹性MapReduce(EMR)相关产品刊例价统一上调5%。4月13日,阿里云宣布旗下大模型平台百炼的Coding Plan Lite基础套餐停止续费和升级。4月15日晚,阿里云再发大模型服务平台百炼部分模型单元服务涨价通知,本次涨幅在2%-7%不等,于5月15日起正式生效。
多位业内人士曾告诉财联社记者,云厂商“涨价潮”主要受上游算力成本递增、市场需求增长、现阶段Token单价较低、市场竞争激烈等多重因素影响。
此外,智谱年内也已三次宣布提价。
值得注意的是,SemiAnalysis经调研还发现,目前Neocloud(指“新云”,一类专注于为AI工作负载提供高性能GPU算力的新兴云计算服务模式或市场类别,旨在应对传统云厂商在AI算力供给上的结构性不足)厂商和超大规模厂商掌握着主动权,可以协商更有利条款,如更高的预付金额、更优惠的价格、更长的合同期限,甚至可以选择合同开始和结束的日期,以匹配其库存情况。
对此,一位港股算力厂商业务负责人告诉财联社记者,美国CoreWeave、Nebius等Neocloud厂商,可进一步和大厂用户建立强绑定关系,且根据市场需求趋势做资产投入调整,使商业模式形成有效闭环。
