英伟达LPU新品会挤压HBM市场?黄仁勋早就澄清过这个误解
原创
2026-03-05 20:06 星期四
财联社 史正丞
①英伟达GTC大会前夕,有关推出Groq芯片推理系统的传言,引发“SRAM路线将削弱HBM需求”的市场猜测;
②但事实上,两者并不是简单的“互相替代”关系。

财联社3月5日讯(编辑 史正丞)随着韩国股市近3天坐上“过山车”,一些揣测也在股价巨震期间敲打着股民们紧绷的神经。

作为背景,上周五美股收盘后有爆料称,英伟达将在当地时间3月16日举行的GTC大会上发布一款专门用于推理计算的新系统,这个新平台将采用初创公司Groq设计的芯片。

随着上周末中东战火重燃,韩国股市周一休市后,周二、周三均遭遇大跌,三星电子、SK海力士均累计跌近20%。除了中东战火外,市场里似乎也有一些声音将内存巨头的大跌归因于“Groq抢了HBM的饭碗”。

image

(三星电子、SK海力士周四均强劲反弹,来源:TradingView)

何来忧虑?

作为背景,英伟达去年底豪掷200亿美元,获得芯片初创公司Groq的人才团队和非独占专利授权。这也是英伟达在核心算力芯片产品上首次大规模引入外部架构。

引发部分三星、海力士股东焦虑的点,正是Groq自研的LPU(语言处理单元)芯片。该芯片的核心特点是在片上集成数百兆SRAM(访问速度比HBM快约20倍),通过减少或者完全不调用外部存储,实现超低延迟的token输出。

随着英伟达发布会临近,“Groq是否利空HBM”又被拿来讨论:如果推理芯片路线从HBM堆料转向片上SRAM,存储公司的生意不是被抢走了么?

作为这一猜想的佐证,OpenAI上周五在宣布获得英伟达300亿美元融资时,就专门强调将从该公司购买大量“专用推理算力”,暗示了这款新型处理器的存在。

黄仁勋也曾表示,将在GTC上发布“世界前所未见”的全新芯片。市场猜测,如果不是Rubin CPX或下一代Feynman架构的GPU旗舰产品,确有可能是以SRAM为核心的LPU。

两者真的是替代关系么?

对于这种说法,韩国科技分析师Jukan周四开盘前引用独立分析机构KIS的分析称,认为SRAM推理芯片的出现将减少HBM使用的想法,反映出对存储器的理解不足

分析称,与DRAM相比,SRAM的单元面积大、密度低。相同容量的SRAM需要DRAM 5到10倍的芯片面积,因此也限制了容量的扩展。正因如此,SRAM历来被用于对延迟要求极低的缓存或片上缓冲区应用,而不是作为存储大量数据的主存储器。

因此,与其说取代GPU,这类芯片更多会成为针对特定推理工作的额外选择,例如需要极低延迟的物理AI边缘应用(机器人和自动驾驶),而不是取代HBM或DRAM。

事实上,英伟达CEO黄仁勋也在1月CES的分析师问答活动上详细解释过这件事。

黄仁勋表示,如果把所有东西都放在SRAM里,那么当然就不需要HBM内存了。但问题是:能够放进这些SRAM里的模型规模会小大约100倍。工作负载的形态一直在变化,有时候会遇到MoE模型,还有多模态模型等,因此英伟达需要提供普适性的解决方案。

黄仁勋也指出,对于某些特定工作负载来说,SRAM可能会“快得惊人”,因此在预填充阶段和解码阶段可以看到一些好处。

收藏
16.06W
我要评论
图片
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
要闻
股市
关联话题
14.46W 人关注
5.72W 人关注
6.49W 人关注
关于我们|网站声明|联系方式|用户反馈|网站地图|友情链接|举报电话:021-54679377转617举报邮箱:editor@cls.cn财联社举报
财联社 ©2018-2026上海界面财联社科技股份有限公司 版权所有沪ICP备14040942号-9沪公网安备31010402006047号互联网新闻信息服务许可证:31120170007沪金信备 [2021] 2号