全程直击黄仁勋“全栈AI”演讲:算力产业新蓝图即将揭晓
2026-03-17 01:50 星期二
财联社环球频道
①北京时间周二凌晨2时起,英伟达CEO黄仁勋将用约两小时阐述AI“全栈技术路线”的前沿进展;
②市场关注焦点包括Rubin平台进展、下一代Feynman架构,以及LPU、光通信等题材热点;
(持续更新中……)

财联社3月17日讯(编辑 史正丞、牛占林)北京时间周二凌晨,资本市场翘首以盼的英伟达GTC大会主题演讲拉开帷幕。英伟达创始人兼首席执行官黄仁勋将进行约两个小时的主题演讲,官方预告称演讲主题将覆盖“整个技术栈”,包括芯片、软件、模型以及应用

综合财联社此前报道,GTC 2026主题演讲的关注焦点主要包括以下几点:

1)现有产品路线图更新,包括即将出货的Vera Rubin平台、Rubin Ultra芯片,以及下一代Feynman架构和潜在收入预期;

2)与Groq的合作以及LPU相关消息,Rubin CPX亦有可能单独出货;

3)数据传输和供能体系的相关消息,涉及光通信、CPO、HVDC、PCB等一众热门概念;

4)面向企业的AI开源智能体平台NemoClaw,以及AI应用层面的讨论会提及哪些上市公司。

黄仁勋的演讲恰好位于美股交易时段,资本市场也会在第一时间对他的说辞予以反馈。贵为全球市值最高的上市公司,英伟达股价自去年夏季以来便持续处于横盘状态。分析师们普遍预期,要打破当前局面,英伟达得拿出一些真正的惊喜才行。

以下为直击实录:


03:45 黄仁勋进一步讲解LPU的价值。

他表示,如果你的工作负载主要是高吞吐任务,那么只使用Vera Rubin就很好。但如果你的工作负载包含大量编程任务或高价值工程任务(例如Token生成),应该在数据中心中加入Groq芯片。

image

该架构使用了大量SRAM,并且专门针对推理这一单一工作负载进行优化。而推理正是AI工厂最核心的工作负载。

英伟达正在重新设计推理流程,其中Vera Rubin负责 Prefill(预填充)与主要计算,Groq负责低延迟Token解码生成。目前Groq LP30芯片由三星制造,已经进入生产阶段,预计今年下半年发货。

image


03:40 Rubin Ultra登场

image

与Rubin横向滑入机架不同,Rubin Ultra在Kyber机架中是垂直插入的。在一个NVLink域中可连接144块GPU。


03:33 股民们要的炒作概念喷涌而出。

黄仁勋表示,Vera Rubin系统已经实现100%液冷。过去需要两天安装的系统,现在只需要两个小时就能完成安装。这同样是一台采用45℃热水冷却的超级计算机。这种方式减少了数据中心的压力,显著降低了冷却成本,并释放出更多可用电力。第六代NVLink系统也是完全液冷的。

image

备受关注的Groq LPU系统也登场。这个系统包含8颗LP30 Groq芯片,目前已经进入量产阶段。

image

此外还有全球首个采用 CPO(共封装光学)的Spectrum-X 交换机。该交换机已经进入全面生产阶段。

image

所谓共封装光学(CPO),就是把光模块直接集成在芯片上,使光信号可以直接与硅芯片连接。电子信号在这里转换为光信号并直接进入芯片。英伟达与 台积电共同开发了这项制造工艺,目前只有英伟达实现量产。这项技术被称为Co-Packaged Optics,是一项革命性的技术。

黄仁勋也展示了单独出售的Vera CPU系统。在后续的新闻稿中,英伟达表示Vera CPU的产业合作伙伴包括Meta、甲骨文、阿里巴巴、字节跳动、Nebius等。

image


03:28 Vera Rubin来了

image


03:22 黄仁勋开始强调每瓦Token数(Tokens per watt)这个指标。他强调,英伟达的Token成本目前是世界级的,基本无人能及。之所以能够做到这一点,是因为进行了极端程度的协同设计(co-design)。

黄仁勋还摆出了一个“Token之王”的姿势。

image


03:11 黄仁勋:事实上,我们很可能仍然会供不应求。我确信计算需求将远远高于这个数字

他进一步介绍称,英伟达约60%的业务来自超大规模云厂商(hyperscalers),也就是那些正在建设数据中心、需要大量AI GPU的公司。另外40%的业务来自其他领域,包括云服务、企业客户、机器人、游戏以及超级计算等。


03:09 最新营收预测登场!到2027年1万亿美元!!!!!!

image

黄仁勋说:“去年这个时候我说过,当时站在那个时间点上,我们看到了大约5000亿美元的需求——而且是高度确定的需求,包括到2026年的Blackwell和Rubin采购订单。那是我去年说的。”

他进一步表示:“不过我要告诉你们的是,现在在我所站的位置,我看到的是到2027年将达到至少1万亿美元的规模。


03:06 黄仁勋:过去三年AI产业的3个里程碑产品分别是ChatGPT、o1推理模型,以及Claude Code智能体,象征着推理需求的激增。

image


02:50 黄仁勋谈应用加速(application acceleration)

黄仁勋表示,加速计算并不是一个系统层面的难题。“加速计算”这个说法其实少了一个词,只是现在很少再提起——那就是应用加速(application acceleration)。

如果我能让一台计算机把所有事情都运行得更快,那其实就是CPU的工作,但这种方式已经走到了尽头。未来我们能够继续提升应用速度、实现巨大性能提升并大幅降低成本的唯一方法,就是通过针对应用或特定领域的加速

image

黄仁勋指出,面向特定领域的专用软件库(domain-specific libraries)将成为解决各个垂直行业具体问题的关键——从自动驾驶汽车到金融交易,从机器人到电子游戏等领域皆是如此。


02:34 今天的第一个新品:DLSS 5

英伟达宣布推出新一代AI图形技术DLSS 5,通过实时神经渲染模型为游戏画面注入更真实的光照和材质效果,被公司称为继2018年实时光线追踪后的最大图形突破。该技术利用游戏的颜色与运动向量数据生成接近电影级的画面效果,并保持实时交互性能,预计今年秋季上线,支持4K游戏,并获得多家大型游戏厂商支持。

image

演示中出现了《生化危机安魂曲》、《FC 26》等游戏。英伟达宣布,产业合作伙伴 / 支持厂商包括卡普空、网易、腾讯等游戏大厂。


02:30 黄仁勋开场回忆了一番公司历史,例如CUDA、RTX、GeForce等产品的发展史。


02:20 回顾起点——今年正值CUDA诞生20周年

黄仁勋表示,今天是一场科技大会,我们将探讨诸多议题,包括人工智能、AI工厂、硬件设备以及更多精彩内容。"二十年来,我们始终致力于这一架构——这项革命性的发明,"黄仁勋表示。

02:19 黄仁勋登场!GTC主题演讲正式开始

image


02:00 在黄仁勋登台前,英伟达股价涨超2%,依然在去年8月至今的股价中枢上波动。黄仁勋似乎来晚了一些,演讲并没有准时开始。

image

(来源:TradingView)


事前分析:【Wedbush证券:英伟达很有可能给出一份“非常看多”的最新展望】

投行Wedbush证券表示,英伟达很可能在GTC大会上给出一份“非常看多”的最新展望。

分析师在报告中写道:“我们预计公司将围绕企业级AI需求给出一份非常乐观的更新,并预计黄仁勋会对整个AI行业以及订单管线机会发表’毫无保留’的积极展望。我们认为,这一规模将轻松超过此前提出的2026年Blackwell和Rubin平台出货5000亿美元的目标。”

分析师们进一步指出:“这也对应着英伟达到2030年在AI基础设施领域 3万亿至4万亿美元的市场机会,我们预计公司将在GTC大会上对此进行更新。与此同时,未来几年的产品路线图也可能在GTC上进一步披露,公司正在持续扩展AI产品组合,并进一步瞄准与自动化相关的 ‘物理AI(Physical AI)’ 市场机会。”


事前分析:【郭明𫓹:Nvidia投资Groq后LPU出货料爆升逾10倍】

周一早些时候,知名分析师郭明𫓹在社交媒体上表示,英伟达投资Groq后,面向超低延迟推理场景的LPU生态正进入爆发期。供应链预计2026–2027年LPU出货量将达400万至500万颗,同比历史规模实现10倍级增长,主要受益于与CUDA等英伟达软件生态深度整合,以及AI智能体、实时消费级应用和Physical AI带来的低延迟推理需求扩张。

郭明𫓹进一步表示,预计英伟达计划将单机架LPU密度从64颗提升至256颗,以满足长上下文推理对KV-cache的需求并保持解码阶段低延迟,新一代机架预计在2026年底至2027年初量产。该架构升级还将带动网络互连、编译器与开发框架的深度整合,并触发高端PCB材料的新一轮产业周期。

收藏
1.49W
我要评论
图片
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
要闻
股市
关联话题
14.68W 人关注
5.75W 人关注
关于我们|网站声明|联系方式|用户反馈|网站地图|友情链接|举报电话:021-54679377转617举报邮箱:editor@cls.cn财联社举报
财联社 ©2018-2026上海界面财联社科技股份有限公司 版权所有沪ICP备14040942号-9沪公网安备31010402006047号互联网新闻信息服务许可证:31120170007沪金信备 [2021] 2号