电子行业:英伟达GTC2025跟踪报告:2028年全球万亿美金CAPEX可期 关注CPO、正交背板等新技术趋势

类别:行业 机构:招商证券股份有限公司 研究员:鄢凡/程鑫/谌薇/涂锟山 日期:2025-03-20

  事件:

      英伟达GTC 2025 大会于3 月17-21 日举办,英伟达CEO 黄仁勋于3 月19 日发表主题演讲,介绍AI 加速计算新时代、AI 加速计算的新品、CPO 芯片及集成光子引擎、以及AI 技术在自动驾驶、机器人等前沿领域的应用。综合演讲及材料信息,总结要点如下:

      评论:

      1、数据中心28 年Capex 望超万亿美元,训练推理带来100 倍Tokens 增长。

      1)资本开支:数据中心、CSP 和相关基础设施的资本开支将大幅增加,预计2028 年数据中心建设将达到1 万亿美元,绝大部分投资或将用于加速计算芯片。

      2024 年公司向四大云服务商共交付130 万颗Hopper GPU,预计2025 年将出货360 万颗Blackwell。英伟达认为,世界正在经历一场革命性转型,全球数据中心正在向人工智能工厂转型,计算机将为软件生成Tokens,处理分析并生成AI 驱动的研究和应用。2)训练及推理:英伟达概述了三层次的AI,即GenerativeAI、Agentic AI 以及Physical Al,从生成式到AI 推理再到理解物理层面;由于训练和推理模型的计算量剧增,AI 基础设施在短时间内增长惊人,如今所需计算量较去年预计增长100 倍,当AI 技术生成Tokens 时,会生成代表推理步骤的单词序列,致使Tokens 数量大幅增加,为保持模型响应交互性,需将计算速度及Tokens 速度提高10 倍。

      2、Blackwell 全面投产且进展顺利,展示Rubin 和Feynman 等未来代际产品。

      1)Blackwell:英伟达表示,Blackwell 已全面投产且进展较快,客户需求量较大,Blackwell NVL72 结合Dynamo 推理性能提升了40 倍,相当于一座HopperAI 工厂的性能;英伟达将于25H2 发布Blackwell Ultra,算力较GB200 NVL72提升约50%(FP8 精度算力达0.36EF),搭载HBM3E、内存从192GB 提升到了288GB,搭载CX8 链路并达到14.4TB/s 的传输速率。2)Vera RubinNVL144:预计26H2 推出,包括VeraCPU+ RubinGPU,同时调用时Rubin 能在推理时实现每秒50 千万亿次浮点运算,Rubin 内存将升级为288GB 容量的HBM4,带宽也会从原来的8TB/s 大幅提升至13TB/s,扩展NVLink 后Rubin带宽翻倍至260TB/s,同时采用CX9 链路并达到28.8TB/s 传输速率;3)RubinUltra NVL576:预计27H2 推出,FP4 精度算力达15 EF、FP8 精度算力达5 EF,相较于GB300 NVL72 性能提升约14 倍;Rubin Ultra NVL576 搭载HBM4e 内存、带宽达到4.6 PB/s ,并支持 1.5PB/S 带宽的NVLink 7,与上一代相比提升约12 倍,同时采用CX9 链路及115.2 TB/s 传输速率,较上一代提升约8 倍。

      4)Feynman:预计2028 年上市,Vera CPU、NVSwitch-NEXT、Spectrum7、CX10 网卡等配套都将同步迭代,迎接千兆瓦AI 工厂时代。

      3、英伟达推出CPO 交换机,预计2026 年开始将随Rubin 系列逐步推向市场。

      1)Quantum-X CPO 交换机:预计25H2 推出,整体交换容量为115.2Tb/s,相比可插拔光模块方案能耗降低约3.5 倍,并带来网络弹性提升10 倍以及部署效率提升1.3 倍;每个Quantum-X CPO 交换机包含4 个Switch 模块,单Switch具备28.8Tb/s 传输速率,采用台积电N4 代工,具备3.6TFLOPS FP8 精度的算力;Switch 周围放置6 个光学组件,组件内含3 个1.6T 可拆卸硅光引擎(共计18 个),由324 路光纤连接,其中包括36 路光纤输入及288 路光纤输出。

      硅光引擎采用200Gb/sDe 微环调制器,光纤耦合采用台积电COUPE 平台、N6工艺生产,用垂直耦合方式,与3D 封装的EPIC 进行光路耦合。交换机外部共有1152 路单模光纤,即8×2(收发)×3(光引擎数)×6(光组件数)×4(芯片数),单个模块包括8 个激光器用于自动温度跟踪、波长和功率调谐,整个Quantum-X 交换机对外接口包括18 个外置光源输入,144 个MPO 连接器、324根光连接,对应115 太比特每秒的吞吐量。2)Spectrum-X CPO:预计26H2推出,分为两种型号,①SN6810 包含128*800GB/S 端口,背板带宽102.4TB/S,②SN6800 包含512*800Gb/S 端口,背板带宽409.6TB/S;3)MRM micromirror 技术:结构为1 个小波导连接1 个环形结构,当光信号在波导中传输时,环形结构能产生共振、控制波导反射率、通过吸收光阻断光信号,将直接连续激光束转化为0 或1;由于英伟达选择这项技术,25H2 硅光子交换机将顺利推出,未来英伟达将硅光子学与共封装技术相结合,无需收发器,可直接将光纤接入512 接口的交换机中,扩展到数十万个甚至数百万个GPU 规模的能力,采用CPO 交换机可以帮助数据中心节省60MW 的电力,相当于100 个Rubin 的耗电量。4)合作伙伴:波若威科技、Coherent、康宁、Fabrinet、富士康、Lumentum、SENKO、矽品SPIL、住友电工、天孚光通信TFC、台积电等。

      4、智驾推出Halos 系统,机器人领域推出开源通用基础模型Isaac Groot N1。

      ①自动驾驶:英伟达认为自动驾驶时代已经来临,英伟达在汽车安全领域发布了Halos 系统,通过Omniverse 加速自动驾驶汽车开发,Cosmos 的预测和推理能力支持AI 优先的自动驾驶系统,该系统通过模型蒸馏、闭环训练和合成数据生成实现端到端可训练。②机器人:英伟达认为训练机器人需海量数据,借助基于英伟达Omniverse 和Cosmos 构建的方案可生成合成数据,英伟达推出并开源适用于类人机器人的通用基础模型Isaac Groot N1,具有快慢双系统架构,通用性强,开发者可利用相关流程对其进行后期训练。

      投资建议:我们认为英伟达此次主题演讲技术展示市场前期已有较多预期,从Rubin 平台开始的CPO、PTFE 正交背板等新技术变化值得长线跟踪,未来需要持续关注单rack 架构内布局结构对PCB 等产品的迭代推动进度,短期预期柜内仍将会使用较多铜连接方案,单卡和单柜功率提升对于电源和液冷等要求持续提高,建议重点关注以下长线有边际变化的细分领域和对应公司:CPO:

      致尚科技、太辰光、天孚通信等;PTFE 材料高速背板:生益科技(核心材料)、景旺电子、胜宏科技、沪电股份等;高速背板连接器:立讯精密、安费诺等;高多层PCB:胜宏科技、沪电股份、景旺电子、方正科技等;高阶HDI:胜宏科技、景旺电子、沪电股份等;液冷:川环科技、英维克、比亚迪电子等;电源:麦格米特、立讯精密、欧陆通、比亚迪电子等。(部分标的由招商通信/电新等组覆盖。)

      风险提示:竞争加剧风险、贸易摩擦风险、行业景气度变化风险、宏观经济及政策风险。