计算机行业周报:英伟达GTC2025:加速向“AI工厂”迈进
预训练、后训练与推理时扩展三大扩展定律驱动,“AI 工厂”时代来临。2025 年GTC 2025 大会期间,黄仁勋阐述了英伟达在AI 硬件侧、软件侧和应用侧的全栈式AI 布局。在预训练、后训练与推理三大扩展定律的驱动下,AI 发展正从Agentic AI 迈向Physical AI。为了满足训练AI 所需的海量Token,英伟达预计2028 年数据中心资本支出将超过1 万亿美元,以生产Token 为单一任务的“AI 工厂”时代即将到来。
硬件侧:GB300 如期而至,从Rubin 到Feynman 引领算力蝶变。1)2025-2028 年,英伟达将逐年推出Blackwell Ultra、Vera Rubin、Rubin Ultra、Feynman 四大架构。Blackwell Ultra:HBM3E 内存容量跃升至288GB,推理性能较前代Hopper 架构提升40 倍。Vera Rubin:提供50 PFLOPs 密集FP4 计算性能,比B300 的代际性能增长超过三倍,同时采用英伟达全定制核心VeraCPU。2)Kyber 机架助力纵向扩展,Photonics 交换机实现横向扩展。Kyber机架:NVL576 机架大幅提高机架部署密度,NVLink 规模达到144 个GPU(576 个裸片)。Photonics 交换机:将分别于2025 和2026 下半年推出两款光电一体化封装网络交换机,使得收发器功耗占计算资源的比例从10%降至1%。3)英伟达设立加速量子研究中心(NVAQC),基于GB200 NVL72 硬件开发量子纠错技术,推动量子计算与AI 加速融合。
软件侧:Dynamo 和CUDA-X 构筑英伟达AI 工厂护城河。在软件层面,英伟达推出开源推理软件Dynamo 和CUDA-X 全栈生态系统,提升了AI 工厂的整体运行效率。1)Dynamo:Dynamo 通过智能资源调度、分布式推理优化、KV 缓存管理技术,显著提升Token 生成速度。对于DeepSeek 等专门的推理模型,Dynamo 能将每个GPU 生成的token 数量提升30 倍以上。2)CUDA-X:
CUDA-X 结合开源工具CuOpt 和Newton 物理引擎,强化AI 开发效率。Newton物理引擎实现超实时触觉反馈仿真,将机器人训练效率提升10 倍,cuOpt 数学规划工具能够实现复杂优化任务的千倍级性能提升。
应用侧:智能驾驶和机器人驱动,物理AI 降临。1)智能驾驶:Cosmos具备完整的端到端训练体系,采用模型蒸馏、闭环训练和合成数据生成等新方法开发自动驾驶系统,协同Omniverse 增强自动驾驶汽车的环境适应能力。2)人形机器人:英伟达开源人形机器人基础模型Isaac GR00T N1 发布,采用“快”与“慢”的双系统架构,其后训练策略降低数据需求,促进跨形态迁移学习。
投资建议:建议关注海光信息、协创数据、欧陆通、麦格米特、英维克、曙光数创、奥飞数据、数据港、科华数据、润泽科技、寒武纪、浪潮信息、中科曙光、神州数码、紫光股份、龙芯中科等。
风险提示:地缘政治或供应链风险、AI 技术迭代不及预期风险、商业化落地不及预期的风险、AI 技术应用风险等。