AI云计算新范式:规模效应+AIINFRA+ASIC芯片

类别:行业 机构:上海申银万国证券研究所有限公司 研究员:林起贤/夏嘉励/黄俊儒 日期:2025-03-28

  我们近期已发布多篇深度报告,围绕重点标的AI布局及进展,从底层硬件至上层应用进行全方位梳理:

      1. 腾讯AI详细梳理:《腾讯控股(00700)点评:AI应用+云业务有望迎来价值重估》2. 阿里云深度:《阿里巴巴-W(09988)深度:AI开启阿里云新成长(阿里巴巴深度之三暨GenAI系列报告之39)》

      3. 字节AI详细梳理:《豆包大模型升级,字节AI产业链梳理—— GenAI之四十四》4. 金山云深度:《金山小米生态核心云厂,AI+智驾乘风而上》5. 美股云行业季度总结:《云厂Capex指引仍乐观,AI应用ROI路线清晰或将迎来催化——美股云计算和互联网巨头24Q4总结》、《北美云厂Capex加速,AI降本增效初步体现—— 美股云计算和互联网巨头24Q3总结》

      6. 谷歌深度:《谷歌:AI征途换档提速,云业务驱动成长》7. META深度:《Meta Platforms (META):广告推荐应用+开源模型+算力,AI布局解析》8. 博通深度:《博通:软硬一体的AI卖铲人》9. AI应用深度:2024年总结-《AI应用:商业化初露锋芒——AI应用深度之二暨GenAI系列报告之三十九》、2023年总结-《AI应用:从生产力工具到交互体验升级——生成式AI2024年投资策略》

      AI云计算新范式:规模效应+AI Infra能力+算力自主化。云计算在AI收入拉动下营收增速回暖、Capex增长加速已成为市场共识。

      但对于AI云时代竞争格局以及云厂利润率还有分歧,也是本报告的重点。1)更强的规模效应;2)AI infra能力;3)算力自主化为云厂中长期降本方向。

      规模效应:更高的初始投入,更高的算力利用率。(1)AI云更高的资本密集度。(2)AI服务器/网络设备使用年限更短、成本占比明显提升。多租户+多场景(含自有场景)+自有模型平抑需求峰谷,降低产能空置率、摊薄单位计算成本,实现更高的ROI。

      以腾讯、阿里、谷歌等为代表的大型云厂商/互联网巨头具备庞大的内部工作负载禀赋+AI大模型的优势,有望降低单位计算成本。

      AI Infra:实现计算性能挖潜。AI Infra定位于算力与应用之间的“桥梁”角色的基础软件设施层,体现在:1)硬件集群的组网构建、算力调度系统;2)大模型+AI开发工具,增强大模型对于算力计算效率的挖潜;3)针对应用的定向优化等工作。尽管模型开源,但针对特定模型推理的优化能力、AI工具丰富度差异仍会放大云厂对同一开源模型优化后的推理成本差距。以谷歌、字节火山引擎、阿里云、DeepSeek等为代表的厂商已在AI Infra领域发布训练/推理侧工具。

      算力自主化:海外ASIC芯片趋势启示。强大的工程能力或有望弥补ASIC和GPU硬件生态差距。ASIC架构:基于脉动阵列的定制架构为重要路线;ASIC开发生态:谷歌和AWS均基于XLA,Meta MTIA v2软件堆栈基于Triton。ASIC芯片的确定性来自:(1)供给端,芯片设计制造专业分工:降低ASIC与GPU在代工制造、后端封装设计上的差距,ASIC辅助设计博通、迈威尔等崛起。

      (2)需求端:牧本摆动,有望从标准化到定制化:架构创新,催生新的定制化芯片,并再度基于新的芯片进行算法创新升级,以实现芯片性价比优势;商业上可行:具备庞大算力需求的云厂可覆盖开发定制化芯片的成本。ASIC制造模式:云厂前端设计+IC辅助设计支持。

      推荐(1)互联网云计算:腾讯控股,阿里巴巴,金山云;谷歌、微软、META、亚马逊;(2)ASIC辅助设计:博通。

      风险提示:内容和互联网平台监管环境变化风险;大模型性能进步不及预期;AI应用落地进展不及预期风险