软件及服务行业:AI智道(7):DEEPSEEK INFRA开源周总结 及算力测算一览

类别:行业 机构:中国国际金融股份有限公司 研究员:于钟海/魏鹳霏/王之昊/王倩蕾 日期:2025-03-15

  行业近况

      2025 年2 月24-28 日,DeepSeek进行为期一周的Infra开源周,Infra工程优化能力国内领先。我们就开源周内容进行梳理,并对推理算力及毛利率水平进行测算。

      评论

      DeepSeek开源周深度适配GPU特性,通过五大Infra核心技术构建大模型-算力全栈协同体系,FP8 精度与通信优化为核心。计算层,FlashMLA实现可变长序列解码加速,配合DeepGEMM的FP8 动态精度矩阵运算突破算力瓶颈。通信层,DeepEP通过FP8 压缩与RDMA(Remote Direct MemoryAccess)技术打通MoE模型跨节点传输,DualPipe/EPLB则以计算-通信流水线重叠消除分布式训练间隙并实现负载均衡;存储层通过3FS文件系统以SSD(Solid State Drive)+RDMA架构保障数据高效存取。DeepSeek以“单卡算力提升-核心计算加速-通信延迟降低-多卡协作优化-数据流高速供给”为技术脉络,形成软硬协同的优化闭环,最终将千亿参数模型的训练、推理效率推向硬件极限,实现大模型开发成本的大幅压缩。

      DeepSeek成本及算力测算:毛利率水平国内领先。DeepSeek在3 月1 日公开了模型推理效率和成本,我们以模型API定价测算收入、GPU hours租赁成本作为考虑的核心成本项,来测算综合毛利率:倘若这些输入/输出Token全按照R1 的定价,收费是56 万美元;而按照V3 的定价,收费是30万美元左右,则对应毛利率分别为84.5%/71%,因此综合毛利率应在71-84.5%,这一毛利率在行业中处于领先的水平。

      Infra优化能力进一步推动大模型平权,Agent等应用有望带来AI应用百花齐放、推理算力需求乐观。1)推理算力侧,我们认为AI infra的进步将会提升算力利用效率,推动整个行业的繁荣,这对于未来的推理算力需求影响为正面;此外,我们认为多模态、Manus等Agent应用有望驱动更大规模的推理算力需求。2)应用侧,我们认为随着模型推理成本的持续降低,推理成本已进入“不敏感”区间,更多AI应用的规模商业化取决于模型能力、工程优化。其中2C应用,我们更看好互联网公司在产品化的沉淀;2B应用,我们则更为关注垂类卡位的企业服务厂商的客户、场景沉淀。

      估值与建议

      保持相关公司盈利预测、评级及估值不变。

      风险

      技术进展不及预期,商业化落地不及预期。