电子元器件行业:DEEPSEEK-V3.2-EXP发布 国产算力需求加速增长
本报告导读:
DeepSeek-V3.2-Exp 发布,性能不变前提下API 费用大幅下调,国产算力需求加速增长。
投资要点:
投资建议。根据 DeepSeek 公众号,其于 2025 年 9 月 29 日正式发布DeepSeek-V3.2-Exp 模型。该模型引入DSA 机制,在保持性能基本不变的前提下大幅降低API 成本。我们认为或将加速国产AI 应用渗透,加快国产算力需求增长。推荐标的:寒武纪-U、海光信息、中芯国际、兆易创新、盛科通信-U,相关标的:芯原股份。
DeepSeek-V3.2-Exp 引入DSA 机制,API 费用大幅下调。根据DeepSeek 公众号,其于2025 年9 月29 日正式发布DeepSeek-V3.2-Exp 模型。该模型在V3.1-Terminus 的基础上引入DeepSeek SparseAttention,针对长文本的训练和推理效率进行优化与验证。其(1)DeepSeek Sparse Attention 首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果前提下实现长文本训练和推理效率大幅提高。
并且在各领域公开评测集中,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平;(2)新模型服务成本大幅降低,API 价格亦大幅下调。输入(缓存命中)价格由0.5 元/百万tokens 降至0.2 元/百万tokens,输出价格由12 元/百万tokens 降至3 元/百万tokens。我们认为,DeepSeek 通过引入DSA 机制,在保持性能基本不变的前提下大幅降低API 成本,将有效加速国产AI 应用渗透,加快算力需求增长。
国产算力芯片实现Day 0 适配,软硬一体加速国产替代。根据寒武纪公众号,其已同步实现对DeepSeek-V3.2-Exp 的适配,并开源大模型推理引擎vLLM-MLU 源代码。针对本次新模型架构,寒武纪通过Triton 算子开发实现快速适配,利用BangC 融合算子开发实现极致性能优化,并基于计算与通信的并行策略,达成业界领先的计算效率水平。根据华为计算公众号,昇腾在DeepSeek-V3.2-Exp 一发布开源即实现DeepSeek-V3.2-Exp BF16 模型部署,并在CANN 平台上完成对应的优化适配。针对稀疏DSA 结构,叠加实现长序列亲和的CP 并行策略,兼顾时延和吞吐,在128K 长序列下能够保持TTFT 低于2 秒、TPOT 低于30 毫秒的推理生成速度。我们认为寒武纪与昇腾针对DeepSeek-V3.2-Exp 的Day 0 适配,表明国产算力芯片在性能及软件生态建设方面加速完善,未来或可应用至国产训练场景中。
催化剂。基于国产算力芯片的一流AI 大模型发布;国产高性能AI应用发布。
风险提示。先进制程产能扩产进度不及预期。


