传媒行业动态跟踪:DEEPSEEK带来的AI变革

类别:行业 机构:华福证券有限责任公司 研究员:杨晓峰 日期:2025-01-30

  投资要点:

      一、用户量:海外加速出圈,迅速登顶全球下载榜单1、网页端:重度用户为主,DeepSeek 在24 年12 月26 日推出V3(对标GPT4o),因其显著的性能,用户迅速开始增长,同时在1月20 日发布R1(对标GPT-o1)后,进一步出圈。

      2、APP 端:大众用户为主,R1 推出后,追平GPT-o1,迅速出圈海外。根据点点数据,从DeepSeek 在美国下载排名从1 月22 日的201名,迅速在1 月27 日登顶第一名;根据七麦数据,截止1 月30 日,DeepSeek 在168 个国家位居下载榜第一名。

      二、DeepSeek 偏好激进性创新:架构(MOE+MLA)+精度(FP8)1、MOE 架构创新:相比过去主流模型的MOE 专家模型停留在8~16 个,而DeepSeek 每个MoE 层包含1 个共享专家和256 个路由专家,有助于降低模型推理时激活的参数量。

      2、MLA 架构创新:MLA 通过联合压缩键值矩阵为低秩向量,将多个头的键值信息融合,使推理时仅需缓存少量低秩向量,大幅降低KV 缓存需求,减少内存占用。

      3、训练特色:突破大模型训练固定思维(一般模型权重和梯度使用FP16,优化器参数使用FP32),敢于尝试在低精度FP8 的模式下训练大模型,并且该尝试同样出现了较好的效果。

      三、DeepSeek 开源对AI 应用和AI 终端的影响:产品力竞争时代DeepSeek 从V3 到R1,将进一步推动全行业大模型的提升,更快的追赶GPT4o 和GPT-o1;同时成本的下降,有助于AI 应用和AI 终端的普及。未来行业竞争将进入“产品能力竞争”,巨头的流量优势将进一步凸显。

      四、DeepSeek 对推理成本的影响:用户规模和使用频次未来推动推理成本增加的核心因素:用户规模和用户使用频次的增加。根据Grok 创始人,过去60 年,每10 年计算成本降低约1000倍,但人们的购买量增加了10 万倍,总支出反而增长了100 倍。

      五、投资建议

      AI 全球竞争时代来临,看好以为DeepSeek 为代表的中国大模型的崛起,尤其看好AI 应用和AI 终端的落地。预期未来推理成本仍将显著增长,全球AI 竞争背景下,国产替代是算力增长核心。

      风险提示

      AI 竞争激烈,AI 发展不及预期