25年度春节期间AI新闻信息汇总:DEEPSEEK引领效率模型潮流 中美AI竞赛提速

类别:行业 机构:上海证券有限责任公司 研究员:刘京昭 日期:2025-02-06

  背景介绍

      春节期间,人工智能题材新闻密集发酵,DeepSeek 于海外广受关注、话题讨论持续火热;海外模型陆续推出,中美AI 竞赛步入白热化阶段。我们认为,相比于2024 年度,AI 模型、机器人本质上已获得显著的技术突破,商业化落地进程进一步加快,投资逻辑日益清晰。

      分析与判断

      一、国内层面:Deepseek 横空出世,开源助力模型弯道超车

    DeepSeek 全球爆火,R1 模型性能强劲。中国AI 公司深度求索发布DeepSeek R1,性能直接对标ChatGPT o1 正式版,并使用MIT 协议开源、支持免费商用、无需申请授权。1 月26 日,DeepSeek 于AppStore 免费应用下载榜上排名第一,并于2 月2 日登顶全球140 个市场的应用商店下载榜。

      我们认为,DeepSeek R1 技术突破主要体现在创新性训练路径、系统性工程优化和开源生态构建三大维度:1)训练路径优化: R1 并未局限于规则驱动的数学模型或算法,而是成功地将强化学习带来的强大推理能力泛化到其他领域; 2)系统性工程创新:美国AI 公司Anthropic CEO Dario Amodei 指出,DeepSeek 团队在“键值缓存(Key-Value cache)”的管理上以及推动“混合专家(MOE,mixtureof experts)”方法的使用上进行创新性改进;3)开源协同生态搭建:

      开源模型可吸纳更宽广、更多元的社区参与到AI 开发中,并增强透明度与责任感,研究人员可以深入检查模型的训练数据,如若发现存在偏见或者侵权可及时进行反馈。

      DeepSeek 模型技术生态加速全球化布局,国内外云服务及硬件平台接入实现双向突破:1)全球技术生态突破: 1 月31 日,DeepSeek-R1 作为NVIDIA NIM 微服务预览版上线开发者平台,被官方认证为"最先进高效的大语言模型";DeepSeek-R1 同步登陆Amazon Bedrock 与SageMaker 平台;2)国产化技术协同创新:硅基流动基于华为云昇腾云服务首发DeepSeek-V3/R1 生产级推理服务,通过自研推理引擎优化,实现与全球高端GPU 部署同等性能的模型响应效率。

      二、海外层面:模型大厂动作频频,AI 竞赛加速推进

    OpenAI 发布o3-mini 系列模型,商业化路径持续探索。OpenAI 正式推出新一代推理模型o3-mini 系列,包含low、medium、high 三个版本,在定价策略与成本优势方面,o3-mini 输入/输出定价分别为1.10美元/百万token 和4.40 美元/百万token,较o1-mini 降低63%,较满血版o1 大幅缩减93%,成本优化显著;在性能突破与场景适配方面,o3-mini 在数学、编程领域能力超越o1-mini,响应速度提升24%,重大错误率下降39%,在基准测试中表现突出,但安全性测试仍存改进空间。

      OpenAI 获2900 亿新融资,市值突破2 万亿。OpenAI 本轮计划融资规模达400 亿美元,对应投后估值突破3000 亿美元,仅次于SpaceX。核心融资进展及战略影响如下:1)软银拟投资150 亿至250 亿美元,可能成为最大单一支持者;2)此次融资将加速技术研发,拓展市场,并可能改变行业竞争格局。

      xAI 即将发布Grok-3,下周亮相推理能力力压OpenAI。Grok-3 AI 模型已开始内部测试,预计下周正式发布。测试显示其表现优于o1 和DeepSeek R1 模型。

      投资建议

      建议关注: 芯片/服务器:浪潮信息、中科曙光、工业富联、寒武纪、海光信息、中芯国际;AI 模型端:科大讯飞、金山办公、拓维信息、拓尔思;端侧AI 布局:广和通、移远通信、美格智能等。

      风险提示

      国内外行业竞争压力;国际格局变动、贸易摩擦加剧风险;新技术落地和商业化不及预期。