计算机:AI应用正当时:国产大模型调用量首超美国 看好大模型出海与商业化落地进展加速

类别:行业 机构:长江证券股份有限公司 研究员:宗建树/刘思缘 日期:2026-03-03

  事件描述

      近期,中国AI 的模型调用量爆发式增长,OpenRouter 平台调用量首次超过美国。

      事件评论

      中国AI 的模型调用量爆发式增长,OpenRouter 平台调用量首次超过美国。全球最大的AI 模型API 聚合平台OpenRouter 数据显示,9 日~15 日这周,中国模型以4.12 万亿Token 的调用量,首次超过同期美国模型的2.94 万亿Token。16 日~22 日这周,中国模型的周调用量进一步冲高至5.16 万亿Token,三周增长127%,而同期美国模型调用量跌至2.7 万亿Token。与此同时,全球调用量排名前五的模型中,中国模型占据四席,这股强大的增长动能并非依赖单一爆款产品,而是中国AI 厂商集群式崛起。

      进入2026 年,国产模型加速迭代,能力明显提升。2026 年2 月16 日至22 日的周榜单显示,平台调用量排名前五的模型中,有四款来自中国厂商,分别为MiniMax 的M2.5、月之暗面的KimiK2.5、智谱的GLM-5 以及DeepSeek 的V3.2。四款模型合计贡献了Top5总调用量的85.7%。具体来看,(1)MiniMax 于2026 年2 月13 日发布M2.5 模型,2 月9 日至15 日当周平台总调用量增加的3.21 万亿Token 中,M2.5 贡献1.44 万亿Token增量。(2)月之暗面于1 月27 日发布KimiK2.5,凭借原生多模态架构和强大的Agent 并行处理能力,调用量连续提升。Kimi 在发布KimiK2.5 后不到一个月的累计收入已超过其2025 年全年的总收入,增长主要由全球付费用户及API 调用量大涨共同推动。(3)智谱的旗舰模型GLM-5 于2 月12 日发布,用户规模高速增长。(4)a16z 与OpenRouter 联合发布的报告显示,Qwen 全系列模型总Token 调用量以5.59 万亿位居全球第二,仅次于DeepSeek(14.37 万亿)。中国大模型B 端市场,2025 年下半年,千问(Qwen)系列模型的日均Token 调用量占比32.1%位列第一,相较上半年的17.7%几乎翻倍。

      价格竞争力依旧显著,国产大模型出海与商业化落地有望加速。输入价格来看,MiniMax-M2.5 与GLM-5,价格均为0.3 美元/百万Token。Claude Opus4.6 的价格为5 美元/百万Token,是中国这两款模型的约16.7 倍。在输出价格来看,MiniMax-M2.5 价格为1.1 美元/百万Token,智谱GLM-5 为2.55 美元/百万Token,Claude Opus4.6 则为25 美元/百万Token,分别是前两者的约22.7 倍和9.8 倍。除了算法架构的革新,中国AI 厂商还在积极探索“垂直整合”的路径,以进一步压缩每一个Token 背后的成本。

      我们认为,国产AI 大模型正在发生价值质变,Token 正从互联网流量成为AI 时代的“水电煤”,新商业模式一触即发。2026 年将会是大模型商业化爆发元年,核心变化是 1)从卖算力到卖Token;2)文生视频迎来2025 年Coding 时刻;3)入口侧重构,互联网CSP迎来分化;4)Agent 时代来临,AI 从对话时代转向执行时代。重视三条主线:新入口&大模型商业化爆发、国产芯片(CPU+GPU)&第三方云、Agent 重构软件。

      风险提示

      1、AI 技术发展不及预期;

      2、下游应用需求不及预期。