AI产业跟踪:DEEPSEEK-V3小幅度更新 持续关注相关模型更新进展
事件描述
3 月24 日,DeepSeek 在开源平台上线了升级后的DeepSeek-V3 模型。新模型的版本号为DeepSeek-V3-0324,模型参数为6850 亿,较早期版本的6710 亿有小幅增长。
事件评论
模型性能全面提升,登顶非推理模型排行榜。根据DeepSeek 官方给出的新版DeepSeek-V3 跑分结果,新版V3 模型的百科知识(MMLU-Pro,GPQA)、数学(MATH-500,AIME2024)和代码任务(LiveCodeBench)表现均有提升。同时,在专业AI 模型评测机构Artificial Analysis 最新排名中,新版DeepSeek-V3 在基准测试中较老版V3 跃升了7 位,登顶非推理模型排行榜。,其推理任务表现、前端开发能力、中文写作能力等,较之前版本均有提升。
DeepSeek-V3 模型的开源协议更新,持续开源推动AI 技术平权。此次更新后,DeepSeek-V3 与DeepSeek-R1 统一采用 MIT License。该协议相较于其他开源协议,如GPL、Apache 等,是最早且最宽松的开源协议之一,允许模型蒸馏、商用等行为,给了开发者更多的自主权。因此DeepSeek-V3 相关开发者可以更好的开发利用DeepSeek-V3,从而加速中国AI 产业整体发展进度。
DeepSeek-V3 更新后,或可期待相关模型更新。DeepSeek 此前发布的DeepSeek R1模型充分利用了V3 的架构,但在设计上针对推理任务进行了优化。此次,DeepSeek-V3更新后或可期待R1 模型也将同步进行一定更新。同时DeepSeek-V4 及DeepSeek R2也有望加速问世,或将带动市场对相关题材关注度。
DeepSeek 持续更新,中国AI 产业有望持续迭代发展。此次DeepSeek-V3 的更新在模型性能上持续提升,后续或将带动DeepSeek 其他相关模型加速迭代,并惠及中国AI 产业链。建议关注:1)中国推理算力产业链,重点推荐国内AI 芯片领军寒武纪;2)云服务厂商,重点关注与DeepSeek 合作的相关云厂商,3)IDC,重点关注于腾讯、阿里、字节等大厂合作的IDC。
风险提示
1、AI 技术发展不及预期;
2、下游应用需求不及预期。