传媒互联网行业研究:阿里发布QWQ-32B MONICA推出MANUS

类别:行业 机构:太平洋证券股份有限公司 研究员:郑磊 日期:2025-03-09

  报告摘要

      阿里发布开源推理模型QwQ-32B,推理能力显著提升阿里发布开源通义千问QwQ-32B 推理模型,该模型基于强大的基础模型进行大规模强化学习,实现推理能力显著提升。在技术路径上,QwQ-32B 采用了多阶段强化学习的训练策略,在初始和第二阶段分别对模型的数学、编程、通用任务,以及通用能力进行训练。实验表明,通过少数步骤的通用强化学习,可提升模型的通用能力,并且数学、编程性能未出现显著下降。从测评结果来看,在数学推理、编程能力和通用能力的测评中,模型参数仅320 亿的QwQ 性能表现与模型参数6710 亿的DeepSeek-R1 相当。此外,凭借小参数规模优势,QwQ-32B 已可实现端侧部署。根据测评,对于同一道数学、逻辑推理问题,虽然输出速度相对较慢,但端侧部署的本地模型可给出正确解答。

      Monica 发布通用AI Agent Manus

      Monica 发布通用AI Agent Manus,该应用可根据用户输入的问题或要求,进行“任务拆解-规划-执行”的一系列高效自动化操作,为用户直接交付完整的任务成果。在通用AI 助手基准测评(GAIA)中,Manus 超越OpenAI DeepResearch 位列第一。在技术架构上,Manus采用Multiple Agent,通过分工协作机制,让每个Agent 基于独立的模型分别进行任务处理,以此大幅提升对复杂任务的处理效率、缩短响应时间。从公司公布的用例来看,Manus 可处理旅行规划、数据分析、供应商采购等日常生活、工作场景中的任务。

      核心观点

      我们认为,目前模型预训练阶段的Scaling Law 已放缓,推理模型的性能提升表现更优。并且,QwQ-32B 表明强化学习提升模型性能的重要前提是基于强大的基础模型,两者相辅相成。此外,Monic 此前曾发布AI 浏览器插件、PDF 工具、图片工具等多款应用,实现了底层技术和产品化能力的积累。因此,整合AI 技术及产品化能力或将是推进AI 应用发展的重要路径之一。关注AI+应用场景下的应用突破。建议关注:1)AI+广告营销:天娱数科、因赛集团;2)AI+影视:

      博纳影业;3)AI+游戏:恺英网络、巨人网络等。

      风险提示

      AI 技术发展不及预期的风险、政策监管的风险、行业竞争加剧的风险。