计算机行业周观察:持续关注AI产业链投资机会
近期OpenAI 相继推出Agent 开发工具链及新一代语音模型,字节持续布局AI Agent 构建工具。此外,4 月起端侧AI 可能面临字节AIOT 大会等事项催化,继续看好AI 端侧、应用的机会,建议重点关注。
OpenAI 推出工具链简化智能体开发。3 月11 日,OpenAI 推出专用于简化智能体开发的API 和工具,包括Responses API、三大内置工具和AgentsSDK。其中:Responses API 融合了Chat Completions API 的简洁性和Assistants API 的工具使用能力,通过单次API 调用,开发者就能使用多种工具和模型轮次解决复杂任务;三大内置工具包括Web 搜索工具(能够实时从互联网上抓取最新数据,并提供清晰且相关的引用来源)、文件搜索工具(能够快速、准确地从大量文档中检索相关信息)、计算机使用工具(可以自动控制计算机);Agents SDK 简化了核心智能体逻辑、编排和交互,使开发人员更容易构建智能体。OpenAI 表示计划在未来几个月内推出更多工具和集成,以帮助开发者更有效地部署、评估和扩展Agent 应用。
OpenAI 发布新一代语音模型。3 月21 日,OpenAI 发布三款全新语音识别模型gpt-4o-transcribe、gpt-4o-mini-transcribe、gpt-4o-mini-tts,实现了新的SOTA 水平,在准确性和可靠性方面优于现有解决方案,提高了语音/文本转录应用的可靠性,特别适合客户呼叫中心、会议记录转录等用例。其中:
GPT-4o-transcribe 与GPT-4o-mini-transcribe 为语音转文本模型,前者每分钟0.6 美分,后者每分钟仅0.3 美分;GPT-4o-mini-tts 为文本转语音模型,每分钟1 美分。相较于2022 年发布的Whisper,新模型在词错误率(WER)、语言识别能力和准确性方面均有显著提升。OpenAI 在博客中称,新的语音模型套件旨在为语音Agent 提供强大支持,并已向全球开发者开放。
字节持续布局AI Agent 构建工具。据特工宇宙公众号,字节内部Dev Infra团队开发了一款公司内部使用的Dev Agent 智能体产品,该Agent 通过集成内网知识库和多种内部工具实现调研、开发、数据分析等任务。目前该项目处于实验阶段,仅面向该部门员工进行内测。字节在今年1 月份推出了多模态 AI 代理UI-TARS。UI-TARS 是一个开源 GUI Agent 模型,能够通过自然语言理解和处理来控制计算机界面。与传统的模块化系统不同,UI-TARS将感知、推理、行动和记忆等基本元素整合到一个统一的视觉-语言模型(VLM) 中,实现了无需依赖预先建立的工作流或人工干预的全面任务自动化。
投资建议:1.大模型、Agent 持续发展,看好AI Infra、应用、国产算力。重点关注阿里巴巴、深信服、品高股份、星环科技、智微智能、金山办公、用友网络、金蝶国际、泛微网络、卫宁健康、讯飞医疗科技、科大讯飞、华宇软件、数据港、润建股份、奥飞数据、万国数据、世纪互联、神州数码、拓维信息、海光信息、中科曙光、浪潮信息、寒武纪;2.随着 AI Agent 爆发,数据要素有望充分发挥其潜在价值。重点关注通行宝、盛视科技、国新健康、博思软件、中科江南、上海钢联、久远银海、航天宏图、德生科技、太极股份、易华录、云赛智联、深桑达;3.邻近季末,市场对25Q1 业绩情况关注度提升,关注海光信息、同花顺、指南针、九方智投控股、深信服、赛意信息、品高股份、科远智慧、道通科技、智微智能、锐明技术、南网科技等。
风险提示:政策落地不及预期;AI 发展不及预期;行业竞争加剧风险。