计算机行业研究:OPENAI推出语音模型 模型赋能推动应用发展
行业事件
2025 年3 月21 日,OpenAI 发布了三款全新语音识别模型gpt-4o-transcribe、gpt-4o-mini-transcribe、gpt-4o-mini-tts,前两款为语音转文字模型,后一款为文字转语音模型。该三款模型大幅降低了单词识别错误率、提升了语言识别能力与准确性,在涉及口音、嘈杂环境和不同语音速度等场景均有较好效果。
OpenAI 模型赋能语音Agent,API 价格下降推动语音智能体发展
OpenAI 此次发布三款语音模型的语音转文本和文本转语音功能,可帮助开发者构建智能体。在文本转语音模型上,开发者可以让模型以特定方式说话,从而提升语音Agent 定制化程度,使得Agent 对话更为逼真。官网上提供了11 种预置的声音选项,选完声音后可选择特定的风格或人设,从而数秒内回复实现逼真的对话,模型同时可模仿特定历史时期说话方式。价格上,gpt-4o-transcribe 定价为每分钟0.006 美元;gpt-4o-mini-transcribe 定价为每分钟0.003 美元;gpt-4o-minitts的定价为每分钟0.015 美元。
多公司积极布局Agent,AI 应用出现摩尔定律随着模型基本推理能力与生成能力提升,AI 应用中的Agent 市场在2025 年快速发展。谷歌Gemini 率先推出Deep Research,完善Gemini 应用家族,为客户提供搜索与报告生成的AI 研究助手。后续OpenAI、Perplexity、Grok、Claude 相继推出实时进行最新网络信息搜索与处理的Agent 助手抢占市场,该类型助手可有效帮助使用者提升日常工作效率。国外机构METR 发布AI 应用摩尔定律:过去6年中,AI 完成任务的长度,每7 个月会翻一倍。AI 应用随模型进步诞生摩尔定律。
AI 赋能助力公司业务拓展,应用或迎来业绩兑现期
AI 赋能公司业务拓展,部分数据已在上市公司财报中体现,未来业绩或迎来兑现期。金蝶国际年报中,大型企业市场方面,苍穹AI 平台已服务海信、温氏等20 家客户,星瀚上线20 余个AI 应用;小微企业市场,推出小微AI 助手、AI 开单等应用,已赋能7,500 家企业。金山办公年报中,截至2024 年末,WPS AI 国内月活跃用户达1968 万,国内累计年度个人付费用户数达4170 万人。AI 赋能带动客户数增长,未来相关业务有望迎来业绩兑现。
投资建议:建议关注AI 技术进步带动整体产业链机会
AI 技术进步带动模型平权,在模型平权有望带动四方面投资机遇。(1)算力基础设施建设机遇:大模型能力提升或推动算力需求改变,国产GPU 生态体系加速发展,建议关注中科曙光、紫光股份、浪潮信息等领军企业;(2)端侧AI 软件开发机遇:端侧设备将是人机交互的重要中介,或将带动端侧AI 应用的软件开发机遇,建议关注中科创达等相关公司;(3)生产力工具革新机遇:大模型有望为生产力工具带来降低专业门槛、减少重复劳动等,建议关注金山办公、用友网络、泛微网络等;(4)行业信息化创新机遇:大模型有望率先在金融、法律、教育、医疗、汽车等领域落地,行业信息化厂商将是连接基础大模型厂商和行业客户的重要环节,建议关注恒生电子、宇信科技、中控技术、卫宁健康等行业信息化头部企业。
风险提示:商业化进程不及预期风险,数据安全风险,行业竞争加剧风险。