计算机行业研究：OPENAI推出语音模型模型赋能推动应用发展

类别：行业机构：国联民生证券股份有限公司研究员：陈安宇日期：2025-03-24

　　行业事件

    　　2025 年3 月21 日，OpenAI 发布了三款全新语音识别模型gpt-4o-transcribe、gpt-4o-mini-transcribe、gpt-4o-mini-tts，前两款为语音转文字模型，后一款为文字转语音模型。该三款模型大幅降低了单词识别错误率、提升了语言识别能力与准确性，在涉及口音、嘈杂环境和不同语音速度等场景均有较好效果。

    　　OpenAI 模型赋能语音Agent，API 价格下降推动语音智能体发展

    OpenAI 此次发布三款语音模型的语音转文本和文本转语音功能，可帮助开发者构建智能体。在文本转语音模型上，开发者可以让模型以特定方式说话，从而提升语音Agent 定制化程度，使得Agent 对话更为逼真。官网上提供了11 种预置的声音选项，选完声音后可选择特定的风格或人设，从而数秒内回复实现逼真的对话，模型同时可模仿特定历史时期说话方式。价格上，gpt-4o-transcribe 定价为每分钟0.006 美元；gpt-4o-mini-transcribe 定价为每分钟0.003 美元；gpt-4o-minitts的定价为每分钟0.015 美元。

    　　多公司积极布局Agent，AI 应用出现摩尔定律随着模型基本推理能力与生成能力提升，AI 应用中的Agent 市场在2025 年快速发展。谷歌Gemini 率先推出Deep Research，完善Gemini 应用家族，为客户提供搜索与报告生成的AI 研究助手。后续OpenAI、Perplexity、Grok、Claude 相继推出实时进行最新网络信息搜索与处理的Agent 助手抢占市场，该类型助手可有效帮助使用者提升日常工作效率。国外机构METR 发布AI 应用摩尔定律：过去6年中，AI 完成任务的长度，每7 个月会翻一倍。AI 应用随模型进步诞生摩尔定律。

    　　AI 赋能助力公司业务拓展，应用或迎来业绩兑现期

    AI 赋能公司业务拓展，部分数据已在上市公司财报中体现，未来业绩或迎来兑现期。金蝶国际年报中，大型企业市场方面，苍穹AI 平台已服务海信、温氏等20 家客户，星瀚上线20 余个AI 应用；小微企业市场，推出小微AI 助手、AI 开单等应用，已赋能7,500 家企业。金山办公年报中，截至2024 年末，WPS AI 国内月活跃用户达1968 万，国内累计年度个人付费用户数达4170 万人。AI 赋能带动客户数增长，未来相关业务有望迎来业绩兑现。

    　　投资建议：建议关注AI 技术进步带动整体产业链机会

    AI 技术进步带动模型平权，在模型平权有望带动四方面投资机遇。（1）算力基础设施建设机遇：大模型能力提升或推动算力需求改变，国产GPU 生态体系加速发展，建议关注中科曙光、紫光股份、浪潮信息等领军企业；（2）端侧AI 软件开发机遇：端侧设备将是人机交互的重要中介，或将带动端侧AI 应用的软件开发机遇，建议关注中科创达等相关公司；（3）生产力工具革新机遇：大模型有望为生产力工具带来降低专业门槛、减少重复劳动等，建议关注金山办公、用友网络、泛微网络等；（4）行业信息化创新机遇：大模型有望率先在金融、法律、教育、医疗、汽车等领域落地，行业信息化厂商将是连接基础大模型厂商和行业客户的重要环节，建议关注恒生电子、宇信科技、中控技术、卫宁健康等行业信息化头部企业。

    　　风险提示：商业化进程不及预期风险，数据安全风险，行业竞争加剧风险。

日	一	二	三	四	五	六
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

日	一	二	三	四	五	六
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

日	一	二	三	四	五	六
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

计算机行业研究：OPENAI推出语音模型 模型赋能推动应用发展

数据推荐

计算机行业研究：OPENAI推出语音模型模型赋能推动应用发展

日	一	二	三	四	五	六
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31