智能语音行业精品报告:从语音合成(TTS)的发展探寻智能语音行业的现状与未来

类别:行业 机构:头豹信息科技南京有限公司 研究员:—— 日期:2021-06-17

  语音合成模型已经发展到第三代

      语音合成模型经过长时间的发展,由最初的基于拼接合成,到参数合成,逐渐达到了现阶段感情充沛的基于端到端合成,最新一代端到端合成降低了对语言学知识的要求,可批量实现多语种的合成系统,语音自然程度高。

      TTS技术主要分为两种

      TTS语音主要分为通用TTS和个性化TTS,通用TTS适用于导航、语音播报、智能客服和大多数语音交互场景,个性化TTS则主要应用于对声音质量较高的教育,长音频、直播以及影视游戏配音等场景当中。

      TTS技术助力长音频行业的发展

      中国用户在网络音频上的MAU已经从2019年的342分钟快速增长至2020年的600分钟,长音频市场未来发展潜力巨大,长音频作品大量都基于文字脚本而来,TTS技术能够大大减少将文字转为语音的时间和财务成本,也为长音频作品带来创新体验。

      语音合成行业格局稳定,未来注重商用落地

      语音合成行业发展较成熟,原有格局难以打破,新进入者只能通过弯道超车或差异化竞争打破僵局,用户的需求将会变得多样,这对语音合成行业也是巨大挑战,在未来,语音合成技术也将逐步打开商用化道路,应用场景将逐渐细化和专业。