软件及服务行业:AI动态跟踪:CHATGPT重大更新 多模态能力快速提升

类别:行业 机构:中国国际金融股份有限公司 研究员:于钟海/王之昊/魏鹳霏 日期:2023-09-27

  行业近况

      9 月25 日,ChatGPT推出图像和语音功能,预计两周内向Plus用户和Enterprise用户开放,并随后向开发者发布1;9 月20 日,OpenAI发布DALL·E 3 研究预览版,DALL·E原生构建于ChatGPT中,预计10 月初向Plus用户和Enterprise用户开放、秋季稍晚时面向研究实验室和API发布2。

      评论

      图像与语音功能重大更新,显著提升用户体验。9 月25 日,ChatGPT重磅推出图像和语音两大新功能,其中语音功能适用于移动端iOS平台和安卓平台,图像功能则适用于所有平台;新功能预计在两周内面向Plus用户和企业用户开放并随后向开发者等用户群体发布。基于OpenAI官网发布的演示,我们认为图像功能加持下ChatGPT具有强大的图像识别、分析能力,语音功能通过解锁语音对话场景提供了更加便捷快速的交互方式,总体而言,两大新功能在实用性和便捷度等方面显著提升了用户体验,进一步拓宽了ChatGPT的使用场景和任务类型。我们认为OpenAI后续开放相关API将会便利广大应用厂商调用图像和语音相关AI能力,从而持续打开AI应用层想象空间。

      DALL·E 3 原生构建于ChatGPT中,图像能力大幅增强。9 月20 日,OpenAI面向少数测试用户发布文生图大模型DALL·E 3 研究预览版,并预计10 月初向Plus用户和企业应用开放、秋季稍晚时对研究实验室和API推出。经过对比DALL·E 3 相较于DALL·E 2 和Midjourney的表现,我们认为其创作的图像质量显著高于DALL·E 2,而且较Midjourney而言能更好地理解和严格遵守用户的做图指令。我们认为,DALL·E 3 原生集成于ChatGPT的特点将大幅提升ChatGPT的使用体验和拓宽其使用场景,同时ChatGPT可以成为用户使用DALL·E 3 做图时的灵感助手和提示词扩写改写助手,从而显著提升文生图效果,起到相互促进的积极作用。

      估值与建议

      我们维持板块覆盖公司盈利预测、目标价和评级不变。我们认为ChatGPT功能重大更新体现了其在多模态领域实现重要突破,持续看好AI应用层发展机遇。我们认为AI行业应用趋势愈发明朗,前期展望有望逐步兑现,建议关注国内AI应用领域的商业化落地进展。

      风险

      技术进展不及预期,国内应用落地不及预期。