传媒行业动态点评:GPT-4O原生生图的突破与影响
OpenAI 推出GPT-4o 原生图像生成功能,有望重塑多领域生产力北京时间3 月26 日,OpenAI 推出GPT-4o 原生图像生成功能,具备强大的图像生成与修改能力,如更好的文本集成、增强的上下文理解、改进的多对象绑定和多样化风格适应等。我们认为该功能的出现,使得图像生成的用户体验更流畅、生成效果更逼真,并且降低了用户使用门槛,意味着模型即产品的时代将加速来临。我们认为GPT-4o 生图功能在影视、营销、电商和游戏等领域具有较大应用潜力,有望成为真正的生产力工具,为行业带来变革性影响。
GPT-4o 生图能力全球领先,技术路径基于自回归模型GPT-4o 生图的特点在于能精准渲染图像内文字、精确执行复杂指令、上下文扩展确保多个交互之间的视觉一致性、支持各种艺术风格等,生图能力和质量目前来看全球领先。GPT-4o 在图像生成技术上与过往DALL-E 系列所采用的扩散模型不同,为基于自回归模型打造,从图像整体架构出发,逐步细化填充。这种技术路径的优势在于面对复杂场景的图像生成任务时,图像质量和逻辑性更有保障。此外,模型可充分理解多轮对话中的复杂指令,大幅提升图像生成的准确性与效率,为其在多领域的应用筑牢技术根基。
GPT-4o 原生图像生成功能将推动构建全场景、多模态创意交互新生态我们认为该功能的上线丰富了OpenAI 的生态体系,生图能力全球领先,革新了创意交互模式。在个人端,ChatGPT 各层级用户,无论付费与否,都能在对话中轻松利用GPT-4o 大模型生成图像(之前为调用DALL-E 模型),并依上下文动态调整,实现一站式创作。企业用户与教育机构后续也将获得专属优化版本,降低专业场景创作门槛。Sora 平台作为OpenAI 打造的创意协作空间,同步支持该功能,用户可实现文本到视觉内容的全流程创作,推动第三方应用集成GPT-4o 图像生成能力,拓宽应用边界。未来,借助API 接口,我们认为GPT-4o 有望与更多工具、平台深度融合,构建庞大创作生态,推动图像创作向全民化、智能化、协同化发展,进一步释放其在各行业的应用潜力。
GPT-4o 生图功能将提高影视/营销/电商和游戏等行业内容创作效率和质量我们认为在影视行业特别是动漫IP 领域,可借助GPT-4o 快速产出角色概念图、场景分镜、文生漫,为项目策划提供丰富创意素材,大幅缩短筹备周期和成本;营销和电商行业,可利用该功能一键生成商品展示图、营销海报,生动呈现商品细节与卖点,提升用户的购物体验和转化率;游戏开发领域,可让游戏角色和场景的生成更加逼真和多样化,甚至能够生成多帧连贯动画,助力打造沉浸式游戏体验。产业链标的包括:影视-奥飞娱乐、上海电影、光线传媒、果麦文化、百纳千成;游戏-恺英网络、巨人网络;电商-焦点科技、值得买;营销-蓝色光标、易点天下等。
风险提示:AI 发展不及预期,用户反响不及预期,政策监管风险。