GPT-4O：原生图像生成功能重磅上线

类别：行业机构：华创证券有限责任公司研究员：刘欣/赵海楠日期：2025-03-31

　　GPT-4o 是OpenAI 于2024 年5 月推出的多模态大模型。根据界面新闻，2025年3 月25 日，美国开放人工智能研究中心（OpenAI）正式宣布推出GPT-4o原生图像生成功能，将目前最先进的图像生成技术深度集成至其旗舰模型GPT-4o 中。

    　　图像生成功能重磅上线。在GPT-4o 原生图像生成功能上线之前，ChatGPT 的图像生成能力主要依赖独立的DALL-E 模型，其功能实现与当前存在显著差异。1）外部调用机制：用户需通过文本指令触发图像生成请求，系统会跳转至DALL-E 模型单独处理，生成结果以图片链接形式返回。2）基础文生图能力：支持通过文字描述生成静态图像，但受限于DALL-E 的理解能力，对复杂指令的处理效果有限。

    　　模型性能全面优化。更新的主要内容还包括：1)多指令解析优化：OpenAI 对GPT-4o 模型进行了深度优化，使其在处理复杂指令方面能力大幅提升。2)技术问题处理能力增强：升级后的GPT-4o 在解决复杂技术和编程问题方面更具实力，能够为用户提供更精准的解析和有效的解决方案，助力技术开发者提高工作效率。3)逻辑推理与创造力提升：此次更新使GPT-4o 在逻辑推理和创新性思维方面取得显著进步，跨领域知识融合能力得到增强，为用户提供更具启发性的建议和解决方案。4)交互界面精简：为了提升专业场景下的对话体验，OpenAI 在新版GPT-4o 中减少了表情符号的使用频率，使交互更加简洁、高效。此外，根据IT 之家新闻，在LMArena 基准测试网站上，GPT-4o 模型在最新测试中取得了令人瞩目的成绩，跃居第二。

    　　从官网及互联网实测效果案例来看，我们认为GPT-4o 图像生成能力具备以下特点：1）对话式图像生成：用户无需编写复杂的提示语，通过自然语言即可完成创作，通过4o 模型，创建的图像在光影、文字、细节处栩栩如生。2）吉卜力画风：吉卜力画风生成功能是其2025 年3 月推出的原生图像生成功能中最受关注的特性之一。3）持续生成能力：GPT-4o 能基于聊天上下文中的图文内容持续创作，确保输出结果的一致性。4）GPT-4o 多模态生图功能在电商设计场景中展现高效生产力：电商经营者利用其生图功能，快速生成产品海报和营销素材，极大提高了工作效率。

    　　风险提示：政策监管趋严，AI 技术迭代发展不及预期，AI 产品商业化不及预期，测试效果为单次效果存在随机性的风险等。

GPT-4O：原生图像生成功能重磅上线

数据推荐