GPT-4O:原生图像生成功能重磅上线
GPT-4o 是OpenAI 于2024 年5 月推出的多模态大模型。根据界面新闻,2025年3 月25 日,美国开放人工智能研究中心(OpenAI)正式宣布推出GPT-4o原生图像生成功能,将目前最先进的图像生成技术深度集成至其旗舰模型GPT-4o 中。
图像生成功能重磅上线。在GPT-4o 原生图像生成功能上线之前,ChatGPT 的图像生成能力主要依赖独立的DALL-E 模型,其功能实现与当前存在显著差异。1)外部调用机制:用户需通过文本指令触发图像生成请求,系统会跳转至DALL-E 模型单独处理,生成结果以图片链接形式返回。2)基础文生图能力:支持通过文字描述生成静态图像,但受限于DALL-E 的理解能力,对复杂指令的处理效果有限。
模型性能全面优化。更新的主要内容还包括:1)多指令解析优化:OpenAI 对GPT-4o 模型进行了深度优化,使其在处理复杂指令方面能力大幅提升。2)技术问题处理能力增强:升级后的GPT-4o 在解决复杂技术和编程问题方面更具实力,能够为用户提供更精准的解析和有效的解决方案,助力技术开发者提高工作效率。3)逻辑推理与创造力提升:此次更新使GPT-4o 在逻辑推理和创新性思维方面取得显著进步,跨领域知识融合能力得到增强,为用户提供更具启发性的建议和解决方案。4)交互界面精简:为了提升专业场景下的对话体验,OpenAI 在新版GPT-4o 中减少了表情符号的使用频率,使交互更加简洁、高效。此外,根据IT 之家新闻,在LMArena 基准测试网站上,GPT-4o 模型在最新测试中取得了令人瞩目的成绩,跃居第二。
从官网及互联网实测效果案例来看,我们认为GPT-4o 图像生成能力具备以下特点:1)对话式图像生成:用户无需编写复杂的提示语,通过自然语言即可完成创作,通过4o 模型,创建的图像在光影、文字、细节处栩栩如生。2)吉卜力画风:吉卜力画风生成功能是其2025 年3 月推出的原生图像生成功能中最受关注的特性之一。3)持续生成能力:GPT-4o 能基于聊天上下文中的图文内容持续创作,确保输出结果的一致性。4)GPT-4o 多模态生图功能在电商设计场景中展现高效生产力:电商经营者利用其生图功能,快速生成产品海报和营销素材,极大提高了工作效率。
风险提示:政策监管趋严,AI 技术迭代发展不及预期,AI 产品商业化不及预期,测试效果为单次效果存在随机性的风险等。