传播文化业行业:字节文生图开源模型大幅降本 利好营销电商场景落地

类别:行业 机构:国泰君安证券股份有限公司 研究员:陈筱/陈俊希/李芓漪 日期:2024-02-25

  本报告导读:

      字节跳动开源文生图模型大幅压缩成本,随着各类图像生成技术逐渐稳定和降本,其将首先在营销、短视频领域落地,而后拓展到其他内容产业。

      摘要:

      事件:2月23 日,字节跳动智能创作团队公布了最新的文生图开放模型SDXL-Lightning,该采用渐进式对抗蒸馏技术,成本显著降低。

      模型通过渐进式对抗蒸馏技术显著降低计算成本及时间,目前在hugging face 排名趋势榜前列。截至2 月24 日晚间,模型SDXLLightning在hugging face 上排名趋势榜前列,当前生图领域的先进模型依赖于扩散模型,其将噪声逐步转化为图像样本的扩散过程需要耗费巨大的计算资源并且速度较慢,相比之下SDXL-Lightning 通过渐进式对抗蒸馏技术显著降低了计算成本和所需的时间,能够在短短2步或4 步内生成极高质量和分辨率的图像,将计算成本和时间降低十倍,对于其在产业端落地具备突出意义。

      图像生成技术呈现成熟化、开放化趋势。文生图片、视频是近期各AI团队重点突破的方向,如2 月16 日OpenAI 推出的文生视频模型Sora,采用diffusion 加Transformer 的路径,将生成视频的长度从过往的3-5s 大幅扩展到60s,且内容的一致性和细节程度有显著提升;开源端同样有持续进展,如2 月21 日谷歌发布开源多模态模型Gemma,平均性能远超130 亿参数的Llama-2,成为目前全球最强大的开源模型,2 月23 日,Stable Diffusion 3.0 发布,画面质量、文字渲染、复杂对象理解大提升,该模型预计在确定安全性后开源。开源模型的推出预计将推动AI 图像生成技术的整体进步及落地应用

      AI 生成内容已有初步落地,对应短视频、营销、影视内容等多场景。

      近期,AI 生成的内容已初步在多个领域落地,如OpenAI 新开TikTok认证账号,更新多个全新Sora 生成视频,因视频逼真效果4 天涨粉10 万;国内方面,AI 种草博主已在抖音批量出现,主要通过视频挂车带货模式变现,根据新抖数据统计,近30 天来看,部分AI 博主预估已实现5 万元以上带货金额,AI 主播的优势在于低门槛、可批量生产。深度内容方面,首部中国原创的文生视频AI 系列动画片《千秋诗颂》,将于2 月26 日起在总台综合频道播出,创作过程中,AI使得团队创作从一个月1 集加速到一个月3 集,速度提升两倍。

      投资建议:我们预计AI 有望先在时长、内容质量要求相对较低的营销、电商领域落地,之后将随着技术的持续迭代和成本压缩,逐步对专业内容生产进行改造。受益标的包括因赛集团(多模态营销GPT)、捷成股份(数字人产品)、值得买、蓝色光标、国脉文化、青木股份。

      风险提示:AI 视频技术落地推进不及预期;政策与安全性风险。