传媒周观点:STABLEDIFFUSION3可通过API使用 百度举办AI开发者大会

类别:行业 机构:上海证券有限责任公司 研究员:陈旻 日期:2024-04-22

  主要观点

      4 月18 日,Stability.ai 在官网宣布最新文生图模型Stable Diffusion 3(简称“SD3”)和 SD3 Turbo 可以在API 中使用。与前两代相比,SD3 除了生成的图片质量更高之外,可以更好地理解提示文本中嵌入到图片中的文字。Stability.ai2 月22 日在官网首次展示了SD3 并开启候补测试,3 月5 日在arxiv 上公布了其论文并介绍,SD3 与前两代相比最大技术创新在于使用了MM-DiT 和Flow Matching 两种方法来增强模型的输出、训练、优化等,同时支持文本或图像作为提示实现多模态能力。通常多数文生图模型在生成的过程中,只考虑图像本身而没有充分利用文本信息,所以,输出结果时经常出现“驴头不对马嘴”的情况,甚至是一些无法理解的乱码或者扭曲的图像。而MM-DiT 通过结合Transformer 的自注意力机制强大的文本和图像序列处理能力,帮助模型在生成图像时能与文本实现更好的匹配。当用户输入文本或图像提示时,首先被转换为嵌入表示。文本通过预训练的文本模型编码,而图像则通过预训练的自动编码器转换为潜在空间表示。

      4 月16 日,Create 2024 百度AI 开发者大会在深圳举办。百度创始人、董事长兼首席执行官李彦宏发表了题为《人人都是开发者》的主旨演讲。他认为,AI 正在掀起一场创造力革命,未来开发应用就像拍短视频一样简单,人人都是开发者,人人都是创造者,大模型和生成式AI 将彻底改变开发者群体。百度已经为开发者们准备好了三大“开箱即用”的工具,包括智能体开发工具AgentBuilder、AI 原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder,这三个工具都代表了先进生产力。此外,百度正式发布了文心大模型4.0 的工具版,开发者可通过文心4.0 降维裁剪出来的更小尺寸模型,在同等尺寸下,比直接拿开源模型调出来的效果更好;在同等效果下,成本更低。

      在10 亿互联网用户的基础下,国内大模型拥有足够的AI 应用场景和产业体系。我们认为在国家“人工智能+”政策的支持和鼓励下,个人和企业可充分利用大模型工具,释放无限创造力和生产力。在大语言模型百花齐放阶段,我们认为国内大厂持续投入大语言模型,有望打造出更适合中国的AI 生产力工具。目前AIGC 行情已有所分化,未来主题性机会有望逐步切换向案例兑现、甚至基本面兑现,龙头及龙头板块需重点关注,持续推荐具备基本面优势的【游戏】板块。

      投资建议

      基于我们“大模型+小模型+应用及内容”的研究框架,我们认为从基本面受益的角度上看,需沿着目前成熟大模型模态输出的范围选择标的,重点关注AI+文本/虚拟人板块,其次关注AI+图片(大模型+小模型);从价值重估的角度上看,需沿着掌握优质数据或内容(多模态数据)的范围选择标的,重点关注AI+内容/IP/版权板块。

      AI行情分化趋势下,建议重点关注基本面优异的【游戏】及【出版】板块:

      1、AI:关注【昆仑万维】;推荐【创业黑马】。

      2、MR:推荐【风语筑】;关注【宝通科技】。

      3、游戏新模式:推荐【盛天网络】、【完美世界】、【三七互娱】。

      4、影视新模式:关注【中文在线】、【上海电影】、【光线传媒】、【华策影视】。

      风险提示

      政策边际优化的程度不及预期、AI推进进度不及预期、AIGC商业模式或落地场景效果不及预期、内容监管趋严。