软件与服务行业研究:百度正式发布文心一言大模型 开启国内通用大模型新篇章

类别:行业 机构:长江证券股份有限公司 研究员:宗建树 日期:2023-03-17

事件描述

    3 月16 日下午,百度正式发布文心一言大模型。在发布会上,百度CEO 李彦宏展示了文心一言的文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五种能力。百度将大模型生态分为了芯片层、框架层、模型层、应用层四层,此次发布的文心一言位于模型层。百度AI 全栈布局的优势在于可以在技术栈的四层架构中实现端到端优化,大幅提升效率。在发布会上,李彦宏预言大语言模型将带来新型云计算、行业模型精调、应用开发三大产业机会。

    事件评论

    百度文心一言开启了国内通用大模型的新篇章。自从2022 年11 月OpenAI 发布ChatGPT以来,预训练大模型已经证明了商业化落地的可行性;但OpenAI 不对国内厂商开放API接口,国内商业化大模型领域仍为空白市场。百度在这一领域积极投入,虽然在初期阶段文心一言的Prompt 和RLHF 能力相较ChatGPT/GPT-4 仍有一定距离,但国产化大模型正在加速追赶。目前文心一言在国内已有650 位合作伙伴,未来有望迅速提高AI 技术在国内市场的渗透率,对AI 通用领域和行业专用领域产生颠覆性影响。

    文心一言展现了较强的文字处理、逻辑推理、多模态生成能力。虽然百度尚未公布文心一言大模型的参数,但李彦宏在发布会上通过五个案例展示了文心一言的能力。(1)文学创作:文心一言准确回答了《三体》作者、电视剧角色扮演者,《三体》内容总结等事实性问题;(2)商业文案创作:文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务;(3)数理逻辑推算:面对“鸡兔同笼”逻辑推理题,文心一言能理解题意,并有正确的解题思路。(4)中文理解:文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。(5)多模态生成:

    现场展示了文心一言对“2023 世界智能交通大会”的主题生成文本、图片、音频和视频的能力。

    聚焦投资视角,百度文心一言掀起了新一轮AI 产业链的浪潮,有望带动底层基础设施环节、底层数据资源环节、基础模型环节、上层应用环节的发展。建议关注:(1)底层基础设施环节:算力设施的发展是大模型推进的前提,而从商业模式角度出发,无论上层应用如何变化,对算力的需求是确定的,建议关注A 股芯片(训练芯片、推理芯片)、服务器、IaaS 等板块投资机会;(2)底层数据资源环节:模型的训练需要海量数据的支撑,建议关注数据标注板块投资机会;(3)基础模型环节:本次发布会上百度也推出了文心大模型开发套件,大模型套件可以提供全流程大模型开发与部署工具集,端到端、全方位发挥大模型效能;同时建议关注国内其他大模型厂商的开发进展;(4)上层应用环节,建议关注具有潜在爆款应用落地场景的科大讯飞、金山办公等公司,和具备图像场景的公司等,同时建议关注百度文心生态圈公司的投资机会。

    风险提示

    1、技术推进不及预期;

    2、技术商业化落地不及预期。