传播文化业行业:PIKA评测超预期 GOOGLE大模型蓄势以待

类别:行业 机构:国泰君安证券股份有限公司 研究员:陈筱/李芓漪 日期:2023-12-07

  本报告导读:

      近日,AI 视频生成工具Pika 1.0 评测效果超预期,Google 展示多模态大模型Gemini,二者分别对标Runway Gen-2、GPT-4 并创新功能,相关AI 应用值得期待。

      摘要:

      事件:1)近 日,AI 视频生成工具Pika 1.0 面向部分用户开放测试资格,从现有的用户评测结果来看,实际画质精细度较11 月29 日的宣传片均更胜一筹,功能比预期更丰富。2)12 月6 日,Google 展示多模态大模型Gemini 的实测影片,Gemini 可实时与用户进行趣味互动并输出文字、图片、音频等。

      Pik a 1.0 面向部分用户首发评测,操作体验优化,创新功能增加,生成效果超预期。从现有的用户评测结果来看,与Discord 社区上展示的早期版本相比,Pika 1.0 网页版操作更为便捷,原先需手动输入文字命令进行调整的细节,现在只需点击选项或拖动滑轨便可完成参数设置:1)屏幕纵横比设置:设有16:9、9:16 等六种选项,FPS 帧数可在8-24 区间内调节;2)镜头控制:设有左/右、上/下、顺时针/逆时针、放大/缩小四组选项以控制镜头画面呈现角度,内容速度可在0-4 区间内调节;3)负面提示词及提示词相关性设置:可输入负面提示词如“丑陋的”、“糟糕的”以避免生成相关内容,内容与提示词相关性可在5-25 区间内调节。除了此前宣传片中展示的局部修改(Modify Region)、尺寸调整(Expand Canvas)两大创新功能以外,Pika 1.0 网页版还新增两大功能,延长4 秒(Add 4s)使默认生成的4 秒视频延长至8 秒,增强(Upscale)在不损画质的情况下将画面放大两倍,最终生成视频画质较Discord 社区版本亦更为精致细腻。

      Google 展示多模态大模型Gemini,或为GPT-4 最强竞品。在GoogleGemini 实测影片中,Gemini 可识别用户的多种行为并进行多模态反馈互动,或是向用户抛出问题与之互动,如在“猜国家”游戏中,Gemini给出袋鼠、考拉、大堡礁三个图像并倒计时30 秒,用户需在地图上指出对应国家所在方位。与3 月14 日OpenAI 发布的GPT-4 相比,Gemini 同样具备视觉能力并输出文字、图片、音频等,在此基础上具备更强的互动趣味性。Pika 1.0 与Runway Gen-2 的对标,Gemini 与GPT-4 的对标均说明了AI 技术迭代之快,建议关注积极布局AI 应用的公司,推荐标的:上海电影、恺英网络、三七互娱等,受益标的:

      易点天下、蓝色光标、中文在线、光线传媒、掌阅科技等。

      风险提示:AI 商业化不及预期、政策监管风险等。