数据驱动创新系列:AI助力新药研发破局 数据要素定位竞争格局

类别:行业 机构:中信证券股份有限公司 研究员:张若海/陈竹/刘泽序 日期:2021-06-16

  全球产业资本近三年重金押注新药AI 研发科技公司,助力解决新药研发成功率低、成本高、研发周期长等问题。从数源角度看,相对开放和全面的文献数据,有助于初期行业的蓬勃发展和算法的快速迭代,商业化全面提速。同时核心的临床研发数据的稀缺特性,也给行业中期的护城河确立了明确的门槛,率先与头部药企达成合作的AI 新药公司将享有更高的竞争力和发展空间。

       产业资本重金布局数字健康,国内AI+新药研发渐成行业发展新热点。全球AI+制药领域自2014 年起兴起,近3 年行业进入扩张快车道。2020 年全球融资事件47件,融资总额27.8 亿美元。相比国外,中国在AI+制药方面起步则略有滞后,自2015 年起开始出现少量融资事件,每年不到10 起,总融资额不足10 亿人民币。

      2020 年,中国AI+制药融资项目数量实现翻倍,且同年融资总额出现了同比约10倍的增长。其中,晶泰科技一枝独秀,凭借超过3 亿美金融资直接占据了全年融资额的70%,一举奠定国内行业独角兽地位。

       AI 助力新药研发结构性升级,重塑产业发展规律。一直以来,新药研发都呈现三大高风险特性,平均每一种新药从靶点发现到上市,都存在成功率低(10%左右)、成本高(10 亿美元)、研发周期长(10-12 年)等问题。新药研发包括药物发现、临床前研究、临床研究试验以及申报上市4 个阶段。其中药物发现、临床前研究这两个环节涉及靶点发现、化合物合成、晶型预测等细分步骤,需要大量资本开支和密集人力投入。因此降低研发费用,提高成功率,缩短周期,同时满足开发有差异性、竞争力、技术门槛高的药物是各大制药公司迫切需要解决的问题。人工智能凭借机器学习的训练能力能够将候选药物发现的速度和效率大幅提高,据估计AI 技术可为新药研发节约近50%时间,每年节约费用超百亿美元。

       行业快速发展核心催化剂,开源数据+算法迭代。AI 新药行业作为人工智能和医药的交叉领域,其核心要素:一是海量生物医药相关领域的数据,二是不断迭代优化的机器学习算法。在数据层面,AI 新药行业的主要数据源分为三大类,医疗文献数据、药物化学数据、临床试验数据。其中,医疗文献数据库主要用于构建生物医药领域知识图谱,进而发现疾病和靶点、疾病和基因之间的关系等,是较早能够定位新药天花板的关键数据“捷径”;药物化学数据库尤其在化合物合成、筛选环节发挥作用;临床数据的应用则贯穿临床试验的全过程,从患者招募、到优化临床试验设计、再到药物重定向均发挥不同作用,是在研发全流程能够大幅缩短研发周期的“密钥”。在算法层面,深度学习算法应用最为广泛,无论是在靶点发现、化合物合成、还是晶型预测等环节都有应用,主要以市面上各种开源的神经网络模型为主,但根据不同应用药品研发细分领域和环节做场景优化。

       行业关键生产要素,基础数据结构化较好助力行业快速起步。AI 新药行业常用的三类数据中,医疗文献数据,权威的数据库是Pubmed,包含3000 万篇中、英双语的学术论文,领域覆盖生物、医学、药学等,有细致的领域标签,且提供全文获取链接;药物化学数据方面,权威的数据库是ChEMBL,收录约200 万化合物,1.3 万余靶点,且完全开放,支持网页或FTP 下载,此外还有由美国多所著名大学与IQVIA 合作发布的TDC 数据集,包含了20 多个任务,和70 多个高质量数据集;其中临床试验数据,主要来源是药企在药品研发过程中积累的各种数据,这部分数据属于非公开数据,也是药企的核心资产。相对开放和全面的底层数据,有助于初期行业的蓬勃发展和算法的快速迭代,同时临床研发数据的不公开,也给行业的准入带了门槛,率先与头部药企达成合作的AI 新药公司将享有更高的竞争力。

       风险提示:一级市场投资热情降温;AI 算法应用效果不及预期。

      投资建议:头部产业资本持续加码AI 新药研发科技公司,行业蓬勃快速发展。在新兴公司方面,我们建议关注在技术背景雄厚,大药企客户开拓方面领先的晶泰科技,在新药研发流程实现全覆盖的深度智耀。对于二级市场生物医药领域方面,我们重点推荐临床研发数据积累最为雄厚的平台型药企,如恒瑞医药、复星医药,和引入AI 新药研发技术较为领先的药明康德,关注丽珠集团。