图片来源@视觉中国
本文来自钛媒体,文|锦缎。
众所周知,创新药研发迄今仍逃不开“双十定律”——研发费用10亿美元,研发周期10年。高投入与高风险,不仅考验投资人的耐性与运气,更令憧憬于改变产业格局与人类健康命运的创新药公司与科学家,长期徘徊于“一念天堂一念地狱”之间。
就在5月27日,天境生物(NASDAQ:IMAB)公布其“CD73抗体尤莱利单抗药物”的中国II期临床研究数据。数据显示,在19例可评估疗效患者中,5例达到部分缓解(PR),客观缓解率(ORR)为26%;9例疾病稳定(SD),疾病控制率(DCR)为73.7%。
有评论人士认为,两药联用26%的ORR,可能单用PD-1也不比这个数据差多少,这吃了和没吃有啥区别吗?二级市场随之投出不信任票,天境生物市值本来就日渐萎靡的市值被一刀砍翻,当日重挫26.88%。这则案例,也再度印证了创新药研发之难,对于医药公司而言如同一场“生死劫”。
图:天境生物市值来源:雪球
如何能通过技术革命,“更快、更好、更强”地进行新药研发,从本质上实现医药公司“逆天改命”式救赎?在这个问题上,除了祈祷,更多的创新药公司正将希望寄托在“AI‘制药’”上——
随着赛诺菲与英国药物研发AI技术服务提供商Exscientia达成了一笔52亿美元的AI制药大单;英矽智能,半年内两次宣布发现新药,并率先进入临床试验新阶段;阿斯利康、默克、辉瑞、梯瓦等制药巨头联合建立的AI药物研发实验室AION Labs宣布正式启动……各界无不期待“AI‘制药’”重新定义制药流程,为世界带来一场巨大变革。
那么,AI制药到底是什么?
AI如何“制药”?
19世纪以前,人们主要利用天然植物、动物、矿物直接用于部分疾病的治疗。例如《本草纲目》记录了各种动物和人体组织等“奇葩”药材。这个时期,只要是自然界存在的物质,人们都拿来试试能不能做成药。
20世纪随着随着药理学和有机化学等科学的发现,人们可以合成一些自然界不存在的全新化合物。这些药物以人体为研究对象,以人体代谢和作用机制为抓手,研究出了抗生素、维生素、磺胺类药物、精神病药物、麻醉镇痛、疫苗等的新药。
20世纪60-80年代,一些与疾病相关的酶、激素、神经递质的受体和底物被发现。物质分析检测技术和计算机的发展应用。人们开始尝试摆脱随机发现转向到主动编辑化合物。
20世纪80年代之后,基因组学、蛋白质组学、生物信息学等现代分子生物学科得到发展,以靶点为基础的新药研发模式得到应用。
如今,新药物发现的大致过程需要先发现靶点-验证靶点-发现先导物-优化先导物,从数十万个化合物中选出几个候选药物,最后再进入临床试验环节。靶点可以理解为不同疾病关键点构成的“锁”,人们在众多药物分子可能性中,设计和筛选最合适的分子作为“钥匙”去解锁。
人们利用计算机辅助制药(CADD)来评估分子多样性、构建化合物库、开展基于分子相似性的筛选。建立大型化合物库与生物靶标自动对接软件,并分别打包变成研发系统的组件。
CADD的应用,一方面能够允许研究者减少实验来评估化合物的有效性,直接在电脑上就能设计和“改造”分子。但另一方面,这些分子仍需要人工搭建生成,并与资料库比对。这些前期工作需要从上万个化合物中一个个筛选无异于“大海捞针”。
图:药物研发流程示意。来源:塔夫茨药物开发研究中心
这种对人来说的繁琐工作,恰恰是AI非常典型的应用场景。
今天所说的AI制药就是利用AI的归纳推理能力,分析实验数据优化药物研发环节;利用AI算力优势,物理层面演绎分子结构从而加速筛选优化先导物。换句话说,AI制药把创新药行业的规则扭转到了比特币“挖矿”的逻辑。谁的算力大,谁的模型做的好,谁就能率先进入临床试验。
AI制药可以跳过原来漫长的临床前的研发时间,降低前期研究所耗费巨大的人力和材料成本,直接推选出最符合要求的候选药物。而这恰恰是创新药前期研发的全部流程。谁能率先发现新的靶点,谁就能摆脱其他的同类追随者。
以治疗肿瘤的PD-1为例,这个靶点上密密麻麻趴满了等待套利的伪创新药企业,同业竞争压力巨大。跟这些追随者竞争,就算成功跑了出来,在中国也要面临医保费用有限购买力的“大剪刀”,让这些fast in follow、me too、me better企业蹦跶不了太高。
AI制药的大面积应用这将允许药企能够摆脱经费不充足的压力,可以不再追热度、抄作业,向着Best in Class(同类最优)甚至First in Class(同类第一)进军。更好地吃到独家特效药所带来的收益,为社会和股东创造价值。
在算力取得长足进步的今天,AI制药在硬件上具备了施展的可行性。AI制药的实力如何,还得看赛道上的玩家做得怎么样。
赛道上都有谁?
目前,AI药物研发市场有三大类公司,IT巨头、AI药物研发初创企业和大型药企。三类企业依托各自在平台、算法和数据的优势切入行业。
大型药企这边,近年来世界头部药企如辉瑞、诺华、强生、阿斯利康、默沙东等都有积极布局AI药物研发领域;国内医药行业的龙头,如中国生物医药、药明康德等也抓住机遇纷纷布局此赛道,开展与AI药物研发初创公司的合作。
布局方式上,国外医药公司多与初创型AI药物研发公司合作,共同开发新药模式为主,也会以投资的方式合作。国内医药企业在AI药物研发的布局虽然相较海外略晚,但也是合作与投资兼有。其中药明康德前后已参与了4家AI药物研发初创公司的投资。
图:国内公司与AI公司合作情况来源:健康界研究院
IT公司这边,从2018年开始,阿里、腾讯等巨头都开始相继布局此赛道。主要发力方向是利用公司算力和AI模型的优势,介入到AI制药的环节中。
例如百图生科推出的“免疫图谱卓越计划”,实质上是结合百度自有的算力和AI经验,结合10亿元资金补贴吸引生态联盟合作伙伴共同运作的生物运算引擎平台。不过,目前这些科技公司搭建的平台都是以搭载数据库训练模型为主,并未产生太多实际应用。
图:国内IT巨头布局AI制药数据平台来源:亿欧智库
初创企业是AI制药的主力军,是AI制药的主要推动者和实践者。2021年,全球融资总额约为266亿元(超42亿美元)。其中,中国在该领域的融资金额超过90亿元。
2022年一季度,AI制药领域发起40多起融资,总金额金额累计超24亿美元。投融资活动仍主要发生在中美两国,占总融资事件的80%。其中,国外的Schrodinger、Exscientia、Abcellera和国内的英矽智能、晶泰等公司较为优秀。
图:截止至2022年初,全球AI制药融资情况来源:BiopharmaTrend
Exscientia(纳斯达克上市,市值14亿美元)
从2012年成立到现在,exsientia成功让两个AI研发的药物走上临床试验阶段。分别是治疗强迫症的化合物DSP-1181和免疫肿瘤药物EXS21546。这两款药的前期研发周期均不超过一年。
Exscientia的核心能力源自于扎实的数据库(ChEMBL)和主动学习的AI。ChEMBL是一个包含了大量临床实验药物和批准药物的治疗靶标和适应症的平台,是成为AI制药公司们训练并生成药物分子最重要的数据源之一。公司的主动学习AI,可以在数据很少打标签,或者不打标签的情况下,通过让模型更多关注或者学习。做到能在较少的训练样本下获得较好的模型。
Schrodinger(纳斯达克上市,市值19亿美元)
Schrodinger的核心能力是业界绝对领先的分子计算模型和大量已经成熟的药物开发模组。
Schrodinger成立于1990年,经过多年的发展,他们发现了一个精度非常高的用于描绘分子动态变化的模型。在化学分子计算中,你所能模拟的分子越精确就相应的能获得更好的预期编辑效果。因此,随着现在发现新药的难度越来越高,越来越多的制药企业寻求通过计算来探索新的药物发现之路。
这家公司能一直维持收入超过30%的增速。目前,Schrodinger的软件已经在全球有了1600个客户,自己也有25个管线。
除此之外Schrodinger还提供了一整套分子模拟的解决方案,也就是CADD中常说的薛定谔软件。其中包含太多业内文明的模块,比如:Glide(分子对接)、FEP+(自由能微扰)、Desmond(分子动力学模拟)、PyMol(蛋白可视化工具)等。这些套件在业内的药物开发环节中,不可或缺。
图:Schrodinger营收增长来源:Chioce
Abcellera(纳斯达克上市,市值22亿美元)
Abcellera的核心能力在拥有扎实的数据基础之上,将AI、工程学、数学、化学、生物学等学科领域综合起来的能力。
2月12日,美国EUA了一个针对Omicron有效的中和抗体Bebtelovimab,这也是Omicron出现以后,第一个针对Omicron设计的中和抗体。该项目研发时间被压缩到了90天,震惊世界。
Abcellera是怎么做的呢?首先,Abcellera拥有他和美国众多医院合作收集的资料。接下来Abcellera从几百万个细胞中筛选出几百个用于实验。为了达到如此效率,他们使用一次性能够过筛25600个细胞,卡片大小的筛选器来进行操作。
这些细胞在测出氨基酸序列后,他们采用NLP(自然语言处理)来处理数据。然后在利用AI的归纳能力对几百个特征进行整理。为了保证结果准确性,他们接着把来自同一个捐献者的所有抗体重新测序,以获得单个细胞与所有免疫细胞之间的角色关系。
最后Abcellera再通过高通量的实验和前面产生的各种排列组合再对抗体进行优化,从而推出少数几个抗体。
如此技术只能说令人瞠目结舌。得益于高强的技术,目前Abcellera已与全世界众多药企展开合作,研发实力毋庸置疑。
图:Abcellera的合作机构来源:公司官网
晶泰科技(国内,未上市)
晶泰科技成立于2014年,是中国最早一批AI制药初创公司之一,目前共获得6轮融资,总融资金额高达7.85亿美元。
该公司的主要专攻方向是AI晶型预测。这个流程能够预测化合物的不同结晶状态,并指出不同状态下的用药效果。从而提高药效和缩短研发周期,使药企能够通过注册晶型专利的方式延长专利周期。
晶泰科技的技术平台不仅能准确预测晶体结构,并大幅缩短时间,同时还可以帮助优化分子结构。
2016年,晶泰科技获得了辉瑞晶型预测的盲测机会。随后晶泰科技正式成为辉瑞药物晶型预测等服务的供应商,并不断扩展了两家公司之间的合作,包括基于晶泰科技的AI技术,为辉瑞定制化开发人工智能药物模拟平台,用于新药发现。
目前晶泰科技已和多家药企达成合作,包括与世界排名前十药企中的7家达成正式付费合作,其主导的药物发现项目有几十个,绝大多数都是first in class(业界首创)。
图:晶泰科技晶型预测流程来源:公司官网
英矽智能(中国香港,未上市)
2018年6月,英矽智能获得了由药明康德领投的一笔战略融资,成为药明康德投资的第三家AI药物研发公司。2019年4月,英矽智能总部由美国转移落户香港。2021年的英矽智能,全球首次利用AI发现了一种全新机制的用于治疗特发性肺纤维化(IPF)的临床前候选化合物,整个研发过程只花了不到18个月的时间和大约200万美元,刷新了新药研发的速度和最低成本纪录。
今年1月12日,英矽智能拿到了来自复星医药的1300万美元的首付款和未来的里程碑式付款,这是国内AI制药公司迄今最大的一笔订单。
英矽智能的主要优势在于其提供的AI制药研发模组可覆盖大部分药物开发环节,如靶点发现、化合物合成、临床试验结果预测等药物开发等。
与其他公司主要采用的机器学习、深度学习、神经网络再辅以独家模型的操作模式不同,英矽智能采用的是生成式对抗网络(GANS)和强化学习(RL)的技术。该技术能够强调数据之间的内学习,从而发现药物起效的新机制、新关联。
英矽智能发现一款靶向主蛋白酶(3CL)的临床前候选药物,用于治疗新型冠状病毒引起的肺炎。该候选药物的全新分子结构由英矽智能自主研发的AI平台所生成,该化合物是一项全新的分子构造。从原料到制备化合物仅需两步,合成效率高。
AI制药在今天的成就从近年的投资热度也能瞥见,上述这些风格迥异的研发成就给了资本信心。
图:2015-2021国内AI制药融资情况来源:亿欧智库
但资本的火热并不代表AI制药的成熟。早年彼得·蒂尔(Peter Thiel)一眼相中Abcellera的研发能力,该公司在上市之初市值一路干到了200多亿美元。不过因为AI制药公司需要长期的研发支出,外加医药领域对AI制药的谨慎态度,使得Abcellera今天的市值缩水到当初的十分之一。
AI制药的挑战
梳理了众多的AI制药公司后可以发现,AI制药虽然取得了不少成果,但仍算是一个相当早期的阶段。从产业研发特性来说,AI制药是一个高科技、跨学科、高支出、强监管的产业,这些挑战每一项都称得上是悬在头顶的“达摩克里斯之剑”。
首先,AI制药的跨界人才壁垒极高。AI制药不同于今天的各类型AI科技公司,AI制药对人才在AI和生物学、化学、物理学等等学科都要求精通。
对于AI科技公司来说,自动驾驶称得上是AI难度的巅峰之一了。但自动驾驶的核心难度在于如何将不同类型传感器的信息进行融合,对这些数据进行综合汇算,最后再调整汽车不同系统之间的配合,达到自动控制的效果。但成为一名驾驶员只需要考一本驾照。
而AI制药需要从业者拥有兼具两者的综合能力。不精通其他学科,调制的AI输出结果无效,白白浪费数据和时间。对AI技术不精通,那制作的模型和统计的数据就不能很好地被AI所用。
对于AI制药来说,这些差距是不能仅通过烧钱、跑测试就能弥补的,Abcellera和Schrodinger能够独霸一方,靠的正是多年专业能力的积累和AI技术的独门秘籍。
其次,AI制药初创公司难以获得高质量的数据。
拥有有效且翔实的数据来源是能够保障AI输出结果正确度的保障。目前,AI制药公司的数据源多来自于公开资料,如已发表的医学文献,公开的靶点库,药企、科研机构或院校的公开数据等。但最主要的高质量数据是来自药企自身的研发实验室,这部分数据属于商业机密,十分宝贵。
目前做的比较好的AI制药公司基本上要么是有自建实验室和研发管线,要么就是和大型药企以投资的方式合作(如药明康德领投Schrodinger的E轮融资)。
同时,缺乏数据也是大型科技企业的AI制药平台产出成果缓慢的核心原因。
缺乏数据和主动权的AI制药想要在业内真正拥有话语权,难度很大。不过目前特殊的例子也有,例如Relay Therapeutics(纳斯达克上市,市值18亿)在分子动力学的计算上见长。当然,这是因为他们真的有一台超算。
图:Relay的超算ANTON来源:网络
最后,AI制药仍不可替代真正的实验,当前也并没有AI制作的药物真正上市。
医药领域的超强监管使得创新药的研制一定需要漫长的临床实验周期。目前这些AI药物还都在慢慢的走临床实验流程。未能上市就不能直接证明药物价值,进而无法体现公司价值。
而技术上,市面上大部分AI制药,依然停留在以数据驱动的AI模型辅助药物分子发现的阶段。对于分子的模拟上,即从物理模型驱动的AI模式,最大的挑战在于计算效率和计算精度无法兼顾。比如传统的分子动力学模拟在应对复杂的蛋白体系以及蛋白动态构象采样方面的还是力不从心。这就意味着现阶段AI制药仍受限于技术研发,实验室的实验成本不能完全取代。