在2024年诺贝尔物理学奖与化学奖接连发布后,比起这两个领域更兴奋的是人工智能领域的从业者与关注者。
10月8日,瑞典皇家科学院宣布,2024年诺贝尔物理学奖被授予美国普林斯顿大学教授约翰·霍普菲尔德(John Hopfield)和加拿大多伦多大学教授杰弗里·辛顿 (Geoffrey Hinton),以表彰他们“基于人工神经网络实现机器学习的基础性发现和发明”。
次日,2024年诺贝尔化学奖公布,一半授予大卫·贝克(David Baker),“以表彰在计算蛋白质设计方面的贡献”;另一半共同授予德米斯·哈萨比斯(Demis Hassabis)和约翰·M·詹珀(John M. Jumper),“以表彰他们在蛋白质结构预测方面的成就”。
两项名单跟AI关联度之高,在各自领域激起了巨大浪潮。
前者共同帮助启动了机器学习的爆炸式发展,即以人工神经网络为核心的深度学习革命。后者则是利用AI技术促进科学研究的典范,其中大卫·贝克为华盛顿大学蛋白质设计研究所所长,首次使用生成式人工智能从头设计出了全新的抗体,有望让AI从头设计蛋白进入抗体药物市场。德米斯和约翰则共同来自以AlphaGo闻名在外的谷歌旗下DeepMind,团队研发的AlphaFold系列对于蛋白质结构预测及相关变革性研究具有里程碑式贡献。
这一奖项的决定,在很大程度上肯定了由计算机科学撬动其他领域基础科学研究进程的研究范式,即AI for Science(AI4S),这背后存在一个巨大的可发展的创业体系和商业空间。
AI4S是指利用人工智能技术来推动和加速科学研究的新型研究范式。这种范式通过结合机器学习、数据分析、高性能计算等技术,帮助科学家在各个领域进行更深入的探索和发现。正如DeepMind和大卫·贝克团队的研究成果,加速了该领域对于蛋白质结构预测与设计的研究工作,这将直接推动生物医药领域的研发进程。
在国内,有一家叫做深势科技的创业公司,其成就能够对标DeepMind。2021年,深势科技团队凭借UniFold成功复现了AlphaFold 2,并在个别指标上优于后者,打破了DeepMind在蛋白折叠领域的垄断。随后,其发布的Uni-Mol Docking V2在蛋白-配体对接预测工作上实现重大突破,表现仅略微逊色于AlphaFold 3。
在PoseBuster数据集上,各方案展现出的预测精度
深势科技同样锚定在AI4S领域的基础设施搭建,提出了“多尺度建模+机器学习+高性能计算”的科研范式,目前已推出Bohrium科研云平台、Hermite药物计算设计平台、RiDYMO难成药靶标研发平台及Pilotey电池设计自动化平台等工业设计与仿真基础设施。
作为国内为数不多定位AI4S领域的企业,深势科技CEO孙伟杰就诺贝尔奖对AI4S形成的话题效应接受了界面新闻记者的采访。
对于诺贝尔物理学奖和化学奖显示出Science与AI的关系,孙伟杰认为物理学奖更像是Science for AI,化学奖则更多体现了AI for Science。从两个奖项的可预测性来讲,物理学奖更让人意外。团队推测,这可能与过去几年来人工神经网络在物理学领域陆续发挥了重要作用有关,例如相关的数据处理、新仪器设备研发以及新材料发现等等。
虽然今年的诺贝尔奖让大众忍不住猜想,评委们的视线是否有意向AI进行了倾斜,但在科研人员视角下,逻辑并非如此。
孙伟杰告诉界面新闻记者,公司内部在日常讨论的时候,已经有人推测过AlphaFold获得诺贝尔奖的可能性。因为在人类现存尚未获奖的重大成果中,AlphaFold对于蛋白折叠(指蛋白质在合成后,从无规则的多肽链自发形成具有特定三维结构的过程,AlphaFold利用AI技术实现了对蛋白质三维结构的精准预测)的贡献,是内部公认最值得获奖的成果之一,相比其他成果对科研和产业的影响都至关深刻。
大卫团队和DeepMind的成果毫无疑问是AI技术在化学生物领域的重要突破。从领域上来看,生命科学和物质科学将是AI4S的重点落地方向,它们包括但不限于生命科学、材料科学、能源科学、环境科学、信息科学等。
孙伟杰认为接下来会有两个重要趋势,首先,在AI解决了一个具体科学问题后,未来外界会看到越来越多的类似成果;其次,整个基础科学研究的范式已经发生改变,在未来,AI与学科领域认知和先进实验手段相结合,将成为主流的科研范式。
理论上来说,AI4S走上诺奖风口不一定会让资本和创业者迅速涌入某一个赛道,但它一定有自己潜移默化的影响,孙伟杰认为它最根本的影响将是加强大众对AI4S的共识。
这种共识会加速科研领域的范式转变,让研究机构更快把精力投入转移到AI4S的路线上,这也就意味着AI4S基础设施将变得更加重要。在这个“从0到1”的转变背后,跨学科的研究壁垒和人才培养可能是其中的核心难点。
科研之外,就AI4S的商业格局而言,以深势科技为代表的基础设施建设企业处于中游,这里的行业生态其实还相对早期,但AI4S的上下游产业生态已经相对成熟和庞大,其中上游包括以AI芯片、云计算服务为代表的基础设施,下游则对应生命科学和物质科学两大门类中的众多场景,单就AI制药而言已包含多家上市公司。
其中,以DeepMind和深势科技为代表的公司,其商业模式有高度重叠的部分,即为有基础科研需求的产业和企业提供AI4S研究工具和平台。孙伟杰预估,这里对应一个万亿级全球市场,国内市场也至少是千亿级别。
中美在这一落地环节上存在差异。就生物医药产业而言,美国相对中国市场更加完善,且市场规模更大。而在材料、电池、能源等制造业领域,中国企业的优势非常明显。不过在不同市场,AI4S服务客户的底层技术是相通的,这意味着企业要针对不同领域采取不同的市场策略。
以深势科技自身而言,团队的下一步技术突破方向是其“深势宇知”科学大模型体系,要完成分子、原子、基因、蛋白这四种模态的统一,使其对于无论小分子、大分子还是高分子都具备完整的表征和性质预测的能力,这将是一个“有机分子宇宙”的通用模型,有机会对上述科研工作产生重大的推动力。
此前,深势科技首席科学家张林峰在今年上半年接受界面新闻采访时,曾判断AI4S领域的科学大模型正处于GPT-2阶段,孙伟杰表示,GPT-3时刻可能会出现在2025年。在这个阶段,模型的核心任务仍是学到更多科学规律。而在GPT-3之后,它的下一个进化目标是如何对现实世界的数据做出反馈。
在孙伟杰看来,科学研究的范式已经被AI改变了,但这种改变还不均衡,不同学科和不同人群之间的快慢进度会不一样。而怎么让AI对科研的改变变得更普世和通用,这是深势科技这类公司的使命。
作为少数定位AI4S平台化建设的公司,孙伟杰不讳言在诺奖名单公布后得到了外界的诸多关注,这当中也包括投资人。对于这件事在融资和商务拓展上的直观影响,他表示接下来可能“敲门”会更加容易,但无论是融资还是商务拓展最终一定是符合市场和商业逻辑。
对于这个领域的信仰者而言,在未来,所有传统研发手段都值得被AI for Science重新升级一遍。
“本质上是大家拥有了一台更高水平的挖矿机,之前可能只能挖地表一两米,但是剩下的这些都是深矿,需要更准的探测技术和更强的挖掘能力。”孙伟杰说,“而这就是AI for Science将会带给大家的。”