随着2024年诺贝尔物理学奖和化学奖授予了人工智能相关研究,科学智能(科学和AI深度融合)及其研究方向引发了从科学家到公众的广泛关注,接下来将有哪些研究重点?
在11月11日下午举办的“2024科学智能创新论坛”上,上海科学智能研究院(下称“上智院”)联合复旦大学、集智科学研究中心和阿里云,共同发布了科学智能前沿观察报告,十大前沿方向涵盖AI for Science、Science for AI和科学智能基础设施三个维度。
其中,AI for Science的前沿方向包括垂直领域科学大模型、融入先验知识的AI模型、基于LLM模型的科学研究、从提出假设到自动验证的AI科学家,以及复杂世界的多智能体建模;Science for AI的前沿方向则覆盖了物理世界的第一性原理和科学启发的可解释AI新架构;科学智能基础设施前沿方向包括合成数据和新型智能计算。展望未来,面向可信可解释的科学世界模型和上述九个方向共同构成科学智能十大前沿。
十大前沿
上智院院长、复旦大学浩清教授漆远在会上表示,AI与基础科学的深度融合,将开启AI与科学“双螺旋引擎”共振驱动的科学研究新范式。AI for Science和Science for AI,类似DNA和RNA的双螺旋结构,一方面,AI将成为科学研究探索的最前沿;另一方面,科学启发的AI也将成为实现AGI的重要支撑。未来可望有更多的科学智能研究成果问鼎诺贝尔奖。“发布科学智能前沿观察报告,就是希望推动和支持更多AI和基础研究领域的科学家,深度融合无缝合作,共同探索科学智能的新未来,打造能够自主发现复杂世界未知规律的‘AI爱因斯坦’。”
为何叫双螺旋引擎
科学智能(AI X Science)是一个新兴的跨学科研究领域,其研究方向和驱动力可以表述为“双螺旋引擎”:其一,将AI技术应用于具体领域的科学研究(AI for Science);其二,将领域学科知识用于AI算法和架构的理解和改进(Science for AI)。
随着大量数据的快速积累和文献的爆炸式增长,人类科学家自身的信息处理能力达到极限,甚至成为研究突破的瓶颈。而越来越多的科学研究领域在面对复杂问题的挑战时也难以利用传统的数学和物理方法。如何将AI运用于垂直的科学领域研究,加速科学发现,扩展科研边界,是AI for Science的核心主题。
今年诺贝尔化学奖授予的AlphaFold2,即是AI算法用于解决科学领域重要问题的研究典范。AI for Science其他成功研究案例还包括AI可控核聚变、气象模型等等。
不过,虽然已获重大突破,但AI仍然面临数据稀缺、耗能过大、解释性较差等重大挑战。而人类科学家已经积累了各个学科领域的海量知识, 如何将科学家的经验和知识,甚至直觉和启发式想法,转化为AI系统的能力,构成了Science for AI研究的重点。
漆远接受第一财经采访时表示,今年的诺贝尔奖就是科学智能非常好的代表,随着基础研究科学家和人工智能科研人员的双向奔赴,未来会看到更多科学智能的成果产生,这也会影响科研范式本身。对于科学智能的未来研究方向,他提到了依旧要选择具有大科学价值的领域,另外也需要在社会和产业价值之间找到平衡点,去重点突破。
漆远
多个大模型发布
除了科学智能前沿观察报告,会上还发布了“PI-AGENT气候领域大语言模型”、“女娲:生命流体大模型”&“女娲:基因导航大模型”、“女娲:生物结构大模型”。
上智院介绍,此次发布的“女娲:生物结构大模型”类似于2024年诺贝尔奖成果AlphaFold和RoseTTAFold,通过生成式大模型生成生物结构,包括RNA、分子、蛋白质等,主要应用于制药产业,因为生物结构直接决定了药物的功能。
“女娲:生物结构大模型”团队负责人、复旦大学人工智能创新与产业研究院研究员朱思语告诉第一财经,从产业应用角度来看,目前他们已与一些制药CRO企业合作,开展药物结构合成的临床前验证。同时,他们还在探索通过官网提供API,供研究人员和企业申请调用女娲-生物结构大模型的服务。“在生物数据方面,我们将与国家蛋白质中心(上海设施)合作,通过分子动力学模拟积累动态蛋白数据,为模型生成提供支持。”
“女娲:基因导航大模型”团队负责人、复旦大学人工智能创新与产业研究院副院长、研究员程远解释,之所以取名为“基因导航大模型”,是希望对这些“暗物质”对生命的作用机制提供一套“导航图”,最终可以构建出一套基因与基因之间、基因与环境之间、基因与外部刺激之间的关联关系图谱,就像我们在黑暗环境中有了一张导航地图一样。“我们希望将这套‘导航系统’开放给学术界和工业界,为未来的生命科学研究添砖加瓦。初期我们会首先开放基因调控关系图谱和预测接口,然后逐步完善功能。”
而对比上智院此前发布的“伏羲”大模型,11日发布的气候领域大语言模型有何区别?
“气候领域大语言模型”团队负责人,复旦大学校长助理、上海创智学院副院长吴力波解释,该模型是中国首个独立自主研发的气候科学大语言模型,模型融合海量领域专业知识,通过智能体建模提升模型对科学事实的认知和总结能力、数据和信息的掌握能力,为气候领域的研究人员和从业者提供全方位智能的AI科学家服务,加速气候变化研究进展。
上智院首席战略官,复旦大学兼职教授杨燕青