“我们去年5月开始小试,半年就完成了,到现在实现放大生产,全过程只用了一年多。”在上海交通大学张江高等研究院,43岁的洪亮教授举着纸杯咖啡,一路行色匆匆。他的创业团队与瀚海新酶合作,一改传统化学法为生物酶法,制备出用于急性胰腺炎等血检的核心物料。相比罗氏制药每公斤30万元的高价,它直接降为不到3万元。
洪亮团队在《自然》子刊发表论文。(资料)
“有了自建的蛋白质工程领域垂直大模型:Pro系列,我们可以师法自然,在大自然恩赐的基础上,做出更好的蛋白。”洪亮带着几分骄傲笑言,“现在从基础研究到应用研究,从0到100加速孵化,中间可能直接跨过‘1’这样的事了。”这些日子,洪亮刚刚完成“搬家”,其交大闵行校区等处的研发资源,正“聚焦”到张江高研院。
上海交大张江高研院群楼。
作为交叉研究高地的这个新型研究机构,已搭建起七大中心:变革性分子前沿科学中心、超快科学中心、人工智能网络安全创新中心、未来材料创制中心、合成科学创新研究中心、人工智能生物医药中心、DNA存储研究中心,还有公共仪器平台。在这里,科研范式变革催生新质生产力,到底有多快?看看洪亮这些青年科学家的高倍速转化。
【大模型设计蛋白质直接产业化】
“结构决定性质”。不论生产过程中还是体内过程中,当人类需要耐酸、耐碱、耐酒精、耐高温等带有“抗性”的生物分子,什么样的微观结构才是最经得起考验的?
洪亮给记者打比方,“如果说ChatGPT是用大模型理解人类文字排列方式来做智能问答,那么Pro系列蛋白质大模型就是用AI学习自然界生物分子的设计规则,从而实现性能优越的各种蛋白产品的智能开发。”
洪亮团队发表蛋白质全新序列研究成果。(资料)
基于Pro系列大模型,他们与金赛药业联合开发用于纯化生物生长激素的极耐碱的单域抗体,成为世界首款大模型设计并放大生产进入产业化阶段的蛋白质产品。这款“蛋白原型”,是从4000万量级羊驼单域抗体库筛选出来的高亲和力纳米抗体,但耐碱性很差,在制药流程的强碱洗脱环节中,蛋白质结构会被破坏,导致其使用寿命短,消耗量大。
而不到一年内,一个普通不耐碱的蛋白就变为极度耐碱的蛋白,从没有任何实验数据到成为全球首个实现5000升工业化生产的大模型设计蛋白产品,“这在以往是绝对不可能实现的。”而且,这个产品为该企业每年节省超过千万元的生产成本。
此前做蛋白质工程,只能针对单个场景下的单个指标慢慢去改,一个工业酶改造花三五年很正常。洪亮向记者坦陈,“但过去一年多,我们团队仅用20多位设计和实验人员,便完成了20余款蛋白质设计项目的交付,涉及热稳定性、酸碱耐受性、活性、亲和力、特异性等诸多蛋白质的理化性质,覆盖生物医药、营养保健、酶制剂等多个领域。”在他们手里,还有在研项目50余项。
要驾驭“万能的AI”,本身最好也是“跨界理化生”。洪亮本科学物理,硕士在港学化学,博士在美学生物,之后在美国国家实验室学习计算生物学,如今也是上海交大国家应用数学中心副主任。
多科交叉背景下,他成为天鹜科技的公司创始人和首席科学家。去年以来,其核心平台Pro系列建立了“AI自动设计+少量实验验证”的蛋白质设计新范式,改变了“专家经验和大量试错”传统范式,大大提升企业产品性能、缩短研发周期、降低生产成本。
当然,洪亮直言,大模型并非总能拿到“100分”,40个项目可能有5个也会失败。但经测算,总实验样本数量由成千上万个,减少到了100个甚至更少,项目交付周期也由2到5年,压缩至2到6个月,总成本从千万量级压缩至不到100万元。
【AI模拟几无成本测得最佳方式】
与基因组计划、蛋白质组计划类似,近年来,世界各国相继启动不同形式的“微生物组计划”,预示着微生物学科下一个里程碑的到来。今年国务院政府工作报告明确提出,积极打造生物制造、商业航天、低空经济等新增长引擎,这也是“生物制造”首次被写入政府工作报告。
绿色材料“生物造”,同样“多快好省”。当前餐饮业大量采用的一次性吸管已不再是塑料材质,而是可降解的生物材质,即聚乳酸等生物基聚合物。作为上海交大张江高研院、生命科学技术学院长聘教轨副教授,倪俊博士团队的生物塑料合成过程,竟像植物在光合作用下生长一样,仅靠空气来源的CO作为碳源和光能驱动。
在高研院二号楼5楼,光合微生物蓝藻中的聚球藻,就是他在实验室常用的细胞工厂“基底”。这种“光合底盘”直接利用二氧化碳生长,最高生长速度快过酵母菌等一些传统工业微生物。固碳效率方面,它们经过改造更成为吸收温室气体的高手。而且,不再需要像其他微生物那样“投喂”葡萄糖作为底物,就能高效合成出麦角硫因、生物塑料等一系列高值产物。
同时身为光玥生物创始人和首席技术官的倪俊博士认为,基于合成生物技术的CO等单碳原子化合物的绿色转化,将为低碳经济发展开辟新的空间,成为扩展新质生产力的关键领域。
生物技术与信息技术“BT+IT”交融,生物工程时代迈向智能生物工程时代。倪俊开发“细胞工厂”的背后同样引入AI,指导代谢路径改造。简单说来,代谢物原料需要经过蛋白A,到中间代谢物,再经过蛋白B,催化为产物,而将蛋白A和B在空间上连接,方式可能至少有20的10次方种。
“如果没有AI,考虑到综合成本,通常只能测试少数几种。”为此,倪俊自开发高通量的AI模拟平台,为解放日报·上观新闻记者算了一笔账:原本测试一种连接就需要花费100美元,如今则只要0.003美元,几乎可以无成本测得最佳方式。
在上海交大校长丁奎岭院士的眼中,张江高研院属于基础研究自由区,通过有组织的科研打破学科边界,“交叉”进入无人区,开拓科技新疆域。“越是AI无处不在的时代,越需要人类智能(HI)互补,越要关注其核心竞争力。”他强调“AI+HI”,让人工智能加之人的智慧与创造性。