本文来自微信公众号:深究科学 (ID:deepscience),编译:齐萱,原文标题:《生物学正经历一场AI革命:它不仅是工具,更是新的“科研伙伴”》
本文来自微信公众号:深究科学 (ID:deepscience),编译:齐萱,原文标题:《生物学正经历一场AI革命:它不仅是工具,更是新的“科研伙伴”》
在华盛顿大学实验室的荧光显微镜下,人工设计的荧光素酶正穿透小鼠的深层组织,发出穿透力极强的生物荧光;
在多伦多的超级计算机中,算法正在解析单个细胞内的基因表达密码;
而在伦敦的DeepMind总部,AlphaFold模型正在以前所未有的精度解构蛋白质的三维迷宫。
在2024年的诺贝尔化学奖颁奖典礼上,人工智能(AI)首次因其在生物学领域的突破性贡献而登顶科学界的最高殿堂。David Baker、Demis Hassabis和John Jumper凭借AI驱动的蛋白质折叠与设计技术获得荣耀。
由AI驱动的生物学革命正在发生......
一、荣获诺奖的蛋白质折叠和设计
2024年,AlphaFold帮助科学家解决了蛋白质折叠和设计问题,让David Baker和Demis Hassabis、John Jumper获得了诺贝尔化学奖,如今全球生物学家都在借助人工智能预测蛋白质结构,并从头设计新的蛋白质。
诺贝尔奖得主David Baker,利用深度学习模型创造出比天然蛋白更适合解决现代问题的全新蛋白质
我们回顾下蛋白质折叠和设计的历史,当1994年首届CASP竞赛启动时,蛋白质折叠预测领域还笼罩在‘序列决定结构’的迷雾中。科学家们在氨基酸序列与三维构象的黑暗中艰难前行。
1998年,David Baker团队开发了用于蛋白质能量配置建模的Rosetta软件,依赖物理能量计算,虽取得一定进展,但效率低下。2008年,科学家甚至转向众包模式,开发了游戏Foldit,让全球玩家手动折叠蛋白质。
转折来到2018年的CASP13会议上——DeepMind开发的AlphaFold以中位数90Å的预测精度横空出世,在CASP13竞赛中以惊人的准确度击败所有传统方法,相当于用计算镜头看清了蛋白质分子的“量子舞步”。
两年后,AlphaFold2更是将预测精度提升至原子级别,宣告蛋白质折叠问题“基本解决”。
AlphaFold的成功绝非偶然。它基于超过10万种已知蛋白质的结构数据,在深度神经网络的34层矩阵中构建出进化规律与物理化学法则的交互图谱。
这种“数据蒸馏”能力让生物学家第一次拥有了“蛋白质X光机”,能够以前所未有的速度破解生命的基本构件。
正如诺奖得主David Baker所言:“我们现在能设计自然界从未存在过的蛋白质,就像用乐高积木搭建全新功能的分子机器。”
二、AI设计全新蛋白质
AlphaFold的突破不仅在于“预测”,更在于“创造”。
Baker实验室利用AI设计了超稳定荧光素酶,其亮度是天然酶的10倍,可用于深层组织成像。这类‘从头设计蛋白质(de novo protein)’并非对自然的简单模仿,而是通过算法探索从未存在过的分子构型,从而赋予蛋白质全新功能。
传统蛋白质工程依赖试错法,耗时数年;而AI能在几天内生成数百万种候选结构,并筛选出最优解。这种“计算优先”的策略正在重塑药物设计、酶工程和生物材料领域。
例如辉瑞利用AI加速KRAS抑制剂开发,将原本需5000人年的工作量,压缩至数月完成。
三、抗生素危机中的AI解药
抗生素耐药性危机迫在眉睫,而新药研发却陷入停滞。面对鲍曼不动杆菌(Acinetobacter baumannii)等“超级细菌”,麦克马斯特大学的Jon Stokes团队开发了生成式AI模型SyntheMol。
这个“分子梦想家”通过强化学习,在虚拟化学空间中探索出能穿透细菌防御机制的全新化合物Halicin——一种对多重耐药菌有效的非传统抗生素,在体外实验中展现出对多种耐药菌株的强效抑制活性。
AI制药的核心优势在于打破人类思维定式,与传统药物发现动辄十年的周期不同,AI在短短几个月内就生成了数十种候选分子。
传统药物设计受限于已知化学规则,而AI能发现反直觉的分子结构。这种“计算优先”的药物研发模式正在重塑整个制药工业。
例如Insilico Medicine利用AI设计的抗纤维化药物,已进入临床试验阶段,全程仅用18个月,成本降低90%。
四、人工神经网络模拟人脑学习机制
受人脑启发,人工神经网络(ANNs)发展迅速,这是一种包含多层互联节点(神经元)的机器学习模型,能够处理复杂数据。
网络中的每个节点通过加权输入数据进行数学运算,并根据阈值决定是否将输出传递至下一层。科学家使用已知数据集训练ANN,使其通过对比预测结果与真实答案来优化精度。
训练后的ANN可用于预测新数据集的结果。尽管存在局限性,但ANN能识别人类难以察觉的复杂数据模式,并自动执行繁琐任务,为研究者节省了不少时间。
五、语言模型解码大脑奥秘
研究人员开发出能通过脑部MRI图像解读思维的类ChatGPT语言模型。
得克萨斯大学奥斯汀分校的Alexander Huth团队训练出“读心”模型,能通过fMRI数据重建受试者听到的句子,同时也揭示了人脑功能的奥秘。模型显示,即使MRI扫描仅显示前额叶皮层活跃,大脑所有区域都在使用与意义相关的信息。
这项技术不仅为失语症患者带来希望,更揭示了大脑语义处理的分布式特征。虽然目前模型尚不能跨主体通用,但随着准确性提升,专家建议对这类技术保持警惕。
六、AI预测单细胞基因表达
多伦多大学计算生物学家Bo Wang团队开发的单细胞生成预训练转换器(scGPT),能比现有主流方法更有效地分析单细胞RNA测序数据。
该模型在预测基因扰动影响方面也表现出更高的准确性。最初针对骨髓和免疫细胞训练的scGPT,现已适配多种细胞类型分析,有望在近期解答重要生物学问题。
尽管AI在从脑科学研究到新型疗法开发等生物学领域展现出巨大潜力,专家仍提醒需要谨慎使用,其成功有赖于专业知识的深度与广度。
AI不仅是工具,更是新的“科研伙伴”——它能提出人类未曾设想的问题,并给出超越经验的答案。
如Baker所言:“我们不再只是生命的观察者,而是成为生命的设计师。”这场由AI驱动的生物学革命,终将重新定义生命新的可能性”。
参考资料
Artificial Intelligence in Biology:From Neural Networks to AlphaFold
https://www.the-scientist.com/artificial-intelligence-in-biology-from-artificial-neural-networks-to-alphafold-72435