本文来自微信公众号:学术经纬 (ID:Global_Academia),作者:药明康德内容团队编辑,原文标题:《今日<自然>:基因操控进入AI新时代!设计数千种DNA“开关”,有望带来精准基因治疗》,题图来自:AI生成
本文来自微信公众号:学术经纬 (ID:Global_Academia),作者:药明康德内容团队编辑,原文标题:《今日<自然>:基因操控进入AI新时代!设计数千种DNA“开关”,有望带来精准基因治疗》,题图来自:AI生成
近年来,基因编辑技术的发展让科学界拥有了改写基因的工具。不过在很多情况下,我们只想要改变特定器官组织或细胞类型中的基因,而不是通盘影响整个生物体的基因。
例如在基因疗法中,避免脱靶效应就是一项重要挑战——同样是通过基因编辑替换一种错误的蛋白质,在一种细胞中可以成为有效的疗法;但在其他的细胞里却可能造成副作用。
要实现对不同细胞中基因的精确调控,离不开DNA“开关”——顺式调节元件(Cis-regulatory elements,CRE)。CRE控制基因表达,可以协调组织身份、发育时间和刺激反应,这些差异共同塑造了我们体内的数千种细胞类型。
在此前的研究中,科学家们已经识别出了大量CRE,但由进化产生的CRE序列毕竟只是潜在序列的一小部分,不足以满足治疗应用的需求。因此,如何从未经开发的DNA序列中挖掘有治疗潜力的CRE,成为科学界面临的一大挑战。
▲图片展示了CRE如何开启或关闭基因,并为精准医疗开辟新的可能性(图片来源:Broad Institute of MIT and Harvard)
如今,来自博德研究所(Broad Institute of MIT and Harvard)、杰克森实验室(The Jackson Laboratory)、耶鲁大学医学院等机构的联合研究团队借助AI技术,实现了前所未有的特异性基因调控。这项研究基于机器学习合成了数千个全新的CRE,它们可以精准控制基因在不同细胞类型中的表达情况,并且具有比天然CRE更强的细胞类型特异性。
研究的共同领导人、杰克森实验室的Ryan Tewhey教授表示,这项技术为编写具有预定义功能的新调控元件铺平了道路,这些工具可能具有重要的生物医学意义,将来可以使用这些元件来控制特定细胞类型中的基因表达,达到治疗目的。
在此前十余年间,大规模并行报告基因检测(MPRA)技术的发展检测出了大量调节元件的活性,可以帮助我们明确哪些CRE在特定细胞类型中活跃,从而特异性靶向这些细胞。不过,人们还没有掌握这些CRE作用的规则,也就是理解其中的“语法”。
研究团队意识到,这个超出人类学习能力的问题,恰好是AI擅长的领域。我们可能比较熟悉的是,卷积神经网络(CNN)可以通过学习图像特征,区分不同物体(例如猫与狗)的照片。同样,这项技术也可以学习用于区分细胞类型的CRE序列特征,例如导致基因在特定细胞中表达的转录因子结合位点,从而区分出不同的CRE、掌握不同CRE的“语言”。
研究团队将这两项工具相结合,由MPRA提供AI模型训练所需的大量CRE序列数据。为此,作者使用的数据来自人类的数十万个DNA序列,包含了在血液、肝脏和大脑这3种细胞中的CRE活性。
经过训练,AI模型能够了解CRE序列的“语法”如何影响基因激活。利用这些规则,研发团队开发的CODA(意为DNA活性计算优化)平台能自主合成CRE序列,设计出数千种具有所需特征的新型CRE,并且这些合成的CRE能模拟出训练中天然CRE的细胞类型特异性。
▲CODA设计合成CRE的示意图(图片来源:参考资料[1])
通过大规模体外验证,研究证实,这些合成的CRE在血液、肝脏和大脑的3种细胞系中,可以比天然序列更高效地驱动细胞类型特异性表达——它们在所需的细胞类型中激活基因,同时在不需要的细胞类型中避免基因激活。
在随后的小鼠和斑马鱼体内实验中,几种合成CRE序列同样表现出了良好的特异性。例如,一种CRE能激活发育中的斑马鱼肝脏的荧光蛋白,同时避免激活鱼的其他部位。
研究指出,合成的CRE序列包含了负责在目标细胞类型中表达基因的序列组合,以及抑制或关闭其他细胞类型中基因表达的序列。这样的序列特征赋予了合成CRE更强大的细胞特异性。
由此,该研究提出了一项从头开始设计新型合成CRE的新策略。论文指出,程序化、高度精确、细胞类型特异性的CRE将有助于开发专门的报告基因、CRISPR疗法、基因替代方法等。目前,细胞类型特异性靶向递送的缺陷阻碍了基因疗法的应用。而具有细胞特异性功能的合成CRE,可以为纳米颗粒和病毒载体技术提供补充工具,提升基因递送能力。
参考资料:
[1]Sager J.Gosai et al.,Machine-guided design of cell-type-targetingcis-regulatory elements.Nature(2024).DOI:10.1038/s41586-024-08070-z
[2]Andreas R.Pfenning.Synthetic gene-regulatory sequence designed by AI.Nature(2024).DOI:10.1038/d41586-024-03170-2
[3]Researchers flip genes on and off with AI-designed DNA switches.Retrieved October 23,2024 from https://www.eurekalert.org/news-releases/1061861
支持一下 修改