深度学习算法预测生物分子组合的结构_科学_鸡鸣网

   日期:2025-09-11     来源:本站    作者:admin    浏览:96    
核心提示:  一种新的深度学习算法可以预测与各种其他分子(如药物、荧光团和金属)结合的蛋白质的结构。这项工作使研究人员能够设计出结合

  一种新的深度学习算法可以预测与各种其他分子(如药物、荧光团和金属)结合的蛋白质的结构。这项工作使研究人员能够设计出结合特定分子的蛋白质,在酶催化等领域可能会很有用。

  Figure

  该算法可以预测蛋白质与底物结合时的结构,从而提供更真实的蛋白质图像。三个成功预测多种生物分子的例子(从左至右):具有血红素辅助因子和脂质底物的脂肪酸脱羧酶,具有s -腺苷型同型半胱氨酸和酪氨酸相互作用的二聚体酪氨酸甲基转移酶,以及与DNA结合的DNA聚合酶

  蛋白质由数千个原子组成,因此使用密度泛函理论等能量最小化模型来解决它们的结构在计算上是不可行的。AlphaFold(由谷歌DeepMind开发)和RoseTTAFold(来自华盛顿大学蛋白质设计研究所)等深度学习算法已被证明非常有用,它们在国际蛋白质数据库中搜索已知结构,以自学如何解决未知结构。蛋白质设计研究所(Institute for Protein Design)所长、计算生物学家贝克(David Baker)说,这些深度学习方法都是根据概率而不是能量来工作的。

  一个复杂的因素是,蛋白质在自然界中并不是作为孤立的氨基酸链存在的。美国马萨诸塞州哈佛大学医学院的尼古拉斯·波利兹说:“有些蛋白质除非与金属或其他可能是小分子的所谓辅因子结合,否则不会折叠。”“配体通常通过AlphaFold或RoseTTAFold来暗示,因为它们是在蛋白质上进行训练的,这些蛋白质是结晶的,并且它们的结构与配体结合在一起。”“然而,这阻碍了研究人员理解配体的作用或设计一种结合特定配体的蛋白质。”

  在这项新研究中,Baker和他的同事们开发了一种改良的RoseTTAFold,叫做RoseTTAFold全原子,这使得他们能够将蛋白质的氨基酸链结构与小分子配体的原子表示结合起来。他们从蛋白质结构数据库中获得了蛋白质-小分子结构、蛋白质-金属复合物和氨基酸共价键的蛋白质的数据,并用这些数据来训练算法,使其能够发展出通用的预测能力。它以很高的准确度预测了未在训练中出现的最近解出的结构。研究人员还利用该模型设计和实验合成了结合三种常见配体的蛋白质:酶促辅助因子血红素、心脏病药物地高辛和光收集分子胆磷脂。

  Figure

  三个与训练集相似度较低的成功预测例子(从左到右):G蛋白受体,与抑制剂结合的激酶和与非天然底物结合的荧光素酶酶

  研究人员正在展望几种应用,包括小分子药物和传感器的设计。贝克说:“我们对在催化剂设计中使用这种方法非常感兴趣,我们可以模拟化学反应的过渡状态,并设计一种蛋白质来稳定它。”

  Polizzi没有参与这项工作,他将这项工作描述为一个“里程碑”。然而,他警告说,改进该方法的一个障碍将是寻找更多的数据来为算法提供支持。他指出:“蛋白质结构预测已经取得了如此大的进步,因为蛋白质序列有数十亿个数据点,但目前还没有小分子的等量数据。”

  Polizzi说,最新版本的RoseTTAFold似乎“在你已经知道与蛋白质结合的分子的情况下,对于预测与分子结合的蛋白质的结构非常有用”。然而,他指出,许多人会想要测试一个分子是否会与蛋白质结合。他说:“我仍然会亲自尝试……但我不会盲目相信这些结果。”

  Volcanic lightning

  A man in protective clothing uses a jet wash to clean red mud from the pavement

  Water drop

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行