打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Nat.Commun | 应用AlphaFold2进行多肽-蛋白质对接

今天为大家介绍一篇发表在nature communications上的论文,“Harnessing protein folding neural networks for peptid-protein docking”. 文章证明AlphaFold2除了能够进行结构预测之外,还可以快速准确地模拟多肽-蛋白质相互作用。在不需要多肽的多序列比对信息的情况下,作者应用AlphaFold2成功建模出多肽-蛋白质复合体,并且还可以处理配体结合诱导的受体构象变化。

1

研究背景

多肽-蛋白质相互作用对许多生物过程十分重要,多肽常通过结合蛋白质和介导或阻断相互作用,作为治疗药物应用于生物技术、药物传递、成像等等。确定这些多肽-蛋白质复合物的三维结构是推进研究的重要步骤,可以为识别对结合至关重要的热点残基提供基础,并且通过突变这些热点,可以揭示给定相互作用的功能。

近年来,蛋白质结构预测领域迅速发展。预测单体蛋白质结构的深度学习神经网络架构的开发和应用提供了高准确度的计算模型,由 Google Deepmind 开发的AlphaFold2 (AF2) 能够生成非常精确的模型,接近晶体学实验的分辨率。由 RosettaCommons 开发的 RoseTTAFold 的性能也得到了显著改进。

作者注意到RoseTTAFold和AF2都在单链蛋白质结构数据上进行了训练,并且都使用多序列比对 (MSA) 作为结构预测的关键步骤。由于这两种方法都严重依赖高质量的 MSA,因此建模多肽-蛋白相互作用的主要挑战是准确预测肽构象。但由于它们的长度短,为其创建有效的MSA具有一定的挑战性。

作者提出一种多肽-蛋白质对接方法,该方法结合生物学概念,将相互作用模拟为蛋白质折叠,并利用训练好的神经网络来预测单体蛋白质结构。实验表明,通过将多肽连接到受体,神经网络会生成准确的多肽-蛋白质复合结构。这一性能的实现要归功于AF2能够 (1) 准确识别非结构化区域并将它们建模为linker,以及 (2) 预测多肽-受体复合物,而无需对多肽进行多序列比对。

2

方法

1)用AF2进行结构建模

建模是使用公开可用的AF2代码进行的,输入包括来自MMseqs2的查询序列和MSA,没有使用任何模板,也没有对模型进行额外的细化。

2)序列收集和格式化

要建模的受体和多肽的序列是从PDB文件的SEQRES行中提取的,去除了未知残基和末端修饰。然后,将每对序列与30个甘氨酸残基构成的linker连接,顺序为(N端)受体-linker-多肽(C端)。

3)建模Poly-A-receptor相互作用

通过将肽残基突变为丙氨酸(在查询序列中),对基序和非基序数据集进行对接,保持每个结构的原始肽长度,然后用AF2建模。

4)基于模板的建模

由于AF2可以根据HHSearch结果读取模板,作者为每个复合物创建了一个序列比对文件。通过提供包含这些结构的所有mmCIF文件的目录路径,AF2能够解析和处理这些模板。

3

实验结果

1)将基于神经网络的结构预测应用于肽对接

作者将对接模拟为单体折叠——将多肽序列通过聚甘氨酸linker添加到受体单体序列的C端。这是基于神经网络会将聚甘氨酸片段识别为不相关并将其仅作为linker的假设(如图1)。

图1

2)AF2高精度预测肽-蛋白质结构

作者在一组肽-蛋白质复合物数据上进行实验(26个复合物,其中12个具有实验表征的肽结合基序,分为基序集和非基序集)。AF2在1.5 Å的误差内模拟了基序集中75%的相互作用,而非基序集的性能较差(在2.5 Å误差内为 36%)(见图2,蓝色:基序集;红色:非基序集;黄色:非冗余数据集(96个复合物))。

图2

3)肽序列在成功对接中起着至关重要的作用

为了更好地理解AF2对肽序列的依赖性,作者测试了一个极端情况,其中整个肽序列被聚丙氨酸取代。结果发现,模型性能显着降低,特别是当去除保守基序时(图 3)。总的来说,在没有任何关于肽序列的信息的情况下,AF2无法成功地模拟肽-蛋白质复合物结构。

图3

4)AF2建模配体结合诱导的构象变化

蛋白质对接中最具挑战性的任务之一是对结合时发生的构象变化进行建模。图 4显示了一些例子,其中位于结合位点的 C端螺旋被去除,为肽腾出位置(图4a),或者β-发夹环结构在肽结合时变得无序(图4b)。在这两种情况下,AF2 都能正确预测复合体的结构。

图4

4

结论

本文应用AF2来预测多肽-蛋白质复合物结构,无需进一步的训练,只需对运行参数进行少量优化,就能够达到相当高的精度。AF2的速度快且只需要将序列作为输入,并且可以在一定程度上建模结合时发生的构象变化。此外,值得一提的是,AF2还能够在没有可用的多肽MSA信息的情况下,模拟多肽-蛋白质复合结构。总的来说,虽然AF2是在单体结构上进行的训练和测试,但是作者证明了,AF2可以成功地应用在多肽-蛋白质相互作用的研究上,并且对未来开展更多研究和解决领域内长期以来的瓶颈富有信心。

参考资料

Tsaban, T., Varga, J.K., Avraham, O. et al. Harnessing protein folding neural networks for peptide–protein docking. Nat Commun 13, 176 (2022). 

https://doi.org/10.1038/s41467-021-27838-9

代码

https://github.com/Furman-Lab/Peptide_docking_with_AF2_and_RosettAfold

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
AlphaFold2的原理和架构及其在生物学和医学领域的应用
“像自动驾驶一样训练智能体完成蛋白进化”,华大智造研发团队Nature子刊发布强化学习算法
借鉴下棋博弈,华大智造新型强化学习算法登Nature子刊,可快速进化功能蛋白
Science: 人工智能AI 成功预测蛋白质相互作用-AlphaFold (AF)和RoseTTAFold (RF)
龚海鹏:AlphaFold2与结构生物学
Science前沿:大语言模型涌现演化信息,加速蛋白质结构预测
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服