打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
AlphaFold再获突破,已预测超2亿个蛋白结构,或将加速药物发现和改变基础科学
userphoto

2022.07.29 甘肃

关注



DeepMind 旗下蛋白质结构预测工具 AlphaFold 再获重大突破。过去 1 年里,AlphaFold 的蛋白质结构数据库(AlphaFold DB) 已得到了大规模扩展。

美东时间 7 月 28 日,DeepMind 与欧洲分子生物学实验室的欧洲生物信息学研究所(EMBL-EBI)宣布, AlphaFold 的数据库现已经包含了超过 2 亿个蛋白质结构,这些预测的结构涵盖了科学界已知几乎所有已编目蛋白质。

根据官方的介绍,AlphaFold 蛋白质结构数据库由 DeepMind 和 EMBL-EBI 共同开发,DeepMind 称,将继续免费向用户提供这一蛋白质结构数据库。

(来源:https://alphafold.ebi.ac.uk/)

DeepMind 方面表示,去年同期 AlphaFold 仅预测 350,000 个蛋白质三维结构,与之相比,这是一个巨大的飞跃,能够更进一步加深对生物学的理解。

根据双方的说法,更深层次来讲,最新数据库的辐射范围已经不限于疾病理解和药物开发,还有潜力为可持续发展、染料、粮食安全等重大问题提供更多机会。

“我们希望扩展的数据库帮助更多的科学家及其重要工作,并开辟一种全新的科学发现方式。”DeepMind 首席执行官 Demis Hassabis 博士接受媒体采访时说。

图|DeepMind 首席执行官 Demis Hassabis

已预测超 2 亿个蛋白质,已集成到公开数据库中


AlphaFold 是 DeepMind 旗下开发的一款深度学习模型。在 2020 年底,AlphaFold2 在蛋白质结构预测大赛中(CASP)取得的预测分值中位数为 92.4 GDT,这一预测结果与实验室水平不相上下,而此前 20 多年间预测分值仅在 20 - 40 分之间。当时,AlphaFold2 成功出圈,一举破解了困扰学界长达五十年之久的“蛋白质折叠”难题。

2021 年 7 月,DeepMindNature 发文首次详细公开 AlphaFold2 预测蛋白质三维结构的方法论,并将代码开源。时隔一周,DeepMind 公布了基于此方法预测出的蛋白质三维结构数据库,当时的数据库涵盖了350,000 个蛋白质三维结构,涵盖了人类基因组表达的约 20,000 个蛋白质,以及其他 20 多种生物的蛋白质结构。

(来源:Nature

在此基础之上,研究人员继续扩展 AlphaFold 的蛋白结构数据库。过去一年多的时间里,他们使用 AlphaFold 预测了超过 100 万个物种中约 2 亿( 2.14 亿)个蛋白质的结构,这几乎涵盖了地球上已知的所有蛋白质。

官方通稿指出,本次发布针对超 2 亿个蛋白结构的预测是基于 UNIPROT 数据库中的序列,其中一些蛋白质结构已经覆盖在了基于实验方法的数据库中,或者是存储在相似的数据库中。

从官网也可以看到,本次更新的数据库包括植物、细菌、动物等多种生物的蛋白质预测结构,这为更多研究人员提供了新机会,有望促进可持续性、粮食问题、难治疾病等重大问题的发展。值得一提是,此番更新意味着主要蛋白质数据库 UniProt 上的大多数页面都会带有预测结构,超 2 亿个蛋白质结构可以通过 Google Cloud Public Datasets 批量下载。

(来源:DeepMind 官网)

“更新的数据库收录的蛋白质数据涵盖了人类、小鼠和其他哺乳动物等,这些不同的物种会为 AlphaFold 数据库提供更多见解和资源。这会是一个非常棒的资源。”何塞·卡雷拉斯白血病研究所( Josep Carreras Leukaemia Research Institute in Barcelona)的计算生物学家 Eduard Porta Pardo 博士在通稿中说。

DeepMind 方面还表示,免费开源的 AlphaFold 蛋白结构库已集成到了其他公共数据集中。迄今为止,已有来自 190 个国家/地区超过 500,000 名研究人员访问了 AlphaFold DB,且查看了超过 200 万个蛋白质结构。

Demis Hassabis 也表示,AlphaFold 数据库仍然需要随着新生物的发现不断更新,并基于这些数据改进和优化 AlphaFold 的蛋白质结构预测性能。DeepMind 会长期支持该数据库,每年更会进行更新。

或将加速药物发现并彻底改变基础科学


蛋白质是细胞生存的基础,参与了细胞生命活动的每一个进程。由于蛋白质的功能与三维结构密切相关,因此解析蛋白质的结构可以更好地了解其作用和工作原理。

AlphaFold 团队指出,已经在看到了越来越多科学家将 AlphaFold 应用到了解析疾病、保护蜜蜂、破解生物谜题、更深入探索生命起源等领域中。

(来源:DeepMind 官网)

也有外媒指出,这一突破可能会加速药物开发,打开生物信息学的新世界,甚至彻底改变基础科学。

对于生物学家而言,这一大规模的数据库可以为肿瘤治疗或者纠正基因突变提供潜在的药物靶点发现新途径。据估计,AlphaFold 推出之前,大约只有三分之一的人类蛋白质结构被用于研究,这一定程度上限制了靶点发现和药物开发。

AI 制药初创公司 1910 Genetics 首席执行官 Jen Nwankwo 博士告诉外媒,AlphaFold 数据库的扩展对生物学领域具有非常重大的意义,可能会改变药物发现领域某些靶点发现的游戏规则。不过,她也指出,关键的问题还是 AlphaFold 数据库在蛋白质动态结构解析或者在难成药靶点中发挥怎样的价值和作用,尤其是针对膜蛋白、变构区域、蛋白动态结构解析等。

图| Jen Nwankwo 博士(来源:1910 Genetics官网)

英国AI制药上市公司 Exscientia 结构生物信息学副主任也对外媒表达了类似的观点。他在一份邮件中指出,现在该考虑的问题是这些结构的用处有多大,我们现在可以专注于为 AlphaFold2 提供更多数据,提高预测已知蛋白质结构的可信度和精确度。数据库扩展帮助我们通过未知的药物结合位点扩大已知的可成药药物基因组,增加了研究人员的选择,使其有机会找到更多新药物解决未解医学难题。

值得一提的是,去年 11 月,DeepMind 的新姊妹公司 Isomorphic Laboratories 在伦敦成立,这是一家重点构建识别新药物工具的 AI 药物发现公司。该公司计划基于AI的方法重新构想整个药物发现过程,并最终模拟和理解生命的基本机制。

DeepMind 和 EBI 也分析了一些 AlphaFold 在生命科学领域的进展。比如说,AlphaFold 曾在为科罗拉多大学的研究提供了一个晶体学验证模型后,两名研究人员在半小时内识别出 10 年来难以捉摸的细菌蛋白质结构。

斯克里普斯研究所( Scripps Research)转化所的创始人兼主任 Eric Topol 博士在一份声明中表示,AlphaFold 已经加速并促成了大量的发现,包括破解核孔隙复合体的结构。数据库的更新进一步照亮了几乎整个蛋白质宇宙,并帮助研究人员每天揭开更多的生物谜团。

“开启数字生物学新时代”

过去几十年来,确定蛋白质结构的主要方法是实验室中的各种成像技术,包括X 射线晶体学、冷冻电镜、微晶电子衍射等。这些方式通常依赖昂贵的设备,耗时比较长,解析出一个蛋白质结构可能需要数月甚至数年时间。

与实验室中的各种成像技术相比,基于氨基酸序列预测蛋白质结构是一种极具吸引力的方式,也是 AI 在生命科学领域的重要落脚点。AI 制药公司华深智药创始人彭健博士对 MIT TR 表示,以 AlphaFold 为代表的蛋白结构预测模型可能是人工智能对科学界的最大贡献。

图 | AlphaFold 工具预测卵黄蛋白原结构(来源:DeepMind)

DeepMind 在官方通稿中表示,以 AlphaFold 为代表的蛋白结构预测将生物学带入了一个结构更为丰富的时代,并以数字化速度开启科学探索。

Demis Hassabis 在新闻发布会上也表示,扩展数据库后,基本上你可以认为该数据库涵盖了整个蛋白质宇宙,我们正处于数字生物学新时代的开端。

DeepMind 和 EMBL-EBI 在一份宣布数据库扩展的声明中详细解释道,更新的数据库包含了基本所有已解析的蛋白质结构,其功能基本上类似于“谷歌搜索。”也就是说,未来基于氨基酸序列预测已知蛋白质的三维结构,会像谷歌搜索一样简单,即输入氨基酸序列即可获得三维结构。

官方还表示,希望这一扩展的数据库帮助更多的科学家开展工作,并开辟全新的科学探索方式,比如说宏蛋白质组学(metaproteomics)。

上文提到,DeepMind 已经基于 AlphaFold 深度学习模型及其开源数据创办了 Isomorphic Laboratories,在多个领域进行探索并寻求突破。

“AlphaFold 是对未来的'窥见’,也是将计算和人工智能方法应用于生物学领域的'探路者’。基于此,生物学可以被视为一个信息处理系统,正如数学是物理学的完美描述语言一样,AI可能成为描述生物学复杂性的正确语言。作为数字生物学领域的'领路者’,AlphaFold 极具潜力成为推动科学发现和理解生命基本机制最有价值的工具。”DeepMind 如是总结道。

参考资料:
1.https://endpts.com/deepminds-alphafold-now-contains-structure-of-200million-proteins-what-does-that-mean-for-drug-rd/
2.https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe
3.https://www.nature.com/articles/d41586-022-02083-2
4.https://www.nature.com/articles/s41586-021-03828-1



本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
谷歌 DeepMind:已发现科学界几乎所有已知的蛋白质结构
由数据驱动的生物学和医学革命
Nature评论|AlphaFold如何在结构生物学中实现AI的全部潜力
AlphaFold的开源一年,引发了生物学的一场量变
继围棋AI之后,DeepMind又有突破!可加速新药研发
里程碑式突破!谷歌旗下AI公司DeepMind破解了几乎所有已知的结构
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服