打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
NBT | 刘勇勤/骆迎峰等发布冰川微生物组的基因组和基因集

题目:A genome and gene catalog of glacier microbiomes
发表杂志:Nature Biotechnology
发表时间:2022627
第一作者:刘勇勤计慕侃、余涛
通讯作者:刘勇勤骆迎峰
研究团队:兰州大学泛第三极环境中心生物地球化学循环团队,中科院青藏高原研究所,中科院微生物所澳大利亚昆士兰大学和丹麦奥胡斯大学
影响因子:68.16
DOI 10.1038/s41587-022-01367-2
原文链接:https://www.nature.com/articles/s41587-022-01367-2

摘要

冰川有着丰富的微生物遗传多样性。青藏高原拥有面积最大的低纬度冰川,特别容易受到全球变暖的影响。通过对来自 21 个西藏冰川的 85 个宏基因组和 883 个培养的分离物进行测序,包括环境中的雪、冰和冰粒,我们提供了一个专门的冰川微生物基因组和基因数据集,体现冰川基因组和功能的多样性。这个全面的西藏冰川基因组和基因 (TG2G) 数据集包括 883 个基因组和 2,358 个宏基因组组装的基因组,代表了 30 个门的 968 个候选物种。该数据集还包含超过 2500 万个非冗余蛋白质编码基因,通过探索次生代谢物生物合成潜力、毒力因子鉴定和全球冰川宏基因组比较来研究其作用。TG2G 数据集有助于加深对西藏冰川微生物组的结构和功能的理解。

背景

冰川历来被认为是极端环境,在有限的碳资源、低温、频繁的冻融等方面对生命体构成挑战2022627日,兰州大学泛第三极环境中心、中国科学院青藏高原研究所及中国科学院微生物所等团队提出了我们所知的第一个专门用于冰川生态系统的微生物基因组和基因数据集TG2G,包括来自85个西藏冰川基因组和883基于培养的细菌分离株3241冰川细菌和古菌基因组。其中,88.33-100%的微生物被鉴定为潜在新种。这项研究展示了冰川的微生物和功能多样性填补了对冰川生态系统中微生物多样性和功能理解的重大知识空白。

研究结果

1.冰川有丰富的潜在微生物新种
作者85个西藏冰川宏基因组进行了组装和分箱,得到了2358个宏基因组组装的基因组(MAGs;图1b和补充表2)。这些MAGs883个培养的分离的基因组相结合(补充表3),生成TG2G数据集的基因组部分(n=3,241)。这些西藏冰川基因组(TGGs)的基因组大小0.42Mb10.48Mb之间GC%30%77%之间。它们都达到或超过了基因组组装的最低信息(MIMAG)标准的中等质量水平(完整度≥50%,污染≤5%),平均完整度87%±14.23%),平均污染1.5%±1.35%)(图1c)。此外,47%的基因组至少有部分16S核糖体RNArRNA)基因片段被鉴定(平均长度=1296±373bp)(补充表2)。
使用95%ANI阈值和30%比对分数阈值,3241TGGs被聚类为968个操作分类单元(OTU)(补充表2),其中分别有75%23%MAG和分离基因组代表,而全部MAG中只有2%同时由MAG分离基因组代表(图2a)。968个物种水平的OTU88.33-100%OTU与大型环境细菌和藻类基因组数据库的基因组表现出低序列同一性,极地海洋(99.9%)、北冰洋(100%)、地球微生物组数据库(97.42%)和基因组分类学数据库(GTDB)(88.33%)(表1)。这反映了与其他生态系统相比,冰川微生物有微生物和代谢组成。超过15%n=138)的TGGs在所有的冰川表面环境类型中都得到了鉴定,50%TGGs只从三种环境中的一种得到(图2a)。大约11%n=108)的OTU在单一冰川中被鉴定出来,相反,10%n=100)的OTU几乎无处不在(从70%以上的采样冰川中鉴定出来)(图2b)。OTU的数量随着流行率的增加而明显减少(Pearson相关性,P<0.001),表明TGGs由地方性物种而不是世界性物种构成。因此,冰川微生物组可能特别容易受到气候变化引起的冰川融化的影响。
根据GTDBR06-RS202版本)的分类注释,TGGs代表30门、69个纲129目、221科和475属(图2c和补充表2)。TGG数据集以Proteobacteria, Bacteroidota, ActinobacteriotaFirmicutes主,而ChloroflexotaDeinococcotaMyxococcawere鉴定见的门。此外,3个纲14目、31科、174属和798种目前在GTDB中没有(补充图1),因此代表了潜在的新种。仅由培养的分离组成的OTU属于4个门(即Actinobacteriota, Proteobacteria, Bacteroidota, Firmicutes),包括4个新属和121个新种。相比之下,由MAGs和培养分离物组成的OTU仅属于3个门(即Actinobacteriota, Proteobacteria, Firmicutes),且只鉴定出6个新种。

1.宏基因组-组装基因组样本的地理分布。a.宏基因组的地理分布。b.85个测序的基因组和883基于培养的分离株中共得到3241TGGs。所有的TGGs完整度≥50%,污染度≤5%c. MAGs基于培养的分离株基因组中的质量分布(n = 3,241),显示最小值、第一四分位数、中位数、第三四分位数和最大值。

2 .TGGs揭示了冰川生态系统中微生物组的独特性。a.每个分类组中的培养和不可培养基因组的比例。灰条表示每个分类组(上)或栖息地(下)中每个基因组的OTU的百分比。b.OTU的数量与频率图。c.根据连接排列的120个普遍存在的细菌单拷贝基因,为961OTU建立了系统发育树。

2. 西藏冰川微生物组独特的功能
TG2G数据集中的基因部分是由已分箱和未分箱contigs构建的,从而得到整个微生物群的功能。36,021,651contigs的平均长度为1.29kbN501.47kb。自比对率(即reads比对到其对应的基因组的contigs上)从13.3%95.6%不等(平均68±20%;补充表4)。然而,当整个数据集中的contigs作为参考基因组时,平均比对率增加到85±20%37.7-98.7%),代表平均比对率增加17%。因此,该数据集可以作为未来冰川基因组分析的参考基因组,以提高组装率。1,844,3475.6%)个contigs来源于真核生物,占总reads12%。具体来说,71,754contigs鉴定为Chlorophyta Rhodophyta,它们是冰川生态系统中最主要的藻类,占总reads0.045%
共预测了40,066,799个开放阅读框架(ORFs),然后使用80%比对分数阈值和95%ANI阈值将其去重25,320,330个基因。根据Prodigal的预测,超过50%的基因簇(13,558,76554%)是完整的,平均长度为690bp。非冗余基因的数量随着抽样深度的增加而逐渐上升,即使使用50%的核苷酸同一性阈值,也没有达到一个稳定状态(图3a)。这表明西藏冰川蕴藏着丰富的基因多样性,需要进一步测序以全面了解功能多样性。我们使用NRSwiss-ProtUniRef50数据库来注释已经去重复的基因簇的功能,发现NR数据库注释(不包括假蛋白)16,560,33165.4%基因,而Swiss-ProtUniRef50数据库注释38%78%的基因
我们探讨TG2G数据集中合成次级代谢物的能力,以研究其在发现新型生物活性化合物方面的作用。次代谢物对在干旱、营养匮乏的生态系统中的微生物的生存起着重要作用,从而有利于新型代谢物的生物研究。我们使用AntiSMASH5.1版)从3241TGGs中确定了15954假定的次级代谢物生物合成基因簇(BGCs)。这比人工整理的最小生物合成基因MIBig数据库中已知功能的BGCs的规模大8倍,表明西藏冰川微生物组中BGCs的多样性。只有8.4%TG2G BGCs存在于最新的GTDB版本(R06-RS202)中,这进一步证实了TG2G数据库包含大量功能新颖的次级代谢产物,与观察到的新颖的分类相一致。
预测的次级代谢物被分为八组(图3b)。其中,合成萜类化合物BGCs是最多样的,有4105个独特的序列被鉴定出来,占鉴定的BGCs总多样性的25.7%。它们也是大多数门水平的细菌中最丰富的BGCs(图3c,补充图3和补充表5)。这可能是由于萜类色素(如类胡萝卜素)在细菌中广泛存在,它们能捕获光能以中和氧化剂以及作为毒力因子。此外,从18个门中共鉴定出2731个(17.1%)非核糖体肽合成酶(NRPS)基因簇,从11个门中鉴定出268个(1.7%I聚酮合酶(PKS基因簇,从12个门中鉴定出319个(2.0%PKS-NRPS复合蛋白基因簇,从14个门中鉴定出348个(2.2%)核糖体合成和翻译后修饰肽(RiPP基因簇。
ProteobacteriaTG2G数据集中最有潜力的抗生素研究的对象,共鉴定出529PKS1095NPRS133PKS-NRPS复合蛋白基因簇(补充表5)。此外,每个基因组中Myxococcota门鉴定的BGCs数量最多,这与来自地球微生物组(GEM数据集结果一致。虽然许多基因簇片段化的,但我们识别出长度超过50kb478个(3.0%BGC另外2,934个(18.4%BGCs的长度超过30kbAureimonas属(补充图2a)和Flavobacterium属(补充图2b)的MAG分别鉴定两个NPRS基因簇,长度分别是128,754bp106,171bp。在Aureimonas基因组中发现的NPRS基因簇(B307-4)包括14个核心模块,与Stappiaindicasesbanimide生物合成基因簇相关(75%的氨基酸同源性(AAI)),除此之外还有一个额外的Arylpolyene生物合成模块。FlavobacteriumDSR2-3-3)编码了一个由11个核心模块组成的NRPS基因簇,与Pseudomonas fluorescens SS101的抗生素马塞脱内酯生物合成基因簇最为相似(44% AAI)。因此,TG2G数据集是一个丰富的新型BGCs来源,为探索极端环境下的BGC进化提供了重要资源。此外,约40%NRPS7%IPKS14%PKS-NRPS基因簇在培养分离的基因组中被鉴定出来(图3b),因此,该数据集可随时用于生物活性化合物的纯化和结构分析
3 .TG2G数据集研究a.因簇的数量随着reads的增加而稳步增加。b. BGCMAG和分离基因组中的相对频率。c. BGC在各优势门中的相对频率BGC基因主要在Proteobacteria, Firmicutes, Bacteroidota Actinobacteriota中发现,并且不同门有很大的变化。

3. TG2G数据集的毒力因子
基于毒力因子数据库(VFDB),TG2G数据集鉴定了27267个潜在的毒力因子,但只有14301个(52%)与GEM数据库中确定的毒力因子实质的相似性(基于70%的覆盖率和80%AAI的阈值;补充表6)。这揭示了TGGs中潜在新颖的毒力因子,这些因子主要与移动24%)、粘附性(13%)、效应传递系统(11%)和生物膜(11%)有关。此外,预测出1%的毒力因子和毒素的产生相关,这可能与冰川融化期间人类和野生动物的健康有关(图4a)。459TGGs有鉴定出毒力因子,其中每个基因组包括1374毒力因子(补充图4a)。这些基因的丰度是每百万有5876个转录本(补充图4b),它们主要(90%)来自Proteobacteria, FirmicutesActinobacteriota(图4b)。将每个TGG的毒力因子数量与其他生境的基因组进行比较,发现平均数量(12.7)大大高于陆地和水生生态系统(分别为3.52.4),但低于人类肠道(18.2)(补充图5)。
使用PathoFact流程396OTU包括29个分离物基因组和367MAG鉴定出可移动元件(噬菌体或质粒)和毒素基因。这些OTU占鉴定的总OTU41%(补充表7)。在鉴定1,539移动毒力因子中,86%12%分别由质粒和噬菌体序列携带,而其余2%载体无法确认(补充图6a)。此外,40%60%的潜在移动毒素基因分别编码分泌型和非分泌型致病因子(补充图6b)。Proteobacteria含有最多的移动毒素基因,其次是ActinobacteriotaCyanobacteriaBacteroidota(图4c)。
4.TGGs多种多样的潜在致病因子。a.基于VFDB鉴定的的多样性的致病因子。b.要细菌门中致病因子类型的相对频率(左)和每个门所代表的总多样性的百分比(右)。 c.TGGs中带有可移动元件的毒力基因的分布。移动元件包括噬菌体、质粒以及尚未明确区分的元件(可能是噬菌体或质粒)。

4. 西藏宏基因组和全球冰川宏基因组的比较
TG2G数据集提供了一个在全球范围内鉴定和比较冰川微生物功能的平台。在此研究中,通过在TG2G数据集中增加120个非西藏细菌分离基因组和45个来自阿尔卑斯山(n=4)和北极地区(n=41)的冰川基因组,证明了这种能力。几乎所有的基因组都是从冰石样本中获得的,只有4个来自冰层。这些基因组的处理方法与TG2G数据集相同,产生了405个额外的MAGs。这些MAGs95%ANI进行了去重,代表了215个额外的物种(补充表8)。
青藏高原(0.045±0.11%;补充图8)和北极冰川(0.016±0.017%;单因素方差分析Dunn’s post hoc析,P>0.05)的藻类序列的相对丰度相似,它们都明显低于阿尔卑斯山冰川(0.117±0.124%P<0.05)。相比之下,西藏冰川不同生境中的藻类序列的相对丰度没有明显的差异(P=0.256)。对于门水平的细菌和古细菌,北半球的冰川相关样本主要按地理位置聚类(方差分析P<0.001),而不是按生境聚类(P<0.001),细菌在八个门水平的差异解释度超过80%(图5a)。雪和冰中的微生物组表现出高度的相似性(P=0.78),并且都与冰中的微生物组有明显不同(P<0.001)。冰样品按地理位置主要分为两组,青藏高原和阿尔卑斯山为一组,帕隆冰川和北极为另一组(补充图7)。青藏高原和阿尔卑斯山的冰富含Cyanobacteria Proteobacteria,而北极的冰粒有较高丰度的Actinobacteriota, Acidobacteriota, Armatimonadota, Chloroflexota, Myxococcota Eremiobacterota
从功能上看,三个北极冰面的微生物组与青藏高原的微生物组相似,而青藏高原、阿尔卑斯山和北极地区的冰微生物组则不同(图5b)。冰微生物组多富集在在核苷酸和脂质代谢有关的功能,而冰雪微生物组则富集在与次级代谢物、萜类和聚酮类的合成以及辅因子和维生素的代谢相关的功能。
5.西藏、阿尔卑斯山和北极冰川微生物群落的主成分分析图。a.群落组成的变化,重点关注了生境类型和门水平之间的差异(箭头)。b.不同的生境类型在功能方面有明显的区分。富集在冰和雪样品中的功能主要包括:(1)其他氨基酸的代谢;(2)辅因子和维生素的代谢;(3)异型生物质的生物降解和代谢;(4)萜类和聚酮类的代谢;(5)其他次级产物的生物合成。

结果与展望

作者提出了首个专门用于冰川生态系统的基因组和基因集,包括基于培养的883冰川细菌基因组和来自21个西藏冰川的85个宏基因组样本,涵盖了不同的生境,包括雪、冰和冰本文展示了细菌和古细菌的TG2G数据集,其中包括基因组和基因水平上的数据。该数据集包括968个候选的可定义的细菌和古细菌物种(平均核苷酸一致性≥95%)和超过2500万个基因簇,为冰川微生物在基因组和基因水平上的分析提供了一个数据库和平台。从而有助于对全球和本地冰川微生物多样性、功能和进化方面的研究,以及评估冰川融化的潜在健康风险。
参考文献:Liu, Y., Ji, M., Yu, T. et al. A genome and gene catalog of glacier microbiomes. Nat Biotechnol (2022).

通讯作者

姚檀栋,中国科学院院士,美国地球物理学联合会会士,第二次青藏高原综合科学考察研究队队长,现任第三极环境(TPE国际计划主席、中国青藏高原研究会理事长、中国第四纪研究会副理事长等职务。现任中国科学院青藏高原研究所研究员、名誉所长、学术委员会主任。
刘勇勤,中国科学院青藏高原研究所研究员。从事青藏高原和南北极冰雪湖泊微生物与气候环境关系的研究。以第一和通讯作者在Nature Biotechnology“Environmental Microbiology”“FEMS Microbiology Ecology”“Science of the Total Environment”“Journal of Glaciology” 等期刊发表论文80余篇。
骆迎峰,中国科学院微生物所副研究员中国科学院青年创新促进会会员研究方向生物信息学,基因组解析,宏基因组学及其应用
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
单纯疱疹病毒属于什么病毒?
2019:二代测序在肺部感染性疾病中的应用(综述)
如何寻找细菌的毒力因子?
科研 |MICROORGANISMS:转录组揭示草莓与角斑病菌互作的分子机制
瞄准超级细菌“毒力开关”,中国学者揭示抗生素新靶点 | Nature 子刊
细菌完成图+比较基因组学助力沙门氏菌毒力因子研究
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服