打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Adv Sci |人类皮肤细菌基因组综合目录揭示了大量尚未探索的特定生境微生物组多样性和功能
























摘要

皮肤是人体最大的器官。其表面上的各种皮肤环境构成了一个复杂的生态系统。皮肤微生态系统的特征之一是生物量低,这极大地限制了通过测序对微生物物种进行全面鉴定。在这项研究中,对450个面部样本进行深度鸟枪法测序(平均21.5千兆字节(Gb))和2069个样本的公开皮肤宏基因组数据集,以组装统一人类皮肤基因组(UHSG)目录。UHSG包含来自5779个宏基因组组装基因组的813个原核生物物种,其中470个是新的物种,涵盖20个门,有1385个新的组装基因组。基于UHSG,描述了皮肤微生物群的核心功能,并确定了不同门之间在氨基酸代谢、碳水化合物代谢和耐药功能方面的差异。此外,对近完整基因组的次级代谢物进行分析,进一步发现了1220个推定的新次级代谢物,其中一些是在以前未知的基因组中发现的。单核苷酸变异(SNV)揭示了一种可能的皮肤保护机制:皮肤环境对条件病原体的负选择过程。UHSG提供了一个方便的参考数据库,将有助于更深入地了解皮肤微生物在皮肤中的作用。

关键词:细菌基因组、突变、次级代谢产物、单核苷酸、皮肤微生物组
01
引言


在人类中,皮肤健康和疾病与皮肤微生物群有关。[1]宏基因组分析可以推断出复杂微生物群的物种分类和潜在功能,以进一步了解其在皮肤健康和疾病中的作用。[12]然而,缺乏足够的微生物多样性参考数据阻碍了宏基因组数据分析和对微生物物种潜在功能的理解。皮肤微生物的培养研究不断揭示了皮肤群落生物学对人体皮肤健康的影响的新见解。[3]虽然一些未知的皮肤微生物可能由于各种原因(如生长培养基中缺乏营养或皮肤微生物丰度低)而逃避当前的培育方法,但它们可能发挥重要的生物学作用,而这尚未得到阐明。因此,获取皮肤微生物基因组并建立全面的目录对于新发现至关重要。
几项研究表明,独立于培养基和无参考的方法是发现和鉴定新物种的成功策略。[1]宏基因组分析可以将从头组装得到的重叠群(contig)装入假想基因组,称为宏基因组组装基因组(MAG)。一些研究已将这种方法应用于重建各种MAG [2]其中一项研究恢复了北美样本中数千个皮肤微生物基因组, [3]并提供了北美皮肤微生物群多样性的详尽图谱。
在这里,统一的人类皮肤基因组(UHSG)是从2519个人类皮肤宏基因组样本中产生的。UHSG包括2111个高质量(HQMAG3668个中等质量(MQMAG。接下来,鉴定了1385个新组装基因组,并研究了它们独特的潜在功能。进一步的基因组聚类程序产生了813个推断的原核物种,其中包括549个近完全原核物种(NCPS)。此外,根据NCPS评估了物种间基因的水平转移、潜在的次生代谢物生物合成和单核苷酸变异。这些为我们了解皮肤微生物的种类和功能及其在人体皮肤中的重要作用提供了新的视角。
02
结果



2.1. 皮肤中发现的大规模未培养和未组装的细菌物种

为了全面表征人体皮肤微生物群,我们对4D-SZ队列中的450个健康面部样本进行了深度鸟枪法测序(共计9.7太字节(Tb)的高质量数据,平均21.5 Gb的数据),并从4项不同的研究中检索了2069个人类皮肤宏基因组数据集(共计6 Tb的高质量数据,平均2.9 Gb的数据)[126](图S1和表S1,支持信息)。可用的皮肤微生物组样本主要来自美国(n=109943.6%)或中国(n=127150.5%);大多数样本是健康样本,反映了当前人类皮肤微生物组研究中地理和健康样本的偏好。
为了获得皮肤微生物群落中全面、高质量的参考基因组,我们使用2519个宏基因组样本恢复了27406个基因组(图S1,支持信息)。使用CheckM软件确定基因组的污染和完整性,无论是高质量(HQ,完整性≥90%,污染≤5%)还是中等质量(MQ,完整性≥50%,污染≤10%)。根据这些指标,获得了2111HQ MAG3668MQ MAGUHSG,图S1和表S2,支持信息),这些MAG主要来自4D-SZ队列中收集的样本(图S1,支持信息,n=359462.2%)。之后,使用基因组分类数据库工具包(GTDB-Tk,图1A)对每个HQMQ MAG进行分类。然而,24%n=1385)的MAG不能被分类为已报道的物种,32.2%n=1862)的MAG是未培养的细菌基因组,这表明UHSG的部分目前未在参考数据库中得到体现(图1A)。5779MAG中有2个是古细菌基因组,其中一个可以被分类为解淀粉芽孢杆菌(Natronococcus amylolyticus)。另一个不能被分类为现有物种,这表明皮肤微生物群落中古细菌的稀缺性(表S2,支持信息)。UHSG充分覆盖了不同的分类群(图1A),在皮肤中20种最丰富的物种中(图S2,支持信息),使用宏基因组数据和微生物基因组重建方法,我们获得了高质量的基因组,包括痤疮丙酸杆菌(n=1094)、克里夫兰劳森氏菌(n=268)、颗粒状丙酸杆菌(n=255)、表皮葡萄球菌(n=193)、施氏假单胞菌(n=190)和奥斯陆莫拉氏菌(n=156)。
1.人类皮肤微生物群基因组目录的系统发育多样性。A)人类皮肤中组装的5777MAG的最大似然系统发育树。分支的外圈描述了GTDB门注释。MAG由其分离的基因组可用性(第一层)注释,其中它们被分类为已知物种水平(第二层),16S rRNA序列可用性(第三层),来自研究项目信息(第四层),MAG质量控制信息(第五层),条形图表示基因组大小(最外层)。B)显示了未分类MAG在门水平上的比例。括号中表示门水平上未分类物种的数量及其在门水平上的比例。未分类皮肤微生物群组成和潜在功能基因家族的多样性。C)系统发育树显示了未分类MAG82个(目水平)细菌分支。分支的外圈显示了每个分支的MAG数量。D)显示了每个分支中所有物种的平均基因组大小和编码密度。E)直方图显示了每个分支中所有物种的平均基因数、平均基因家族数和未知功能基因数。
接下来,我们关注了未被分配给GTDB中现有物种的基因组(平均核苷酸同一性(ANI)为95%)(图1B)。基因组主要集中在变形菌门(682个,49.21%)、放线菌门(228个,16.45%)、拟杆菌门(167个,12.05%)和 Deinococcota 62个,4.47%),涉及82个目和139个科(图1C和图S3,支持信息)。此外,基因组的编码空间(从57.1%到95.0%)、基因重复率(从0%到5.9%)和潜在功能(从2.4%到62.7%)具有高度多样性(图1C、图S3和表S3,支持信息),支持基因组在维持皮肤功能多样性方面的重要地位。此外,在11个门中发现了新的物种水平分支,属于蛭弧菌门、疣微菌门、粘球菌门、蓝细菌门、Eremiobacterota、浮霉菌门、Armatimonadota、酸杆菌门、蛭弧菌门、疣微菌门和绿弯菌门(图1AB)。这些分支主要集中在高深度测序样本中(图S4,支持信息),这表明高深度测序有利于未知皮肤细菌的基因组组装。
为了确定UHSG中包含的物种数量,使用至少95%ANI30%的比对分数阈值对所有HQMQ MAG进行聚类。[48]基于基因组信息(最小污染和最大完整性),从每个簇中选择最佳质量的基因组作为代表性物种水平基因组箱(rSGB)。从聚类过程中推断出813rSGB,其中549个是接近完整的原核物种(NCPS,完整性≥90%,污染≤5%),470个是物种(表S4,支持信息)。发现rSGB的数量远低于报告的肠道微生物组[4b]或口腔微生物组[5b],差异可能是由于rSGB的数量尚未达到饱和点,表明还有更多的物种有待发现(图S5,支持信息)。所有皮肤宏基因组数据集都被映射到813rSGB,证实了UHSG中人类皮肤微生物多样性的代表性。使用BWA-MEM,获得了77.81%的平均分类率。与HMP数据库相比,这表示了35.5%的改进(表S1,支持信息)。来自中国和美国的样本显示分类率有最显著的改善,突出了UHSG目录在研究研究不足人群的微生物多样性方面的潜力。

2.2. 人皮肤细菌代谢潜能的基因组变异

构建皮肤细菌基因组目录对于理解皮肤细菌的潜在功能至关重要。5779个基因共编码14590154个蛋白质编码基因(表S2,支持信息),这些基因可分为2657347个非冗余蛋白质家族(NPF)。平均而言,eggNOGCARD中分别有90.8%0.03%的基因显示序列/结构域同源性(表S2,支持信息)。然而,我们的NPF中约有1351610个(50.86%)蛋白质家族在可用的iHSMGC中没有发现。此外,NPF谱的主坐标分析(PCoA)显示,17个细菌门放线菌门、变形菌门、厚壁菌门和拟杆菌门之间存在明显分离(图S6,支持信息)。出乎意料的是,颗粒状丙酸杆菌和其他种类的丙酸杆菌分类学显示了明显的分离,表明它们在皮肤中的潜在功能存在差异(图2和图S6,支持信息)。具体而言,不同种类的丙酸杆菌分类学在辅因子和维生素生物合成、氨基酸代谢、磷酸转移酶系统和脂质代谢方面存在显著差异(表S5,支持信息)。
2.皮肤细菌在门水平上功能的潜在差异。热图显示了不同门中NCPSKEGG代谢模块的完整率。颜色深度显示了NCPSKEGG代谢模块的完整率;深紫色表示编码该模块中所有酶的基因都存在;浅紫色表示部分存在;白色表示不存在。
根据KEGG模块的完整性比率,重建了核心功能通路(图2和图S7,支持信息)。所有物种都具有近乎完整的中枢代谢(即糖酵解、糖异生、戊糖磷酸途径和柠檬酸循环)、氨基酸代谢(即赖氨酸、脯氨酸、精氨酸、色氨酸、亮氨酸、异亮氨酸、组氨酸和苏氨酸的生物合成)和核苷酸代谢通路(图S7,支持信息)。放线菌门和厚壁菌门,特别是丙酸杆菌属和葡萄球菌属,表现出比其他细菌更丰富的磷酸转移酶系统(PTS)多样性(图2),表明它们在吸收糖及其衍生物方面具有重要作用。而变形菌门、拟杆菌门、蛭弧菌门、粘球菌门、蓝细菌门、变形杆菌(莫拉氏菌属和不动杆菌属)和疣微菌门在脂质代谢方面表现出更丰富的功能多样性(图2)。在我们的先前研究中,根据数据驱动的分类,发现了两种皮肤亚型:C亚型主要由丙酸杆菌属组成,M亚型主要由莫拉氏菌属组成。在这里,通过对基因组的功能分析,两种皮肤亚型形成的潜在原因是这两个皮肤微生物群具有不同的营养需求
更重要的是,抗生素抗性基因(ARGs)在不同门类中表现出明显的异质性(图2)。为了评估不同门类之间ARGs的变化,使用CARD数据库[9]v3.1.4)分析了ARGsNCPS基因组序列(表S6,支持信息)。皮肤中ARGs的储存主要来自变形菌门和厚壁菌门。皮肤中的耐药库主要存在于厚壁菌门的葡萄球菌属和变形菌门的假单胞菌属、不动杆菌属、克雷伯氏菌属、Enterobacter himalayensis、雷根斯堡约克菌和Pluralibacter gergoviae,这些细菌都是多重耐药菌(图S8,支持信息)。大多数耐药细菌都对四环素类抗生素和氟喹诺酮类抗生素具有抗性(图S8,支持信息),因为这些抗生素被广泛使用。值得注意的是,皮肤中变形菌门的耐药细菌对夫西地酸、糖肽类抗生素、恶唑烷酮类抗生素、对氨基水杨酸、截短侧耳素类抗生素和链阳菌素类抗生素没有抗性。厚壁菌门的耐药细菌对苯扎氯铵、双环霉素、碳青霉烯、头孢霉素、elfamycin抗生素、糖肽类抗生素、甘氨酰环素、异烟肼、单氨苄青霉素、硝基呋喃类抗生素、硝基咪唑类抗生素和对氨基水杨酸没有抗性(图S8,支持信息)。我们的发现可以指导抗生素在皮肤疾病治疗中的应用。

2.3. 皮肤上的细菌水平基因转移(HGT)

在微生物中,HGT被认为可以驱动微生物的进化和适应,这与抗生素耐药性和毒力的产生有关。[11]使用MetaCHIP422NCPS中共鉴定出2276个候选HGT事件(表S7,支持信息), [12](基于最佳匹配和系统发育方法)。其中,供体主要包括变形菌门(66%)、放线菌门(19.7%)、拟杆菌门(9%)、厚壁菌门(3.4%)和疣微菌门(1%)。受体主要包括变形菌门(62.1%)、放线菌门(18.5%)、拟杆菌门(9.8%)、厚壁菌门(3.4%)、粘球菌门(2.4%)、疣微菌门(1.5%)和Armatimonadota门(1.2%)(图3A)。特别是,大多数转移发生在同一门内,弯曲菌门、粘球菌门、蓝细菌门、盐杆菌门和浮游菌门仅是转移基因的受体(图3B)。此外,皮肤中相对低丰度物种的HGT数量显著增加,如Bosea spp.SGB_493)、UBA1936 spp.SGB_290)、Aureimonas altamirensisSGB_269)、Chryseolinea spp.SGB_153)、Aquabacter spp.SGB_209)、Inquilinaceae spp.SGB_201)和玫瑰假单胞菌(SGB_123)(图S9,支持信息),这表明它们对皮肤环境的进化和适应。
图3.细菌物种之间存在水平基因转移。A)供体和受体的内环和带由被转移基因的蛋白质家族着色,带的宽度与HGT的数量相关。内环由微生物顺序着色。外环由微生物门着色。B)桑基图描绘了门之间的水平转移。左:供体。右:受体。百分比表示同一门之间的水平转移率。
238 个水平转移基因(10.5%)的遗传差异小于 1%,表明是近期转移的(图 S10A,佐证资料)。MetaCHIP 还发现了 2038 个(89.5%)基因转移的遗传差异高于 1%,即代表非近期转移(图 S10B,佐证资料)。然后,利用 COG 系统对 MetaCHIP 软件预测的近期和非近期检测到的 HGT 进行注释。例如,COG类别C(能量产生和转换)、Q(次级代谢物的生物合成、运输和分解)和I(脂质运输和代谢)仅在非近期HGT中富集,而类别K(转录)、L(复制、重组和修复)和U(细胞内运输、分泌和囊泡运输)在近期HGT中富集(图S10B,佐证信息)。这与之前土壤和肠道基因组中的 HGT 结果[ 12 ] 不同。这表明不同生长环境中的物种在进化过程中对功能基因的需求不同。
HGT是导致耐药性迅速传播的主要因素。在2276个候选HGT事件中鉴定出6个耐药基因(adeFmexQ)(图S11,支持信息)。铜绿假单胞菌的多重耐药基因(mexQ)被认为是全球健康问题,发现其被转移至粘质沙雷氏菌_1 Serratia marcescens_1),表明需要注意多重耐药基因的传播。此外,具有四环素和氟喹诺酮抗性的adeF基因可能在皮肤细菌中广泛传播,暗示需要仔细考虑皮肤表面使用的抗生素类型。

2.4.次级代谢物生物合成基因在皮肤细菌中广泛分布

在皮肤生态系统中,微生物会产生各种次级代谢产物,如抗生素、抗真菌药物、β-内酯和铁载体,这些代谢产物在人与环境的相互作用中起着重要作用。虽然大多数已知的抗生素是通过少数培养的微生物群落获得的,但大多数皮肤细菌的潜在次级代谢产物几乎未被研究。在这里,使用antiSMASH 6.0.0DeepBGC474NCPS中鉴定了1525个生物合成基因簇(BGCs)(表S8,支持信息)。这些基因簇主要包括非核糖体多肽合成酶(NRPS)和/或多酮合酶(PKS)、芳基多烯、β-内酯、铁载体、萜烯、β-内酯、非α-多氨基酸(NAPAA)、氧化还原辅因子和翻译后修饰肽(RiPP)(图4A)。在生物合成基因簇(MIBiG)数据库中仅发现了20%BGCs1525个中的305个)(相似性≥30%[20]),并在之前的研究中有所报道(表S8,支持信息)。因此,我们的分析极大地扩展了皮肤细菌潜在次级代谢产物生物合成的数量。
4.皮肤细菌潜在生物合成基因簇的多样性。A)每个门在 NCPS 上发现的生物合成基因簇的数量,按 antiSMASH 指定的假定产品类型着色。B) 在每个门的 NCPS 上发现的 NRPSPKS、类 NRPS 和类 PKS 基因簇的数量。C) NRPS PKS 生物合成基因簇网络,边缘连接共享基因的基因簇。线的粗细随遗传相似性的增加而增加。只有在一个或两个系统水平上预测到的 NRPS PKS 生物合成基因簇的共享基因网络被圈成紫色。D) 在每个 NCPS 上发现的生物合成基因簇和 NRPS/PKS。紫色: NRPS/PKS,其他颜色:生物合成基因簇。
目前,大多数已知细菌的天然产物来自放线菌和变形菌的分离物,这些细菌通常在皮肤微生物成员中占大多数。[26]在这项研究中,在12个皮肤微生物门中鉴定了BGCs,包括变形菌、放线菌、拟杆菌门、厚壁菌门和粘球菌门(图4B)。变形菌中最丰富的BGCsLysobacter spp.Aquabacterium spp.Pseudomonas spp.Aquabacterium spp.,和Comamonas tsuruhatensis;放线菌中最丰富的BGCsGordonia spp.Mycobacterium spp.Tsukamurella spp.Williamsia muralis,和Patulibacter spp.;拟杆菌中最丰富的BGCs是甲壳菌属,黄杆菌属,黄杆菌属,Emticicia sp002855535,和Hymenobacter spp.;厚壁菌中最丰富的BGCs是链球菌属,乳球菌属,Dolosigranulum pigrumPeptoniphilus_A spp.,和厌氧球菌属(图4D)。
编码PKSsNRPS的基因簇可以产生各种类型的抗生素、抗真菌药物、铁载体和免疫抑制剂。[21] 239NCPS的拼接体上鉴定了639NRPSPKSI型和III型)和杂合(NRPS-PKS)基因簇(图4B和表S8,支持信息)。与上述一致,这些簇主要出现在变形菌门、放线菌门、拟杆菌门、厚壁菌门和粘球菌门中(图4B和表S8,支持信息)。NRPSPKSNRPS-PKS基因簇分别占变形菌门、放线菌门、厚壁菌门和拟杆菌门平均BGC32.81%51.64%12.82%17.93%(图4D)。
接下来,基于共享基因构建了簇关系网络,以比较生物合成簇中共享基因的程度。这种方法揭示了皮肤中潜在次生代谢物的多样性,并发现了皮肤微生物群中许多多样化和稀疏连接的BGC(图4C和图S12,支持信息)。簇关系网络主要形成于放线菌门、变形菌门、厚壁菌门和拟杆菌门内的物种之间(图4C和图S12,支持信息)。例如,在放线菌门中几乎普遍存在的保守型I PKS基因座形成了三个密集的网络簇。同时,保守型III PKS基因座是变形菌门中的一个密集网络簇(图4C)。变形菌门形成了三个芳基多烯、四个β-内酯、六个萜烯;放线菌门形成了两个β-内酯和三个氧化还原辅因子保守簇;拟杆菌门形成了四个芳基多烯和两个萜烯的保守簇(图S12,支持信息)。这些BGC在分类群中的高度保守性可能表明存在一组新的代谢物。

2.5. 皮肤微生物组的单核苷酸变异(SNV)

为了进一步探索皮肤细菌的潜在功能,对NCPS的单核苷酸变异进行了研究。通过inStrainNCPS的单核苷酸变异(SNV)进行了定量分析。在2519个样本中,NCPSSNVs168 076 666个,其中57.4%为同义突变(Ks),35.1%为非同义突变(Ka),7.5%发生在基因间区域(图5A)。最值得注意的是,同义突变和非同义突变(即选择压力)的比例在不同物种和皮肤环境中存在显著差异。所有细菌在干燥的皮肤环境中都表现出负选择(图5A)。常见皮肤细菌痤疮丙酸杆菌、奥斯陆莫拉氏菌、凯菲尔棒状杆菌、Cutibacterium humerusii,、表皮葡萄球菌和颗粒表皮葡萄球菌的选择压力在皮脂和湿润环境中呈正选择。而致病性假单胞菌(包括P. sp003428805P. sp002742565P. putida)、鲍氏菌属、微杆菌属和Comamonas tsuruhatensis的选择压力在皮脂和湿润环境中呈负选择(图5A)。此外,我们观察到不同皮肤环境中某些细菌的选择过程存在差异。例如,鞘氨醇单胞菌在皮脂环境中呈正选择,在湿润环境中呈负选择,马赛菌(Massilia spp)在湿润环境中呈正选择,在皮脂环境中呈负选择(图5A)。这一发现表明,条件致病菌更倾向于稳定选择,从而降低了产生更多有毒菌株的可能性。
5.皮肤微生物的SNV密度分析。A)柱状图显示了按SNV数量排名的前25NCPS的分布。颜色显示了同义、非同义和基因间SNV的数量。上面的两个柱状图显示了不同皮肤环境中前25NCPS的基因组大小和Ka/Ks比值。饼图显示了同义、非同义和基因间SNV的总数和比例。B)通过eggNOG的类别描述了不同皮肤环境中总基因大小、SNV数量(同义和非同义)、功能Ka/Ks比值以及不同功能单元SNV数量占总基因大小的比例。C)不同皮肤环境中不同种属葡萄球菌潜在功能的Ka/Ks差异。D)不同皮肤环境中不同种属假单胞菌潜在功能的Ka/Ks差异。
接下来,SNV被映射到皮肤微生物基因功能。发现SNV出现在几乎所有的COGs中,约占细菌基因组大小的0.1%,所有COGs的选择压力都是负选择,与皮脂和湿润环境相比,干燥环境中的负选择压力较低(图5B)。更重要的是,基于属的水平评估了单个物种各种功能的选择压力。注意到不同种类的金黄色葡萄球菌、假单胞菌、棒杆菌、不动杆菌、莫拉菌和丙酸杆菌的选择压力存在差异(图5CD和图S13,支持信息)。这些差异可能与细菌的条件致病性有关,尤其是大多数假单胞菌和金黄色葡萄球菌的功能基因在各种疾病中的负选择压力。此外,它们在不同皮肤环境中的选择压力也存在差异。在干燥环境中,金黄色葡萄球菌、假单胞菌、棒杆菌、不动杆菌、莫拉氏菌和丙酸杆菌的选择压力(图5CD和图S13,支持信息)进一步解释了皮肤在干燥环境中细菌负荷低于皮脂和湿润环境。同样,皮脂和湿润环境之间也存在选择压力差异。例如,在湿润环境中,金黄色葡萄球菌、人葡萄球菌、头葡萄球菌、抗辐射不动杆菌和Moraxella_A atlantea 的选择压力高于皮脂环境。另一方面,假单胞菌_E sp003428805、麦氏棒杆菌、棒杆菌假白喉菌和克氏棒状杆菌在皮脂环境中的选择压力较低。此外,许多微生物功能在三种皮肤环境中表现出正选择压力,包括与运输相关的蛋白质(K07791K03291K07791K09815K03308)、转移酶(K21828K03801K00791K00954K00611K00556K18100)、激酶(K00859K00925)和与碳水化合物代谢相关的蛋白质(K22135K00024K01193K13929K13877K00064K00075K12972)(图5CD)。我们的研究结果强调皮肤细菌与宿主之间的相互作用可能会影响细菌进化的方向。
03
讨论


在这项研究中,对450个汉族皮肤样本进行了深度全基因组鸟枪法测序,并与2069个皮肤样本结合,构建了包含2111个高质量基因组和3668个中等质量基因组的UHSG。在该组中的813个原核生物物种中,57.81%物种代表,这意味着该目录中的大多数微生物多样性仍需要实验表征。在准备本文期间,从培养和组装中释放了622个皮肤原核生物物种的新集合[5a],其中217个原核生物物种不在UHSG集合中;这217个物种将被纳入未来的版本。UHSG是一个进一步扩展和补充皮肤微生物研究的资源,提供了皮肤微生物多样性的全面视图。
皮肤微生物基因组功能分析揭示了微生物群的核心功能和不同分类水平的特定功能。发现放线菌和厚壁菌,特别是丙酸杆菌属和葡萄球菌属,对糖及其衍生物具有很强的吸收能力,变形菌中的莫拉氏菌属和不动杆菌属显示出更丰富的脂质代谢能力,这与我们之前报道的皮肤微生物分类中的驱动细菌一致。[6a]更重要的是,皮肤微生物在潜在耐药功能方面表现出强烈的异质性。皮肤中的耐药细菌更集中在变形菌中,特别是绿脓杆菌,它几乎涉及所有种类的抗生素, [25] 并且对皮肤中的各种抗生素表现出强烈的耐药性。因此,绿脓杆菌感染已成为医院获得性感染的真正问题,特别是在重症和免疫功能低下患者中。[23a]我们的研究结果表明,绿脓杆菌对几种抗生素没有耐药性,包括elfamycin、夫西地酸和糖肽。使用这些抗生素可能在一定程度上降低与绿脓杆菌感染相关的死亡率。
近年来,基于宏基因组学挖掘微生物次级代谢产物已成为流行趋势,从肠道、土壤和海洋微生物群中鉴定出许多次级代谢产物。作为人体最大的器官,皮肤直接与外部环境接触。皮肤表面的微生物及其产生的次级代谢产物可能在人体中发挥关键作用。在皮肤细菌的基因组中发现了几种次级代谢产物合成基因。由于这些次级代谢产物中的80%无法在已知数据库中识别,这极大地扩展了次级代谢产物数据库。此外,NRPSPKS是重要的天然产物,因为它们具有抗菌、抗真菌、抗寄生虫、抗肿瘤和免疫抑制等临床价值。发现NRPSPKS簇构建的关系网络可达60个独立子网(图4),每个子网代表一种可能被开发和利用的生物活性分子。这一发现可以为后续微生物药物开发提供参考。
随着皮肤微生物基因组目录的建立,很明显,超过一半的微生物物种和功能尚未得到表征。通过分析,我们表征了皮肤细菌的功能,建立了它们之间的水平基因转移,预测了次级代谢物,并表征了每种细菌的SNV及其适应性进化。拥有如此全面的资源可以帮助指导未来的研究,并优先考虑进一步实验验证的目标。通过利用资源中可用的信息,研究人员可以专注于特定的微生物物种、遗传途径或生物活性化合物,这些物种显示出进一步研究的潜力。此外,根据UHSG目录,来自社区队列或特定临床环境的样本可以反映皮肤细菌的丰度。通过特定的疾病分类组,可以找到靶向的皮肤细菌,以加深对皮肤细菌在疾病分类中的作用的理解。关于皮肤中大量未培养的细菌,UHSG目录可以显著提高基于宏基因组的研究准确性和分辨率。因此,本研究中提出的基因组及其功能分析将有助于阐明人类健康与皮肤微生物之间的相互作用。
04
实验部分



道德声明

本研究获得了华大基因伦理与生物安全审查委员会(BGI‐IRB19121)的批准。本研究符合所有适用的关于人类信息和样本的伦理使用的机构规定。每位参与者被要求在参加该计划之前提供他们签署的知情同意书。

受试者招募和采样

本研究从4D-SZ队列中招募了450名健康志愿者。通过问卷调查从每个人那里获取药物和医疗史。排除过去六个月内有皮肤病史和抗生素摄入史的受试者。要求每个受试者在采样前一天和采样当天不要使用护肤品或化妆品。为了最大限度地增加皮肤微生物负荷,从每个受试者的左右脸颊采集样本。采集样本的房间保持在20°C50%湿度。根据之前报道的方法收集和储存样本。

DNA提取和样本测序

根据先前描述的MetaHIT方案进行皮肤DNA提取。[629]皮肤样本的DNA浓度由QubitInvitrogen)估算。由于皮肤样本典型的低生物负载,BGI NGS平台库使用MGIEasy Universal DNA Library Prep KitBGICat. No. 1000017571)创建。根据制造商推荐的方案,使用0.5-10 ng提取的DNA作为输入构建库。然后,在DNBSEQ-T1上用2*150 bp的成对末端读取对库进行测序。

宏基因组数据的预处理和从头组装

根据之前的描述, [6a] SOAPnuke [30]用于质量控制,bowtie2 [31]v 2.3.5.1)用于识别和删除与人类基因组参考序列(hg38)相似的人类序列。使用MEGAHIT [32]v1.1.3)对每个样本进行宏基因组读取组装,根据不同的k-mer大小(k=21,33,55,77,99)生成初始组装结果。这产生了2.26*109个不同的contigs,总长度为1.88*1011 nt(表S1,支持信息)。

宏基因组分箱和质量评估

使用bowtie2[31]v2.3.5.1),将高质量的读数映射到每个样本中的连续体,并使用MetaBAT2[33]v.2.12.1)对每个连续体进行合并。接下来,通过MetaBAT2生成了总长度为4.74*1010 nt27406bin。使用CheckM[34]1.1.2)的“lineage_wf”工作流程计算每个bin的完整性和污染度。根据完整性≥90%,污染度≤5%和完整性≥50%,污染度≤10%的标准,分别对高质量(HQ)和中质量(MQ)基因组进行分类。共获得2111HQ MAG3668MQ MAGBarrnap[35]0.9)(默认参数)用于搜索MAG基因组中的16S rRNA序列。只有10.89%629)的MAG恢复了16S rRNA(图1A和表S2,支持信息),这与之前报道的观点一致,即通过宏基因组组装难以恢复16S rRNA
为了评估皮肤物种的数量,使用dRep (v2.2.4)[36]5779MAGHQMQ)进行聚类。参数如下:“‐pa 0.9 ‐sa 0.95 ‐nc 0.30 ‐cm large从聚类过程中获得了813个推断的原核生物物种,其中549个是几乎完整原核生物物种。通过bowtie2[31]v2.3.5.1)将高质量的读数与813个推断的原核生物物种对齐,从而获得物种概况的构建。随后,使用默认参数的“jgi_summarize_bam_contig_depths”计算813个推断的原核生物物种覆盖深度的重叠群。考虑到不同样本的不同测序深度,使用归一化的重叠群覆盖深度来估计重叠群相对丰度。最后,使用同一物种内重叠群相对丰度的中位数作为物种相对丰度的度量。

分类学分类

GTDB‐Tk[ 7a ]v1.3.1GTDB数据库R05‐RS95)用于对工作流进行分类,并使用“gtdbtk classify_wf”对每个MAG进行分类。 GTDB数据库第95版涵盖了近20万个基因组,分为31 910个物种簇。GTDB‐Tk生成的蛋白质序列比对用于构建最大似然树。使用IQ‐TREE[ 37 ]v2.1.2)创建系统发育树,以说明5777个细菌(不包括两个古细菌)的进化关系。使用“ModelFinder”的贝叶斯信息准则得分自动选择最佳拟合模型。使用LG+F+R9模型构建系统发育树。使用R“ggtree”对系统发育树进行可视化。

功能特征描述

使用prodigal[38]v2.6.3)和EggNOG[39]v5.0)预测和注释了5779个基因组的蛋白质编码序列(CDS)。对于泛基因组分析,首先,使用MMseqs2算法在蛋白质水平上对MAG进行直系同源基因聚类,并使用选项“–min‐seq‐id 0.5 ‐c 0.9”(相似性50%,最短序列长度的最小覆盖阈值90%)进行。然后,使用blast[40]v2.9.0+)的blastpE值截断为1*106,比对长度至少为30%[6a])功能将每个MAG的蛋白质水平序列与直系同源基因聚类进行比较,以鉴定5779MAG的共同和特有序列。

SNV分析

共使用539个几乎完整的前原核生物物种来生成SNV目录。高质量的读数通过bowtie2[31]与几乎完整的前原核生物物种进行比对。每个样本生成一个单独的BAM文件。BAM文件和几乎完整的前原核生物物种被用作输入,InStrain[22]v1.0.0)使用默认参数(最小覆盖率为五个读数,SNP最小频率为0.05FDR1*10-6)来识别同义和非同义SNV。根据物种测序深度的同义或非同义SNV数量,校正不同样本之间的测序深度的影响,以便在不同组之间进行比较。

水平基因转移分析

MetaCHIPv1.10.4[12]使用默认参数分析了539个近完整物种水平的HGT。候选HGT基因使用了GTDB数据库[7a]中确定的分类群的结果,候选HGT基因的潜在功能基于EggNOG注释的结果。[39]

生物合成基因簇分析

使用默认参数,antiSMASH[ 18 ] (v6.0.0)DeepBGC[ 19 ] (v0.1.29)用于处理几乎完整原核物种基因组。所有潜在的次生代谢物生物合成基因簇汇总于表S8(支持信息)。基于共享基因的基因簇网络是通过BLASTP[ 40 ]搜索预测的生物合成蛋白序列建立的。共享蛋白质被定义为蛋白质比对,其中至少50%的查询序列被覆盖,氨基酸同一性>50%

统计分析学

基于非冗余蛋白质家族谱的Bray–Curtis相异性,使用ade4软件包进行主坐标分析(PCOA),以评估在门、纲、目、科、属和种水平上MAGs潜在功能基因的差异。细菌系统发育对潜在功能的影响大小通过R vegan软件包的置换多变量方差分析(PERMANOVA)进行估计。除非特别说明,否则p值由Wilcoxon 秩和检验生成。
原文链接:
DOI: 10.1002/advs.202300050

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
生物芯片在环境微生物研究中的应用
科研 | 华大:1520个人肠道单细菌参考基因组,助力菌群研究
NBT:人类肠道培养细菌的1520个基因组
9文聚焦皮肤菌群:为啥重要?受何调控? | 热心肠日报
前沿研究|16s+宏基因组binning揭示大型藻类附生微生物群落核心组成
肠道核心菌属——经黏液真杆菌属(Blautia),炎症肥胖相关的潜力菌
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服