打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
超大规模宏基因组学研究思路



导读


微生物是人体的重要组成部分,人体微生物的基因数目远远超过人体自身基因数。其中,肠道微生物是人体微生物组的主体,口腔、皮肤、阴道微生物均为人体微生物组的重要组成部分。有研究表明,人体不同部位的微生物组成更是存在很大差异1


人类基因组计划完成之后,人体微生物组研究逐渐提上日程:美国国立卫生研究院于2007年底启动人体微生物组计划Human Microbiome Project, HMP)旨在通过对人体微生物遗传和代谢的整体研究,了解人体微生物组;紧随其后,欧盟于2008年初启动人体肠道宏基因组学计划(Metagenomics of the Human Intestinal Tract, MetaHIT),旨在通过对比疾病人群,解析人体微生物与健康或疾病的关系,促进人类健康。


由于微生物在代谢及免疫调节等方面的重要作用,与人体健康密切相关。所以,近年来,微生物研究也已成为各大科研机构的研究热点,微生物相关产品和应用更是层出不穷。以微生物为研究对象的宏基因组学研究也变得火热起来。


加上,近年来,高通量测序技术的快速发展,使得测序成本大大降低,大规模宏基因组研究更是得以迅速开展。作为宏基因组研究的重要工具,宏基因组鸟枪法测序技术使我们能够从基因水平、物种水平、功能水平全方位刻画微生物组;宏基因组关联分析作为宏基因组研究的一种重要分析方法,其探究微生物与多种复杂疾病如2型糖尿病、肥胖等的关系,也为疾病预防、诊断、治疗提供了新的思路。



本次特别邀请了深圳华大生命科学研究院宏基因组研究所的研究团队,结合宏基因组已有研究基础与当前宏基因组关联分析的进展,对大规模宏基因组研究思路作一总结和概述。



16s rRNA基因扩增子测序与宏基因组鸟枪法测序

不同于单一物种的基因组研究,宏基因组研究以环境样品中全部微生物基因组为研究对象,其丰富的物种多样性成为宏基因组研究的难点。


16S rRNA基因扩增子测序方法以分类学标记基因为基础,能够鉴定样品中存在的微生物种类,研究微生物与疾病之间的关系。其中,16S rRNA基因扩增子测序相关的研究表明,肠道菌群失调可能是许多疾病的关键因素然而,该方法产生的数据在低层次的物种分类水平上缺乏一定的分辨能力,加上其产生的数据缺乏功能水平的信息,此方法应用范围有限。


而随着2代测序技术的发展,宏基因组鸟枪法测序技术能够对微生物群落中全部DNA序列进行描述提供所有物种分类水平和功能通路上的基因丰度的信息,为宏基因组学相关研究的开展提供了技术支持。



非冗余参考基因集的构建

宏基因组研究中以基因谱、物种谱和功能谱来描述微生物组,下游分析均以此为基础展开。如果想让不同样品的基因丰度具有可比性,一个统一且完整的参考基因集显得尤为重要。

 

2010年,以 MetaHIT 计划为背景,覃俊杰2 等人建立了第一个人体肠道菌群非冗余参考基因集:从124个欧洲人肠道菌群中鉴定到3.3M个微生物基因,是人类基因集的300倍。【非冗余基因集去除了不同菌种之间的冗余基因以及不同样品之间共有的冗余基因。】该基因集包含了该人群队列中绝大多数的肠道微生物基因,并且大部分基因在人群中共有;此外,该研究证实了在宏基因组研究中,短序列可以用于复杂环境中基因的鉴定;并通过对肠道宏基因组和肠细菌基因组进行功能分析,为宏基因组研究确定了基本的研究思路。在此之后,大多数人类肠道微生物研究都基于参考基因集数据库进行。

 

但由于数据库构建方法以及样本来源的地域差异,不同的横向研究结果难以比较。2014年,李俊桦3 等人根据来自三个大洲、共1267个人体肠道微生物样本,结合511个肠道相关的原核生物基因组信息,构建了一个包含约9.9M个基因的高质量人类肠道微生物基因集数据库(Integrated genecatalog, IGC)(图1)。该数据库包含了绝大多数肠道微生物的基因。以此数据库为基础,该团队发现中国和丹麦人群样本的肠道菌群在物种组成和功能组成上均存在显著差异,表明地域差异可能造成肠道菌群特征的差异。

 

2016年,谢海亮4 等人对已有的9.9M IGC基因集进行了进一步更新。他们通过对250名英国成年双胞胎进行粪便菌群宏基因组测序,鉴定到约5.9M个非冗余基因,与9.9M IGC 基因集整合后建立了综合性的肠道菌群参考基因集,发现约11.4M个基因。


非冗余参考基因集的构建和完善为大规模宏基因组研究的开展奠定了基础。


图1   9.9M非冗余参考基因集构建流程



BGISEQ-500

得益于高通量测序技术的快速发展,超大规模的宏基因组研究成为必然趋势,而更大样本量的宏基因组鸟枪法测序依赖于高通量、高性价比的测序平台。


2015年,华大发布新一代测序系统 BGISEQ-500,该测序系统采用了优化的联合探针锚定聚合技术(cPAS)和改进的DNA纳米球(DNB)核心测序技术,新平台在全基因组测序、RNA-seq 及 small RNA-seq 等方面展开全面应用,相关成果陆续在 Cell,GigaScience 等高影响因子杂志刊发表5,6,7。那么 BGISEQ-500 在宏基因组研究中表现如何?


2017年,方超15 等人对新型高通量测序平台 BGISEQ-500 应用于宏基因组领域的性能进行了综合评估,并将其性能与IlluminaHiSeq 2000与HiSeq 4000平台的性能进行对比。从数据质量、基因丰度、物种丰度等方面分别对平台内稳定性及不同平台的一致性做了评估。结果显示BGISEQ-500平台内具有极高的技术可重复性,平台内的建库重复与技术重复的物种丰度相关性高达0.97(图2);跨平台间物种丰度相关性也可达到0.948 (图3),高准确度及高度技术可重复性表明 BGISEQ500 测序平台对于开展宏基因组研究具有可行性。 


图2   BGISEQ-500平台内技术重复与建库重复的物种丰度相关性


图3   BGISEQ-500与Hiseq 2000/4000跨平台的物种丰度相关性



宏基因组关联分析

宏基因组关联分析 (Metagenome-wide association study, MGWAS)是研究特定环境中的微生物,并将微生物(物种,基因)与表型关联起来的一种方法,是探究微生物群落及其功能与人体疾病相关的机制的有效的方法。

 

2012年,MGWAS 首次由覃俊杰等在探究2型糖尿病与人体肠道菌群的相关关系的论文中提出,论文还基于“不同样品种来自相同微生物组的一类基因应该有相同的丰度变化模式”这一原理提出了 MLG(Metagenomic linkage group)这一基因聚类的方法。该研究共鉴定出52,484个2型糖尿病相关的分子标记8 (图4)。


  图4   2型糖尿病肠道微生物的分类学和功能特征


图4注释
对2型糖尿病的 MGWAS 分析发现,2型糖尿病患者仅出现了中度的肠道微生物菌群失调。进一步的功能分析表明,2型糖尿病患者肠道中丢失了一些有益菌,比如产丁酸细菌,而一些条件致病菌则出现了很高的多样性。


随后 MWGAS 广泛应用于肝硬化,大肠癌,类风湿性关节炎,肥胖症等复杂疾病与肠道菌群的关联研究中9,10,11,12


2016年, 贾慧珏与王俊对 MGWAS 的技术及进展进行系统总结13(图5)


图5   宏基因组关联分析流程


图5注释

(1)实验设计,群体选择。

(2)采集人体肠黏膜,口腔,皮肤,阴道,胎盘,粪便等处的样本。

(3)对这些样本进行宏基因组鸟枪测序。经过质量控制,测序得到的序列(reads)被重新组装成更长的序列(contigs),这些contigs共同组成宏基因

  组。

(4)将contig比对到高质量的参考基因集上,可以得到基因的丰度,基因的      注释(即对基因进行形态学注释)和基因的功能信息。

(5)基于“不同样品种来自相同微生物组的一类基因应该有相同的丰度变化模    式”这一原理对宏基因组学的数据集中的基因进行聚类。基于不同的相关系数    和算法,这些聚类方法包括建立MLG,MGC或者MGS。

(6)通过Wilcoxon秩和检验,spearman’s相关系数等统计学方法,可以在物     种,基因,基因的功能单位,MLG层面,功能通路等不同层面来进行与个体     表型进行关联;

(7)对关联分析的结果进行交叉验证,控制假阳性率;如果有需要,还可进    一步进行实验验证。


2017年,采用 MGWAS 和 MLG 方法,深圳华大生命科学研究院和上海交通大学医学院附属瑞金医院的研究人员进行了肥胖相关基因的分类学研究和功能研究12(图6)。


图6   肥胖患者和正常人的MLG差异图


图6注释

研究结果显示肥胖患者菌群的物种多样性和基因丰度比正常人群偏低,拟杆菌门和厚壁菌门的比值也偏低;从功能分析来看,肥胖患者对碳水化合物的利用率升高,促炎症因子,芳香族氨基酸和支链氨基酸的产生升高


MGWAS 分析中,应用最普遍实验设计主要是 Case-control (病例对照研究)。基于 Case-control 模型的宏基因组关联分析主要可以显示肠道菌群的组成结构在健康人群和疾病人群里的差异;找到和疾病相关联的 metagenomic markers,并利用这些 marker,在一定的准确率的情况下划分疾病人群和健康人群。同时基于 Case-control 模型的 MGWAS 有其局限性,主要体现在不能明确疾病和菌群之间的因果关系,即不能明确疾病的发病机理。纵向研究、干预模型和动物模型、多组学分析等方法则显示可能有助于因果关系的探究14


基于肠道基因集的构建,以及一些相关方法学的开发,MGWAS现在已经成功应用于对多种复杂疾病生物学标志的鉴定,比如:2型糖尿病,肥胖,肝硬化,结肠癌等。未来,我们期望通过时间序列分析,多组学方法以及动物模型的构建,进一步丰富和完善我们对肠道微生态的了解。也期望 MGWAS 方法最终能为人类复杂疾病的诊断和治疗提供宝贵的信息。



参考文献


1. Huttenhower, C. et al. Structure, function and diversity of the healthy human microbiome. Nature 486, 207–214 (2012).

2. Balzola, F., Bernstein, C., Ho, G. T. & Lees, C. A human gut microbial gene catalogue established by metagenomic sequencing: Commentary. Inflamm. Bowel Dis. Monit. 11, 28 (2010).

3. Li, J. et al. An integrated catalog of reference genes in the human gut microbiome. Nat. Biotechnol. 32, 834–841 (2014).

4. Xie, H. et al. Shotgun Metagenomics of 250 Adult Twins Reveals Genetic and Environmental Impacts on the Gut Microbiome. Cell Syst. 3, 572–584.e3 (2016).

5. Huang, J. et al. A reference human genome dataset of the BGISEQ-500 sequencer. Gigascience 6, 1–9 (2017).

6. Fehlmann, T. et al. cPAS-based sequencing on the BGISEQ-500 to explore small non-coding RNAs. Clin. Epigenetics 8, 123 (2016).

7. Chen, K. et al. Methyltransferase SETD2-Mediated Methylation of STAT1 Is Critical for Interferon Antiviral Activity. Cell 170, 492–506.e14 (2017).

8. Qin, J. et al. A metagenome-wide association study of gut microbiota in type 2 diabetes. Nature 490, 55–60 (2012).

9. Qin, N. et al. Alterations of the human gut microbiome in liver cirrhosis. Nature 513, 859–864 (2014).

10. Feng, Q. et al. Gut microbiome development along the colorectal adenoma–carcinoma sequence. Nat. Commun. 6, 6528 (2015).

11. Zhang, X. et al. The oral and gut microbiomes are perturbed in rheumatoid arthritis and partly normalized after treatment. Nat. Med. 21, 895–905 (2015).

12. Liu, R. et al. Gut microbiome and serum metabolome alterations in obesity and after weight-loss intervention. Nat. Med. 23, 859–868 (2017).

13. Wang, J. & Jia, H. Metagenome-wide association studies: fine-mining the microbiome. Nat. Rev. Microbiol. 14, 508–522 (2016).

14. Gilbert, J. A. et al. Microbiome-wide association studies link dynamic microbial consortia to disease. Nature 535, 94–103 (2016).

15. Fang, Ch. Zhong H, et al. Assessment of the cPAS-based BGISEQ-500 platform for metagenomic sequencing.(submitted)


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
『锐帮读』体育运动如何强身健体,微生物组 代谢组学研究再添力证
科研 | Cell Reports:整合的宏基因组基因集揭示了对小鼠肠道微生物组的新见解
Nature:基于宏基因组测序构建人类肠道微生物组参考基因集
宏基因组学[宏基因组学]
根据16S预测微生物群落功能最全攻略
宏基因组基础知识梳理
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服