打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
PacBio三代宏基因组测序大幅提升海洋水体宏基因组研究效果
期刊名:Frontiers in Microbiology影响因子:5.64
背景介绍
三代测序的读长长,但错误率较高,且宏基因组的组装软件大都是基于二代测序设计,所以在既往的宏基因组学研究中较少用到三代测序数据,然而二代测序在宏组学研究中仍存在一些技术局限,如在相似性较高的微生物组和原核基因组中,短reads的组装效果不佳。本文以冬季地中海混合水样为研究对象,深入比较二代测序与三代测序数据对宏基因组组装注释的效果。
实验设计
将PacBio Sequel II的长读长(LRs)与经典方法—使用Illumina Nextseq短读长(SRs)序列进行宏基因组研究及组装的比较。
组装方法
数据来源
组装方法
二代产生的短读长SRs
IDBA-UD
三代产生的长读长LRs
Canu和MetaFlye
二代+三代
metaSPAdes
主要结论
长读长测序技术性价比更高
在同等成本下,PacBio测序产生的原始数据可达Illumina测序数据的18倍。
更高的分类分辨率和可靠性
LRs基因片段可以提高16S rRNA的分类,减少未实现分类的reads数量(0.4% LR和1.3% SR),LRs用于宏基因组学组装可以避免组装过程中的错误,因此具有更高的分类分辨率和可靠性。
得到更优质的组装序列
结果显示,由CCS组装得到的序列优于IDBA SR(SRa),metaSPAdes CCS5获得的最大contig长度可达2.6 Mb,比SRa组装结果高一个数量级;metaSPAdes CCS5的平均contig大小也比SRa高7倍;使用metaSPAdes和CCS15池实现了最好的装配结果。
组装无偏好
通过比较LRs组装与SRa组装在门水平的分类差异来验证metaSPAdes CCS15的组装是否具有偏向性,发现这两种方法均可以有效回收所有菌门,仅存在数值上的差异,该结果证实了metaSPAdes CCS15在组装微生物基因组过程中没有产生过大偏好。
补齐经典MAGs的短板
对于外界环境中一些最普遍存在的菌,经典MAG的产出率很低,如远洋细菌(Pelagibacterales)在上层海洋水域占主导地位,但在通过宏基因组研究检索到的MAGs数量相对较少,目前公共存数据库中只有34个MAGs(中等质量,50%完整,5%污染),另一个例子是Ca. Actinomarinales ,它是广泛分布在海洋中的一种放射线细菌,公共存数据库只有7个MAGs。这种异常现象的原因尚不清楚,可能是这些微生物具有高度的序列微多样性特征。LR宏基因组组装大大提高了这两类微生物的组装效果。LRa的数据量是SRa的6倍,并且有更长的contigs,这有助于恢复完整的MAGs。
更强的基因筛选能力
为了进一步评估LR宏基因组组装注释新蛋白的能力,本研究选择了三个常用于评估宏基因组鉴定能力的蛋白:视紫质、聚酮合成酶(PKS)和CRISPR系统。
①在LR中鉴定到的视紫红质的数量最多,可以识别三个Tara装配中没有的、新的视紫红质,这表明即使是单一的样本,LR宏基因组也可以组装出新的视紫红质;
②聚酮合成酶分为三类,三个数据集筛选到类型1的数量相似,对于类型3和杂囊性糖脂合成酶PKS,LRa的筛选鉴定能力最强;
③在LR中,发现4个既包含Cas蛋白又包含完整CRISPR阵列的序列。
获得高质量、可靠的MAGs
以培养组作为参考,比较两种方法产生的MAGs的完整性情况,在LRa和SRa中检索到两种微生物基因组。SRa只有2%完整度,有6个小contigs,其中最长的为34 kb;LRa MAG几乎覆盖了整个纯培养获得的基因组,只有6个contigs,最长608 kb,占纯培养株系基因组的98%以上。
总之:LRa比之前的Illumina表现得更好,产生更大的contigs,更容易binning,因此,可以组装复原更多更完整的宏基因组数据来源的基因组,包含许多适应性基因。它可能会补充SAGs和MAGs,以获得在过去十年中发现的许多新群体的完整和可靠的基因组,提高它们的注释效果。
文章链接:
Enhanced Recovery of Microbial Genes and Genomes From a Marine Water Column Using Long-Read Metagenomics.Frontiers in Microbiology.2021DOI:10.3389/fmicb.2021.708782.
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
43只牛瘤胃宏基因组测序,超800Gb数据组装得到913个细菌基因组草图
Nat. Methods | 哈佛李恒组开发三代HiFi宏基因组组装软件--hifiasm-meta
2017/09/29 植物最新文章动态:檀香基因组,甘蔗全长转录组发布,植物中的m5c测序
一作解读 | Phasebook: 专注二倍体基因组,长 reads 从头组装单倍型
技术贴 | 宏基因组分箱(Binning)第一课——介绍和报告展示
三代测序的长读序列宏基因组
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服