打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
16s扩增子分析注意事项和经验总结Tips

个人1年多16s/ITS扩增子分析中积累的点点滴滴,此文适合新人了解相关零散知识,也适合有分析经验的人交流与讨论。

以下分析的经验,是以测序数据类型为Illumina HiSeq 2500产出的双端250数据类型(PE250)为基础。

  1. 扩增测序技术选择:推荐使用PE250,性价比超高;

  2. 原始数据使用fastqc质量评估,会发现数据右端末端质量较差,这是测序仪原理导致,我们在双端合并时还会利用另一端高质量序列进行校正,此处不必过分担心;


  3. 双端序列合并方法qiime中有fastq-join和seqprep可选,不必太纠结,原理非常简单事,亲测两者差别不大,用默认fastq-join较快;

  4. extract_barcodes.py提取barcode的种类很多,记得只有左端用barcode_single_end,其它全用barcode_paired_stitched,接头长度如实填写即可。

  5. split_libraries_fastq.py中过滤质量-q选20,即准确度99%; —max_barcode_errors选项是否允许barcode错配不用纠结,一般的barcode调也不支持。

  6. cutadapt去除引物需要-g/-a分两次去除,一次同时去会有很多无法去掉;

  7. 聚类OTU前先使用usearch -derep_fulllength先去冗余,不然QIIME慢到想哭;

  8. 聚类OTU推荐usearch -cluster_otus,直接高效的去除了嵌合体;

  9. 依据参考数据库去除嵌合体,推荐使用usearch -uchime_ref和RDP_gold数据库

  10. align_seqs.py和filter_fasta.py配合去除非细菌序列;

  11. biom的convert, add-metadata要学用,不仅需要格式转换,还需加添加注释信息;

  12. assign_taxonomy.py的方法有uclust, blast, rdp等,我比较感觉rdp方法注释的最全面;

  13. 多序列比对使用clustalo方便多线程快速比对;

  14. make_phylogeny.py默认使用fasttree建树极快;

  15. alpha_diversity.py计算前需要使用single_rarefaction.py进行重抽样,推荐数据量1万-3万;

  16. alpha_diversity.py常用的多样性种类,包括shannon,chao1,observed_otus,PD_whole_tree,最后一种还需要树方件;

  17. normalize_table.py将OTU-table进行CSS方法标准化,再进行beta多样性分析结果更好;

  18. beta_diversity.py常用方法有bray_curtis,weighted_unifrac,unweighted_unifrac,根据结果再选方法;

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
扩增子分析解读2提取barcode 质控及样品拆分 切除扩增引物
mothur QIIME usearch,三足鼎立,谁主沉浮?
扩增子分析解读4去嵌合体,非细菌序列,生成代表性序列和OTU表
PICRUSt:16S预测宏基因组-扩增子分析锦上添花
技术贴 | 16S专题 | 初学者如何深入解读16S rDNA扩增子测序数据,从而选择自己的分析步骤(满满干货~)
迅速提高序列拼接效率,得到后续分析友好型输入,依托qiime
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服