功能基因多样性研究概述

本文转载自“美吉生物”，已获授权。

不知道各位从事或即将从事微生物群落功能生态学研究的大虾有没有留意到，通过功能基因扩增子测序技术研究微生物群落功能的文章，一般多会将测序获得的核酸序列通过特定软件翻译成氨基酸序列后，再进行聚类、组成、比较、差异、关联和进化等一系列分析。

比如这篇文章：

DOI:10.1038/ismej.2017.97

或者这篇：

DOI:10.3389/fmicb.2016.01894

又或者这篇：

DOI:10.1111/1462-2920.12366

那么问题来了，为什么功能基因扩增子测序可（hai）以（yao）使用氨基酸序列做分析呢？原因有如下几点：

功能生态学关注的是功能类群的多态性
对核酸序列进行有效翻译后可以进一步降低分析数据的复杂度
提高功能基因的分辨率
序列翻译过程中能够去除（矫正）4种错误序列

嵌合体序列

测序带来的插入/缺失导致的移码突变（Frame shift）

包含终止子的序列

非目的功能基因序列

因此，功能基因使用氨基酸序列分析相较于使用核酸序列分析优势尽显！

怎么做呢？Follow me！

下面小美就给大家隆重介绍一下结合科研前沿自主研发的功能基因使用氨基酸序列分析的思路！

本方案整体的分析流程如下所示

原始数据质控拼接后获得核酸序列优化数据既可以上传I-Sanger平台直接进行36项含金量十足的交互分析；也可将核酸优化序列可以翻译成氨基酸序列，后续以氨基酸序列为数据基础分别进行Unique氨基酸序列分析和OPU聚类分析等32项前沿的线下功能基因使用氨基酸分析。
Unique氨基酸序列：使用Framebot软件将核苷酸序列翻译成氨基酸序列后，去除完全重复后的氨基酸序列，直接用于物种注释和OPU聚类分析。
OPU：即Operational Protein Unit，将Unique氨基酸序列按照一定的相似性阈值进行聚类后获得的功能分类单元，挑选每一类中丰度最高的氨基酸序列作为该OPU的代表序列并进行后续各类分析。

产品结构设置

典型分析结果展示

指数组间差异检验分析

指数组间差异检验分析通过比较不同组间指数的差异显著性，进而评估不同组间微生物群落的丰度和多样性差异。每条柱子代表一个分组。两组样本比较结果（左图），多组样本比较结果（右图）。

OPU多度PCA分析

选取高丰度或感兴趣的关键OPU，在PCA分析的基础上增加OPU信息，比较该OPU在各样本中的多度（多度指群落中功能分类的频率分布）排序情况。由不同的样本向各OPU箭头做垂线，如果样本的投影点在箭头的反向延长线上，则表示该OPU在此样本中内多度小于平均值；反之，则大于平均值。

VPA分析

通过VPA分析，土壤性质（ENV）与地理因素（GEOL）两类环境因子各自单独对微生物群落变化的解释度分别为1%和23%，二者共同的解释度为12%，两者未解释的比例是64%。

Network网络分析

OPU相关性网络图中蓝色节点表示OPU，节点的大小表示OPU的相对丰度大小。两个节点间连接有线段时，表示这两个OPU存在一定的相关性，红色表示正相关，绿色表示负相关。

系统发生进化树（OPU水平）分析

选取特定OPU代表序列，并调取该序列在相应功能基因数据库中的Best hit序列共同构建系统发育进化树，进化树中每条树枝代表一个物种或OPU。进化分枝上的OPU后的括号中的数字为该OPU的丰度信息，物种进化分枝上后的括号中的数字为该物种对应序列的Accession Number。树枝上数字为bootstrap值。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。