生信分析时,同一基因可能会有多种命名,如Ensembl gene ID、NCBI Entrez gene ID、Gene Symbol等。在数据分析时,常需进行各种gene ID之间的转换,如GO分析时,要将gene symbol转化为ENTREZID;芯片数据分析时,要将探针ID转化为gene symbol;利用GSEA等分析进行生物学数据库注释时,有时需要进行常见物种同源基因的转换。那有没有一键解决这些名称转换的方法呢?今天小编给大家推荐安诺云小工具,可以快速且准确地实现各种基因转换的需求~
基因有哪些名儿,你知道嘛?
Ensembl gene ID:Ensembl数据库中对基因的命名,如ENSMUSG00000000538。ENS是固定字符,表示这是一个Ensembl ID,默认物种是人,如ENSG00000143322,物种为小鼠时,则以ENSMUS开头。G表示该id指的是一个基因。00000000538为11个数字组成的编号。
用来实现基因名转换的小工具都有哪些呢?
具体功能与使用方法如下,快来体验吧
该小工具基于基因组的注释文件,将Gene ID转换为Gene Name,输出结果在Gene ID列后增加Gene Name列。其他列信息保持不变。
方法1:如果提供gtf文件,则根据提供的gtf文件进行转换。
方法2:如果不提供gtf文件,可以直接选择物种信息,填写对应参考基因组版本即可,可根据安诺的参考基因组库直接进行转换,使用更方便!
下面是这些小工具使用时的一些注意事项,快来了解一下吧~
工具名称 | 输入文件 | 适用范围 |
基因id转换为基因name | 含有Gene ID列的文件 | Gene ID列可在任意列,可参数指定;gtf文件可上传,也可不上传直接选取物种信息 |
基因id转换 | fpkm.xls或 fpkm.anno.xls | 输入文件需要有表头,且第一列为待转换基因,可以仅有一列、也可以使用第一列为基因名的文件 |
同源基因转换 | total_count.xls或 fpkm.xls或 fpkm.anno.xls | 输入文件需要有表头,且第一列为待转换基因,可以仅有一列、也可以使用第一列为基因名的文件 |
安诺云工具,意在挖掘和定义客户需求的场景,帮助客户实现“0”基础、一键式拿到分析结果,轻轻松松做分析。我们会持续推出各类场景化工具集、分析套路大揭秘……遇到问题不要怕,来安诺云工具找方法~
撰稿:蔺鑫雨
审核:姜莹
联系客服