原创 gene diagnosis Gene Diagnosis 2022-01-15 16:40
收录于话题
在线工具一般具有“功能强大、操作简单、无需安装、用完就走”的特点,轻松实现“用别人的服务器分析自己的数据”。以下为大家整理介绍几款常用的在线分析工具:
基因结构绘制
1.Exon-Intron Graphic Maker
一个绘制基因结构的在线小工具:Exon-Intron Graphic Maker。它可以根据序列长度等比例绘制基因的结构元件,如5' UTR、CDS、外显子、内含子、突变位点、结构域、3' UTR等。
http://www.wormweb.org/exonintron
RNA二级结构
2.Mfold
一款预测和展示核酸(RNA和DNA)二级结构的在线工具。
http://unafold.rna.albany.edu/?q=mfold
3.RNAfold
RNAfold是预测序列二级结构的软件。
http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi
蛋白互作网络
4.String
是一个搜寻蛋白质之间相互作用的数据库。既包括蛋白质之间的直接物理相互作用,也包括蛋白质之间的间接功能相关性。它除了包含有实验数据、从PubMed摘要中挖掘的结果和综合其他数据库数据外,还有利用生物信息学的方法预测的结果。
https://string-db.org/
基因共表达网络
5.Coexpedia
基因共表达网络(GeneCo-expreesion Network)是用来展现基因间相互作用关系的一种手段,是基于基因间表达数据而构建调控网络图。Coexpedia目前包含大约800万个共表达基因,从384个人类GEO数据集和248个小鼠GEO数据集构建而来。
http://www.coexpedia.org/
序列Motif
6.MEME
MEME 是一款用于研究 Motif 的 组合工具套。Motif 是指在一组序列中重复出现的相似的序列模式(pattern)。MEME包含多个小工具,如 MEME、STREME、 CentriMo、 AME、 FIMO、 Tomtom 等等。MEME 工具套的功能全面,包括 挖掘 Motif(Motif Discovery)、富集 Motif(Motif Enrichment)、查询 Motif(Motif Scanning)、比较 Motif(Motif Comparison)。
http://meme-suite.org/
7.Weblogo
seqlogo图可以直观清晰的反应序列偏好特征,每个位置出现的碱基或氨基酸类型反映了该位置序列的偏好性,每个字母的大小与该碱基在该位置上的出现频率成正相关。这种表现方式对研究转录因子结合、RNA修饰等有重要指导意义,时常被应用到论文中。WebLogo绘制seqlogo的老牌在线工具。相比于在R上绘制seqlogo图,网页版在线工具更加轻松容易。
http://weblogo.threeplusone.com/
基因信息查找
8.Genecard
GeneCard是一个全面的,综合的收集所以已知的或者预测人类基因。它整合跟基因相关的基因组、转录组、蛋白质组、临床等相关信息,收集整理了超过100个网站的数据。
http://www.genecards.org
序列展示
9.ESPript
ESPript主要用于蛋白比对序列的显示。
http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi
Gene ID转化
10.BioMart
BioMart是ensemble开发的的一款方便我们批量查找、转换各种编号的神器,提供网页版和R包的调用。 其整合各现在主流的基因组、转录组、蛋白组数据库的编号信息,其中还包括同源基因的编号,比如小鼠的基因对应到人基因组的名称。
http://www.ensembl.org/index.html
11.g:profiler
g:Profiler是一个用于功能丰富分析和基因列表转换的Web服务器,与最常见的DAVID相比,速度更快,界面也更友好,交互式的画面对非生信人员也很容易操作。
https://biit.cs.ut.ee/gprofiler/convert
12.UniPort Retrieve/ID mapping
Retrieve/ID mapping工具可以实现UniProt数据库ID与其他数据库ID的互转。
https://www.uniprot.org/uploadlists/
13.bioDBnet
bioDBnet这个工具的功能还是比较丰富的,整合了大量的生物数据库包括Gene, UniProt, Ensembl, GO, Affy, RefSeq等。可以使用db2db转换gene id、dbReport查看gene信息、dbOrtho转换为同源gene的id等。
https://biodbnet-abcc.ncifcrf.gov/
韦恩图
14.Venny2.0
韦恩图又称文氏图,用来表示几个数据集之间的关系,常见于转录组分析中差异表达基因的统计结果中。这款在线版的工具最多支持4组数据的韦恩图绘制,其操作非常简单,只需要将几组数据的列表输入到相应的list中,即可自动生成韦恩图。通常我们只需要修改list名称,并将Style改成Colors,然后一张简洁美观的韦恩图就生成了。图片导出也十分简单,在图片框中点击鼠标右键-图片另存为即可。
http://bioinfogp.cnb.csic.es/tools/venny/index.html
三元图
15.Ternary plot maker
三元图在线绘制工具。
https://www.ternaryplot.com/
基因结构分析
16.FGENES
http://softberry.com/
范例结果:
系统发育分析
17.iTOL
ITOL是Interaction Tree Of Life的简称,它是一个集在线展示、注释和管理进化树的交互工具。绘图过程中可以随意调整树枝、标签的颜色、形状和字体。而iTOL最大的特点是可以同时展示不同的数据集,并按照个性化的需求控制数据集的位置、大小和颜色,并允许导出高质量的位图和矢量图。
https://itol.embl.de/
18.Evolview
Evolview可在线进行系统进化分析,简约而不简单。能够标注较复杂的注释信息,可导出多种格式的文件,包括pdf、svg、tiff、png,而且绘制完成的进化树可永久性的保存在网站里,也可进行共享。
http://www.evolgenius.info/evolview/
启动子预测
19.Promoter Scan
启动子预测的在线软件。
http://www.cbs.dtu.dk/services/Promoter/
蛋白一级结构预测
20.PredictProte
可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多蛋白质序列的结构信息。该方法的平均准确率超过72%,最佳残基预测准确率达90%以上。因此,被视为蛋白质二级结构预测的标准。
https://www.predictprotein.org/home
21.ProtParam tool
ProtParam可以计算存储在Swiss-Prot或TrEMBL中的给定蛋白或用户输入的蛋白序列的各种物理和化学参数。计算参数包括分子量、理论pI、氨基酸组成、原子组成、消光系数、估计半衰期、不稳定性指数、脂肪族指数和亲水性(肉汁)总平均值。
http://web.expasy.org/protparam/
信号肽预测
22.SignalP
SignalP是一个信号肽预测服务器,它的功能是预测给定的氨基酸序列中是否存在潜在的信号肽剪切位点及其所在,原核生物和真核生物都可以进行预测。
http://www.cbs.dtu.dk/services/SignalP/
跨膜结构域
23.TMHMM Server v. 2.0
蛋白质跨膜螺旋的在线分析工具。
http://www.cbs.dtu.dk/services/TMHMM/
亚细胞定位
24.PSORT
PSORT预测蛋白质亚细胞定位。
https://www.psort.org/
蛋白三级结构预测
25.SWISS-MODEL
SWISS-MODEL是一款用同源建模法预测蛋白质三级结构的全自动在线软件。SWISS-MODEL中一共有三个工作方式:First Approach mode:Alignment Interface mode:Project(Optimise)mode:
https://swissmodel.expasy.org/
26.Phyre2
Phyre2 分析能力强大,结果界面丰富直观,可以预测和分析蛋白质的结构、功能和突变。
http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index
短序列拼接
27.Cap3
Cap3是一款历史悠久的序列拼接软件,非常适合Sanger序列拼接。
http://doua.prabi.fr/software/cap3
蛋白结构域预测
28.Pfam
Pfam数据库是蛋白质家族的数据库,根据多序列比对结果和隐马尔可夫模型,将蛋白质分为不同的家族,进行蛋白结构域预测。
http://pfam.xfam.org/search
29.SMART
SMART (Simple Modular Architecture Research Tool),它是一个用于蛋白质结构域鉴定、注释的在线分析工具。SMART 有两种模式: normal和genomic。二者主要的区别是底层使用的数据库的不同,前者是冗余的,而后者只使用完成基因组测序的蛋白组数据。
http://smart.embl-heidelberg.de/
基因组杂合性评估
30.GenomeScope
GenomeScope工具的目的就是评估一些高复杂度的基因组,比如说高杂合度或者基因组非常大的物种。GenomeScope只能预测二倍体基因组,GenomeScope 2.0可以预测多倍体物种。基因组越大,杂合度也大,重复片段越大,物种的组装难度就越大。
http://qb.cshl.edu/genomescope/analysis.php?code=example2
圈图
31.CIRCOS
Circos图在线绘制工具。
http://mkweb.bcgsc.ca/tableviewer/visualize/
细胞标记
32.CellMarker
该数据库通过手动收集超过100,000篇发表的论文,涵盖细胞标志物信息,组织类型,细胞类型,癌症信息和来源等4,124个条目。共包含158种人类组织/亚组织(涵盖467种细胞类型,13605个细胞标志物)及81种小鼠组织/亚组织(涵盖389种细胞类型,9148个细胞标志物),旨在为人类和小鼠组织中的各种细胞类型提供全面而准确的细胞标志物资源。
http://biocc.hrbmu.edu.cn/CellMarker/index.jsp
circRNA
33. circBase
circBase 是一个环状RNA的数据库,收录多个物种的circRNA信息,采用了find_circ软件来预测去核糖体文库中的circRNA,数据库可以单个环状和列表形式对环状RNA进行搜索,还可以把全部环状RNA下下来,部署到本地服务器上面,还可以像UCSC一样使用序列进行blat比对。
http://www.circbase.org/
34. CIRCpedia
CIRCpedia是一个综合性的环状RNA数据库。
http://www.picb.ac.cn/rnomics/circpedia/
small RNA
35. deepBase
中山大学推出的deepbase数据库主要强调ceRNA分子网络互作,其中也整合了circRNA相关信息。
http://rna.sysu.edu.cn/deepBase/
36. sRNAanno
sRNAanno是一款植物小RNA注释数据库。
www.plantsRNAs.org
lncRNA
37. TANRIC
癌症非编码RNA数据库,开放访问的网络资源以交互式探索癌症中的lncRNAs。
http://bioinformatics.mdanderson.org/main/TANRIC:Overview
38. NONCODE
NONCODE DB是一款综合性的数据库,该数据库是一个比较全面的ncRNA相关注释的数据库,尤其是lncRNA信息,不仅支持常用lncRNA的name、NONCODE ID搜索,部分lncRNA支持其他数据库名字进行搜索。
http://www.noncode.org/
ceRNA
39. starBase
Starbase是做lncRNA/circRNA/microRNA等研究常用的强大数据库,Starbase可以帮我们解决这些问题:根据microRNA找非编码RNA(比如lncRNA,circRNA等);根据microRNA找mRNA靶点;查找ceRNA调控分子;查找RNA的结合蛋白;
http://rna.sysu.edu.cn/deepBase/
40. miRSponge
该数据库提供了11个物种的599个miRNA-Sponge以及463个ceRNA关系,数据来源于近1000篇已发表文章,类型包含编码基因、假基因、lncRNA、circRNA等。数据库提供浏览、搜索、下载和上传数据等功能。
http://bio-bigdata.hrbmu.edu.cn/miRSponge/
序列翻译
41. ExPASy Translate tool
在线翻译软件将DNA序列和RNA序列可直接翻译成氨基酸序列。
https://web.expasy.org/translate/
42. ORFfinder
在DNA序列中搜寻ORF。
https://www.ncbi.nlm.nih.gov/orffinder/
end
确定
联系客服