长链非编码RNA(long non-coding RNA,lncRNA)是指长度大于200 个核苷酸的不参与蛋白质编码过程的DNA 转录产物。
近年来, 这类lncRNA 在表观遗传、转录及转录后水平上调控基因表达方面的研究比较广泛,已获得较为深刻的认知。最近人们认识到lncRNA 在许多的生理、病理途径中发挥着一定的作用,比如干细胞全能性、神经生长分化与肿瘤发生等。
生命科学研究中非编码调控RNA可谓是研究最火的领域之一,大量lncRNA数据不断积累和各种资源数据库被开发出来,使我们更加方便地查询和研究。
数据团队整理相关文献总结出了24个数据库和工具。接下来我们会对每个数据库和工具进行一个简短的总结,并提供相关的链接和文献。
1. Noncode
NONCODE v4是一个全面的综合注释数据库,数据由二代高通量测序技术产生,涵盖所有类型ncRNAs,(除了rRNAs and tRNAs)。
NONCODE的优势之处在于其ncRNA注释,提供编码能力评估,位置信息,表达信息和潜在功能以及共表达等信息。另外它还对先前的基因芯片数据重注释,以获得更多的lncRNA表达信息。
http://www.noncode.org
2. LncRBase
LncRBase是一个基于特征序列(如CGIs和重复序列)来分析IncRNA功能的注释数据库。
2015年11月,LncRBase收录了83201个鼠的和133361个人类的ncRNA转录本,分析内容包含“lncRNA-ncRNA互作”或“Alu repeat elements”结果。
http://bicresources.jcbose.ac.in/zhumur/lncrbase/
3. lncRNome
lncRNome是专门收集人类lncRNAs信息的知识数据库,包括疾病、表达、生物功能和表观遗传等相关信息。
http://genome.igib.res.in/lncRNome/
4. NRED
NERD是一个发育和分化相关的基因芯片数据库,包含各种组织特异表达的lncRNA。
用户可以在特定的器官,部位和细胞中查询lncRNA的表达情况。
http://nred.matticklab.com/cgi-bin/ncrnadb.pl
5. C-It-Loci
C-It-Loci收录了来自人类、鼠和斑马鱼的组织特异性IncRNA数据库。它考虑了lncRNAs序列的保守性,能使用物种间保守性区域或位点来识别相关
lncRNAs。
http://c-itloci.unifrankfurt.de
6. Co-LncRNA
Co-LncRNA提供了lncRNAs共表达、GO注释和KEGG通路的富集分析结果。数据主要来自细胞系和人类样本的RNA-Seq实验数据。
http://www.biobigdata.com/Co-LncRNA/
7. LNCipedia
LNCipedia是一个人类lncRNA转录序列和结构的注释数据库,使用二级结构信息建立了一个标准统一的分类和命名体系。
lncRNA信息包含编码能力评估,预测开放阅读框和二级结构等信息。
http://www.lncipedia.org
8. LncRNA2Function
LncRNA2Function是一个lncRNA功能注释的数据库。LncRNA2Function注释了来自GENCODE数据库的lncRNAs,结果包含通路注释和GO注释。
http://mlg.hit.edu.cn/lncrna2function/
9. lncRNABase (starBase) v 2.0
Starbase是一个lncRNA与其他分子相互作用的数据库。主要使用CLIP-seq和CLASH等实验数据来支持mRNAs,miRNAs,RNAs,蛋白质和其他各种类型
的ncRNAs之间的相互作用。
http://starbase.sysu.edu.cn/mirLncRNA.php
10. lncRNAdb
LncRNAdb是一个真核生物的lncRNA综合数据库。数据库包括特异的序列结构信息,如转录本、基因组位置、表达、亚细胞定位和保守位点以及相关的功能和疾病。
http://www.lncrnadb.org
11. fRNAdb
fRNAdb结合了SRE和CGI信息以及表观遗传学数据(甲基化、组蛋白修饰),以提高lncRNA的准确性。
http://valadkhanlab.org/database
12. Linc2Go
Linc2Go是一个lncRNA的功能注释数据库,它基于ceRNA假说,即假设lncRNAs与microRNAs相互作用来抑制mRNA的转录,从而预测lncRNA功能。
http://www.bioinfo.tsinghua.edu.cn/liuke/Linc2GO/
13. ChIPBase
在哺乳动物中存在大量高度保守的lncRNA,这些lncRNAs可能具有调控细胞功能的作用。coding/non-coding gene co-expression(CNC)预测是一种基于网络拓扑和特征来预测lncRNAs可能的功能。
ChIPBase使用染色质免疫沉淀结合深度测序(ChIP-seq)数据来连接lncRNAs与表观遗传因子,并且整合了转录因子(TF)-lncRNA、TF-miRNA TF-miRNA-miRNA和TF –ncRNA等调控关系。
ChIPBase结合转录因子结(TFBS)的组织特异表达谱来预测TF与lncRNAs作用关系,来阐释其在转录调控,染色质重塑和组蛋白修饰中的关键作用。
http://deepbase.sysu.edu.cn/chipbase/
14. lncRNASNP
lncRNASNP是一个SNPs对lncRNA以及结合miRNA能力的影响的信息数据库。LncRNASNP提供结合位点,自由能能和互作的结合分值。
此外,LncRNASNP提供了单个SNPs对lncRNA的二级结构影响的可视化示意图。
http://bioinfo.life.hust.edu.cn/lncRNASNP/
15. LncRNADisease
LncRNADiseas是收集各种实验验证的与lncRNA相互作用的信息数据库(蛋白质、RNA, microRNA,DNA…),通过对疾病的聚类和序列的保守性(SNP的
分布密度)来预测lncrna与疾病的相关性。
http://www.cuilab.cn/lncrnadisease
16. Lnc2Cancer
Lnc2Cancer是人工收集1500多篇已发表的论文,提取了531个lncRNAs与86种癌症相关的1057个作用关系。数据库包含lncRNA在癌症中的表达水平(上升或下调)。
http://www.biobigdata.com/lnc2cancer/home.jsp
lncRNA相互作用分析
17. ncFANs v2
ncFANs是一个用于注释基因芯片中包含lncRNAs的分析平台,它通过蛋白与lncRNAs共表达(CNC)网络来注释lncRNAs的功能。
http://www.bioinfo.org/ncfans/
18. lncRNAtor
lncRNAtor是一个包含表达谱,ncRNA-蛋白结合和进化分值和编码能力注释的LncRNA序列的数据信息平台。LncRNA-蛋白结合是lncRNAtor一个特有功能。
此外,lncRNAtor提供了一个器官、癌症、药物、组织和发育阶段等RNA-Seq数据的整合分组。
http://www.bioinfo.org/NPInter/lncPro.htm
19. lncPro
lncPro工具是一个为数不多的专门用于预测lncRNAs和蛋白质相互作用的工具。
与lncRNAtor通过使用差异表达数据来确定结合作用不同,lncPro是使用机器学习的模型,通过对lncRNA二级结构、氢键倾向和范德瓦尔斯力进行计算,从而对lncRNA-protein配对关系进行预测。
20. DIANA-LncBase
DIANA-LncBase是一个用于分析lncRNAs在人类和鼠中的生理和病理的影响。通过ORF方法来识别lncRNAs,并且显示lncRNA-miRNA互相作用。最后,使用序列保守性、人类lncRNA和蛋白质转录本对其进行功能注释。
http://diana.imis.athena-innovation.gr/DianaTools/index.php?r=lncBase/index
21. lncRNAMap
lncRNAMap的是一个人类lncRNAs全面整合的数据库。lncRNAMap提供lncRNA沉默干扰后的信息。
从公开的siRNA文库或siRNA-target的深度测序数据来预测miRNAs和siRNA的靶lncRNAs。
http://lncrnamap.mbc.nctu.edu.tw/php/
22. TF2LncRNA
TF2LncRNA工具月用于评估TFs与lncRNAs之间的相关性。使用超几何检验对ENCODE数据库中的ChIP-seq数据进行基因本体(GO)或通路富集的统计评估。
对于lncRNA-TFs查询,使用Benjamini-Hochberg法对于p值的统计校正。
http://mlg.hit.edu.cn/tf2lncrna/index.jsp
23. TANRIC
lncRNAs作为癌症关键分子的作用不断认识,TANRIC包含大量RNA-Seq数据集,允许通过生物学意义和药物敏感对lncRNAs临床研究进行探索。
使用20种癌症的表达谱包含TCGA和和其他独立的数据集(共计8000多个样本),TANRIC包含lncRNA的生物分子及临床信息之间的关联分析并且支持可视化,例如,热图和聚类。
http://ibl.mdanderson.org/tanric/_design/basic/index.html
24. LongTarget
LongTarget是一个来预测lncRNA-DNA结合motifs和结合位点的工具。按照6个Hoogsteen和18个反向Hoogsteen规律来分析lncRNA和DNA序结结合并预测TFO和TSS。
http://lncrna.smu.edu.cn
lncRNA分析流程
整理一下:
序号 | 数据库 | 网址 | 备注 |
1 | LNCipedia | lncipedia.org | 提供人类的长链序列和完整的注释信息 |
2 | StarBase | starbase.sysu.edu.cn | 提供人类,小鼠和线虫的基于lncRNA-miRNA-mRNA互作网络 , miRNA靶向LncRNA以及circRNA的互作网络等信息。 |
3 | LncRNAWiki | ncrna.big.ac.cn/index.php/Main_Page | 提供人类的长链序列及相关注释信息 |
4 | TANRIC | ibl.mdanderson.org/tanric/_design/basic/index.html | 提供与人类癌症相关的长链信息数据 |
5 | ChIPBase | rna.sysu.edu.cn/chipbase | 提供人类、小鼠、线虫等近10个物种的鉴定的LncRNA和注释信息以 及它的表达图谱。 |
6 | LncRNADisease | 210.73.221.6/lncrnadisease | 提供了人类的有文献支持的疾病相关的LncRNA及注释相关信息。 |
7 | DIANA-LncBase | www.microrna.gr/LncBase | 提供人类的miRNA-LncRNA的互作网络信息。 |
8 | NRED | nred.matticklab.com/cgi-bin/ncrnadb.pl | 提供人和小鼠的LncRNA在芯片数据的表达量相关信息。 |
9 | Lnc2Meth | http://www.bio-bigdata.com/Lnc2Meth/ | 提供基于文献的不同疾病中的人类lncRNA及其甲基化相关信息,以及lncRNA和DNA甲基化在不同疾病的调控关系。 |
10 | LncRNA2Target | www.lncrna2target.org | 提供人类和小鼠的经过人工校验的lncRNA与靶基因的信息。 |
11 | LncRNA2GO | bioinfo.tsinghua.edu.cn/~liuke/Linc2GO/index.html | 提供了人类的基于ceRNA的lncRNA功能注释相关信息。 |
12 | LncRNA2Function | mlg.hit.edu.cn/lncrna2function | 提供人类的基于共表达网络的lncRNA功能注释相关信息。 |
13 | lncRNAMap | lncrnamap.mbc.nctu.edu.tw/php/ | 提供了人类的lncRNA及与互作的miRNA以及表达量等相关信息 |
14 | lncRNASNP | bioinfo.life.hust.edu.cn/lncRNASNP | 提供人类和小鼠的与lncRNA关联的SNP相关信息 |
15 | lncSNP2.0 | http://210.46.80.146/lincsnp/search.php | 同样提供人类和小鼠的与lncRNA关联的SNP相关信息 |
16 | GermlncRNA | germlncrna.cbiit.cuhk.edu.hk | 提供了人类的lncRNA与哺乳动物精子发育的相关信息 |
17 | LNCediting | http://bioinfo.life.hust.edu.cn/LNCediting/lncrna | 提供具有人类的RNA编辑功能的数据信息 |
18 | ALDB | res.xaut.edu.cn/aldb/index.jsp | 提供了猪、鸡、牛的家畜的lncRNA综合性数据库 |
19 | BmncRNAdb | gene.cqu.edu.cn/BmncRNAdb/index.php | 提供了家蚕的包括lncRNA和miRNA的非编码RNA数据信息 |
20 | zflncRNApedia | genome.igib.res.in/zflncRNApedia | 提供了斑马鱼的ChIP-seq与Ribosome-seq的整合非编码RNA数据信息 |
21 | PLncDB | chualab.rockefeller.edu/gbrowse2/homepage.html | 提供拟南芥的非编码RNA数据信息 |
22 | PNRD | structuralbiology.cau.edu.cn/PNRD/ | 提供多个植物的非编码RNA综合数据信息 |
23 | CANTATAdb | cantata.amu.edu.pl | 植物(10种) 以储存和展示lncRNA(编码可能性,序列基本信息等)为主的数据库 |
24 | GREENC | greenc.sciencedesigners.com/wiki/Main_Page | 提供45种植物的lncRNA的wiki数据库 |
25 | lncReg | http://bioinformatics.ustc.edu.cn/lncreg/ | 调控数据库 提供LncRNA的调控网络和具体的调控信息。 |
26 | lncRNABase | http://starbase.sysu.edu.cn/mirLncRNA.php | 提供了miRNA调控LncRNA、假基因和circRNA的互作信息以及和ceRNA调控网络 |
27 | miRcode | http://www.mircode.org | 提供一个LncRNA靶向miRNA的调控网络图 |
28 | RegRNA2.0 | http://regrna2.mbc.nctu.edu.tw/index.html | 提供一个专用来预测转录motif、mRNA降解原件、RNA-RNA结合、翻译预测等RNA功能性motif序列的工具 |
来源:网络、freescience
联系客服