打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
停止用DAVID做GO和KEGG等分析
​原文转自 质谱和蛋白质组学

不管是核酸类组学还是蛋白质组,我们再发表的文章中,以及硕士、博士毕业论文中,包括很多中文学位论文中,大量的人依旧在使用DAVID做生信分析(GO、KEGG等)。不可否认的是,DAVID的功能丰度和易用性上确实很出众,但是好不好用只是一个次要的东西,更重要性的东西是:它准不准?

 

在这里,准不准的核心要素就是数据库更新的及时还是不及时。

 

DAVID的更新不是很及时:

                            

我们惊讶的发现,从2010年年初一直到2016年10月,接近7年的时间里,DAVID一直没有更新数据库。可想而知,在这七年的时间里,那些用DAVID做生信分析的组学文章里,有多少结论是错误的,漏掉了多少有价值的信息。

 

那么,为什么DAVID会突然在16年10月更新数据库呢?因为被骂了。


16年9月有人在《Nature Methods》上发文章痛批以DAVID为代表的工具误人子弟。

 

……

 

不过即便是16年10月的更新,依旧是老旧的,因为KEGG从12年开始就不再提供数据库的下载,日本人也不是无限的财大气粗。至于GO数据库,目前的两大GO数据库来源,Amigo和QuickGO,可是一直在更新数据库。而DAVID的GO数据库还停留在16年10月。

 

这里多说一点,如果你研究的是蛋白质组,我建议做GO的话还是用QuickGO的数据最好,我不太建议使用GO官网数据库。至于为什么,以后本公众号会有一篇专门的文章阐述。

 

既然DAVID的数据库更新不及时,那么,用什么工具好呢?目前,我认为最好的工具是基于R语言的ClusterProfiler(后续我会写多篇文章介绍ClusterProfiler的使用,包括数据库的构建)。

 

在16年9月的那篇《Nature Methods》里,作者统计了2015年发表的3900篇文章,其中有67%的文章使用了过时的数据库工具,与最新的数据库分析结果相比,这些工具的数据库结果只覆盖了26%的真实值。

 


在2015年,DAVID以接近80%的引用率独占鳌头,这真是令人无语凝噎。不过上图中哪些矮的柱子并不都是更新及时的(这里不是DAVID批斗会),42%的web工具都至少5年没有更新了。半年内更新过的只有g:Profiler和PANTHER。

 

在2009年 —— 2016年间,GO和Reactome的数据条目更新了超过2倍,针对基因的精准注释程度提高了接近3倍,而软件自动注释的比例下降了2倍多,没有被注释的基因也下降了2倍多。

在那篇《Nature Methods》中,作者使用75个GBM(glioblastoma)基因分别利用老旧的DAVID以及最新版的数据库进行GO和Reactome【建议大家以后不要盯着KEGG不放,KEGG是做小分子代谢物起家的,虽然KEGG也在蛋白上的数据库构建的也不错,其实Reactome做蛋白类分析更适合一些】富集分析。


结果发现,在最新版数据库的富集结果中,增加了很多有意义的通路,比如glucosesignaling pathway(帮助肿瘤细胞抵抗饥饿)、免疫反应类通路(现在免疫治疗这么火)、Notchpathway(其中的g-secretase inhibitors正在进行临床试验)。

 

综上,使用老旧的工具或者数据库做功能分析丢失了相当多的有意义的结果。


原文链接:https://mp.weixin.qq.com/s/CbVHE2ZADIrrYAOnumnRgA


参考文献:

Wadi L, Meyer M, Weiser J, et al. Impact ofoutdated gene annotations on pathway enrichment analysis.[J]. Nature Methods,2016, 13(9):705.

Yu G, Wang L G, Han Y, et al. clusterProfiler: anR Package for Comparing Biological Themes Among Gene Clusters[J]. Omics AJournal of Integrative Biology, 2012, 16(5):284.

Huang D W, Sherman B T, Lempicki R A. Systematicand integrative analysis of large gene lists using DAVID bioinformaticsresources.[J]. Nature Protocols, 2009, 4(1):44.

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
SCIENCE文章用了DAVID被吐槽
零代码功能富集分析(DAVID数据库、KOBAS数据库使用教程)
富集分析DAVID、Metascape、Enrichr、ClueGO
我想做信号通路分析,但我就是不想学编程
DAVID跟R包注释的差异浅析
使用clusterProfiler进行GO、KEGG富集分析(有参情况)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服