打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
你知道多少火山图中隐藏的坑?

美国夏威夷,当地时间2018年5月17日-18日,基拉韦厄火山持续喷发,居住在夏威夷大岛普纳区(Puna District)的75岁老人Dona Mueller公布了一组照片,记录下她与家人撤离时的惊险画面。小编也是虔诚地双目紧闭,心中默念“上帝保佑你,阿门!”      

言归正传,现在就让小编来告诉大家火山图中的巨坑!火山图,顾名思义,因其绘制后图形的效果酷似火山而命名。火山图的本质其实是一个散点图,其横坐标为差异倍数以2为底的对数值,纵坐标为显著性水平以10为底的对数值。

每个人在使用火山图时的需要可能不一样,绘制出来的效果就不一样。小编简单汇总了部分火山图的展示效果,仅供大家参考。

火山图常被用来展示显著差异表达的基因,故而我们需要两个数据:一个是p值,即显著性;另一个是FC值(Fold Change),即差异表达倍数。注意:坑来了。p值是什么?我们都知道,在处理差异基因分析时,会给定一个显著性水平,即P value。没错,这个是可以用来绘制火山图的。而我们还知道,在进行差异分析时还有一个值,叫做FDR,即错误发现率,这个值可以用在火山图中吗?答案是肯定的。那么,问题来了,P value 和FDR用哪一个合适呢?这个地方一定要注意啦,使用哪个,不是我说了算,也不是你说了算,这个要根据数据的筛选标准来决定。注意,坑又来了。针对一套数据,我们一般情况下会拿到FC值,但是也有可能拿到很多其他的数据,比如Ratio,logFC,log Ratio。这都是什么东西,怎么会有这么多和差异相关的名词,他们之间又有什么关系呢?小编不才,用下图大致反映如上名词之间的关系,其中红色部分代表差异,而蓝色代表没有差异。是不是还没有看懂?让小编一一道来。如上所有名词都是可以相互转换的,而且log Ratio和logFC是可以等价理解的。以某基因2倍差异为例:若Ratio值为2,则FC值也为2,logFC或log Ratio为1,表示该基因2倍上调;若Ratio值为0.5,则FC值为-2,logFC或者log Ratio为-1,表示该基因2倍下调。简单的可以理解为:若差异基因上调,差异倍数等于Ratio;若差异基因下调,差异倍数等于Ratio的负倒数,以此反映类似于上调的数值差异。是不是已经晕了(((φ(◎ロ◎;)φ))),小编觉得,晕是正常的,建议仔细阅读这段话三遍以上,理解与差异相关的名词,妥妥的!

绘制火山图过程非常简单,主要包含了两个过程。一是将差异倍数转换为以2为底的对数值(log2(FC)),将显著性水平转换为负对数值(-log10(P value))(默认是以10为底的对数,也可以是以2为底的对数);二是将转换后的数据以不同的颜色通过散点图绘制的方式绘制在绘图板上,并添加阈值分割线,及横坐标和纵坐标的名称。

火山图的绘制方法有很多种。很多收费的分析软件都内置了绘图工具,如metlab,SPSS等。R语言中也有很多程序包可以免费实现绘制火山图的功能,Gene Matrix就是集成了R语言的火山图绘制功能。当然,强大的Excel也是不容忽视的。但对于一些不会写代码,又嫌弃Excel画图丑的颜控,怎么办?别担心,吉凯基因云平台帮助您,三步操作(上传数据—设置参数—提交),帮您画出心目中完美的火山图。三步操作如下:

上传数据:一列探针ID,一列p value,一列Fold Change文件格式可以为csv,tsv或txt

设置参数:在“应用说明”里有详细的参数介绍,图片可大可小,供君挑选,总有一款是你的菜;

提交:还需要小编多说吗?点击提交按钮即刻获得火山图。

火山图是个耿直boy,它可以非常直观地展现出两个样本间的差异基因,及其统计学显著性(p值)和表达水平差异程度(FC值)之间的关系,具体如下图所示。整体上来讲,火山图可以总结为以下几个特点:1、横坐标显示差异倍数;2、纵坐标显示显著性水平;3、使用差异倍数线将差异倍数超过阈值的数据与低于阈值的数据分开;4、使用显著性水平线将超过显著性水平的数据与显著性不足的数据分开。标准的火山图将所有的数据点分为了6个区域,其中C区为显著差异且上调的数据;A区代表着显著性差异且下调的数据;其他区为不显著差异的数据。不显著差异的数据具体又分为显著不差异(B)、差异不显著(D、F)、不显著且不差异(E)等不同区域。

如果所有的火山图都能够像上边的图示效果一样,那就太好了。但是,事实上坑正在等着你呢。我们在做火山图时会遇到各种各样的异常情况。下图就是一种很典型的异常情况:差异基因极少。不管是在差异倍数上,还是在显著水平上,都明显地表现出差异不足。在这种情况下,赶紧检查下自己的实验有没有问题吧。

当然,也不是所有差异基因数量少的情况都是坑。如果通过降低差异倍数,就可以获得较多的差异基因,这样的实验,还是有可取之处的。可能是你的实验处理,表现出的差异的确比较小,其在大规模检测的时候,差异表现得不明显。那么在这种情况下需要降低差异倍数,获得一定数量的差异基因,以确保后续分析的顺利进行。

下边我们就针对一些其他的异常情况详细说道说道。下图是不是感觉很诡异,为什么无缘无故成了平头鬼了,感觉像是一个坑!这种情况和数据就有非常大的关系了。火山图出现了平头,大多是显著性算法无法输出更大的浮点计算造成的。当算法无法处理时,程序就将超过阈值的值设定为了最大值,就出现了平头的情况。当然,也不是说没有其他的可能,世界之大,无奇不有,小编我也只知道这种原因。(汗颜中……)

还有一种情况,可能每一个搞科研的老师都会遇到,即上调的基因与下调的基因数量偏差太大,导致后续实验很难进行。导致这种情况发生的因素很多,比如说,RNA的降解程度不一样,使得检测结果中实验组和对照组的最终表达量不在一个数量级上,就出现了差异基因上下调数量的偏差;再比如说,实验处理对RNA的表达或者降解具有很明显的促进或者抑制作用,导致RNA表达量发生了明显的变化,影响了所有RNA的表达分布,同样会造成很明显的上下调数量的差异。具体的原因当然需要大家仔细排查实验步骤啦,小编也只能帮到这里了。

最后再说一种很少见的情况,即所有的差异基因分布在一条抛物线上。你们是否在想,这是什么鬼,怎么会有这样的火山图。小编告诉你,这是完全存在的。在nature biotechnology 2008年的一篇论文中,作者创造了一个算法(Significance A),可以针对差异倍数进行显著性水平筛选,以significance A获得的显著性水平与差异倍数绘制出来的火山图就是这么完美的抛物线。

很多人经常说,火山图一点用都没有,论文中用到的很少,是这样子吗?小编就拿出足够的证据来证明一下。根据不完全统计,从2002年到2018年火山图的使用次数呈几何式增长,在未来可能应用会更加普遍。现在火山图主要应用在plos one,sci rep等杂志,在natrue commun等高影响因子的杂志也出现很多的火山图分析。当然,随着生物信息技术的快速发展,火山图的应用将越来越广泛。在此,小编吐血推荐吉凯基因的Gene Matrix云平台,完美的火山图分析,你值得拥有!

火山图大家学会了吗?想要快速上手,就来注册我们吉凯基因的Gene Matrix云平台吧, 成功注册的用户可以获赠1000积分。这里的1000积分,相当于实打实的100元人民币!当您在吉凯基因下单生物信息分析服务的时候即可通过积分进行现金抵扣,使用金额没有上限!


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
火山图Volcano Plot
excel零代码绘制火山图,解锁火山图新姿势!
火山图、热图绘制的多种打开方式,总有一款适合你……
手把手教你绘制火山图与韦恩图
火山图YYDS,我的文章又多了一张图
Origin绘制火山图(文字版)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服