同样只做芯片测序,为何你只能发2分?因为你分析得太简单呗,只是照抄了一下测序报告。。。差异基因筛选、GO和KEGG分析,接下来PCR验证了差异表达最显著的几个基因,然后就没有然后了,是不是?
看看人家是怎么做的吧!今天给大家带来一篇Cancer Science(IF=4)上的lncRNA芯片测序文章——Expression profile analysis of long non-coding RNA in acute myeloid leukemia by microarray and bioinformatics,作者是西安交大的战友,数据已上传GEO数据库(GSE103828)。
先上流程图:
接下来一步步地剖析整个文章分析流程
1、临床样本
5位急性髓细胞性白血病(AML)患者和5位缺铁性贫血(IDA)患者的骨髓样本。
2、差异基因筛选
这部分也不必多说,测序公司的报告里都会给数据和图。mRNA和lncRNA分开分别做火山图和热图。
(文章Figure 1,差异表达10倍和2倍的分别作了聚类热图)
Circos图不知测序公司的报告里有没有给,具体的绘制方法我们之前也介绍过(以后不要再说看不懂Circos的图了!,在windows下安装Circos傻瓜版教程),大家可以自己做嘛。Circos图包含的信息量比较大(染色体位置,差异表达倍数等等各种信息都可以加进去,就看你想画几个环了),可谓文章装逼利器啊!作者同时对lncRNA的类型进行了分类(Venn图)。
(文章Figure 2)
3、功能富集分析
GO和KEGG还是要做的,先做所有差异表达的mRNA的,最显著的KEGG通路可以放一张下面C图的信号通路完整的图,D图可以用Cytoscape的ClueGO插件直接做。生信分析绘图神器,你值得拥有!ClueGO生信作图进阶技巧及实操演示
(文章Figure 3)
4、PPI网络分析
PPI网络分析属于不做白不做啊,STRING数据库现成的数据,把差异mRNA放进去跑一下就OK了。这里作者根据k-core算法对整个网络进行了分析,从中筛选出hub基因以及核心的亚网络。k-core算法怎么做?Cytoscape的MCODE插件呀~如何愉快地利用网络分析筛选关键基因
(文章Figure 4)
上面这个图C怎么搞?对应着GO和KEGG分析结果手动来也可以,但这不是我们的风格,试下STRING数据库自带的分析吧
5、共表达网络分析
WGCNA在分析lncRNA和mRNA的关系里可是利器啊!WGCNA新手入门笔记(含代码和数据),WGCNA新手入门笔记2(含代码和数据)
图里这大大小小的节点同样是根据k-core的一个评分结果
(文章Figure 5)
6、关键lncRNA分析
上图WGCNA共表达分析结果一出,就可以找找其中又大又红的lncRNA进行重点突破了。作者这里相中了那一大块里的RP11-222K16.2。先把WGCNA分析结果里与RP11-222K16.2具有共表达关系的基因拎出来,节点颜色深浅和大小同共表达关系的强弱相关(A图),再做个GO分析(B图)。C图是把差异表达超过10倍的lncRNA单独拿出来,通过具有共表达关系的mRNA的GO分析结果,对lncRNA进行功能注释。
(文章Figure 6)
这些差异表达的lncRNA再用TCGA数据库做一个生存分析
(文章Figure 7)
PCR在临床样本里验证一下
(文章Figure 8)
图A分析了在位置上RP11-222K16.2和什么基因有关,结果发现Eomes同样定位于3p24.1,图B和C分析了在AML以及其它癌症中这两个基因的相关性,结果说明确实有点关系哟,实验做下去说不定就是篇10分哦!图D和E是RP11-222K16.2具有共表达关系基因的GSEA分析结果。
(文章Figure 9)
好了,这篇芯片测序文章到这里就结束了,是不是你能想得到,文章里基本都用到了?文章整个分析,有点有面,接下去做实验也有思路,是不是棒呆?!
联系客服