对于下图,很多人都不陌生。这是大家做家族分析时常用的MEME motif图。实话说,这图不(太)好(丑)看(了),所以我就想着R语言能不能重新做这个图呢,很早以前不太会用R的时候,就想做,无奈的是,基于自己的水平而放弃了。
借着知识的不断积累,现在觉得是时候重新拾起来了。
(1)上传我们的蛋白质序列到MEME网站(http://meme-suite.org/tools/meme)
(2)下载MAST.xml文件
(3)对文件解析得到两个文件
一是每一个motif在每一条蛋白上的位置文件,二是每一条蛋白的长度
(这一步在linux中处理)
文件一:
文件二:
(4)再准备一个蛋白ID顺序文件(目的是让结果中蛋白的顺序按照你的想法输出)
文件为单列。
(5)主要使用的R包:ggplot2、gggenes、RColorBrewer
第三个包可要可不要,是为了颜色设置,如果不用这个包,默认颜色可能不太好看。
后期会整合到BItools中,本文主要为了学习而用。
有需要代码的,可以与我联系。
联系客服