本文介绍一个简洁的批量将基因/蛋白MAP到KEGG通路中,并在通路中标记出输入的基因,并且将标记后的KEGG通路批量下载到本地的方法。
首先你需要有一个基因的ID列表/uniprot的ID列表/KO ID列表
2. 打开KEGG Mapper主页http://www.genome.jp/kegg/mapper.html,点击search&color pathway
3.将ID输入框内,或者浏览上传文件也可
4. 点击Exec后返回页面如下:
这时如果一个个点开下载会非常麻烦,尤其在基因数目较多的情况下。
5. 在web页面的空白出点击右键→查看源代码,并将代码复制到本地,保存为文本”web.txt”。
6. 首先要获得上面图片中的pathway的url:
grep args web.txt |cut -d ' ' -f 2|sort |uniq|sed 's/href=\'/http:\/\/www.genome.jp/g;s/\'//g' >list
此时list文件内容:
7. 循环下载list文件中的链接
while read LIST;do; wget $LIST;done <list
然后我们会得到很多以show打头的文件,这些文件很关键
8. 从下载到的文件中筛选png文件的地址,并将这些地址下载下来即可
while read NAME;do m=$(grep mark_pathway $NAME |grep img|cut -d ' ' -f 2|sed 's/src=\'//g;s/\'//g;s/\/tmp\//www\.genome\.jp\/tmp\//g'); wget $m; done <show*
9. OK, 到这里大功告成了!快看看吧。
生物信息数据智能网络分析平台
联系客服