必要的广告,还是要做的:
1. 欢迎报考现课题组(华南农业大学-园艺学院-夏瑞课题组) 后年(2019)或者三年后(2020之后)的博士(因为目测明年<2018>已经有超过三个人在等了,所以后年也不一定有空位,先预定......)
2. 欢迎真的是在做生物信息相关研究(注意,不是在公司工作)的朋友加入纯粹的生物信息相关技能和理论交流QQ群(bioinformatics*中国:276151571)
3. 欢迎华南农大,做生物信息相关研究的朋友,加入到 校生物信息技术交流群(SCAU生物信息群:257737932)
作为一个公众号,如果超过两个月不更新,似乎不是太好。然后真的是太忙了....不知为何,现在做基因家族分析的人很多,师兄师姐,师弟师妹。只要是设计到基因家族分析,总是要出图的。有个关系较好的师兄,前段时间提起了TBtools画基因结构图片,不知道怎么处理。...
虽然TBtools我本来是写给自己和所在课题组使用的,但毕竟既然其他朋友也觉得有用,有些功能怎么使用,还是写一些比较好
以下,以拟南芥MYB基因家族的可视化为例,最终得到大概这么一张图片:
下载拟南芥的GFF3文件
ftp://ftp.arabidopsis.org/home/tair/Genes/TAIR10_genome_release/TAIR10_gff3下载转录因子序列信息
转录因子序列中存在一些不必要的信息,为了方便下游分析,对ID进行简化
使用TBtools简化这些ID信息
这样既可完成得到 ID 简化之后的序列文件
基于简化的序列文件,我们提取所有转录因子的序列ID,先做一个简单的基因结构图
最基本的功能,直接展示所有基因结构信息
这样就可以得到一个最基本的图片
最基本的图片就完成了,这样的信息就太low了
我们是要搞事情的,不能满足于此,
要把结构域展示进去,才好看
于是我们做一个CDD 或者 pfam
那就CDD吧,我发现CDD似乎比pfam还全
点击进入这个链接
https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi
提交序列,进行保守结构域预测
整理CDD预测结果,整理成四列的格式
于是,一个基本草图已经生成
虽然有图片了,但是这个图片可能并不够好看,我们可以直接修改某类元件的高度,和颜色(支持取色器)
似乎看不出什么规律,因为我们没有排序
所以,TBtools支持指定序列顺序,或者基于newick树格式,
使用各种多序列比对工具 和 进化树构建工具,最后会大概得到这个文本
于是我们得到一个 可能有点信息量的图片
接下来,才是重点
手拼进化树
调整layout格式
在矢量图编辑工具,比如AI,
调整进化树方向,因为。。。各种原因,其实最好自己先不要删除文本,之后对一下
具体顺序
拼合进化树和基因结构图片(含结构域和phase信息)
可以发现,同一个分支的序列 基因结构(内含子,phase)
点击跳转即将离开的课题组主页...[http://pineappledb.xyz]
点击跳转即将加入的课题组主页...[http://xialab.scau.edu.cn/]
相关历史推送:
联系客服