听生信群里大神闲聊,说他师弟做了个TCGA可视化工具,并且有志于各种数据库的可视化,我就点开链接看了一下,不点就算了,一点开不得了,
本来我还举了个例子:
就像我手上的锤子手机,千万别用,用了就无法回头。
但是我怕你们有些人会不适应就率真地删除了。
基于TCGA数据库的网站有很多
但我最关心的功能只有三个(我是临床医生),差异表达,生存分析,相关性分析,这也是我筛选课题的一个方向
基因能够差异表达是前提,没有差异就不大可能用于诊断,也不适合当做治疗靶点
如果这个基因跟生存相关,那就锦上添花了,临床医生搞科研其实很功利的,目的只有一个,能对患者有利。
通过基因的相关性分析找出他的朋友们,所谓物以类聚,看看这个人的朋友基本上就知道他是什么样子的人。
有一个恐怖的传说一直让我后背冒汗心里起火:你的工资是跟你密切交往的6个朋友的平均值。
朋友居然重要到这个层面,所以那么多男女朋友分分合合都能理解了。
好了,不鬼扯,我们简单介绍一下这个数据库GEPIA(Gene Expression Profilling Interactive Analysis),翻译一下应该是
基因表达谱数据动态分析。
http://gepia.cancer-pku.cn/index.html
This tool is developed by Zefang Tang, Chenwei Li and Boxi Kang of Zhang Lab, Peking University.
我要学学宝剑叔叔右哉,先拟定一个让你痛心的场景,蓝后一步一步帮你解决, 这可能有助于我们直接解决问题。
假设,
你现在已经研二了,之前放浪形骸,行散神也散,现在木有课题,木有鱼丸,明年要毕业了,蓝后没有人管你,没有男女朋友,没有大师兄,没有沙师弟,你该怎么办呢?
我们可以这样,先找出某个特定癌症中跟生存最相关的一串基因,再来慢慢筛选,删选后再分析分析,就可以去灌水了,正好GEPIA有这个功能。
先点击一下Survival Analysis,依次点击
这时候相当于进入了单基因入口,这里面给出了这个基因概括,说是线粒体膜的主要组成成分,也跟铁的转运相关,我觉得都是热门方向
如果这个领域你hold不住,就返回去再换一个基因点进来,最右边图我觉得很直观,绿色代表VDAC1在正常组织的表达,红色代表在肿瘤组织中的表达
可能这张图看不出啥特殊,我举个例子,
返回一开始的界面,往下面翻一翻就会看到和这个基因表达类似的基因
VDAC1以暂时不知道的原因升高导致乳腺癌的发生,而乳腺癌患者高表达VADAC1的患者低生存。
而临床医生做科研不外乎诊和疗,就是对自己的工作有用。
从诊治的角度来说,这个基因表达水平对诊断乳腺癌有没有帮助?
从治疗的角度来说,既然高表达低生存,那么有没有可能设计抗体来治疗乳腺癌呢?
当然那个是转化医学,很遥远,在这之前就是基础医学,很多人觉得基础医学没有用,才不是呢。
从研究的角度来看:
这个基因高表达的原因是什么?表观遗传相关么,突变么,转录激活么,翻译修饰么,搞清楚就已经不容易了。
我们试一试表观遗传有没有影响,在UCSC数据库中打开VDAC1(更为严谨的做法是使用乳腺组织的Chip-seq数据来分析,以后会写ENCODE数据库),我的妈呀,他的启动子区域这么汹涌澎湃的H3K27ac修饰(这个基因的转录方向是从右到左的,所以启动子在右边),说明他的表达量本身就很高,不大可能是个坏分子,要么就是他在癌中突变了,要么就是他启动子在癌症中被过度激活了,我只是说可能
那么就会有个子课题产生:
H3K27ac组蛋白乙酰化修饰促使VDAC1基因启动子激活从而升高其表达
另外一个问题,这个基因在乳腺癌中的功能是什么?
可以尝试用生物信息学找到共表达的基因,之前已经列出来了,再去预测他可能有什么功能,
也可以直接构建慢病毒shRNA敲减后看看他的表型,
可是这不是你想要的,我们需要的是短平快,怎么办呢?查文献,
恰好我刚知道那个写过Hallmars of Cancer这篇文章老爷爷Weinberg在nature发表了一篇文章,时间是2017年3月30日(对的我清明节没有休息),他们找到了乳腺癌中一个新的抑癌基因
叫做LACTB,他能够调控脂质代谢抑制乳腺癌,LACTB是一个线粒体相关的蛋白,VDAC1也是一个线粒体相关的蛋白,他们之间可能有联系么?
他们的联系可能多种多样,我们尝试用现成的工具看一下,相关性分析
VDAC1居然跟BAX,BCL2L1相关,表明其可能跟细胞的凋亡相关
好了最终的课题就是
H3K27ac修饰使VDAC1的启动子过度乙酰化促进其表达从而抑制细胞凋亡促进乳腺癌的发展。
我觉得这时候真的可以搞一搞了,什么,你没有shRNA?
不是说了跟别人合作么,你怎么又搞忘了。
蓝后检索一下VDAC1和乳腺癌的文章,发现少之又少,燃烧吧我的小宇宙。
这个过程中好像文献阅读并不重要,但是不要忘了LACTB是Weinberg老爷爷团队的结果,所谓龙生九子,个个不同,但都是神兽呀。
LACTB在乳腺癌中的表达和调控还没有研究呢,上面那个课题要是实在弄不好,就换这一个吧。
蓝后,我觉得科研结果的呈现最基本的要求就是
四个字就是自圆其说,不要前后矛盾,你自己构建了一个体系,一定要让自己信服。
自己都不相信的东西还想让别人相信,你把我当什么了。
联系客服