打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
终于来了!传说中的Oncomine!| 【基因数据挖掘专题第十三期】


今天,我们要介绍一个全新的、大名鼎鼎的数据库

——Oncomine



为了更加形象地帮大家理解这个词,我们不妨解释为Oncology Mining顾名思义,就是挖掘肿瘤方面的生物学信息它结合了TCGA、GEO、ArrayExpress等数据库,经过一系列加工、标准化和分析后汇集而成。这有什么好处?我们平时做的芯片数据往往来自于一个或两个数据集,偶尔会因为样本的批次、平台的差异、实验的条件等因素使结果与我们预期的不一样。而这个数据库,可以让我们站在更高的一个位置来观察所有相关研究的芯片结果,这一点会在这一节讲课中会为大家展示。

另外,据统计,该数据库收集了约500种肿瘤的基因表达样本数据。意味着无论你是研究什么方向,只要是肿瘤方面的,在这里都能找到属于你自己的菜。最后的最后,告诉大家的是,oncomine可以进行在线分析,这对于我们一些非生物信息学专业的同志们来说是个极好的消息。那废话不多说,我们还是来点实实在在的干货。

首先打开主页:

https://www.oncomine.org/resource/login.html

第一步我们就需要进行账号注册,这里需要提醒大家的是,注册过程中需要非营利性机构的邮箱(大学或研究机构),类似QQ、新浪邮箱是不接受的。其他步骤大家只要按照说明依次操作既可。

注册成功后,我们就输入账号和密码,进入下面这个界面。

在页面的左侧红色方框内是我们进行筛选的地方,主要的操作就是在这里完成的。


接下来,我们假设想验证一下EGFR这个因子在脑膜瘤中的表达情况。这时,我们得在下面的红色框内输入EGFR,并点击旁边的“放大镜”。

此时就会跳出右侧这张图,它反应了EGFR在各种肿瘤内的一个表达情况,其中红色代表高表达,颜色越深,则表达越高。蓝色就代表低表达。这个就有点类似我们之前在GEO里面学的热图。但是第一行分别表示的是不同研究中的组织对照的情况,这里分别是癌灶Vs.正常组织,癌灶Vs.癌症,癌灶亚型分析等等。


接下来我们点击上图中箭头所指的地方。得到下面这个界面。表示EGFR在神经系统肿瘤与正常组之间的一个表达情况。

方框一指的是我们的过滤条件,一般默认既可。第二个红色方框表示的是不同神经系统肿瘤与正常组的研究,按照generank由大到小排列。什么是generank?比方说第一个研究的generank为24,也就意味着在该项研究中有23个其他基因比EGFR更具有显著性。

这里由于有很多类型的肿瘤,我们假设只考虑神经胶质瘤,那么我们把所有的GlionlastomaVs. Normal都选上,进行综合分析,如下图。

然后点击compare即可。

可以很容易看到之前我们选的7个研究,EGFR都是表现为高表达的。同样地,我们可以去考察其他的亚型是否能得到相似的结果。

这里小编索性将所有神经系统的肿瘤都纳入进来,可以发现有的研究EGFR表达无明显的统计学差异,颜色上表现为白色。其他则表现为高表达。

好了,今天的内容先介绍到这里。大家是不是觉得非常简单呢?但是由于操作的界面有很多选项,所以建议大家还是自己操作一遍会印象深刻。接下去,小编还会继续跟大家分享这个数据库的其他功能,希望大家再接再厉!


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Oncomine / cBioPortal / GeneCards
“oncomine”——如何在大数据时代挖掘肿瘤数据
GEO、TCGA、Oncomine,我应该选择哪一个?
肿瘤全面分析数据库:oncomine使用介绍
单元课视频初体验:学好Oncomine,触摸肿瘤数据挖掘
做生信数据挖掘一定要会编程吗
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服