那天突然想要挖一下数据,打开挖芯片的神器,也就是以前讲的“不要钱的Oncomine”之后。
突然发觉,卧槽,不能用了,软件无法打开了。
于是登上网站看一下,发觉Gene-E确实已经下架了,他们让大家换一个替代的网页,叫墨菲斯。
那于是我打开了墨菲斯,看了一下,呃,界面确实不太一样了。在里面居然添加了CCLE大量细胞系的甲基化还有CNS的数据,明显是和二代测序接轨了。(我想用用看,但没打开,我放弃了)
接着,我用了一些之前用在Gene-E上的芯片数据,在墨菲斯上试一下,这里有GEO上的数据和ArrayExpress上的芯片数据。这个之前都讲过怎么下载了哈,我真的懒得翻之前的贴了。
导入ArrayExpress的芯片数据,很顺畅,秒开。因为是tsv格式的,也就是写字板格式的表格。
但是当我按照原来的方法,上传GEO的DataSets数据(.gz压缩格式)的时候,却被拒绝了。
然后我打开压缩包,上传里面的Excel格式数据,也无法识别。打开Excel后发觉里面还有大量的注释行。大概是因为这个,无法识别吧。
于是我删掉了注释行,再导入,还是不行。转换成Txt格式文件导入,也还是不行。
快绝望的时候,我把删除注释行的Excel表格中的数据部分,全部复制,然后新建了一个Txt文件,把数据都bia进去,保存了一下。
然后发现这个文件比直接从Excel另存为的txt文件,小了一半。
再把这个倒入进墨菲斯,突然,就显示可以用了。
但这个墨菲斯要怎么用呢?首先,我们要对所有的样本进行一下注释,选择样本列,点击右键,选这个“注释”选项。
然后会弹出一个窗口,上面会有注释的标题,和注释的类别,那我填的就是“类型”和“肿瘤”,或者“类型”和“正常”,于是就会多出这样的类型行:
接着要分析了,选择这个扳手的按钮,然后和Gene-E一样,点Marker Selection:
选择的依据有好多种,可以用T-Test,信噪比等等,我们选最常用的就是信噪比SNR,接着点击类型,这样就是比较“正常”和“肿瘤”的差异基因了。
拉到底下,选100个基因,点击OK形成热图。
然后就出来了,和原来的Gene-E一毛一样有没有?
墨菲斯还有一个功能就是作图,做点箱状图,我们随便选一行的基因。
然后点击上面的Chart,作图按钮。
输入行和列比较类型,就可以显示这个基因的箱状图了,鼠标移上去的话,就直接能显示图上的数据,当然还能截图功能。
当然不光是箱状图,还能做一些别的,只有吧那个下拉菜单拉下去看看就好了。
…华丽丽的分割线…
李莫愁博士:其实这个墨菲斯的用法和Gene-E差不多,唯一的区别就是用的数据格式,需要是纯表格的数据,GEO的数据里还有很多冗余的注释,要把这个去掉,复制到Txt或者Tsv里才能上传。(要知道怎么样下载GEO的数据,就点这里) (要知道怎么从ArrayExpress上下载数据,就点这里)这样的话就稍微有点麻烦,不过如果这点你都嫌麻烦的话,那就只能花钱让人家来帮你挖数据了。我听说过有实验室花了三、五十万买了几个数据挖掘出来的基因的。所以,有时候挖挖数据,还是能有点意义的,起码能省钱。好了,今天就先策到这里吧。要知道这是啥网址,就还是回复“不要钱的Oncomine”吧,记得手动输入哈,复制粘贴是没用的。
联系客服