生信挖掘的常用数据库GEO使用教程:
1、用必应搜索GEO(不要用百度搜,会出现一堆不相关的结果):
2、进入官网后,选择series或datasets,两种方法找到的结果不一样,比如说你搜MSI,会出现不同的数据集结果,可以都试一下以便查找自己想要的数据集:
3、找到自己刚兴趣的数据集后,我们来了解一下详情页都有哪些东西需要注意,以芯片数据为例:
Series Matrix File是表达量数据矩阵,GSE4045_RAW.tar是原始数据集。一般来说下载Series Matrix File是最方便的,但是下载完之后会有许多问题,比如说表达量来源(MAS5 ,RMA ,RPKM,FPKM,TPM还是原始的counts)?芯片对应的基因怎么置换?请听下回分解!
联系客服