打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
找不到差异基因?这个憨憨版在线分析工具了解一下

生信文章复现so easy!





基因差异表达分析,作为根据基因表达矩阵进行生物信息学分析的第一步,有助于我们观察基因在不同样本中的表达差异,从而确定要研究的基因和表型之间的联系,是最常见的生信数据挖掘分析策略之一。

虽然GEO数据库提供了官方在线工具GEO2R,用于比较2组或多组样本以获得差异性表达的基因,但该工具主要是对系列数据(series)进行分析,并非所有系列数据都能用GEO2R工具进行分析,比如测序数据就不能使用GEO2R,对于这类数据,工具栏中的“Analyze with GEO2R”按钮不会显示。

对此,小编给大家推荐一款憨憨版GEO数据在线分析神器——NetworkAnalyst,其操作过程非常简单,方便无生物信息背景的小伙伴们用以挖掘数据。


NetworkAnalyst是一个基因表达谱和荟萃分析的可视化在线分析平台,集成了先进的统计方法和创新的数据可视化系统,可以进行差异分析和对差异分析结果进行功能分析和网络分析。

而本文将以一篇单数据集生信分析的SCI论文为例,并按照文献中的分析思路使用NetworkAnalyst在线工具进行差异分析重现文献中的结果。


所选择的论文是2018年发表在BioMed Research International的一篇生信分析论文;原文的数据来源于GEO数据库GSE50161,文献使用了其中47例样本,包括实验组:34例胶质母细胞瘤患者脑组织样本;对照组:13例癫痫儿童患者脑组织样本。


原文使用的差异分析平台是R语言,筛选标准为adj p<0.05 and |log-foldchange|>2。原文总共筛选得到1913个显著差异基因,其中776个上调基因,1137个下调基因。


接下来,我们将使用NetworkAnalyst数据库筛选差异基因。首先我们在GEO主页检索GSE50161,再进入GSE50161的页面后采集必要信息:如物种、数据类型、数据分析平台等。


点击Series Matrix File(s),下载TXT格式基因表达文件,按照NetworkAnalyst的数据格式提取信息得到基因表达数据(如图所示)。


然后从基因表达值文件中提取信息得到符合NetworkAnalyst要求的表格,然后另存为制表符分隔的文本文件。


打开NetworkAnalyst网站,点击GENE EXPRESSION Table,根据数据来源设置合适的参数,然后选择已经格式化的数据文件,提交成功后点击下一步。


质检结果显示该数据有47个样本,1种实验条件(Control和GBM);箱式图结果显示47个样本之间存在一定的差异,但是差异不大,点击下一步。


因为本数据已经过log2对数转换处理,因此过滤和归一化都选择“默认”,点击提交,提交成功后点击下一步进入差异分析阶段。


又因本数据集是芯片数据,所以统计方法选择Limma;本研究只有一个实验条件,所以主要因素选择“CLASS”即可。

比较方法选择“特定两组比较”,这里一定要注意:实验组在前,对照组在后,否则差异倍数的正负关系就会出错。设置完成后提交,然后点击下一步。


这里筛选标准与原文中的一致:adj p value<0.05 and |log2-foldchange|>2。

提交成功后,分析结果显示:2053个基因显著差异表达;这与原文中1913个差异基因存在一定的出入,我们猜测可能是由于过滤条件的差异造成的。

点击“Download Results”,下载CSV格式的差异分析结果。


差异分析后点击“Proceed”,进入分析概览页面,在分析概览页面点击Volcano plot,进入火山图分析结果页面。


其中灰色代表不符合筛选标准的基因,红色代表上调基因,绿色代表下调基因。

点击火山图单个基因,Gene View可以查看该基因表达的箱式图;在Enrichment Analysis中可选择基因子集,选择查看全部显著差异基因、上调基因或下调基因;然后选择感兴趣的数据库,单击提交进行功能富集分析。

点击下载按钮,即可下载svg格式火山图。


返回到分析概览页面,点击ORA heatmap clustering 进入ORA热图聚类结果页面。在菜单栏设置合适的参数后,右键点击热图另存为png格式到电脑即可。


然后使用Adobe Illustrator软件拼接热图和火山图,可复现文献中结果。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
干货分享!新一代基因表达分析神器NetworkAnalyst
简单粗暴,GEO的R语言分析工具
零代码差异表达分析工具:GEO2R
清清凉凉的GEO挖掘工具
GEO多套数据如何合并进行分析?(之二)
手把手教你GEO数据库表达谱差异基因分析(下):GEO2R
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服