打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
gsea富集分析结果怎么看

我们经常借助一些文献去总结转录组的知识,今天和大家分享的这篇,是一篇二区的用到了GSEA的医学类文章。下面我就来一一讲解这篇案例用到的分析方法和思路,回答大家经常提出的一些问题,比如热图应该挑多少基因去画?GSEA怎么用的?qPCR验证要挑多少基因?

发表期刊: Journal of Steroid Biochemistry and Molecular Biology 发表时间: 2019年 影响因子: 3.785 中科院分区: 二区 研究背景: 脓毒症,是由感染引起的全身炎症反应综合征,尤其脓毒性休克是重症监护病房引起死亡的主要原因之一。下丘脑-垂体-肾上腺轴的应激反应,会提升这种病的生存可能。但患了脓毒症,又会导致肾上腺功能和结构损伤。所以这篇文章就用小鼠构建了病理模型,用转录组研究参与了脓毒症引起的肾上腺损伤过程的基因。 研究样本: 对照组小鼠仅接受生理盐水注射(Saline),野生型雄性小鼠腹腔注射大肠杆菌超纯脂多糖(LPS),诱导产生全身炎症,作为实验组(LPS)。3h,6h和24h之后,小鼠被处死并采集肾上腺用于后续研究。3h样本用于RNA-seq和qPCR验证,6h和24h仅用于qPCR验证,每组各三个生物学重复。 研究思路:
图1 文章思路 研究结果: 1 提取RNA并转录组测序

这篇文章是提取小鼠LPS诱导后的肾上腺内的RNA进行单端转录组测序,得到原始数据后,用Trim-galore去接头,HISAT2比对到小鼠的参考基因组,最后用Htseq-count进行定量,后续对鉴定到的15,317基因进行分析。

2 样本关系分析

文章方法里面写了基于变化最大的100个基因进行了无监督的层级聚类分析,判断样本的异质性。计算z-scores的值,然后基于卡方检验和欧几里得距离,进行层级聚类。这其实指的是热图里的对100个基因进行聚类分析

在结果部分,加上了计算皮尔森相关系数,分析样本间的相关性,还有PCA分析,再次确认样本离散情况。最后计算得出的相关性最低是0.83,PCA重复性也比较好(图2),综合来看样本重复性高,并不影响后续分析。
图2 样本相关系分析 Tips:常用的分析工具,Omicshare云平台都有喔,真正的省时省力工具,需要的话,可以搜索工具名称使用喔~ 云平台地址: https://www.omicshare.com/tools/ Omicshare云平台助攻——相关性热图,PCA
3. 差异分析 这篇文章由于是单端测序,所以设定阈值为FDR<0.05,counts>50。最后结果得到了8458个具有显著差异的基因,用火山图画出了4312个上调,4146个下调的基因(图3A)。然后又挑出了top100的上调和下调的基因画了热图(图3B),然后描述了一下这些差异基因包括什么,多数是和炎症反应相关的。比如显著上调的基因包括趋化因子C-X-Cmotif家族基因、C-Cmotif家族基因、促炎细胞因子、炎症介质等等。显著下调的基因包括胰岛素信号(Irs3),维持干细胞状态(FGF9)等等。
图3 差异分析结果 Omicshare云平台助攻——edgeR,火山图,热图
4. 功能富集分析 文章为了排除结论过于片面,没有用挑出的top100的基因进行富集分析,而是用鉴定到的全部差异基因进行KEGG和GO富集分析。 最后结果给出了上调基因,和下调基因分别富集的GO term和pathway。结果表明,LPS明显增强了炎症相关的通路。抑制的通路包括DNA复制和修复,细胞循环,Wnt-和Hedgehog信号,葡萄糖代谢等等通路。
图4 富集分析结果 为了验证结果的可靠性,文章从top100的上调和下调的基因中挑选了13个做了qPCR验证(上调7个,下调6个)。这些基因除了表达量显著,他们在功能上来看可能参与了LPS引起的肾上腺发育,稳态干扰或损害。 Omicshare云平台助攻——富集分析
5. 利用GSEA发现新通路 GSEA这种利用基因集去做富集分析的方式,不光可以用在转录组的分析当中,基迪奥的蛋白分析流程,也会用GSEA对鉴定到的蛋白再做GSEA分析,尽可能多的提供富集的结果。 作者利用MSigDB下载了Hallmark,GO steroid biosynthetic process和modified WNT三类基因集,对全部基因进行了GSEA。结果是在53个基因集当中,找到了26个实验组上调的26个基因集。大多数在功能富集分析里都鉴定到了,但还是找到了两个之前没鉴定的通路。包括hypoxia和Wnt通路。 结果是给出了最显著富集的Hallmark_inflammatory_response通路的ES图(NES=3.59,p=0.0,FDR q=0.0),同时做了热图,看通路内基因表达量的变化,发现大部分在LPS组是上调的,并用qPCR验证了表达量的变化。又用相同的方式分析了另外三个通路,包括steroid biosynthesis process,hallmark_hypoxia,Wnt通路。其中Wnt通路里的基因,大部分是下调的,这通路的功能是调节肾上腺的发育和再生,可以说明肾上腺确实受到了影响。
图5 GSEA和通路内基因热图分析结果 6.  qPCR验证脓毒症模型基因表达

文章用qPCR分析了6h和24h基因的表达情况,研究循环清除LPS的情况。为了研究在多菌败血症的情况,用盲肠结扎和穿刺(CLP)构建了脓毒症模型。该模型目前是研究人类脓毒症的金标准,涉及细菌及其LPS的不断释放进入循环。挑了一些与缺氧/炎症,肾上腺发育和再生通路相关的基因,进行了qPCR的研究。结果表明之前用RNA-seq挑出的这些基因,在24h的时候,表达量变化的更多了(图6)。其实这一步,就是接着验证了结果的可靠性。

图6  q PCR 验证 G SEA 鉴定到的通路中的基因表达水平 文章小结: 我们首先给文章的内容做个总结。文章通过差异分析找到了显著差异的基因约8500个,占到了所有基因的50%。又通过功能富集分析和GSEA发现了感染引起炎症反应、类固醇生成和缺氧通路内的基因上调,发育和再生相关的基因发生了下调。总的来说,文章就是用转录组分析找到了参与了全身感染引起的肾上腺功能损伤的基因。 然后,我们可以通过这篇文献,总结出几个大家常问的问题:

差异分析阈值怎么定?

文章是单端测序的结果,所以用了counts>50进行筛选,同时设定FDR<0.05。

通常测序还是会选择双端,因为组装准确性会更高。而通常选择的阈值范围是FDR<0.05,|log2FC|≥1。这个范围也是可以人为根据数据情况进行调整的,但一般FDR<0.05是必须的。

通路富集结果怎么用?

这篇文章就是从显著富集的通路(FDR<0.05)当中挑选出了一些炎症和肾上腺功能相关的一些通路和基因进行讨论。又用GSEA以基因集为单位,进一步挑选出了用阈值筛选的传统富集不能找到的通路。然后分别对这些重点关注的通路内的基因,结合表达量变化的结果进行了qPCR验证。

怎么挑基因进行qPCR验证?

主要挑表达量变化高,且变化显著的基因进行验证,再结合富集分析的结果,挑通路或基因本身功能与研究相关的。关于数量,这篇文章挑了总共十几个,上调挑几个,下调挑了几个。

文献不都是用来膜拜的,我们平时除了看大文章去拓展思路,也需要这样的小文章去总结经验。4月28日,基迪奥的在线课堂,还会给大家用Omicsmart还原数据挖掘的过程,用实际操作还原这篇转录组文章的分析思路。尤其是新上线的GSEA分析,实在是太好用了,基因集不用整理了,图形也不单调了,用就完了!
图7 在线课堂GSEA图形调整操作 欢迎大家

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
GSEA入门--原理
GSEA(Gene Set Enrichment Analysis)
浅谈GSEA分析和KEGG富集分析的异同
GSEA学习笔记
Cytoscape插件3:Enrichment Map(2)
科研 | NC:使用iDEA方法对单细胞转录组数据进行差异表达和基因富集分析
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服