打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
绝了!9+纯生信文章,我用15分钟零代码教你复现!老底儿都没了(附详细操作教程)


解螺旋公众号·陪伴你科研的第2520天

高分生信生信文章怎么做?

今天为大家带来一篇影响因子高达8.9分的一篇分析基因家族的生信文章,影响因子虽高,但复现难度却不大,借鉴意义非常大,性价比如此高的文章,各位看官心动不如行动,一起跟着我复现吧!


本文宏观分析了E2F基因家族,为什么作者注意到这个基因家族了呢?前期的研究证明E2F家族成员在哺乳动物的细胞周期调节和DNA合成中起主要作用,且有很多文章证明了E2F在许多恶性肿瘤中(膀胱癌,乳腺癌,卵巢癌,前列腺癌等)有表达升高现象。

但是目前没有文章研究关于E2F在乳腺癌中的生信分析,所以作者就做了以下分析,我们都知道,基础科研往往只能聚焦一个小点,进行深挖机制,而生信研究却可以多基因,多维度进行分析,因此这也是生信研究的特色,是一个很适合临床医生搞的科研方向。

本篇文章共有9张大图一张表,可以看出来本文数据量还是非常扎实的,俗话说得好:逻辑不难,就得拿数据来凑。话不多说,且往下看。


复现内容
Result1:8种E2Fs在乳腺癌中的转录水平
Result2:E2F基因水平与乳腺癌患者临床病理参数的关系
Result3:E2F表达与乳腺癌患者预后的关系
Result4:对乳腺癌患者的E2Fs因子及其邻近基因的功能富集分析


复现工具
 仙桃学术工具
(https://www.xiantao.love/products)
Oncomine数据库
(http://www.oncomine.org)
 K-Mplotter数据库

(http://kmplot.com/analysis/index.php?p=background)

 GEPIA2数据库

(http://gepia.cancer-pku.cn/)

 HPA数据库
(https://www.proteinatlas.org/)
 cBioportal数据库
(https://www.cbioportal.org/)
 STRING数据库
(https://string-db.org/)
 Venn数据库
(http://bioinformatics.psb.ugent.be/webtools/Venn/)
 KEGG数据库
(https://www.genome.jp/kegg/)

现在一切准备就绪,没时间解释了,快上车!跟着我一起开始复现之旅吧!

Figure 1


8种E2Fs在乳腺癌中的转录水平


在哺乳动物细胞中已经鉴定出八种E2F因子,作者利用oncomine数据库比较了这8种基因在癌和癌旁表达的差异


复现步骤:

登陆oncomine数据库 (https://www.oncomine.org/resource/main.html)

首先,在【search】这一栏输入E2F1,就会在右边展示E2F1在各个癌种中的表达情况,按照同样的步骤,将E2F2-8分别做出来,拼接到一起,即可得到figure 1。


在这里,可能不少小伙伴有些疑惑,全靠截图软件拼起来的图片,分辨率能达到杂志要求吗?众所周知,杂志影响因子越高,对图片的质量要求越高。那如何尽可能得到高分辨率的图片呢?在这里,我给大家介绍一个小神器~

不知道各位宝宝们是不是一想到截图,第一反应就是用QQ或者微信截图,虽然是傻瓜式操作,但是功能却很局限,在这里我要跟大家介绍的也是一款截图神器,但是却是可以拿来做科研的截图神器~

当我们在oncomine界面上得到E2F1在各个癌种上的表达后,我们可以自己在EXCEL新建一张表,颜色自己填进去,另存为PDF后,放在拼图软件里就是一张矢量图,无论怎么放大,都不会失真,说到这里,不少小伙伴肯定有些疑问我要怎么才把颜色填进去呢?这里我们就要用到了snipaste神器。

具体步骤如下:
1:在搜索引擎中搜索“snipaste下载“即可找到下载链接,按照提示一步步安装即可


这个截图软件功能很多,比如说可以方便标注图像(可以利用矩形,椭圆,箭头,马赛克,文字等标注),在这里我们用到的是snipaste的取色功能。

如下图所示。

第一步:按下F1(安装时默认是F1进行截屏)之后,把光标放在需要取色的框框中,下方就会出现RGB的3种颜色,我们在这里用E2F1在Bladder Cancer中做一个示例,如图所示,显示RGB的3种颜色分别为255,0,0。


第二步:我们在EXCEL画好框架后就可以进行填色,具体步骤如下图所示。

  1. 把光标放在需要填色的格子里,点击填充颜色--其他颜色
  2. 点击【自定义】,将RGB颜色填我们上一步取色到的数值,点击【确定】
  3. 这样第一个格子就填好颜色,同样的步骤做完,就可以得到一张无论放大多少倍都不会糊的高清原图啦


那研究基因家族在各个癌种中的表达是不是还有别的方法呢?

答案当然是Yes,我们的仙桃工具可以一键出(泛癌)图

复现步骤如下:
  1. 生信高级版选择【表达差异】

  2. 【非配对样本】

  3. 癌种选择泛癌

  4. 分子输入E2F1

  5. 点击【确认】,同样的,将E2F2-8用同样的方法拼接起来,即可得到Figure 1



点击查看大图,得到以下结果。


接着我们来看一下Table1是如何利用oncomine数据库做出来的,我们这里依然用E2F1做一个演示。


复现步骤如下:

首先,点击【Analysis Type】--【cancer vs. Normal Analysis】--【Breast Cancer vs. Normal Analysis】就可以看到E2F1在乳腺癌中有14个数据集,从下图数字4标的框框中,我们就可以看到Table1列出的来自于TCGA中E2F1表达倍数分别为2.734,3.216,2.088。和我们复现时的数据一模一样。

Table1还列出了除fold change以外更具体的信息,那我们可以点击进入Gluck Breast数据集中,这样我们除了知道fold change为2.545以外,右边还有更加具体的信息,比如说p-value为2.29E-5,t-test为10.681。同样的步骤做完,就可复现得到和Table 1完全一致的图。


Figure 2


E2Fs基因表达水平和乳腺癌临床病理参数的关系



本张图由GEPIA在线数据库(http://gepia.cancer-pku.cn/)得到,我们一步一步来复现:

复现步骤:

首先是A图:
  1. 打开GEPIA网址,在【enter gene name】输入E2F1,
  2. 继续点击【GoPIA】
  3. 点击【Expression DIY】选择【Profile】
  4. 输入基因【E2F1】
  5. 选择BRCA癌种
  6. 点击【plot】
  7. E2F1在乳腺癌中的表达图可直接下载,同样的步骤将E2F2-8表达图画出来拼接到一起即可得到Fig 2A


接着,我们来复现Fig 2B。

复现步骤如下:
  1. 点击【Expression DIY】选择【Boxplot】
  2. 在gene一栏输入【E2F1】
  3. 选择癌种【BRCA】
  4. 点击【plot】
  5. 图形显示出来,点击右上角的下载按钮,同样的步骤将剩下的E2F2-8补齐,即可得到Fig 2B。


关于Fig 2我们还可以利用解螺旋的生信工具来复现,图更精致,美观。
复现步骤如下:
  1. 生信工具高级版选择【表达差异】
  2. 选择【非配对样本】
  3. 选择BRCA
  4. 输入目标基因
  5. 点击确认,这样E2F1在乳腺癌中mRNA表达水平就表示好了,同样的步骤,将E2F2-8都画出来,拼接好,即Fig2B。



Figure 3


分析了E2Fs在乳腺癌肿瘤分期中的表达


E2F1和E2F3组差异显著,而E2F2,E2F4,E2F5,E2F6,E2F7,E2F8组的差异都不显著。

具体复现步骤如下:
  1. 点击【Expression DIY】选择【Stage plot】
  2. Gene一栏输入E2F1
  3. 选择癌种BRCA
  4. 【plot color】这里可以任意选成自己喜欢的颜色,文中作者选了红色,这里我们也选择红色
  5. 点击【plot】
  6. 点击下载按钮,同样的步骤将E2F2-8分析出来,拼接到一起即可得Figure 3


Figure 4


利用IHC(免疫组化)检测E2Fs蛋白在乳腺癌组织中的表达


结果显示,E2F1,E2F2,E2F3,E2F5,E2F7,E2F8蛋白的表达在乳腺癌中比在正常组织中有更高的表达。

由于作者这里是自己的抗体做的免疫组化结果,是实验操作,我们这里用HPA数据库来复现本张图。

我们来简单介绍一下HPA数据库(https://www.proteinatlas.org/),目前收录了超过26000种抗体,所有结果均有免疫组化染色,并且经过专业人员确认,准确度很高,可信度强,最重要的是免费,所以在这里我有一个建议给大家,在大家买抗体做免疫组化之前,不妨进这个网站先来看一下蛋白表达情况,让自己心里有个数~

复现步骤如下:
  1. 在这里我们依然以E2F1为例,输入基因【E2F1】
  2. 点击【Search】
  3. 选择【Pathology】
  4. 在蛋白表达里选择【Breast cancer】
  5. 会出现非常多已经染好的免疫组化片子,这个软件的优点也在于染出来的片子会配备很详细的病人信息,比如说年龄,染色的深浅程度,染色位置位于胞浆还是核,抗体信息等。
  6. 同样的步骤将E2F2-8图拼接起来即可得到Figure 4



Result 3


证明了E2F1,2,3,5,7,8高表达,E2F4,6低表达和乳腺癌患者的预有关系


作者这里用到了KM-plotter数据库
http://kmplot.com/analysis/index.php?p=background),这个数据库是一个生存分析的在线工具,最初是设计用来对肝癌中的miRNA进行生存分析,后来在此基础上进一步拓展,目前支持21种肿瘤类型,包括miRNA和mRNA的生存分析,用法很简单,我们这里还用E2F1举例,复现步骤具体如下:
  1. 点击首页【breast cancer】进入分析页面
  2. 在gene symbol这一栏输入【E2F1】
  3. 【use multiple genes】这里可以输入多个基因,批量进行生存分析,这个功能非常适合本篇文章,对E2F基因家族进行分析,这里先用E2F举例。
  4. 这里【split patients by median】可以根据基因表达量将样本分为高低两组,这里支持按照均值等多种统计量来分类,这里我们选择median分析。
  5. KM-plotter支持多种事件的生存分析,对应不同类型
RFS(relapse free survival)以复发作为生存分析中的事件,用来分析手术治疗的效果
OS(Overall survival)分析从确诊之后患者的生存时间
DMFS(Distant Metastasis Free survival)将肿瘤的转移作为生存分析中的事件
PPS(post progression survival)主要分析预后的生存情况。
  1. 这里可以个性化筛选,根据自己的需求筛选临床信息,这一步,我们本次复现不需要选
  2. 确定之后,点击【Draw Kaplan-Meier plot】可以直接出图。
按照同样的步骤,一步一步下载,拼接图片,即可得到Figure5。

在这里我们依然可以用仙桃工具进行预后的分析哦
复现步骤如下:
  1. 进入高级版仙桃工具,选择【预后分析】--【KM曲线图】
  2. 选择癌种(乳腺癌)
  3. 输入基因名称
  4. 预后参数可根据需要选择OS,DSS,PFI
  5. 点击确认,这里和文章中数据不太一致,生信工具里收录的数据更全更新一点,在这里,KM-Plotter结果和生信工具结果如何取舍的话,我建议以生信工具为准。

Result 4


对乳腺癌患者的E2Fs因子及其邻近基因的功能富集分析



本张图用到了cBioportal分析工具(https://www.cbioportal.org/)我们来简单介绍一下这个数据库,它是探索肿瘤的基因组学特征的一个数据库,是从DNA水平进行的,是对机制的进一步研究,本数据库不用注册,可免费使用。这个网站目前存储DNA拷贝数数据,mRNA,miRNA的表达数据,非同义突变,蛋白质水平和磷蛋白水平数据,DNA甲基化数据和一些有限的临床数据等。
具体复现步骤如下:
  1. 进入cBioportal,选择Breast数据集,文章中说选择了1105的数据集,但是目前从cBioportal收录的乳腺癌中只有这个Breast Invasive Carcinoma(TCGA,PanCancer Atlas)包含1084个样本复现出的结果和文章最相似,所以我们就用这个数据集进行复现。


  1. 这一步根据需要要不要选mRNA Expression,这里我们主要想看突变情况,所以勾选了前两栏
  2. 输入E2F基因家族
  3. 点击【Submit Query】
  4. 选择【Cancer Types Summary】
  5. 即可得到E2F家族在乳腺癌中的突变频率,即Fig 6A1
  6. 点击【OncoPrint】列出E2F基因家族的突变频率,即Fig 6A2

Fig 6B 作者通过RNA-seq version(v.)2 RSEM包括了Pearson校正来分析E2Fs家族的相关性。
结果表明
E2F1与E2F2/E2F4/E2F7/E2F8之间存在显著正相关性。
E2F2和E2F1/E2F7E2F8存在显著正相关性。
E2F3和E2F5/E2F7存在显著正相关性
E2F4和E2F1存在显著正相关性
E2F5和E2F3存在显著正相关性
E2F7和E2F1/E2F2/E2F3/E2F8存在显著正相关性
E2F8和E2F1,E2F2,E2F7存在显著正相关性

复现步骤如下:
  1. 点击【Co-expression】
  2. E2F1蓝色代表着分析的正是E2F1和其他基因的相关性
  3. 在搜索框搜E2F2
  4. 右边图中经过Pearson校正后为0.46
  5. 同样的步骤可以得出E2F1与E2F3-8的相关性分别为0.27,0.31,0.25,0.24,0.43,0.41,我们可以利用得到的这些数字,用EXCEL画出如Fig 6B的热图。


Fig 6C是通过cBioportal构建了和E2F家族相关性最强的50个基因,cBioportal这个功能在更新之后已经没有了,但是我们依然可以有很多办法可以得到和E2F家族相关性排名在前50的基因。

思路一:依然用cBioportal,我们利用共表达模块,对于E2F1我们取前100个相关性最强的基因,同样地,我们对于E2F2-8也取前100个相关性最强的基因,800个基因去交集,然后利用我们解螺旋非常牛的生信工具功能聚类模块做GO和KEGG分析。

思路2:利用GEPIA
复现步骤如下:
  1. 点击【similar genes】
  2. 输入基因E2F1
  3. 选择【BRCA】癌种
  4. 得到相关性排名前100的基因,同样的方法得到E2F2-8相关性前100的基因,取交集。


思路3:最最最方便的当属我们解螺旋的生信工具啦
复现步骤如下所示:
  1. 选择解螺旋生信工具的交互网络(联)模块
  2. 选择【分子相关性分析】
  3. 单基因相关性筛选
  4. 选择【乳腺浸润癌】
  5. 分子输入E2F1,点击确定,
  6. 然后我们可以在历史记录里找到【单基因相关性分析】我这里下载的是EXCEL表格,同样的操作,将E2F2-8的表格都下载完成


相关性的图如下图所示

虽然和文章给出的图有些不一致,但是掌握方法设计自己的文章思路才是最重要的,上面列出的3种通过目标基因找与之有相关性基因的方法,如果大家合理掌握,想要设计自己的生信文章,我相信也会游刃有余。

Figure 7


GO和KEGG通路富集分析



复现步骤如下:
  1. 利用我们仙桃学术工具,选择【功能聚类(圈)】
  2. 选择【GO/KEGG富集分析】
  3. 输入我们上一步得到的50个相关基因的分子列表
  4. 点击确认
  5. 我们推荐先点击【保存结果】,然后下载word三线表,结果如下图所示,这样的表格可以直接放在文章当中,但是如果我们想以图形展示的话,就再进行可视化


  1. 接着这一步进行可视化操作,依然是【功能聚类(圈)】,下一步选GO/KEGG可视化
  2. 选择上一步我们保存的结果
  3. 其他参数一般保持默认即可,点击确认
  4. 将可视化的图形保存,可直接用在文章里。即得到Figure7和Figure8两张图(作者在这里可能是为了凑图,将GO和KEGG分成两张Figure,其实完全可以放在一张图上展示,这里就看各位的心情了)


Figure 9A和9B列举了参与cell cycle通路和TGF-BETA signaling pathway通路部分基因,参与了乳腺癌的发生和发病机制。


复现步骤如下:
1. 本图是利用KEGG在线软件(https://www.genome.jp/kegg/)
我们简单介绍一下KEGG:它的全称是Kyoto Encyclopedia of Genes and Genomes(京都基因与基因组百科全书),它拥有多个子数据库,包含基因组,生化反应,生化物质,疾病与药物,以及最常见的PATHWAY通路信息。在搜索框里输入基因名
2. 在【KEGG GENES】模块下选择第一个通路(hsa1869)点进去
3. 选择【cell cycle】这个通路,我们可以惊喜的发现,这张图和作者的Fig 9A一模一样。

说到这里,小编有两句话想说,复现文章作者的数据不是目的,大家通过复现文章,了解这个方法之后,学以致用找到适合自己文章的通路,可以说成逻辑通顺,故事完整的文章才是我们的目的。


至此,本篇文章就复现完成了,有问题的小伙伴欢迎来找我讨论哦。

END

撰文丨rain
排版丨叶子


于肿瘤免疫治疗,这篇53分顶刊的重磅综述必读
我是一个医院摄像头,我看到了很多奇葩事
影响因子3分以上审稿快版面费还便宜的国产SCI

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
​2021年最新3 肿瘤GEO生信研究套路,手把手教你复现,超级详细!建议反复学习!
2区非肿瘤3 SCI套路,零代码搞定!跟我一起来复现!
仙桃学术 | 2021年6 纯生信老套路,焕发新春!亮点在这些美图上,今天教你复现!
乳腺癌免疫微环境预后
逆天!最新3 ceRNA生信研究套路,15分钟教你复现!(附详细操作教程)
文章复现丨我一个小时复现了一篇最新6+泛癌文章,套路设计太赞了!(附详细操作教程)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服