打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
你真的会挑选差异基因吗?针对测序/生信分析后的海量基因,一定要用这8条筛选验证基因原则,快快收藏!
userphoto

2022.10.26 广东

关注

小云:师兄救我啊!!!我用一年时间收集的样本,然后花费了导师一大笔科研经费,做的高通量测序结果终于拿到了。可是这几千个差异表达基因,实在眼花缭乱,该怎么选择基因去验证了?

胖师兄:哈哈,这个问题我也曾遇到过,我愿称之为“幸福的烦恼”。手头没有待研究的靶基因,测序是最优解。但是测序之后,如何挑选基因又称为难题了。实际上,不止RNA-seq,包括外显子测序、各种非编码RNA测序(miRNA、lncRNA、circRNA和piRNA等)和蛋白组测序等等,都会面对基因筛选的问题,而高通量测序基因筛选的原则都是相通的

小云:有筛选原则呀,那就是说有的解了,哈哈哈,师兄果然是最胖(棒)的,快快教教我呀,刚好也能给粉丝们参考下。

胖师兄:哈哈哈,被小迷妹夸,自尊心再次得到满足,那我就从宏观到微观,一条条来说。第一条,多组学测序整合出来的数据质量,一般总是优于单组学测序结果的。比如转录组+蛋白组+代谢组,这三种测序手段基本上是一种逐级验证的关系,把这3个测序数据取一个交集,那能很大程度缩小我们的范围,提高准确率。

小云:嗯,这个我也听说过,可以说多组学整合测序除了更花钱这一个缺点之外,其它所有的都是优点,那第二条原则了?

胖师兄第二条就重要了,要从面汇聚到一条线,也就是说在机制层面,咱总得有个具体的关注点。比如我们前面分享过很多当前热点方向,像铁死亡、肿瘤免疫微环境、线粒体代谢、RNA甲基化等调控通路。这些方向可以是测序前我们就选好了,然后在数据分析时,有意识的往这些方向靠;或者根据测序出的数据具体去寻找调节通路,也就是我们通常见到的GO/KEGG分析(图1)了。

图1 GO分析示意图

小云:哦,原来还有两种方式可以选了,那感觉第二种更客观一些,是吧?毕竟结果出来是啥就是啥,我们提前去预判通路,总会出现不匹配的情况吧?

胖师兄:嗯,你想的挺对的。实际上,第三条,对于直接测序来说,我们会推荐根据测序结果去挑选富集通路;但如果因为经费或者样本问题,无法做测序,那用公共数据挖掘,我们倒是推荐先预设分子机制,通过分析来验证的

小云:哈哈,主要是师兄你讲的好,我能听明白。对了,我有个疑问,如果我打算选择20个基因来验证,我是挑选10个通路,每个通路选两个基因,还是挑选2个通路,每个通路选10个基因了?

胖师兄:我理解你的意思,不要把鸡蛋放到一个篮子里,想多选几个通路,分担风险。不过必要性不大,因为一般我们筛选的差异通路都是TOP10之内的,验证成功率一般也比较高的,与其广撒网,但都没说清楚,不如第四条,优先深入探讨1-2个通路即可,不要贪多求全

小云:嗯,了解,那对于同一个通路里,那么多基因,我又该如何筛选了?

胖师兄:这个时候就该第五条,参考PPI或者其它网络(cytohubba及MCODE插件等),筛选关键节点基因(图2)。

图2 MCODE插件寻找网络hub基因

小云:师兄果然是师兄,太厉害了。那从基因层面该考虑哪些参数了?

胖师兄:这个就相对简单了,第六条,我们可以关注差异倍数高(log2(FC)绝对值高,一般是大于1或者2,图3)+显著性高(校正P值<0.05)+基因表达绝对丰度高(至少在一个样品中的表达量RPKM/FPKM大于50)

图3 基因差异表达倍数统计(log2(FC)

小云:嗯,那具体在验证基因数量以及如何分配验证基因,还有什么建议吗?

胖师兄第七条,验证基因数量一般不低于10个,有条件的可以加到20个。毕竟还会存在成功率的问题,最终得保持8个左右验证成功的基因。至于基因的类型,我的看法如下,第八条,验证的基因不能全部是研究太多的(已成定论,创新性不足),也不能全部没有研究过(容易是阴性结果)。具体比如说验证10个基因,有3个是研究有定论的(确保有阳性结果)+5个其他疾病中有研究的(50%阳性结果)+2个没有研究过的(提高创新性)

小云:真是一场高汤满满的学习盛宴,师兄你太好了,把我所有的疑惑都解开了。走走走,去哪吃饭你随便挑?

胖师兄:师兄我这几年摸爬滚打的经验都无私分享出来了,这顿饭我该去心安理得的吃,哈哈。等你把验证实验都做完,我觉得还有一顿饭也跑不掉,你估计还会来问我,验证实验结果不理想该怎么办?这些都是我之前趟过的雷,你肯定也避免不了。

小云:好好好,那下次我们就再聊聊“验证实验结果不理想”的问题,感兴趣的小伙伴记得关注我们哦。

小云有话说

测序后的验证基因筛选,是一个综合性问题,甚至在课题设计时就开始要构思的, 同时对研究者对该领域的了解深度是一个大考验。高级生信分析以及定制化数据分析,则是我们提供给大家的尚方宝剑通过最大限度的整合公共数据整合分析、提供多种数据分析思路,在深度挖掘数据资源的同时,降低假阳性,从数千个差异基因中定位出几十个最具有价值的基因,极大助力我们的研究。我们可以提供如下服务:免费数据评估服务、付费高级生信分析以及定制化数据分析等。有需要的读者,快来咨询小云吧!

扫码咨询小云

合集

推荐

  双疾病  

  单基因 

 铁死亡 

肿瘤代谢

  线粒体自噬

铜死亡

免疫浸润

肿瘤微环境

  代码 

服务项目

生信热点文献复现

临床预后模型设计

生信&实验方案设计

数据库构建

共享1T生信服务器

35篇原创代码合集

示例报告

单基因在肿瘤中的生信分析

疾病药物代谢相关基因与肿瘤免疫、预后关系探讨

糖尿病周围神经病变铁死亡相关的基因分析

     

我知道你在看

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
候选功能基因筛选和验证集锦
转录组测序后差异表达基因太多?这4招解决你的难题
别看我,我在空调下吹牛编文章
如何挖别人的数据,写自己的标书
上手就会的功能(GO)分析和信号通路(Pathway)分析
GEO多个芯片联合分析,TCGA数据库,生存分析对差异基因验证,热图,火山图,差异表达,GO功能分析,KEGG富集通路,Cytoscape构建蛋白互作网络
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服