打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
带你玩转TCGA数据库

后台留言领取SCI写作秘笈!

TCGA(The cancer genome atlas,癌症基因组图谱)由 National Cancer Institute(NCI,美国国家癌症研究所) 和 National Human Genome Research Institute(NHGRI,美国国家人类基因组研究所)于 2006 年联合启动的项目, 收录了各种人类癌症(包括亚型在内的肿瘤)的临床数据,基因组变异,mRNA表达,miRNA表达,甲基化等数据,是癌症研究者很重要的数据来源。

1 TCGA Code Table

1.1 Data Levels

1.2 Portion / Analyte Codes

1.3 Sample Type Codes

1.4 TCGA Study Abbreviations

  • 01A:癌症组织

  • 01B:福尔马林浸泡样品

  • 02A:复发组织

  • 06A:转移组织

一般只留下01A样品的肿瘤组织样品做差异表达和生存分析并且对于重复样品,随机选取一个



2 表达信息VS临床信息

  • cases表示患者个数

  • files表示样品个数

TCGA数据库不是所有患者都有表达信息,有的患者只有临床信息而没有表达信息。如TCGA-LUAD数据集,RNA-seq-data中有515个cases594个files。而clinical-data却有522个cases



3 TCGA样本命名详解

在TCGA中,一个患者可能会对应多个样本,如TCGA-A6-6650可以得到3个样本数据:

  • TCGA-A6-6650-01A-11R-1774-07

  • TCGA-A6-6650-01A-11R-A278-07

  • TCGA-A6-6650-01B-02R-A277-07

一般在做TCGA数据分析的时候样本名实际上只保留到前四个元素(以”-“分割),例如TCGA-A6-6650-01。所以实际上上示3个样本一般只保留一个。

所以现在看这三个样本:
TCGA-A6-6650-01A-11R-1774-07
TCGA-A6-6650-01A-11R-A278-07
TCGA-A6-6650-01B-02R-A277-07

其区别就在于,前两个使用的是患者的冰冻组织做的测序,而第三个用的是福尔马林固定石蜡包埋组织;而前两个样本的区别在于同一组织后续使用了不同的96孔板
理解了命名规则及三者命名上的主要区别后,现在可以重点解决如何从一个患者的多个样本中挑选样本的问题了,首先排除TCGA-A6-6650-01B-02R-A277-07,因为是-01B,福尔马林固定石蜡包埋组织!剩下的两个:

  • TCGA-A6-6650-01A-11R-1774-07

  • TCGA-A6-6650-01A-11R-A278-07

先看看GDAC firehose遇到这种情况怎么解决,总结起来就是:

  1. 对RNA数据来说,Analyte为R的优先级最该,其次是R和T,而对于DNA层面的分析来说,D的优先级最高

  2. 如果Analyte相同,那就选择Portion和/或Plate值更大的。所以按照GDAC firehose的方法,最终保留TCGA-A6-6650-01A-11R-A278-07,因为其相对于TCGA-A6-6650-01A-11R-1774-07的板号(Plate)更晚。

然后是cBioPortal中的处理方式

  • 随机选择了一个,理由很简单啊,来源于同一个患者的癌组织样本差别不大。

科研路漫其修远兮,吾将上下而求索,有烦恼苦闷或者有趣好玩的事情记得告诉小助理,希望陪伴您一起成长。

踌躇满志无限期

扬帆起航正当时

科研小助理为您在线解答


点在看,SCI发到手软

    本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
    打开APP,阅读全文并永久保存 查看更多类似文章
    猜你喜欢
    类似文章
    【热】打开小程序,算一算2024你的财运
    肿瘤生物信息学相关数据库
    污出新天地
    安利一波TCGA数据可视化分析工具(含操作步骤及结果解析)
    这么好用的TCGA数据下载工具?!
    TCGA数据分析系列(一)
    沈西凌团队开发癌症大数据比较分析方法揭示癌症微生物组清晰图谱
    更多类似文章 >>
    生活服务
    热点新闻
    分享 收藏 导长图 关注 下载文章
    绑定账号成功
    后续可登录账号畅享VIP特权!
    如果VIP功能使用有故障,
    可点击这里联系客服!

    联系客服