1
研究背景
(1)肾透明细胞癌 (ccRCC) 是肾细胞癌最常见和最具侵袭性的组织学亚型,目前ccRCC临床治疗方式(包括常规化疗、靶向治疗和免疫治疗)的疗效受到肿瘤异质性的限制,需要了解潜在的细胞和分子机制,以促进生物标志物的发现并指导临床干预。
(2)ScRNA-seq已被用于全面表征ccRCC的细胞组成和转录状态,揭示其起源和肿瘤内异质性,尚不清楚顺式作用DNA元件(例如,增强子和启动子)和反式作用因子(例如,转录因子(TF))如何调节微环境中的这些变化。
(3)ScATAC-seq 通过 Tn5 转座酶介导的标记识别可访问的染色质区域,并以单细胞水平的分辨率捕获活性 DNA 调控元件,与批量ATAC-seq类似,这种方法可以捕获多种类型的基因调控信息;例如,可以识别全基因组顺式作用元件,并指示TFs和有助于其活性的推断。ScATAC-seq已被广泛用于描绘发育谱系的分化轨迹并揭示关键调控要素。
2
数据来源和研究方法
(1)数据来源:
1. 从Broad Institute GDAC Firehose得到来自肾透明细胞癌的TCGA RNA-seq数据和临床信息。
2. 抗PD-1治疗ccRCC的标准化数据是从先前的研究中获得的。
3. 三个scATAC-seq数据和四个scRNA-seq数据来源于作者提供的数据资料。
(2)研究方法:
1. 从肾透明细胞癌scRNA-seq和scATAC-seq数据集中通过降维,聚类,差异表达分析,为了解释scRNA-seq数据,对两个数据集进行综合分析,scATAC-seq基因活性和scRNA-seq基因表达之间的共享相关模式由“FindTransferAnchors”函数识别,然后通过“TransferData”函数预测scATAC-seq数据中每个细胞的细胞类型标签,经过过滤、批次校正后用SLM算法聚类。
2. 通过inferCNV估计潜在肿瘤细胞群的CNV。
3. 通过Signac中的RunChromVAR推断单细胞转录因子活性结构域。
4. 通过一系列过滤鉴定出肿瘤特异性转录因子。
5. 鉴定出TF候选靶基因,利用igraph包用这些TF基因去构建细胞类型特异性TF调控网络。
6. 使用来自LINCS联盟的药物扰动谱筛选可靶向 TF 的候选药物。
3
结果
1.ccRCC中的单细胞转录和染色质可及性分析
作者首先ccRCC的单细胞RNA测序数据和ATAC测序数据进行聚类分析
图1
1)对于scATAC-seq数据Seurat的label-transfer算法和有监督方式注释细胞(图 1d)
2)通过结合这两个注释结果在scATAC-seq数据集中鉴定了12种细胞类型(图)1e, f)
3)通过典型标记基因CA9和和经典拷贝数变异 (CNV)(染色体 3p 丢失或染色体 5q 增加)来鉴定肿瘤细胞(图1c, f, g)
4)免疫细胞是数量最多的细胞群,占总细胞的70%以上,而肿瘤细胞占群体的<10%(图h)
2.ccRCC中的肿瘤特异性调控元件
作者为了研究所有细胞类型染色质可及性的差异,我们首先使用MACS212在scATAC-seq数据中对每种细胞类型的染色体可及性进行分析
图2
1)从212362个scATAC-seq 差异峰中发现10.6%在细胞类型之间表现出显著差异,这些位点被定义为差异可及染色质区域(DAR)(图2a)
2)大多数DAR位于基因组的启动子和内含子区域,并且DARs的分布在细胞类型中相对保守(图2b)
4)差异TF的分层聚类揭示了不同细胞类型之间共享且独特的调控元件(图2d)
5)选择仅在肿瘤细胞中高度富集的TFs并鉴定出49个TFs在肿瘤细胞中的活性评分显著高于任何其他细胞类型(图2e)
6)然后检查了这些肿瘤特异性TFs在TCGA队列中与患者预后的关联,肿瘤特异性TFs平均表达高的患者总生存期和无病生存期比平均表达低的患者短(图2f)
图3
1)为了进一步研究和验证这些TFs在ccRCC中的生物学功能,选择了四种TFs(HOXC5,VENTX,ISL1和OTP),其表达水平与TCGA-KIRC数据集中较差的总生存期显著相关(图3a)
2)为进一步了解TF介导的肿瘤细胞基因调控,构建了TF调控网络,发现这四个TF调节多个肿瘤特异性基因在肿瘤细胞中的表达显著增加(图3b)
3) 进行实验验证,敲低这些TF显著减少了肿瘤细胞增殖并增加了细胞死亡(图3c,d)
4) 寻找靶向这些TFs的潜在药物,发现FDA批准的两种候选药物(高三尖杉酯碱(HHT)和米妥坦)可以显著降低HOXC5,ISL1和VENTX的表达水平(图3e)
5) 实验验证,两种药物都显著降低了肿瘤细胞的增殖率以及两种肾癌细胞系中HOXC5,ISL1和VENTX的表达水平(图3f-j)
3.ccRCC内的恶性转录程序
图4
1) 成对相关性分析揭示了这些肿瘤中始终存在的多种不同的转录状态(图4a)。
2) 为了更精确地了解肿瘤的异质性信息,我们应用非负基质分解(NMF)来定义了11个肿瘤内程序,又通过分层聚类确定了两个元程序,它们在四个样本中包含了高度相似的程序(图4b)
3) 通过通路富集分析研究了这些元程序的生物学功能(图4c)
4) TCGA-KIRC队列中每个元程序的平均基因表达与患者预后之间的关联(图4d,e)
5) 进一步探讨了元程序与之前发现的四种肿瘤特异性TF之间的调控关系。在元程序1中,四个TF都表现出与VEGFA的作用关系,在元程序2中,肿瘤细胞中的DEGCRYAB由所有四个TF调节(图4f,g)
4.ccRCC中的CD8 T细胞聚类分析
作者接下来为了更好地阐明肿瘤浸润CD8 T细胞的异质性,进一步研究了scRNA-seq和scATAC-seq数据集中的CD8 T细胞亚群。
图5
1)在scRNA-seq数据集中确定了四个主要细胞簇,在scATAC-seq数据集中确定了五个主要细胞簇(图5a,b)
2) 在scRNA-seq和scATAC-seq数据集中基因表达或功能标记的热图(图5c)
3) 使用多个功能基因集进一步研究了这些CD8 T细胞亚群的功能特性, 衰竭集群呈现最高的细胞毒性、衰竭和终末分化特征评分(图5d,e)
4) 评估了每个CD8 T细胞簇的祖细胞和终末耗尽的特征分数, 发现组织驻留的C1簇具有最高的祖细胞特征评分和最低的终末耗尽特征评分(图5f)
5) 通路富集分析,发现两个组织驻留簇富集了不同的途径:组织驻留的C1簇与炎症反应显著相关,组织驻留的C2簇富集了细胞因子和维生素代谢途径(图5g)
6) 接下来,检查了这些CD8 T簇中的TF的富集分数。发现EOMES和BATF与CD8 T细胞耗竭有关,在耗尽簇中高度富集(图5h)
5.ccRCC中的巨噬细胞聚类分析
作者进一步探讨肿瘤相关巨噬细胞(TAM)的异质性
图6
1)进行了类似于CD8 T细胞的聚类分析,并使用已知的表型标记在两个数据集中鉴定了三个TAM簇。(图6a-c)
2)每个TAM簇中MHC分子,趋化因子,细胞因子和其他相关基因的表达热图。(图6d)
3)为了了解这些TAM亚群的功能,进一步检查了多个功能基因集的表达或活性,发现TAM-RGCC簇表现出最高的M1特征分数,其次是TAM-C1QB簇(图6e)
4)TAM-RGCC簇具有较高的血管生成特征评分,TAM-C1QB簇在scRNA-seq数据中显示出最高的吞噬特征评分,表明吞噬活性高。(图f-g)
5)检查了免疫检查点基因和共刺激分子的表达,在TAM-C1QB和TAM-RGCC簇中均检测到多个共刺激信号,但在TAM-LGALS3簇中未检测到(图6h)
6) 探索了TF基序活性的差异,并在6个TAM簇中发现了不同的TF调控程序,四个TF(MEF1C,NFKB3,RUNX1和ENO)在相应簇中的基因表达和活性均显著增加(图6i)
7)因为MEF2C在促进M1巨噬细胞极化和诱导巨噬细胞细胞死亡方面起着至关重要的作用,鉴定了MEF2C靶基因,发现该基因调节多种TF(例如,FOXO1,NEU1和NRP1)和趋化因子(例如,CCL3和CCL3L1)(图6j)
6.ccRCC微环境中的细胞间串扰
接着作者为了探索ccRCC微环境中的细胞间通讯,应用已知配体 - 受体相互作用的存储库CellPhoneDB进行数据分析。
图7
4
文章讨论
本文整合scRNA-seq和scATAC-seq来描绘ccRCC的转录和表观遗传景观。我们的分析表明,scRNA-seq和scATAC-seq具有持续的高细胞识别能力,并且它们的数据相互证实和补充。单细胞多组学谱可以从不同角度提供更全面的信息,使我们能够更好地剖析细胞组成并破译TME中的跨区室相互作用。
写在后面
医学僧的心愿是为医学僧的支持者和科研爱好者营造一个勤学好问、互帮互助、共同进步的优良环境。但是人多了难免鱼龙混杂,良莠不齐,群里不乏有真心实意、脚踏实地的科研人,我们很尊重并欢迎他们,因此不希望被少数来发广告的、划水的、看热闹的、占个坑的所打扰,最终我们的心意付之东流,大家的热情消磨殆尽。为了解决这个问题,我们决定提高入群的门槛——收费进群,这样,愿意进群的同志相信也是个圈内活跃用户,圈内人相互交流,岂不快哉!
因此,为了提升大家的效率,调动大家的积极性,吸收真正的科研爱好者,形成一个良好的学习交流氛围,我们决定增加群的数量,并细化群的功能,暂时增加以下几个主题群:
· 文献下载-医学僧
· 机器学习(分类)-医学僧
· ggplot可视化-医学僧
· 热图可视化-医学僧
· TCGA挖掘-医学僧
· GEO挖掘-医学僧
· 肿瘤预后模型-医学僧
· 肿瘤分子亚型-医学僧
欢迎小伙伴们进群👏👏👏,每个群收费15元。请联系小编微信yixuesengkyrj或扫描下面二维码:
联系客服