打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
你真的理解体细胞突变吗?

学徒和学员已经陆续出师,是时候把生信技能树的舞台交给后辈了!最近重新整理了肿瘤相关教程,看到一个很棒的关于体细胞突变的博文,安排学徒翻译了一下

下面是译文

英文原文是:https://www.haematologica.org/article/view/8999

“体细胞的”和“致病性的”分类策略是否适用于大规模测序?

体细胞突变(somatic mutation)是指患者某些组织或者器官后天性地发生了体细胞变异,虽然它不会遗传给后代个体,却可以通过细胞分裂,遗传给子代细胞。体细胞突变对肿瘤的发生发展有关键性的作用,并且它也是制定肿瘤癌症靶向治疗措施的关键所在。

Introduction

在测序早期,由于该过程高强度的劳动仅测序了少量的碱基。在动物模型和细胞系中,人们确定了一些在肿瘤发病机理中起着重要作用的基因。随后,研究人员在患者样本中分析了这些突变并评估了它们对预后效果的影响。例如:TP53在各种癌症中普遍发生了突变,NPM1是现在急性髓细胞白血病最常分析的基因之一,该突变定义了当前世界卫生组织分类中的急性髓细胞性白血病亚型

发现突变,并且做各种各样的实验来解释这个突变的功能,再临床应用它,这个是早期流程!

高通量测序改变了这一状况,使得在相当短的时间内以可承受的成本对大量的基因到外显子甚至整个基因组进行测序成为可能。挑战不再是测序,而是对结果的评估以及对诊断、预后或治疗方案的影响的解释,这也导致我们查看测序数据的方式发生了一些重大变化。

在2015年,美国医学遗传学和基因组学院(ACMG)和分子病理学协会(AMP)建议将术语“突变和多态性”更改为”变异“,并根据它们与疾病的关联性将突变体细分为五类。该定义是针对遗传性疾病设计的,因此会涉及到种系变体。

癌症中的绝大多数突变事件都是体细胞的,获得的变体代表潜在的药物靶标或生物标记。例如:对于结肠癌,通常通过比较活检和白细胞中的变异以识别体细胞变异来进行突变(肿瘤-正常对照)。在大型或历史性数据集研究中,经典的"肿瘤-正常"的工作流程是非常具有挑战性(额外的测序成本或参考材料供应有限)。白血病则是另一个挑战,因为血液不能用作参考物质。除此之外,对遗传复杂性和肿瘤异质性的日益了解,也对体细胞领域的**历史性二元变体分类(突变,多态性)**提出了挑战。

是否有不具有体细胞突变的参考材料

理想情况下,将肿瘤测序结果与不具有体细胞突变的参考材料进行比较, 潜在的克隆性造血功能使我们对突变是衰老过程的一部分更为熟悉。终生增殖所导致的体细胞变化的不断积累会强烈影响血细胞,但这种现象可能适用于所有类型的参考材料。由分裂速度较慢的细胞组成的组织(例如脑组织)将作为参考,但这不是常规分析的实用方法。毛囊,指甲,尿液,T细胞,成纤维细胞培养物,口腔拭子,唾液和皮肤活检中都比较容易获得参考材料,但DNA产量低和白血病细胞污染(例如指甲血液中的DNA)的存在使得在应用此类材料时还面临挑战。

在没有可用的参考材料的情况下,变异等位基因频率(VAF)可用于区分种系和体细胞变异。种系变异的VAF为50%(杂合)或100%(纯合)。获得性变异通常存在较低的VAF,因为它并非在所有细胞中都存在, 需要注意的是其他因素也可能导致VAF。

  • (1)技术问题(聚合酶链反应/扩增偏向)可能导致VAF偏斜
  • (2)如果分析样品中的恶性细胞数量很多,体细胞突变也可能以50%的VAF发生。(
  • 3)遗传特征(拷贝数)会影响VAF。比如17p的缺失将导致缺失的基因座中的所有种系变异(最主要的TP53)在VAF出现时均不超过50%。拷贝数的获得和拷贝杂合性的中性缺失也会影响VAF。

变异位点的人群频率数据库

数据库经常用于变异的解释,精选的变异数据库符合高质量标准,但仅包含少量变异。具有大量贡献的数据库(例如dbSNP)包含更多变异。最初,如果变异在dbSNP中列出,则被归为良性种系变异。所有允许单个提交者添加数据的数据库都容易出错。

Lek等人证明了外显子组的多样性,他分析了60,706个不同种族的个体,发现平均每外显子组的八个碱基中就有一个变异。数据由外显子组聚合协会(ExAC)收集,其中包括来自广泛研究的整个外显子组测序数据。

ExAC最近已扩展到基因组(gnomAD)。截至今天,gnomAD包含来自141,456个人的数据,这样可以对人口和族裔群体进行具有代表性的概述。因此,它可以用于从候选疾病相关畸变中排除人群中的常见变异。

但是,来自这样一个集合的元数据包括许多血液样本,甚至包括患有(未经诊断)血液病的个体。JAK2基因中的V617F突变(在大多数患有骨髓增生性肿瘤的患者中发现)在gnomAD数据集中在0.04%的个体中也有发现,因此gnomAD的变异本身不能归类为良性

考虑到这些困难,可以质疑严格分离体细胞和种系是否必要。区分它们的原因有很多:

  • (i)在潜力不确定的克隆性造血和意义不明的克隆性血细胞减少症的情况下,只有体细胞变化才能证明克隆生长,并且它们被用于计算肿瘤突变;
  • ( ii)遗传畸变的存在经常被用作监测最小(可测量)残留疾病(MRD)的标志物。生殖系变体不能通过治疗根除(同种异体骨髓移植除外),因此不能作为MRD标记提供信息;
  • (iii)种系变异可以诱发或引起癌症和其他疾病。Tarailo Graovac等从ExAC数据库中发现2.8%的个体具有与各种孟德尔疾病有关的变异

2017年世界卫生组织在还识别出具有种系易感性且在ETV6,RUNX1和其他基因突变的肿瘤。致病性变异对于家庭咨询以及确定家庭成员是否可以被视为干细胞捐赠者至关重要。生殖突变是患者结果和治疗反应的重要调节剂。DNA损伤修复途径的异常可能与治疗相关的骨髓瘤的风险增加有关。

该变异本身比其起源更重要的是对olaparib治疗的反应, 如果患者具有BRCA1 / 2的生殖系或获得性变体,则患者会做出反应,因此必须知道突变是致病的还是作用性的。致病或作用的定义并非无关紧要,而是高度依赖于前后反应。对于遗传性疾病,致病变异通常被理解为因果关系。在少数情况下(例如囊性纤维化),人们已经认识到明确的变异表型关系,但对于许多其他类型的疾病,这种关系更加难以捉摸。ACMG和AMP目前推荐的五级遗传变异分类系统还可以识别出“可能致病”和“可能良性”

在这里,我们专注于癌症的变异。当将遗传发现转化为临床时,一个突变根据实际的问题可能具有不同的价值。Sukhai等人提出了“actionable”一词来描述影响患者管理的突变。美国临床肿瘤学会(ASCO)和美国病理学家学院(CAP)于2017年发布的关于癌症突变指南提出了四个层次系统:Ⅰ级,临床意义强;II级,潜在的临床意义;III级,临床意义未知;Ⅳ级,良性的或可能良性的突变。解释应进一步细分为“诊断”,“预后”和“预测”三个类别,并建议将四层系统应用于每个类别。提供最高水平的证明是可预测对食品药品监督管理局批准的疗法的反应或耐药性的生物标志物,以及来自专业诊断和预后指南的突变。BRAF V600E突变就是一个例子,因为它的存在可以进行vemurafenib治疗。

变异位点的分层级系统合理吗?

粗看分层系统似乎是一种标准化的方法,但是每种情况都面临着挑战。一个例子是患有血细胞减少症和TET2基因的获得性变异的患者。该突变可以证明其克隆性,这对于诊断意义不明的克隆性血细胞减少症至关重要。因此,该突变在诊断分类中将是I级或II级。但是,如果在急性髓细胞性白血病的患者中发现了相同的变异,仍然需要为其定义治疗程序,则分类会变得更加复杂。目前,尚无针对TET2阳性恶性肿瘤的特异性疗法。因此,如果使用对指南的严格解释,则该突变可能会进入III级。

血液疾病密切相关,突变通常是典型的,但并非仅是一种疾病。例如,MYD88中的L265P变异体在所有Waldenström巨球蛋白血症患者中发现90%,但在其他B细胞肿瘤患者中也以较低的频率出现。因此,没有变异体且严格执行规则时,可以视为“诊断”。对于患者而言,所有三个类别(诊断,预后,预测)都很重要。MYD88突变的存在提示依鲁替尼治疗是一种选择。因此,在大多数解释中,L265P可能会被分类为I级。

与MYD88 L265P不同,许多基因没有明确描述的变异热点,例如 在RUNX1,CEBPA和DNMT3A等基因中观察到了各种各样的变异。《癌症体细胞突变目录》(COSMIC)自2004年以来就从同行评审期刊中收集了有关突变的信息。UMD数据库(手动管理)仅包含TP53的6,870个变体,UMD-TP53已经开发它自己的以数据为依据的管理策略,而对于那些不如TP53更好理解的基因,数据库的帮助较小。

在此可以使用算法预测变异对蛋白质结构影响,使用计算机参与分析,并且无需专业知识即可执行。主要的影响因素包括氨基酸交换的类型以及变异在保守或功能域中的位置。dbNSFP数据库包含所有可能的单核苷酸变体的预先计算的值,这些变异会通过18种不同的算法导致人类基因组中的氨基酸或剪接位点发生变化。但是,读数不一定是“是”或“否”,不同的算法几乎永远不会得出完全相同的结果。一些常见的病原体突变没有通用的算法获得足够高的评分。例如,MPL基因中的W515L突变在骨髓增生性肿瘤中是典型的,但仅18种算法中的7种被定为破坏/致病性。当前,大多数算法是针对单核苷酸变异进行训练的,不能应用于插入缺失,高致病性评分并不总是因果关系或可操作性的代名词。

NGS使体细胞变异的检测更加全面,成本更低,在检测多种体细胞变异上具有很大的优势,但在使用过程中还存在着挑战:如**样品降解、覆盖度不足、遗传异质性和组织污染(杂质)等问题。为应对以上挑战,降低错误率,科学家采取了不同的算法和统计模型用于检测体细胞突变。目前最受欢迎的有Varscan、SomaticSniper、 Strelka 和MuTect2 **。这些软件大都是直接对肿瘤-正常样本的每个位点进行比较,对肿瘤样本中明显高于正常样本的次等位基因进行标记,作为体细胞变异,同时排除种系突变和杂合性丢失(LOH)情况。虽然这些软件具有较高的引用率,并在不断地更新,但仍存在不足:

  • a 、缺乏完整可靠的实验来评估检测结果;

  • b、 缺乏金标准,不能保证检测到的灵敏度和特异性最高;

  • c、 在实际应用中,各软件的相对优缺点在很大程度上是未知的。

Tomorrow

至今没有完美的一站式对于变异分类的解决方案,在Google上搜索用于遗传变异解释的软件可带来数百万次点击。在跨实验室的变体分类比较中,只有34%的一致性。全外显子组测序或全基因组测序提供的数据将不可避免地使分析变得更加复杂,因为已鉴定的变异数量是panel测序的许多倍。在所有大约20,000种人类基因中都会发现变异,但并非所有变异都与疾病相关或发生了冗余突变。对两个大型研究集(TCGA和BeatAML)进行了比较,证实了33个基因在急性髓细胞性白血病中经常发生突变,但突变频率为2%或更低的基因存在多样性。仅在一个数据集中甚至一名患者中发现了超过2,000个基因发生了突变。当前的指南,例如来自AMP的指南,都是基于特征基因。因此,Kaur等人认为乳腺癌更适合使用panel测序方法。它们可以实现更深的覆盖范围,这就是更高的敏感性的代名词。1-3%的灵敏度越来越被需要,因为可检测到亚克隆或者如果发现2%的VAF突变,则已经诊断出了潜在的克隆性造血功能。目前,全基因组测序的灵敏度在15%至20%之间,但是该技术可以同时识别结构和拷贝数变异,并且测序成本正在降低。

因此,我们建议对当前使用大规模数据集进行诊断的短期策略和长期方法,以加深我们对恶性过程和治疗选择的理解。

夸大一个突变的重要性显然是危险的,但是具有未知临床意义的突变的报告可能很难转化为临床结果。我们在这里概述了当今使用的主要方面:首先,需要不同实验室部门之间的合作来比较遗传标记和其他生物标记,以及实验室和医师之间的协作以定制个性化方案。例如,

  • (1)通过整合不同的实验室结果,可以将处于形态缓解但仍具有50%VAF的缓解状态的患者确定为具有罕见且可能不太相关的种系变异。另一个方面源于对种系易感性的认识不断提高,例如:骨髓增生异常综合征中具有SAMD9 / SAMD9L突变的患者,如果提供了家庭背景和参考材料,则可以调整检测。
  • (2)其次,数据库是变异解释的基石。联合力量成功的一个令人印象深刻的例子是gnomAD,它现在已成为种系变异的全球参考。
  • (3)第三,在回顾的背景下,串行测试可以揭示具有特定变异的克隆的生长,并突出临床相关性,如回顾性研究所示。4238来自多个时间点的有据可查的信息可用于变异分类,也可用于追踪具有相同变异的患者,理想情况下将来应将其纳入数据库和分类算法中。
  • (4)最后,过滤已知和经过充分研究的变异始终是行之有效的第一步。血液学中的第一个全基因组测序研究表明,当过滤已知拷贝数变异,结构变异和基因变异时,灵敏度和特异性都有所提高。

编码区域外的突变很难与功能关联。它们通过改变转录因子结合,选择性剪接来影响基因表达,某些基因组变异可能是导致染色体畸变的原因。此外,它们可以影响药理遗传学,患者之间相同的体细胞变异也可能由于外界获得或遗传因素的不同而有所不同。

人工智能是一种合理的选择,可以充分利用数据的潜力,而将二进制突变/多态性分类甩到身后。人工智能在临床肿瘤学,基因组解释,尤其是变异报告中的使用势头强劲。从手动分类变异获得的数据可用于训练深度神经网络。这种方法的优势在于该算法能够自主提取相关特征进行分类,并不仅针对遗传信息而且针对所有类型的生物标记物识别重要的组合,不需要任何手动定义的规则集,这对于变量解释特别有用。根据如上所述,基本上不可能使用简单的规则集来捕获整个复杂性。这样的算法的输出可以指示临床上相关的可能性。但是,为了帮助临床决策,未来的报告不仅应是具有各自分类的变体列表,还应是所有遗传信息(包括结构和拷贝数变异)和其他生物标记及其组合意义。

写在最后
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
FDA最新建议:ctDNA液体活检在这一方面仍需着力改善
肿瘤驱动基因分析策略简介
Nature Neuroscience | 哈佛科学家利用高深度全基因组测序解析大脑皮层体细胞突变概况
等位基因不平衡空间模型鉴定单细胞体细胞突变
关于血液肿瘤二代测序报告单解读,您需要知道的。。。
高分文献解读│10篇文章揭示食管鳞癌研究进展①
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服