导读
基于二代测序技术的肿瘤检测已越来越多的应用于临床实验室中,但目前在不同实验室间存在检测方法、报告内容等方面的差异,这对遗传检测的解读以及普及应用造成了一定的影响。因此,在不同实验室间建立统一的分子检测结果的解读和报告标准,及建立行业标准,显得尤为迫切。
在2015年春天,在美国专门成立了一个以临床实验室为核心的工作组,其组成包含了分子病理协会(AMP)、美国医学遗传学与基因组学协会(ACMGG)、美国临床肿瘤学会(ASCO)与美国病理学家协会(CAP)的一线专家,该工作组的主要工作为对肿瘤及疑似肿瘤相关的序列变异检测建立检测标准并在行业达成共识。
该工作组首先对北美地区超过40家的临床检测实验室进行了问卷调查,结果显示不同实验室在检测组织类型、检测基因数量、是否检测肿瘤组织全外显子组或全基因组、以及其他细节方面都存在较大差别,此外在不同单位的检测报告的报告内容方面也存在较多差异。该工作组认为,为医疗机构提供分类的遗传变异报告对病人及整个医疗行业都极为重要,包括:提供精确的肿瘤对
靶向治疗反应性信息;建立国家级别的医疗指南;以及与临床试验合作,对建立不同实验室间的通用标准提供支持。基于以上这些考量,工作组专家们根据已有数据、文献报道和专业知识,给出以下指南建议:
图1 AMP对NGS技术及NGS结果解读的调研A:MAF阈值、B:变异分类数目、C:报告中是否包含治疗性建议 、 D:报告中是否包含潜在的生殖细胞突变、 E:报告是否包含变异等位频率Variant allele frequency (VAF)、F:报告是否包含基因组坐标、G:报告是否包含转录本ID(Transcript accession)、H:报告是否包含不符合质控的基因/区间。
数据库
1、基因组数据库
①大型肿瘤基因组数据库
常见的有:
●The National Cancer Institute’s Genome Data Commons,包含了The Cancer Genome Atlas, Therapeutically Applicable Research to Generate Effective Therapies, 和 the Cancer Genome Characterization Initiative .
●Catalog of Somatic Mutations in Cancer.
② 体细胞序列变异解释相关数据库(不完全统计)
Table 1 Databases Relevant to Interpretation of Somatic Sequence Variants
③ 临床实验室在应用公共数据时一般的注意事项:
(1)了解数据库内容及数据组织形式;
(2)特别注意数据库的限制,避免检测结果过度解读;
(3)注意基因组与转录组的组装版本,应与Human Genome Variation Society (HGVS)注释一致;
(4)根据已有资源评估基因组测序质量;
2、 参考序列数据库
常见参考序列数据库(Reference Sequence Databases) 用于人类基因组组装及相关信息,包括基因组坐标,转录本版本,外显子边界等等。常见的有:
●RefSeq (National Center for BiotechnologyInformation Reference Sequence Database,https://www.ncbi.nlm.nih.gov/),
●Ensembl (http://www.ensembl.org/index.html)
●Locus Reference Genomic (https://www.lrg-sequence.org)
3、群体遗传学数据库
群体遗传学数据库(Population Databases)提供基因多态性、人群等位基因频率等信息,用于区分测序结果中的多态性与突变,常见的有:
●The Database of Short Genetic Variation (the National Center for Biotechnology Information database of genetic variation)
●Exome Variant Server
●Exome Aggregation Consortium
4、 肿瘤特异性数据库
肿瘤特异性数据库(Cancer-Specific Databases )提供汇总之后的不同肿瘤类型及亚型间的序列变异发生率、外显率等信息:
数据库列表见2.1.1 Table 1
5、原发性变异数据库
原发性变异数据库(Constitutional Variant Databases)主要用于区分生殖系变异与体细胞变异,常用的有:
●Human Gene Mutation Database
●ClinVar (http://www.ncbi.nlm.nih.gov/clinvar)
6、内部数据库(实验室产生)
实验室根据内部资源独立建立的数据库,可用于变异注释,将来将会逐步整合到公共数据库资源中。
预测算法和软件
预测算法和软件常用于预测基因中核苷酸的变化是否会影响基因的结构和蛋白质的功能,总体上看,目前的生物信息学算法还无法保证足够高的特异性,因此建议不要将预测结果作为临床分类与临床决策的唯一证据。
Table 2 Algorithms for Computational Prediction of Functional Impact of Sequence Variant/Splice Site Changes
变异鉴定和注释
通常由软件来鉴定和注释变异。临床实验室需注意软件工具的局限性。测序深度、等位基因频率等信息需加以考虑。目前较为通行的注释文件格式为VCF格式,可从中分析相关信息。常见软件有:
1、基于证据的体细胞变异分类的指导意见
基于循证医学的体细胞变异分类的指导意见(Proposed Guideline for Evidence-Based Categorization of Somatic Variants),根据文献报道及工作组专家共识,提议将基因检测相关临床及实验证据分为4级:
A级:可作为FDA批准治疗某种特异性肿瘤的生物标志物(biomarker),或被收录于某些特殊类型肿瘤的诊断、治疗、预后评价的权威指南;
B级:可作为基于强力临床试验证据和专家共识的治疗某种特异性肿瘤的生物标志物,或用于诊断、预后评估;
C级:可用于指导FDA批准的标注外用药,或基于多个小规模研究的证据的诊断/预后评估;
D级:结果不确定的临床前研究,可作为辅助标志物,基于小规模研究且未达成共识。
相应的,可将体细胞基因组变异的临床影响力分为4级:
I级:具有强临床意义的变异(A级和B级证据);
II级:具有潜在临床意义的变异(C级或D级证据);
III级:变异的临床意义不确定;
IV级:与良性或疑似良性相关的变异。
检测结果报告与解读
1、所有检测到的变异都需要根据临床影响力4级分级系统进行分级标识;
2、所有检测到的变异都需要按照HUGO基因命名委员会规则注释与报告,报告中也应包含其他必要信息;
3、生殖系变异在报告中可不加以区分,若报告生殖系变异需符合当地法律与政策(患者需签署
知情同意书等);
4、报告检测到变异的临床意义;
5、报告可随相关医学知识的更新而发生变化,当有特殊需求时可考虑更新报告;
6、实验方法应随检测结果一同报告;
7、可将检测报告与电子病历系统整合。
结论
在癌症基因组谱中越来越多地使用NGS技术,给临床实验室带来了新的挑战。分子专业人员的关键任务之一是,基因测序检测到的癌症相关序列变体的解释和报告的标准化。拟议的“癌症中序列变异的解释和报告标准和指南”代表了工作组成员的专家一致意见及他们代表的利益相关者的意见。该建议描述了一个基于证据的变量分类系统,以及变量注释,分类和报告的过程。该报告还列出了常用于NGS数据分析的有用的生物信息学工具和数据库。这些建议应作为临床实验室专业人员和肿瘤学家的教育资源,以辅助变体解释和临床决策。我们希望本文提供的指南将在癌症基因组学领域得到广泛应用,并推动癌症患者的基因组检测和精确治疗实践。
【本站为非盈利学术交流平台,部分资料来源于网络,如涉及版权问题请及时联系管理员处理;所有文章仅供公益交流,不代表本站立场。欢迎提供素材、资料等,投稿邮箱:tougao@91360.com,一经采纳将给予稿费。】