打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【列线图教程】列线图的前景与缺陷?看看这篇综述如何评价先前开发的列线图们


在细致的梳理后提出了一些建议,主要是:

1. 有效性、可及性(基于网络或应用程序)和易用性的证据可能是列线图成功的关键因素;

2. 持续开发缺乏外部评估和未证实具有临床益处的“新”模型并不一定能为日常决策提供帮助;

3. 改进现有的已验证的模型,比如通过纳入已证实有作用的新变量(例如前列腺癌中的生物标志物或 mpMRI),可以提高“旧”列线图的准确性。

4. 亟待开展前瞻性比较试验,以证明这些开发的列线图在直接临床护理、改善结果和生活质量以及控制治疗成本方面的功效,并最终推进其纳入临床指南。

一起来看看具体的一些列线图是如何被评价的吧

欢迎关注“医学列线图” 公众号,一起学习各种干货满满的列线图吧!

DOI: 10.3390/jcm10050980

泌尿肿瘤学中的列线图:前景与缺陷

泌尿肿瘤学中的临床决策需要整合多种临床数据以提供具体患者需要的答案。尽管医学实践一直是一门涉及经验、临床数据、科学证据和判断的“艺术”,但专科和亚专科的发展使医生每天面临的挑战成倍增加。在过去的几十年中,随着泌尿肿瘤学领域变得越来越复杂,能够整合多种信息并在做出艰难决策时支持临床判断和经验的工具有所增加。这些工具中的绝大多数都基于数学模型中集成的各种信息来计算特定事件的风险。具体来说,泌尿外科领域的大多数决策工具都侧重于术前或术后阶段,并根据可用的临床和病理数据提供预后或预测的风险评估结果。最近,图像和基因组学特征开始被纳入这些模型,以提高它们的准确性。基因组分类器(Genomic classifiers)、显示查找表(look-up tables)、回归树(regression trees)、风险分层工具(risk stratification tools)和列线图(nomograms)都是其中的例子。列线图是迄今为止临床实践中最常用的,但也是这些工具中最具争议的工具之一。这篇综述将重点关注列线图在泌尿肿瘤学领域的应用、传播情况和局限性

1. 简介

列线图是一种图形计算工具,一种二维图表,旨在允许对数学函数或方程进行近似的图形计算。列线图中包括多个标尺,每个变量对应一个标尺。对每个变量分配分数。然后,通过所有计算所有变量的总分,去与预测结果标尺上的结果相匹配。在另一些形式中,该数学函数保存在计算机或智能手机中,通过向其中输入特定变量,可以将列线图的结果反馈给用户。

列线图的开发是一个多阶段的过程。首先,应选择适用列线图的临床人群和相关的临床问题,并明确定义该列线图预计会预测哪些结果。在第二阶段,选择变量(协变量)。这个过程至关重要:协变量的选择将对列线图的性能产生深远的影响,它应该基于临床意义(源自现有证据)而不是仅仅基于统计学的结果。此外,还需选择统计模型:针对二分类型结局事件的logistic回归分析是泌尿外科预测建模最常用的统计模型;而对于生存分析,则大多数时候使用 Cox 比例风险模型来拟合 Kaplan-Meier 生存曲线。

在广泛临床使用之前,研究人员需要评估列线图的性能验证、区分度和校准度。验证是指在不同人群中测试列线图,这可能是在与训练/开发人群无关的人群中进行的(外部验证)。当无法进行外部验证时,内部验证(即在用于开发的同一数据集上)可能仍然可以接受,但需要使用统计方法进行改进。更常见的是随机抽取数据库的不同子集进行验证。校准度是指,预测概率和观察概率之间的一致性。校准图通常用于以图形形式展示其结果。最后,区分度是列线图区分会经历某种结局事件的患者和不会经历某种结局事件的患者的能力,它通常表示为受试者工作特征曲线 (ROC) 的曲线下面积 (AUC),也称为一致性指数(concordance index,CI)。CI可能从0.5(列线图的使用等于扔硬币——不具有预测能力)到1(100%的完美预测)不等。

Steyerberg等人[2]描述了开发预测模型的七个结构化步骤:(1)考虑研究问题和检查初始数据;(2) 编码预测变量;(3) 确定模型种类;(4) 建立模型;(5) 模型性能评估;(6) 内部验证;(7) 展示模型。然后应该从四个关键的方面来验证模型:(1)大规模校准(calibration-in-the-large,模型截距;例如模型的总体预期案例数是否超过观察到的数量,或者预期与观察到的案例的比例是否显着偏离“1”);(2) 校准斜率(calibration slope);(3) 具有一致性估计的区分度;(4) 临床有效性,涉及决策曲线分析(decision-curve analysis)。

理想情况下,为了在临床实践中获得尽可能高水平的证据,每个列线图都应在前瞻性随机临床试验 (RCT) 中证明其有效性。然而,学界非常清楚严格应用这一原则所将带来的风险。事实上,本综述中讨论的大多数结果都来自高水平的回顾性研究,这些研究在提供及时准确的临床预测方面发挥了重要作用

2. 前列腺癌

前列腺癌 (prostate cancer,pCa) 的诊断和治疗过程中不同时刻可能都需要相应的预测工具来协助决策。

2.1. 诊断阶段

临床怀疑pCa的男性面临的第一个难题是“是否进行活检”。前列腺活检是一种与不良事件风险相关的侵入性手术,例如血尿、感染、泌尿系统症状恶化甚至死亡。此外,不必要的前列腺活检会导致对缓慢进展pCa的过度诊断,从而影响生活质量和其他与健康相关的问题。由于这些原因,已经开发了几种策略,以识别具有较高 pCa 风险的男性,进而减少前列腺活检的数量。前列腺特异性抗原 (PSA)或游离/总PSA 被广泛用于活检前对pCa 风险进行分层。为了提高 PSA 的诊断性能,prostate health index (PHI) 结合了三种形式的 PSA:总 PSA、游离 PSA 和isoform [-2]proPSA。其在预测pCa 方面的性能优于总 PSA 和游离 PSA。而且PHI与侵袭性 pCa有关。PHI 也可以与前列腺体积相结合以计算出PHI 密度,从而提高其诊断能力,甚至可以与mpMRI结合获得良好的预测效果。由于越来越多的证据表明 pCa 风险是多因素的,并且不能完全由单一标志物评估,因此前列腺癌风险计算工具旨在基于多种因素估计个体的pCa 风险

European Randomized Study of Screening for Prostate Cancer (ERSPC) 计算器有不同的版本:两种适用于非专业人士,其中考虑了年龄、家族史、泌尿系统症状和 PSA;另外两种适用于医生。另一个类似的工具是Prostate Cancer Prevention Trial (PCPT) 风险计算器,其中包括 PSA、家族史、直肠指检 (DRE) 和先前阴性活检的历史。最近,该计算器已更新,包括了尿液中的生物标志物(如 pCa3 和 MiPS),诊断性能有所提高。然而,头对头比较研究(head-to-head comparison)表明,ERSPC 在预测全体pCa 和临床显着的pCa(clinically-significant pCa) 两类结局上优于 PCPT。Sunnybrook 列线图结合了年龄、泌尿系统症状、PSA、游离 PSA、种族背景、家族史和直肠指检 (DRE) 来估计 pCa 风险。

值得注意的是,这些计算器尚未在 RCT 中进行评估,它们在降低 pCa 死亡率方面的潜在作用仍然未知由于这些原因,National Comprehensive Cancer Network (NCCN) 指南目前不推荐所有这些计算器/列线图来决定是否需要进行前列腺活检

如今,这些预活检工具受到前期 mpMRI 日益改进的作用的挑战。Van Leeuwen等人开发了一种综合前列腺 MRI 和临床特征的列线图,以预测临床显着的 pCa。纳入 MRI 结果极大地改善了列线图的性能:应用该模型将减少 28% 的前列腺活检,而同时仅仅错过了2.6% 的临床显着 pCa。然而,该模型的普遍适用性受到质疑,特别是因为训练人群的 PSA 范围相当狭窄此外该多变量模型并未与单独的 MRI 进行比较,因此该模型中的大部分预测值可能仅由 MRI 提供,这实际上可能“掩盖”其他变量的影响

Bjurlin 等人的近期研究表明 PSA 密度、年龄和 MRI 怀疑评分可以预测联合 MRI 靶向和系统活检(combined MRI-targeted and systematic biopsy)的 pCa,并开发了一个列线图。该列线图在没有事先活检的男性中,对于总体和临床显着 pCa的预测具有0.78 和 0.84 的AUC。Radtke等人基于1100 多名在活检之前接受mpMRI检查的男性开发了一个多变量模型。该模型包括 PSA、前列腺体积、DRE 和 PI-RADS 评分,这些都是重要的前列腺癌的重要预测指标。

然而,基于 MRI 的列线图的作用并未被普遍接受:虽然前期 mpMRI 的广泛使用肯定获得了越来越多的好处,但必须仔细考虑 mpMRI 的局限性(包括分析过程中缺少临床重要pCa 的风险)。事实上,使用 mpMRI 作为模型的一个组成部分而不是作为单一工具可能确实可以减轻这种风险。与常规情况一样,是否进行前列腺活检应基于与患者的知情讨论,而不仅仅是基于列线图(有或没有包括MRI)给出的结果

2.2. 诊断后决策

另一个有争议的情况是诊断后的决策。鉴于每种治疗策略的副作用不尽相同,准确的风险分层就pCa 的可能管理提供建议是非常重要的。当主动监测 (active surveillance,AS) 是一种可行的选择时,这一点则尤其重要

2008 年,Kattan等人开发了一个统计模型来预测未接受治疗的 pCa 男性的 120 个月生存期。其纳入的变量包括临床分期、活检 Gleason 分级、诊断方法(TURP 与活检)、癌症百分比(percent cancer)、基线 PSA、诊断年龄和使用激素治疗情况。从那时起,基于临床病理学变量开发了许多预测模型。最近,Iremashvili等人评估 Kattan 和 Truong 列线图在根治性前列腺切除术队列中选择 Gleason 3 + 3 或 3 + 4 器官局限性 pCa 患者(organ-confined pCa)的能力,并将其与John Hopkins (JH),University of California-San Francisco (UCSF),以及Prostate Cancer Research International: Active Surveillance (PRIAS) 标准的 AS 标准进行比较。结果表明,列线图比 JH 和 UCSF 稍微准确,但表现不如 PRIAS 标准。这反过来证明了在选择低级别器官局限 pCa 患者时灵敏度和特异性之间的最佳平衡。在同一问题上,Davis等人汇总了适合 AS 但接受前期根治性前列腺切除术的男性的数据,并评估了四种模型在预测非临床显着 pCa(各种定义)方面的表现,并获得了从 0.618 到 0.664 的 AUC。这些数据表明这些模型并不完全令人信服的中等准确性。

在这种情况下,加入mpMRI 派生的信息也很有希望。Siddiqui等人根据病灶数量、MRI 怀疑程度和病灶体积/前列腺体积开发和测试了一个模型,以预测后续活检中 AS 不合格的概率。作者在列线图上定义了 19% 到 32% 的截止概率,发现 27% 到 68% 的患者可以避免活检。然而,该模型依赖于一小群经过精心挑选的患者,其对普通人群的适用性可能会受到质疑

最后,在前列腺活检时测定的新的生物标志物为肿瘤生物学提供了更多的见解,并在最初的决策过程中显示了风险重新分层的有希望的结果。OncotypeDX®、Prolaris®、ProMark® 和 Decipher 均已在该临床环境中进行了评估 [18],前两个现已获 NCCN 指南批准用于临床。

2.3. 初次治疗(Primary Treatment)前

在初次治疗之前评估肿瘤扩展和残留/复发的风险绝对是列线图最繁荣的领域之一。D'Amico 风险分类是最早根据不良的疾病特征和复发对 pCa 进行分层的多因素模型之一。从那时起,已经开发了许多工具。这些工具主要关注根治性前列腺切除术(radical prostatectomy,RP),旨在预测淋巴结侵袭、手术切缘阳性和明确病理时的包膜外延伸(extracapsular extension at definitive pathology)。淋巴结问题特别重要,因为通过准确定义 pN+的风险,很大一部分患者可以避免淋巴结清扫和相关的并发症发生。基于临床和活检变量,已经开发了几种列线图。最常用的列线图之一,Briganti列线图是基于 PSA、临床分期、初次和二次活检 Gleason 分级和阳性核心百分比构建。Briganti列线图具有87.6% 的准确性并建议在计算的风险小于5%时避免淋巴结清扫。在同个课题组发布的最新版本中,阳性核心的百分比被细分为两类(较高和较低等级核心的百分比/总核心的百分比)并显示出 90.8% 的准确度。使用 7% 的截止值,该模型将允许保留近 70% 的盆腔淋巴结清扫 (PLND),而错过N+的风险为 1.5%。显然,这种新模型缺乏广泛的外部验证,因此其对其他 RP 人群的适用性值得怀疑

一些研究人员最近提出,基于mpMRI 对囊外延伸 (extracapsular extension,ECE)、精囊浸润 (seminal vesicle invasion,SVI) 或高级别疾病诊断的高准确度,对于Briganti列线图计算的风险 < 5% 的患者,mpMRI 可能在风险亚分层中发挥作用。

其他著名的 pre-RP 列线图包括Partin Tables、CAPRA score、MSKCC、Cagiannos 和 Godoy 列线图。

另一个常见的临床问题是如何选择能从RP中获益最多的高风险pCa男性患者,而不是最适合选择其他方法的男性。要为这个问题提供明确的答案,最终需要开展RCT而不是列线图,但是一个多机构小组开发了一个专门针对这个问题的模型。该模型可以识别40%在RP时有病理证实的高危 pCa 患者,并可以改善这些患者的术前选择。

与其他情况一样,基于临床的列线图受到广泛采用的mpMRI进行分期的挑战。一些报告表明,与临床列线图相比,mpMRI 派生的信息可能具有增量作用(incremental role),尽管存在一些争议。特别是,几乎所有研究都显示 mpMRI 在局部分期(包膜外延伸、精囊浸润)中的显着性能(以及列线图准确性的提高)。而 mpMRI 在淋巴结分期中的增量作用有限(因此证实了mpMRI 在此结果方面的次优准确性以及列线图在此方面的良好性能)。Martini等人最近发表了基于 mpMRI 的列线图。该列线图预测前列腺癌的侧面特异性包膜外扩展。模型纳入了PSA、最高同侧活检 Gleason 等级、同侧核心参与最高百分比、和 mpMRI 上的包膜外侵犯。经过内部验证,模型 AUC 为 82.11%,具有出色的校准效果,特别是与单独的 mpMRI 上的包膜外侵犯的预测效果相比。该模型已经过外部验证,AUC 为 67.6%,然而,该模型显示出次优校准度,并且在其他临床变量上增加mpMRI的结果并没有更好的获益。

这些年来,提出了几个基于类似变量的模型,尽管这些列线图中的大多数缺乏外部验证,并且尚未对这些模型进行正式比较

Gandaglia等人开发了一个列线图,专门用于预测MRI诊断的pCa中的淋巴结侵袭 (LNI)。Briganti 2012、Briganti 2017 和 MSKCC 三个模型在该类人群中表现不佳;而一个新模型的AUC 为 86%。其包括 PSA、cT 分期、mpMRI 上的指数病变的最大直径、MRI 引导活检的分级组以及伴随系统活检的临床显着 pCa 的存在。与现有模型相比,这种提高的准确性将避免更多的不必要的淋巴结清扫,并降低丢失阳性淋巴结侵袭的风险。

最后,Soeterik 等人最近提出了一种用于预测侧特异性EPE的新型列线图。该模型包括 PSA 密度、最高同侧 ISUP 等级、系统活检中阳性核心的侧特异性百分比以及通过直肠指检和 mpMRI 评估的同侧临床分期。mpMRI 信息的使用显着增加了AUC。而基于 PSA 密度、ISUP分级和mpMRI分期的模型在校准度方面更胜一筹。

当对这些列线图进行头对头比较时,Cagiannos 模型和 2012-Briganti 模型在决策曲线分析中显示出最佳校准和结果。另一方面,对于该研究中测试的所有列线图(Cagiannos,2012-Briganti,Godoy 和 MSKCC),避免不必要的淋巴结清扫的能力和 C 指数的值几乎相同

2.4. 初次治疗后

在初次干预后,特别是在进行RP(根治性前列腺切除术)后,必须对患者进行重新分层以确定是否需要额外的治疗。这是一个关键时刻,因为RP后治疗(特别是放射治疗(radiation therapy,RT))具有不可忽视的毒性作用风险

具体而言,对于有 RP 后复发风险因素的男性,有两种主要方法:1.在即使PSA 检测不到或观察的情况下立即辅助放疗,2.以及如果 PSA 开始上升,则开始早期挽救性放疗。显然,准确选择更有可能需要放疗并从放疗中受益的患者以及接受安全管理的患者,将使一定比例的患者避免这些副作用。

CAPRA-S 评分是基于 PSA、病理 Gleason 评分 (pGS)、ECE 和 LNI(各 1 分)、阳性手术切缘和SVI的评分系统。CAPRA-S 评分每增加一点,pCa 复发的HR对应为1.54。Stephenson列线图和 Kattan 列线图使用了类似的变量来获得良好但不是最佳的准确度。这些列线图的一个常见问题是它们在很大程度上依赖于手术/组织病理学变量,并且其中大多数使用 pCa 复发的复合定义,包括生化复发 (BCR)、临床进展、挽救治疗的需要和 pCa 死亡率。此外,虽然它们具有良好的预后价值,但它们在对患者进行额外治疗的分层中的预测作用更具争议性

为了克服这些限制,在过去的 10 年中,已经开发了几种基于基因组的生物标志物来预测复发风险和辅助/挽救性放疗 (ART/SRT) 的益处。有趣的是,Den 等人评估了 ART 或 SRT 后 10 年随访的 188 名 pCa 患者队列的高风险特征。基因组分类器评分 (Decipher®) 优于传统的风险评估工具。此外,只有在 pCa 复发的情况下,基因组分类器 (genomic classifier,GC) 评分低的男性才能安全地接受挽救性放疗,而 GC 评分高的患者最好接受ART。最近的研究将基因组分类集成到列线图中,该列线图将病理变量(例如病理 T 分期 (pT)、格里森评分和淋巴结状态)与基因组分类结果相结合。结果以风险因素的总和形式提供,包括 pT3b/T4 阶段、GS 8-10、LNI 和 Decipher 评分 > 0.6。接受 ART 的有两个或多个危险因素的患者复发率降低,而只有一个危险因素的患者复发率不降低。这项研究表明了一种利用临床和基因组信息进一步改进预测模型的可能方法。另一个有趣的工具是 PORTOS(Post-Operative Radiation Therapy Outcomes Score),这是一种基于 24 个基因的蛋白质表达的生物标志物蛋白质组学工具,可以预测 RP 后个体对 RT 的反应。Prolaris® 和 PTEN缺失是该工具中使用的其他生物标志物。

许多欧洲国家的高成本和实际上的不可及性严重限制这些生物标志物的广泛使用。然而,随着关于这些工具的额外好处的证据的积累,我们可能会看到更多在临床上使用复合模型(临床和生物标志物)作为前列腺切除术后决策辅助的情况

5. 结论

泌尿系统肿瘤无疑是列线图和预测模型研究的沃土。然而,有效性可及性(基于网络或应用程序)和易用性的证据可能是列线图成功的关键因素。持续开发缺乏外部评估和未证实具有临床益处的“新”模型并不一定能为日常决策提供帮助。另一方面,改进现有的已验证的模型,比如通过纳入已证实有作用的新变量(例如前列腺癌中的生物标志物或 mpMRI),可以提高“旧”列线图的准确性

正如 Catto 十多年前已经指出的那样,我们需要更好的有效性证据,而不是盲目增加列线图的数量关于预测模型有一个基本问题:这个工具是否可以改善患者护理和治疗结果?也许提供可靠答案的唯一方法是开展前瞻性比较试验。在这些试验中,列线图可以显示其在直接临床护理、改善结果和生活质量以及控制治疗成本方面的功效。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
前列腺穿刺活检的模式在变迁
ROC曲线+生存曲线如何发6+分?
放射学角影像学在良性前列腺增生与前列腺癌诊断中的作用
前列腺癌诊断和治疗的争议
[青年论坛]刘冉录:前列腺融合靶向穿刺活检的临床应用进展
多参数磁共振成像在前列腺癌诊断中的应用
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服