预测未来,就必然受到时间的影响。
如果预测患者1年的死亡率
需要建立预测模型计算
如果预测患者100年死亡率
不需要复杂的计算
死亡概率99%以上
因此建立预测模型及模型评价
时间是需要考虑的
方案一:不问早晚,只要结局
例如预测住院期间是否发生并发症,住院第一天或最后一天发生的并发症,都认为是在住院期间发生了事件。不关注早晚,只关注结局。
通常根据临床意义确定时间段。数据结构和软件操作之前的微信推文已经分享了:预测模型校准曲线 | Calibration curve (上篇)
方案二:考虑时间,预测结局
2008年发表在J Clin Oncol 的预测结肠癌复发的研究。Individualized prediction of colon cancer recurrence using a nomogram.
图3是校准曲线(Calibration curve),AB两图分别预测60个月和120个月结局事件。横纵坐标分别是预测概率和实际概率。本研究考虑到发生事件的时间,运用Cox模型建立列线图(Nomogram)并绘制校准图。论文统计方法部分描述如下:
例如:用多个临床指标(年龄、性别和BMI)建立结局指标的预测模型,绘制校准曲线。
首先看数据结构:
需要有结果变量(是否发生事件),事件可以是死亡(是/否),也可以是发病(是/否)。通常没有发生事件编码为0,发生事件编码为1。
生存分析是考虑到时间的,因此数据中需要有时间变量(time),时间变量是末次随访到患者的日期减去随访开始日期,单位可以是日、月或年等(连续变量)。
把原始数据整理到一张表中,每个研究对象一行,全数字编码,缺失的数据可以空着。
例如本表中:
编号=1的患者:随访到72天时没有发生事件,时间(time)=72,结局(Outcome)=0
编号=2的患者:随访到275天时发生事件了,时间=275,结局=1
第一步:选择数据操作的“计算残差与预测值”模块,给出结果变量、自变量(即用于建立预测模型的指标)、时间变量和预测时间,点击查看结果。
说明:只要给出时间变量,就是选择用Cox模型拟合生存状态。“预测时间”如果空着,则使用研究对象的观察时间(有长有短);如果要预测某时间段内的事件,就手动输入时间。例如这里输入50,表示预测50个月时的事件,还是调用Cox模型计算的。
得出后缀是PRED的新变量,范围是0-1,表明基于Cox模型预测的发生事件的风险。
第二步:数据操作菜单下的“平滑曲线拟合”模块,给出应变量(结局指标)、暴露变量(上一步得出的预测值),点击查看结果。
结果出来了,横坐标预测的事件发生率,纵坐标是实际事件发生率。红线是曲线拟合线,蓝线是95%CI。绿线是参考线,即预测值=实际值的情况。可见当风险较高时(34%)红线在绿线的下面,表明预测风险高于实际风险。
这个曲线拟合的Calibration curve 放在文章中
可以瞬间增加“颜值”
联系客服