临床预测模型 | 第8期.生存分析I-浅尝Cox比例风险模型

上期内容中，我们介绍了logistic回归的相关内容（第7期.Logistic回归，从原理到操作，一文搞定！），相信你已经掌握了如何实现和解读logistic回归。在接下来的几期内容，我们将详细地给大家讲解生存分析，内容精彩，千万别错过！

一、Cox比例风险模型的数学原理

按照惯例，我们先从Cox比例风险模型的基本理论开始。下图为Cox比例风险模型的数学表达式，h(t)也叫做风险函数，t代表生存时间，x为协变量，b代表协变量的系数。细心的你一定注意到了，这个式子似乎和logit函数有些相似性。

风险函数表达式

风险函数h(t)可以理解为：在给定时间点t下，个体发生事件的风险。为了方便讲解，后面都用死亡代替事件发生。和比值比（OR）类似的，风险比（Hazard ratio，HR）是两个风险函数的比值，表示当自变量X变化1个单位时，个体死亡风险为原来的HR倍。 因此，当某个变量的HR>1时，说明它会增加死亡风险，反之亦然。

HR的推导过程

二、Cox比例风险模型在R的实现

下面我们用survival包中的数据集lung来演示Cox建模，选取的age、sex、ph.ecog和ph.karno作为协变量。因为sex是个分类变量，而数据集的变量类型为数值（numeric），先用as.factor转化为因子（具体可以复习我们的R语言专题哦）。最后同样用autoReg包来总结模型的结果。

library(survival)
library(autoReg)
lung=lung
lung$sex=as.factor(lung$sex)
cox_model <- coxph(Surv(time, status) ~ age+sex+ph.ecog+ph.karno, data = lung)
summary(cox_model)
autoReg(cox_model,uni=T)

Cox模型的参数

结果的第1列coef是上述模型公式中的变量系数b，第2列exp(coef)就是HR，第4列是P值，后面还总结了HR的95%置信区间，分别是lower.95和upper.95。autoReg的结果就更加简单明了，设置uni=True的话还会同时总结单因素分析的结果呢，是不是很方便？这里要注意sex这个变量，如果我们不将它转换成因子（factor），那么也会总结为类似age (Mean±SD)的形式，这对于分类变量就显然不合适了。

那么这就是本期的全部内容啦，你学会了吗？下一期，我们将为大家讲解使用Cox比例风险模型应该满足的条件，以及如何判断自己的数据是否符合这些条件。大家对于推送内容有任何问题或建议可以在公众号菜单栏“更多--读者的话” 栏目中提出，我们会尽快回复！

写在最后

“观科研”（点击进一步了解我们吧）是由一群北京协和医学院（清华大学医学部）的博士开创的公众号，初心是让医学科研有迹可循，帮助一线的医学科研人员更快地成长，希望大家支持与关注！

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。