上期内容中,我们介绍了logistic回归的相关内容(第7期.Logistic回归,从原理到操作,一文搞定!),相信你已经掌握了如何实现和解读logistic回归。在接下来的几期内容,我们将详细地给大家讲解生存分析,内容精彩,千万别错过!
一、Cox比例风险模型的数学原理
按照惯例,我们先从Cox比例风险模型的基本理论开始。下图为Cox比例风险模型的数学表达式,h(t)也叫做风险函数,t代表生存时间,x为协变量,b代表协变量的系数。细心的你一定注意到了,这个式子似乎和logit函数有些相似性。
风险函数h(t)可以理解为:在给定时间点t下,个体发生事件的风险。为了方便讲解,后面都用死亡代替事件发生。和比值比(OR)类似的,风险比(Hazard ratio,HR)是两个风险函数的比值,表示当自变量X变化1个单位时,个体死亡风险为原来的HR倍。 因此,当某个变量的HR>1时,说明它会增加死亡风险,反之亦然。
HR的推导过程
二、Cox比例风险模型在R的实现
library(survival)
library(autoReg)
lung=lung
lung$sex=as.factor(lung$sex)
cox_model <- coxph(Surv(time, status) ~ age+sex+ph.ecog+ph.karno, data = lung)
summary(cox_model)
autoReg(cox_model,uni=T)
结果的第1列coef是上述模型公式中的变量系数b,第2列exp(coef)就是HR,第4列是P值,后面还总结了HR的95%置信区间,分别是lower.95和upper.95。autoReg的结果就更加简单明了,设置uni=True的话还会同时总结单因素分析的结果呢,是不是很方便?这里要注意sex这个变量,如果我们不将它转换成因子(factor),那么也会总结为类似age (Mean±SD)的形式,这对于分类变量就显然不合适了。
那么这就是本期的全部内容啦,你学会了吗?下一期,我们将为大家讲解使用Cox比例风险模型应该满足的条件,以及如何判断自己的数据是否符合这些条件。大家对于推送内容有任何问题或建议可以在公众号菜单栏“更多--读者的话” 栏目中提出,我们会尽快回复!
写在最后
“观科研”(点击进一步了解我们吧)是由一群北京协和医学院(清华大学医学部)的博士开创的公众号,初心是让医学科研有迹可循,帮助一线的医学科研人员更快地成长,希望大家支持与关注!
联系客服