Logistic回归模型被广泛应用于各个学科,如医学,社会学科,机器学习等,主要适用于因变量是分类变量的情况,尤其是二分类变量。该模型采用的是极大似然估计,这就需要足够的样本量来支持,今天就告诉大家一个简单的办法进行Logistic回归样本量的估算。
这个方法叫EPV(events per variable)。即每个自变量的事件数,其中事件表示表示应变量中个数较少的那一类。例如因变量为ICU存活情况,探索3个自变量,假设EPV等于10,而ICU的死亡率为30%。所以需要的死亡患者数为10*3=30,总共需要的样本量,30/30%=100.考虑到失访,增加20%的样本量,所以最后样本量为120例患者,其中30例ICU死亡患者。
联系客服