打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
0实验+CHARLS+预测模型=SCI二区!这篇预测模型做的很规范
‍零基础CHARLS发论文,不容错过!
长期回放+更新+指导!适合零基础,毕业论文,赠送2011-2020年CHARLS清洗后的数据+全套代码!
想学习如何构建预测模型的一定要看这篇文章!到2023年,抑郁症已成为全球疾病负担的首位,特别是中老年残疾人,往往有更严重的抑郁倾向。中国学者使用CHARLS数据库构建了中国中老年肢体残疾者抑郁的预测模型,筛选出与抑郁高度相关的预测变量。该模型的构建可以帮助临床工作者快速筛选出患抑郁症风险较高的中老年人肢体残疾人群,从而实现对抑郁症的早发现、早干预、早治疗。2024年4月23日,山东大学的学者用CHARLS数据库,在期刊BMC Public Health(医学二区top,IF=4.5)发表了题为:“A predictive model for depression in Chinese middle-aged and elderly people with physical disabilities”的研究论文,本研究旨在开发一个抑郁预测模型,基于中老年人抑郁的危险因素评估中国中老年人身体残疾患抑郁症的可能性,以便为抑郁症高风险的身体残疾中老年人提供早期识别、干预和治疗。
本公众号回复“ 原文”即可获得文献PDF等资料
根据分析,研究团队得出了以下结果:
老年人(65岁以上)的抑郁症患病率高于中年人(45~65岁)。
对于中年组,在45 ~ 50岁之间,年龄是保护因素,大于50岁是危险因素,并且随着年龄的增长相关性更强。年龄越大,相关性越弱。
下面我们一起来详细看看!主要研究结果
1.研究设计本研究选取中国健康与退休纵向研究(CHARLS)2015年至2018年的数据,最终共纳入1052名45岁以上有身体残疾的参与者。
抑郁评估:流行病学研究中心抑郁量表(CES-D10),量表包含10个项目,每个项目得分:0(很少或根本没有),1(有时),2(大部分时间),3(所有时间)。总分在0~30分之间,评分≥10分定义为抑郁症。
中老年人的定义:45~65岁的为中年人,65岁以上的为老年人。
身体残疾人群:肢体残疾定义为由于肢体残疾或肢体躯干瘫痪或畸形导致人体运动系统不同程度的功能丧失或功能障碍。
2.基线特征研究共纳入1052名有身体残疾的老年人,其中497人未患抑郁症(47.2%),555名患有抑郁症(52.8%)。结果显示,中国中老年残疾人士的抑郁症患病率超过50%,80%以上的抑郁症患者生活在缺乏医疗保护的农村地区。
3.年龄和抑郁的关联研究者绘制了年龄与抑郁之间的限制性立方样条回归模型。对于中年组,年龄在45 ~ 50岁之间是保护因素,大于50岁是危险因素,并且随着年龄的增长相关性更强。年龄越大,相关性越弱。中年组(45~65岁)648人,其中335人(51.6%)患有抑郁症。
老年组(65岁以上)共有404人,其中220人(54.5%)患有抑郁症。
注:
实线表示ORs(优势比),阴影形状表示95% CI(置信区间)4.LASSO回归分析结合二元logistic回归分析筛选预测变量在LASSO选择路径图(图3A)中,显示了λ的两个具体值:lambda.min和lambda.1se。LASSO路径图如图显示,随着系数的降低,预测因子也相应降低。研究团队基于lambda筛选了22个预测变量。
将经由SPSS软件筛选的18个具有统计学意义的预测变量纳入二元logistic回归分析,将有序分类变量设为协变量,结果如下表所示。
Hosmer-Lemeshaw检验显著性为0.819,表明模型拟合良好。
根据P<0.10的原则,我们从表中筛选出性别、居住地址、近视、听力、未来可能有助力、过去一年是否酗酒、上厕所困难、准备热餐困难、残疾无法工作共9个变量来构建模型。5.中国中老年肢体残疾者抑郁预测模型的构建与验证
在确定了构建中国肢体残疾中老年人抑郁预测模型的最终变量后,我们在Rstudio中使用“rms”包构建模型,并使用包中的“nomogram”函数生成列线图。
中国中老年人躯体残疾抑郁预测模型的ROC曲线下面积为0.714 (95% CI: 0.673 ~ 0.751),如图B所示。
模型的召回率为0.655,精确率为0.692,F1_score为0.672,Brier评分为0.213。平均校准曲线的绝对误差均值为0.016,如图C所示。
DCA曲线显示,在较宽的阈值范围内,使用包含9个预测变量的模型比使用单个预测变量的模型具有更高的垂直坐标值。这表明本研究构建的预测模型具有更大的增益,见图D。
净增益曲线显示,使用预测变量的患者发生抑郁的风险较高,见图E。
内部验证的结果如下图:
ROC曲线下面积为0.716,见A。校准曲线的平均绝对误差为0.018,见图B。
外部验证的结果如下图:ROC曲线下面积为0.716 (95% CI: 0.660-0.772),如图A所示。校准曲线的平均绝对误差为0.016,如图B所示。
统计学方法
1.LASSO回归分析结合二元logistic回归分析筛选预测变量
我们将数据集随机分为训练集和验证集,比例为7:3。在训练集中,我们使用R软件包“glmnet”(版本4.2.2)进行LASSO回归分析。对训练集中的变量进行初步筛选后,使用SPSS (version 26)对上述变量进行二元logistic回归分析。
2.使用函数构建模型筛选中国中老年肢体残疾抑郁预测模型的预测变量后,我们利用设计包中的lrm函数在Rstudio中构建模型。我们使用“rms”包中的“nomogram”函数将模型可视化。
3.校准曲线使用校准曲线评估预测模型的校准性能。通过比较实际观测值与模型预测值之间的关系,有助于研究人员了解模型在不同概率区间下的预测精度水平。
4.决策曲线使用决策曲线分析(DCA)来进一步评估评估不同阈值下分类模型决策性能的图形化工具,权衡分类模型的预测结果,确定最适合决策的阈值。
5.内部验证内部验证是模型开发的必要步骤,其意义在于量化所开发模型的预测性能。本研究采用Bootstrap重采样方法进行内部验证。
6.外部验证使用验证集中的C-index和校准曲线对模型进行外部验证。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
利用NHANES数据库还能构建预测模型? 中国学者写了篇文章,AUC=0.842
IF=6 (1区)机器学习:使用机器学习方法预测中国老年人抑郁症:一项纵向研究
[图文年终盘点]路向长江上,帆扬细雨时!
R语言Lasso回归模型变量选择和糖尿病发展预测模型
我有变量筛选恐惧症,到底哪些变量可以进入多因素统计模型?
运用LASSO Cox回归建立预测模型
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服