期刊文章详细信息
重采样分类模型在我国中老年糖尿病血糖控制中的预测研究
Resampling classification model for predicting blood glucose control in middle-aged and elderly diabetic patients in China
文献类型:期刊文章
WANG Ping;ZHANG Le;HONG Xiaorui;ZHU Suling;ZHAO Xuejing(Department of Epidemiology and Health Statistics,School of Public Health,Lanzhou University,Lanzhou 730000,China;Institute of Probability and Statistics,School of Mathematics and Statistics,Lanzhou University,Lanzhou 730000,China)
机构地区:[1]兰州大学公共卫生学院流行病与卫生统计研究所,兰州730000 [2]兰州大学数学与统计学院概率统计研究所,兰州730000
基 金:国家自然科学基金(11971214)。
年 份:2024
卷 号:28
期 号:9
起止页码:1005-1009
语 种:中文
收录情况:BDHX、BDHX2023、CAS、CSCD、CSCD2023_2024、EMBASE、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:目的利用重采样算法提高糖尿病患者血糖控制分类模型的预测性能。方法对中国健康与养老追踪调查(China health and retirement longitudinal study,CHARLS)数据库中糖尿病患者血糖控制不平衡数据进行重采样,比较重采样前后logistic回归(logistic regression,LR)、支持向量机(support vector machines,SVM)和随机森林(random forest,RF)的分类性能,利用分层五折交叉验证和受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC)确定模型的最优参数,以准确率、灵敏度、特异度、精确率、几何均值(geometric mean,G-mean)、F1分数和AUC为评价指标,比较重采样前后分类模型的性能。结果几种重采样算法均可提高3种分类模型的灵敏度、G-mean和F1分数;重采样算法过采样(adaptive synthetic sampling,ADASYN)、组合采样[合成少数类过采样技术和编辑最近邻(synthetic minority over-sampling technique and edited nearest neighbors,SMOTE-ENN);合成少数类过采样技术和Tomek链接(synthetic minority over-sampling technique tomek,SMOTE-Tomek)]对3种分类模型的AUC值均有不同程度的提高,其中ADASYN使LR分类模型的AUC值提高2.13%,SMOTE-ENN使LR分类模型的AUC值提高3.05%,SMOTE-Tomek使RF分类模型的AUC值提高2.13%。结论ADASYN、SMOTE-ENN、SMOTE-Tomek能较好地处理糖尿病患者血糖控制不平衡数据的问题,提高糖尿病患者血糖控制分类模型的预测性能。
关 键 词:重采样算法 不平衡分类 糖尿病 血糖控制
分 类 号:R587.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...