登录    注册    忘记密码

期刊文章详细信息

重采样分类模型在我国中老年糖尿病血糖控制中的预测研究    

Resampling classification model for predicting blood glucose control in middle-aged and elderly diabetic patients in China

  

文献类型:期刊文章

作  者:王萍[1] 张乐[1] 洪小瑞[1] 朱素玲[1] 赵学靖[2]

WANG Ping;ZHANG Le;HONG Xiaorui;ZHU Suling;ZHAO Xuejing(Department of Epidemiology and Health Statistics,School of Public Health,Lanzhou University,Lanzhou 730000,China;Institute of Probability and Statistics,School of Mathematics and Statistics,Lanzhou University,Lanzhou 730000,China)

机构地区:[1]兰州大学公共卫生学院流行病与卫生统计研究所,兰州730000 [2]兰州大学数学与统计学院概率统计研究所,兰州730000

出  处:《中华疾病控制杂志》

基  金:国家自然科学基金(11971214)。

年  份:2024

卷  号:28

期  号:9

起止页码:1005-1009

语  种:中文

收录情况:BDHX、BDHX2023、CAS、CSCD、CSCD2023_2024、EMBASE、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:目的利用重采样算法提高糖尿病患者血糖控制分类模型的预测性能。方法对中国健康与养老追踪调查(China health and retirement longitudinal study,CHARLS)数据库中糖尿病患者血糖控制不平衡数据进行重采样,比较重采样前后logistic回归(logistic regression,LR)、支持向量机(support vector machines,SVM)和随机森林(random forest,RF)的分类性能,利用分层五折交叉验证和受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC)确定模型的最优参数,以准确率、灵敏度、特异度、精确率、几何均值(geometric mean,G-mean)、F1分数和AUC为评价指标,比较重采样前后分类模型的性能。结果几种重采样算法均可提高3种分类模型的灵敏度、G-mean和F1分数;重采样算法过采样(adaptive synthetic sampling,ADASYN)、组合采样[合成少数类过采样技术和编辑最近邻(synthetic minority over-sampling technique and edited nearest neighbors,SMOTE-ENN);合成少数类过采样技术和Tomek链接(synthetic minority over-sampling technique tomek,SMOTE-Tomek)]对3种分类模型的AUC值均有不同程度的提高,其中ADASYN使LR分类模型的AUC值提高2.13%,SMOTE-ENN使LR分类模型的AUC值提高3.05%,SMOTE-Tomek使RF分类模型的AUC值提高2.13%。结论ADASYN、SMOTE-ENN、SMOTE-Tomek能较好地处理糖尿病患者血糖控制不平衡数据的问题,提高糖尿病患者血糖控制分类模型的预测性能。

关 键 词:重采样算法  不平衡分类  糖尿病 血糖控制

分 类 号:R587.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心