登录    注册    忘记密码

期刊文章详细信息

不平衡数据集分类方法综述    

Review of Classification Methods for Unbalanced Data Sets

  

文献类型:期刊文章

作  者:王乐[1] 韩萌[1] 李小娟[1] 张妮[1] 程浩东[1]

WANG Le;HAN Meng;LI Xiaojuan;ZHANG Ni;CHENG Haodong(School of Computer Science and Engineering,North Minzu University,Yinchuan 750021,China)

机构地区:[1]北方民族大学计算机科学与工程学院,银川750021

出  处:《计算机工程与应用》

基  金:国家自然科学基金(62062004);宁夏自然科学基金(2020AAC03216);北方民族大学研究生创新项目(YCX20082)。

年  份:2021

卷  号:57

期  号:22

起止页码:42-52

语  种:中文

收录情况:AJ、BDHX、BDHX2020、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、ZGKJHX、核心刊

摘  要:不平衡数据集的特点导致了在分类时产生了诸多难题。对不平衡数据集的分类方法进行了分析与总结。在数据采样方法中从欠采样、过采样和混合采样三方面介绍不平衡数据集的分类方法;在欠采样方法中分为基于K近邻、Bagging和Boosting三种方法;在过采样方法中从合成少数过采样技术(SyntheticMinorityOver-sampling Technology,SMOTE)、支持向量机(SupportVectorMachine,SVM)两个角度来分析不平衡数据集的分类方法;对这两类采样方法的优缺点进行了比较,在相同数据集下比较算法的性能并进行分析与总结。从深度学习、极限学习机、代价敏感和特征选择四方面对不平衡数据集的分类方法进行了归纳。最后对下一步工作方向进行了展望。

关 键 词:不平衡数据集 分类  采样方法  K近邻(KNN)  合成少数过采样技术(SMOTE)  深度学习  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心