期刊文章详细信息
文献类型:期刊文章
WANG Le;HAN Meng;LI Xiaojuan;ZHANG Ni;CHENG Haodong(School of Computer Science and Engineering,North Minzu University,Yinchuan 750021,China)
机构地区:[1]北方民族大学计算机科学与工程学院,银川750021
基 金:国家自然科学基金(62062004);宁夏自然科学基金(2020AAC03216);北方民族大学研究生创新项目(YCX20082)。
年 份:2021
卷 号:57
期 号:22
起止页码:42-52
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、ZGKJHX、核心刊
摘 要:不平衡数据集的特点导致了在分类时产生了诸多难题。对不平衡数据集的分类方法进行了分析与总结。在数据采样方法中从欠采样、过采样和混合采样三方面介绍不平衡数据集的分类方法;在欠采样方法中分为基于K近邻、Bagging和Boosting三种方法;在过采样方法中从合成少数过采样技术(SyntheticMinorityOver-sampling Technology,SMOTE)、支持向量机(SupportVectorMachine,SVM)两个角度来分析不平衡数据集的分类方法;对这两类采样方法的优缺点进行了比较,在相同数据集下比较算法的性能并进行分析与总结。从深度学习、极限学习机、代价敏感和特征选择四方面对不平衡数据集的分类方法进行了归纳。最后对下一步工作方向进行了展望。
关 键 词:不平衡数据集 分类 采样方法 K近邻(KNN) 合成少数过采样技术(SMOTE) 深度学习
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...