登录    注册    忘记密码

期刊文章详细信息

不平衡分类的数据采样方法综述    

A Survey on Data Sampling Methods in Imbalance Classification

  

文献类型:期刊文章

作  者:刘定祥[1] 乔少杰[2] 张永清[3] 韩楠[4] 魏军林[1] 张榕珂[5] 黄萍[4]

LIU Dingxiang;QIAO Shaojie;ZHANG Yongqing;HAN Nan;WEI Junlin;ZHANG Rongke;HUANG Ping(School of Cybersecurity,Chengdu University of Information Technology,Chengdu 610225,China;School of Software Engineering,Chengdu University of Information Technology,Chengdu 610225,China;School of Computer Science,Chengdu University of Information Technology,Chengdu 610225,China;School of Management,Chengdu University of Information Technology,Chengdu 610225,China;Western General Hospital,Chengdu 610083,China)

机构地区:[1]成都信息工程大学网络空间安全学院,成都610225 [2]成都信息工程大学软件工程学院,成都610225 [3]成都信息工程大学计算机学院,成都610225 [4]成都信息工程大学管理学院,成都610225 [5]西部战区总医院,成都610083

出  处:《重庆理工大学学报(自然科学)》

基  金:国家自然科学基金资助项目(61772091,61802035,61702058);广西自然科学基金资助项目(2018GXNSFDA138005);四川省科技计划项目(2018JY0448);四川高校科研创新团队建设计划项目(18TD0027);成都市软科学研究项目(2017-RK00-00053-ZF);成都信息工程大学中青年学术带头人科研基金资助项目(J201701);成都信息工程大学科研基金资助项目(KYTZ201715,KYTZ201750)

年  份:2019

卷  号:33

期  号:7

起止页码:102-112

语  种:中文

收录情况:BDHX、BDHX2017、CAS、JST、RCCSE、ZGKJHX、核心刊

摘  要:如何获得更加精确的分类效果一直是机器学习领域的重要研究内容,现有大多数分类器都是针对平衡的数据集来设计的。虽然平衡的数据训练出来的分类模型能取得较好的正负样本分类正确率,但现实生活中的数据往往是不平衡的,不平衡的数据使得正样本分类正确率急剧下降,不能满足机器学习对分类效果的要求。针对这种情况,综述了当前主流不平衡分类的数据采样方法。首先,阐述了欠采样方法,包括基于聚类和基于整合的欠采样方法;其次,对过采样方法进行了总结,包括基于k近邻、基于聚类、基于半监督、基于深度神经网络和基于进化算法的过采样方法;再次,对混合采样方法进行了总结;最后,总结了不平衡分类问题研究的发展趋势。

关 键 词:机器学习  不平衡数据 过采样 欠采样 混合采样

分 类 号:TP311]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心