登录    注册    忘记密码

期刊文章详细信息

面向不平衡数据集分类的LDBSMOTE过采样方法    

LDBSMOTE Oversampling Method for Imbalanced Data Sets Classification

  

文献类型:期刊文章

作  者:王泳欣[1,2] 张大斌[1] 车大庆[1,2] 吕建秋[1,2]

Wang Yongxin;Zhang Dabin;Che Daqing;Lyu Jianqiu(College of Mathematics and Informatics,South China Agricultural University;Guangdong Academy of Science and Technology Management and Planning,Guangzhou 510642,China)

机构地区:[1]华南农业大学数学与信息学院 [2]广东省科技管理与规划研究院,广州510642

出  处:《统计与决策》

基  金:国家自然科学基金面上项目(71971089)。

年  份:2022

期  号:18

起止页码:58-63

语  种:中文

收录情况:BDHX、BDHX2020、CSSCI、CSSCI2021_2022、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:文章针对传统SMOTE及BSMOTE过采样方法会导致多数类样本识别率下降的问题,提出基于局部密度的改进BSMOTE算法(LDBSMOTE)。首先,根据样本分布特点计算局部密度值并筛选根样本,最大限度地保证具有潜在价值的样本不会被丢失,然后通过SMOTE合成样本,最后利用集成学习算法进行分类。为了验证LDBSMOTE的有效性对15个公共数据集进行实验,结果表明,相比SMOTE和BSMOTE,LDBSMOTE算法在F1、G-mean及AUC上平均提升了2.25%,且平均得分均为最高,能在保证多数类样本识别率的基础上提升少数类样本的识别率,有效提升分类性能。

关 键 词:不平衡数据集 局部密度  SMOTE 集成学习  

分 类 号:TP311]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心