期刊文章详细信息
文献类型:期刊文章
Wang Yongxin;Zhang Dabin;Che Daqing;Lyu Jianqiu(College of Mathematics and Informatics,South China Agricultural University;Guangdong Academy of Science and Technology Management and Planning,Guangzhou 510642,China)
机构地区:[1]华南农业大学数学与信息学院 [2]广东省科技管理与规划研究院,广州510642
基 金:国家自然科学基金面上项目(71971089)。
年 份:2022
期 号:18
起止页码:58-63
语 种:中文
收录情况:BDHX、BDHX2020、CSSCI、CSSCI2021_2022、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:文章针对传统SMOTE及BSMOTE过采样方法会导致多数类样本识别率下降的问题,提出基于局部密度的改进BSMOTE算法(LDBSMOTE)。首先,根据样本分布特点计算局部密度值并筛选根样本,最大限度地保证具有潜在价值的样本不会被丢失,然后通过SMOTE合成样本,最后利用集成学习算法进行分类。为了验证LDBSMOTE的有效性对15个公共数据集进行实验,结果表明,相比SMOTE和BSMOTE,LDBSMOTE算法在F1、G-mean及AUC上平均提升了2.25%,且平均得分均为最高,能在保证多数类样本识别率的基础上提升少数类样本的识别率,有效提升分类性能。
关 键 词:不平衡数据集 局部密度 SMOTE 集成学习
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...