登录    注册    忘记密码

期刊文章详细信息

一种新的过采样算法DB_SMOTE    

New oversampling algorithm DB_SMOTE

  

文献类型:期刊文章

作  者:刘余霞[1] 刘三民[2,3] 刘涛[2] 王忠群[4]

机构地区:[1]安徽工程大学建筑工程学院,安徽芜湖241000 [2]安徽工程大学计算机与信息学院,安徽芜湖241000 [3]南京航空航天大学计算机科学与技术学院,南京210016 [4]安徽工程大学管理工程学院,安徽芜湖241000

出  处:《计算机工程与应用》

基  金:国家自然科学基金(No.61300170;No.71371012);教育部人文社科基金(No.13YJA630098);安徽省自然科学基金重点资助项目(No.KJ2013A040);高校省级优秀青年人才基金重点项目(No.2013SQRL034ZD);校青年基金(No.2013YQ31;No.2012YQ32)

年  份:2014

卷  号:50

期  号:6

起止页码:92-95

语  种:中文

收录情况:AJ、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、IC、INSPEC、JST、RCCSE、ZGKJHX、普通刊

摘  要:针对非平衡数据集中类分布信息不对称现象,提出一种新的过采样算法DB_SMOTE(Distance-based Synthetic Minority Over-sampling Technique),通过合成少数类新样本解决样本不足问题。算法基于样本与类中心距离,结合类聚集程度提取种子样本。根据SMOTE(Synthetic Minority Over-sampling Technique)算法思想,在种子样本上实现少数类新样本合成。根据种子样本与少数类中心距离构造新样本分布函数。基于此采样算法并在多个数据集上进行分类实验,结果表明DB SMOTE算法是可行的。

关 键 词:非平衡数据学习  过采样 数据分类

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心