期刊文章详细信息
文献类型:期刊文章
机构地区:[1]安徽工程大学建筑工程学院,安徽芜湖241000 [2]安徽工程大学计算机与信息学院,安徽芜湖241000 [3]南京航空航天大学计算机科学与技术学院,南京210016 [4]安徽工程大学管理工程学院,安徽芜湖241000
基 金:国家自然科学基金(No.61300170;No.71371012);教育部人文社科基金(No.13YJA630098);安徽省自然科学基金重点资助项目(No.KJ2013A040);高校省级优秀青年人才基金重点项目(No.2013SQRL034ZD);校青年基金(No.2013YQ31;No.2012YQ32)
年 份:2014
卷 号:50
期 号:6
起止页码:92-95
语 种:中文
收录情况:AJ、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、IC、INSPEC、JST、RCCSE、ZGKJHX、普通刊
摘 要:针对非平衡数据集中类分布信息不对称现象,提出一种新的过采样算法DB_SMOTE(Distance-based Synthetic Minority Over-sampling Technique),通过合成少数类新样本解决样本不足问题。算法基于样本与类中心距离,结合类聚集程度提取种子样本。根据SMOTE(Synthetic Minority Over-sampling Technique)算法思想,在种子样本上实现少数类新样本合成。根据种子样本与少数类中心距离构造新样本分布函数。基于此采样算法并在多个数据集上进行分类实验,结果表明DB SMOTE算法是可行的。
关 键 词:非平衡数据学习 过采样 数据分类
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...