登录    注册    忘记密码

期刊文章详细信息

面向不平衡数据分类的最近邻三角区域合成少数类过采样技术    

The Nearest Neighbor Triangle Regions Synthetic Minority Oversampling Technique for Imbalanced Data Classification

  

文献类型:期刊文章

作  者:刘丹[1] 王晓兰[2] 邢胜[1]

LIU Dan;WANG Xiao-lan;XING Sheng(College of Computer Science and Engineering,Cangzhou Normal University;Department of Information Engineering,Cangzhou Technical College,Cangzhou 061001,China)

机构地区:[1]沧州师范学院计算机科学与工程学院 [2]沧州职业技术学院信息工程系,沧州061001

出  处:《科学技术与工程》

基  金:国家自然科学基金(71371063;61170040;61672205)资助

年  份:2018

卷  号:18

期  号:28

起止页码:215-219

语  种:中文

收录情况:BDHX、BDHX2017、RCCSE、ZGKJHX、核心刊

摘  要:针对传统的合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)在类别区域重合的数据集应用时,可能产生多个更接近多数类的人工样例,甚至突破类别边界,从而影响整体分类性能的情况,提出了一种最近三角区域的SMOTE方法,使合成的人工样例只出现在少数类样例的最近三角区域内部,并且删除掉距离多数类更近的合成样例,从而使生成的样例更接近少数类,且不突破原始的类别边界。实验分别在人工数据集和改进的UCI数据集上进行,并和原始的SMOTE方法分别在G-mean和F-value的评价指标上进行了对比。实验结果验证了改进的SMOTE方法在类别区域有重合的数据集上要优于原始SMOTE方法。

关 键 词:不平衡数据 过采样方法  分类  最近邻规则  

分 类 号:TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心