登录    注册    忘记密码

期刊文章详细信息

若干评价准则对不平衡数据学习的影响  ( EI收录)  

Effects of Several Evaluation Metrics on Imbalanced Data Learning

  

文献类型:期刊文章

作  者:林智勇[1] 郝志峰[2] 杨晓伟[3]

机构地区:[1]华南理工大学计算机科学与工程学院,广东广州510640 [2]广东工业大学应用数学学院,广东广州510006 [3]华南理工大学理学院,广东广州510640

出  处:《华南理工大学学报(自然科学版)》

基  金:广东省教育部产学研结合项目(2007B090400031);广东高校优秀青年创新人才培育项目(LYM08074)

年  份:2010

卷  号:38

期  号:4

起止页码:147-155

语  种:中文

收录情况:AJ、BDHX、BDHX2008、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:为解决绝大部分传统的以精度准则为优化目标而获得的分类器不适于不平衡数据学习(IDL)的问题,文中通过在支持向量机(SVM)模型上进行"元学习",研究了精度、平衡精度、几何平均、F1得分、信息增益、AUC(ROC曲线下方图面积)以及文中新提出的GAF和GBF等评价准则对IDL的影响.在16个来自UCI的不平衡数据集上进行了仿真实验.对实验结果的统计分析表明:不同准则对分类器性能的影响有显著差异;即便是对于先进的学习方法支持向量机(SVM)而言,若以精度准则最大化选择分类器,那么得到的SVM分类器也容易偏向预测多类;通过在其他准则上优化,能输出纠偏了的SVM分类器,它们的整体性能更好,尤其是在预测少类能力方面;在GAF以及GBF准则上优化所得的SVM分类器具有稳定且良好的性能.

关 键 词:评价准则  不平衡数据学习  支持向量机 GAF准则  GBF准则  

分 类 号:TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心