期刊文章详细信息
文献类型:期刊文章
机构地区:[1]华南理工大学计算机科学与工程学院,广东广州510640 [2]广东工业大学应用数学学院,广东广州510006 [3]华南理工大学理学院,广东广州510640
基 金:广东省教育部产学研结合项目(2007B090400031);广东高校优秀青年创新人才培育项目(LYM08074)
年 份:2010
卷 号:38
期 号:4
起止页码:147-155
语 种:中文
收录情况:AJ、BDHX、BDHX2008、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:为解决绝大部分传统的以精度准则为优化目标而获得的分类器不适于不平衡数据学习(IDL)的问题,文中通过在支持向量机(SVM)模型上进行"元学习",研究了精度、平衡精度、几何平均、F1得分、信息增益、AUC(ROC曲线下方图面积)以及文中新提出的GAF和GBF等评价准则对IDL的影响.在16个来自UCI的不平衡数据集上进行了仿真实验.对实验结果的统计分析表明:不同准则对分类器性能的影响有显著差异;即便是对于先进的学习方法支持向量机(SVM)而言,若以精度准则最大化选择分类器,那么得到的SVM分类器也容易偏向预测多类;通过在其他准则上优化,能输出纠偏了的SVM分类器,它们的整体性能更好,尤其是在预测少类能力方面;在GAF以及GBF准则上优化所得的SVM分类器具有稳定且良好的性能.
关 键 词:评价准则 不平衡数据学习 支持向量机 GAF准则 GBF准则
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...