登录    注册    忘记密码

期刊文章详细信息

一种新的不平衡数据学习算法PCBoost  ( EI收录)  

A New Learning Algorithm for Imbalanced Data—PCBoost

  

文献类型:期刊文章

作  者:李雄飞[1] 李军[1,2] 董元方[1,3] 屈成伟[1]

机构地区:[1]吉林大学符号计算与知识工程教育部重点实验室,长春130012 [2]长春理工大学应用数学系,长春130022 [3]长春理工大学经济管理学院,长春130022

出  处:《计算机学报》

基  金:国家科技支撑计划项目(2006BAK01A33);吉林省科技发展计划项目(20070321;20090704)资助~~

年  份:2012

卷  号:35

期  号:2

起止页码:202-209

语  种:中文

收录情况:BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20121214874179)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:现实世界中广泛存在不平衡数据,其分类问题是机器学习研究中的一个热点.多数传统分类算法假定类分布平衡或误分类代价均衡,在处理不平衡数据时,效果不够理想.文中提出一种不平衡数据分类算法-PCBoost.算法以信息增益率为分裂准则构建决策树,作为弱分类器.在每次迭代初始,利用数据合成方法添加合成的少数类样例,平衡训练信息;在子分类器形成后,修正"扰动",删除未被正确分类的合成样例.文中讨论了数据合成方法,给出了训练误差界的理论分析,并分析了集成学习参数的选择.实验结果表明,PCBoost算法具有处理不平衡数据分类问题的优势.

关 键 词:数据挖掘 不平衡数据 集成学习  提升  扰动  

分 类 号:TP18]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心