期刊文章详细信息
文献类型:期刊文章
机构地区:[1]吉林大学符号计算与知识工程教育部重点实验室,长春130012 [2]长春理工大学应用数学系,长春130022 [3]长春理工大学经济管理学院,长春130022
基 金:国家科技支撑计划项目(2006BAK01A33);吉林省科技发展计划项目(20070321;20090704)资助~~
年 份:2012
卷 号:35
期 号:2
起止页码:202-209
语 种:中文
收录情况:BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20121214874179)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:现实世界中广泛存在不平衡数据,其分类问题是机器学习研究中的一个热点.多数传统分类算法假定类分布平衡或误分类代价均衡,在处理不平衡数据时,效果不够理想.文中提出一种不平衡数据分类算法-PCBoost.算法以信息增益率为分裂准则构建决策树,作为弱分类器.在每次迭代初始,利用数据合成方法添加合成的少数类样例,平衡训练信息;在子分类器形成后,修正"扰动",删除未被正确分类的合成样例.文中讨论了数据合成方法,给出了训练误差界的理论分析,并分析了集成学习参数的选择.实验结果表明,PCBoost算法具有处理不平衡数据分类问题的优势.
关 键 词:数据挖掘 不平衡数据 集成学习 提升 扰动
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...