期刊文章详细信息
高度不平衡数据的代价敏感随机森林分类算法 ( EI收录)
Cost Sensitive Random Forest Classification Algorithm for Highly Unbalanced Data
文献类型:期刊文章
PING Rui;ZHOU Shuisheng;LI Dong(School of Mathematics and Statistics,Xidian University,Xi'an 710126)
机构地区:[1]西安电子科技大学数学与统计学院,西安710126
基 金:国家自然科学基金项目(No.61772020)资助。
年 份:2020
卷 号:33
期 号:3
起止页码:249-257
语 种:中文
收录情况:BDHX、BDHX2017、CSCD、CSCD2019_2020、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:在处理高度不平衡数据时,代价敏感随机森林算法存在自助法采样导致小类样本学习不充分、大类样本占比较大、容易削弱代价敏感机制等问题.文中通过对大类样本聚类后,多次采用弱平衡准则对每个集群进行降采样,使选择的大类样本与原训练集的小类样本融合生成多个新的不平衡数据集,用于代价敏感决策树的训练.由此提出基于聚类的弱平衡代价敏感随机森林算法,不仅使小类样本得到充分学习,同时通过降低大类样本数量,保证代价敏感机制受其影响较小.实验表明,文中算法在处理高度不平衡数据集时性能较优.
关 键 词:不平衡数据 聚类采样 代价敏感学习 随机森林
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...