期刊文章详细信息
基于混合采样策略的改进随机森林不平衡数据分类算法
Improved Random Forest Classification Algorithm for Imbalance Data Based on Hybrid Sampling Strategy
文献类型:期刊文章
ZHENG Jianhua;LIU Shuangyin;HE Chaobo;FU Zhiqiang(College of Information Science and Technology,Zhongkai University of Agriculture and Engineering,Guangzhou 510225,China;Guangdong Engineering & Technology Research Center for Smart Agriculture,Guangzhou 510225,China)
机构地区:[1]仲恺农业工程学院信息科学与技术学院,广州510225 [2]广东省高校智慧农业工程技术研究中心,广州510225
基 金:国家自然科学基金资助项目(61471133,61871475);广东省科技计划项目(2017A070712019,2017B010126001);广东省教育厅项目(2016KZDXM001,2017GCZX001);广州市科技计划项目(201704030098)
年 份:2019
卷 号:33
期 号:7
起止页码:113-123
语 种:中文
收录情况:BDHX、BDHX2017、CAS、JST、RCCSE、ZGKJHX、核心刊
摘 要:针对传统分类算法难以处理不平衡数据的问题,提出了一种基于混合采样策略的改进随机森林不平衡数据分类算法。首先从理论上分析了混合采样策略提升随机森林基分类器多样性的机理,随后设计了改进随机森林不平衡数据分类算法。算法采用过采样和欠采样混合采样策略为每棵子树生成不同的平衡训练子集,再利用该训练子集训练子树,从而创建随机森林分类器。最后用13种不平衡数据集进行实验测试。结果显示:采用较小的过采样因子可以取得较好的分类效果;与9种对照算法相比,改进的随机森林分类算法在AUC值对比时获得10个最优结果,G-mean值对比时获得9个最优结果。
关 键 词:混合采样策略 随机森林 不平衡数据 集成学习 分类算法
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...