期刊文章详细信息
文献类型:期刊文章
机构地区:[1]中国科学院动物研究所,北京100101
基 金:中国科学院战略性先导科技专项(XDA05080701);环保部公益项目(201209027)
年 份:2013
卷 号:50
期 号:4
起止页码:1190-1197
语 种:中文
收录情况:AJ、BDHX、BDHX2011、BIOSISPREVIEWS、CAB、CAS、CSA、CSCD、CSCD2013_2014、JST、RCCSE、WOS、ZGKJHX、核心刊
摘 要:随机森林(random forest)模型是由Breiman和Cutler在2001年提出的一种基于分类树的算法。它通过对大量分类树的汇总提高了模型的预测精度,是取代神经网络等传统机器学习方法的新的模型。随机森林的运算速度很快,在处理大数据时表现优异。随机森林不需要顾虑一般回归分析面临的多元共线性的问题,不用做变量选择。现有的随机森林软件包给出了所有变量的重要性。另外,随机森林便于计算变量的非线性作用,而且可以体现变量间的交互作用(interaction)。它对离群值也不敏感。本文通过3个案例,分别介绍了随机森林在昆虫种类的判别分析、有无数据的分析(取代逻辑斯蒂回归)和回归分析上的应用。案例的数据格式和R语言代码可为研究随机森林在分类与回归分析中的应用提供参考。
关 键 词:随机森林 分类树 判别分析 回归 机器学习
分 类 号:S711[林学类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...