期刊文章详细信息
随机森林算法基本思想及其在生态学中的应用--以云南松分布模拟为例
The basic principle of random forest and its applications in ecology: a case study of Pinus yunnanensis
文献类型:期刊文章
机构地区:[1]中国林业科学研究院林业研究所、国家林业局林木培育重点实验室,北京100091 [2]北京林业大学林学院,北京100083 [3]中国林业科学研究院森林生态环境与保护研究所、国家林业局森林生态环境重点实验室,北京100091 [4]Department of Forest Sciences,University of British Columbia,3041-2424 Main Mall,Vancouver B.C.Canada V6T 1Z4
基 金:国家自然科学基金资助项目(41301056,31290223);中央公益性院所基本科研业务专项资助项目(RIF2012-04);林业公益性行业科研专项资助项目(201104006,200804001);国家“十二五”科技支撑项目课题资助项目(2011BAD38B04)
年 份:2014
卷 号:34
期 号:3
起止页码:650-659
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、GEOBASE、IC、JST、PROQUEST、RCCSE、SCOPUS、WOS、ZGKJHX、ZR、核心刊
摘 要:通常来讲,生态学者对于解释生态关系、描述格局和过程、进行空间或时间预测比较感兴趣。这些工作可以通过模拟输出值(响应)与一些特征值(即解释变量)的关系来实现。然而,生态数据模拟遇到了挑战,这是因为响应变量和预测变量可能是连续变量或离散变量。需要解释的生态关系通常是非线性的,并且解释变量之间具有复杂的相互作用关系。响应变量和解释变量存在缺失值并不是不常有的现象,奇异值也经常出现在生态数据中。此外,生态学者通常希望生态模型即要易于建立又易要于解释。通常是利用多种统计方法来分析处理各种各样情景中出现的独特的生态问题,这些模型包括(多元)逻辑回归、线性模型、生存模型、方差分析等等。随机森林是一个可以处理所有这些问题的有效方法。随机森林可以用来做分类、聚类、回归和生存分析、评估变量的重要性、检测数据中的奇异值、对缺失数据进行插补等。鉴于随机森林本身在算法上的优势,将就随机森林在生态学中的应用进行总结,对建模过程进行概述,并以云南松分布模拟研究为例,对其主要功能特点进行案例展示。通过对随机森林的一般术语、概念和建模思想进行介绍,有利于读者掌握本方法的应用本质,可以预见随机森林在生态学研究中将得到更多的应用和发展。
关 键 词:随机森林 分类回归树 变量重要性 多维数据 物种分布模拟
分 类 号:S718.5[林学类] S114
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...