登录    注册    忘记密码

期刊文章详细信息

基于随机森林的文本分类模型研究    

Automatic text classification model based on random forest

  

文献类型:期刊文章

作  者:张华伟[1] 王明文[1] 甘丽新[1]

机构地区:[1]江西师范大学计算机信息工程学院,江西南昌330022

出  处:《山东大学学报(理学版)》

基  金:教育部重点科技资助项目(03070);江西省自然科学基金资助项目(0311041)

年  份:2006

卷  号:41

期  号:3

起止页码:5-9

语  种:中文

收录情况:BDHX、BDHX2004、CAS、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、JST、MR、PROQUEST、RCCSE、RSC、ZGKJHX、ZMATH、核心刊

摘  要:随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构造.当森林中决策树的数目增大,随机森林的泛化误差将趋向一个上界.将随机森林模型应用于文本分类,在Reuter21578数据集上的实验表明,分类效果比较好,性能比较稳定,将其同C4.5,KNN,SM0,SVM 4种典型的文本分类器进行了比较,结果显示它的分类性能胜于C4.5,同KNN,SMO和SVM方法相当.

关 键 词:文本分类 随机森林  决策树 泛化误差

分 类 号:TP18]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心