期刊文章详细信息
几种常用文本分类算法性能比较与分析 ( EI收录)
Performance Comparison and Analysis of Several General Text Classification Algorithms
文献类型:期刊文章
机构地区:[1]北京交通大学软件学院,北京100044 [2]湖南大学计算机与通信学院,湖南长沙410082
基 金:教育部科学技术研究重点课题资助项目(107114)
年 份:2007
卷 号:34
期 号:6
起止页码:67-69
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CAS、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20073110726255)、JST、MR、RCCSE、RSC、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:分析了几种典型的文本分类算法的特点,并基于中文文本数据集和英文文本数据集对算法性能进行了综合评价.实验结果表明:对于英文文本数据,支持向量机具有最优的性能,但时间开销最大,贝叶斯算法速度较快;对于中文文本数据,由于分词的困难,使得算法性能普遍低于同等规模下在英文数据集上的性能.几种算法性能均随训练集规模的增大而有改善.
关 键 词:文本分类 支持向量机 K近邻 贝叶斯算法 TFIDF算法
分 类 号:TP183]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...