期刊文章详细信息
文献类型:期刊文章
机构地区:[1]西北大学可视化研究所,西安710069 [2]周口师范学院计算机系,河南周口466000 [3]北京师范大学信息科学与技术学院,北京100875
基 金:十一五国家科技支撑计划重点资助项目,编号2006BAD20B02
年 份:2008
卷 号:40
期 号:4
起止页码:48-51
语 种:中文
收录情况:CAS、CSA-PROQEUST、IC、JST、MR、RCCSE、RSC、ZGKJHX、ZMATH、普通刊
摘 要:研究了典型的特征加权方法,分析了词频权重以及tf*idf权重等特征加权方法在表现特征重要性上的不足,提出了一种新的特征权重计算方法tf*idf*cf.该方法综合考虑了特征频率、文档频率以及特征类别信息,更为全面准确地描述了特征在文本中的重要程度.实验结果表明,该方法可以有效地改善分类性能.
关 键 词:文本分类 向量空间模型 特征权重
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...