期刊文章详细信息
基于文本分类TFIDF方法的改进与应用 ( EI收录)
Improvement and Application of TFIDF Method Based on Text Classification
文献类型:期刊文章
机构地区:[1]重庆大学计算机学院,重庆400045 [2]重庆师范大学数学与计算机科学学院,重庆400047
年 份:2006
卷 号:32
期 号:19
起止页码:76-78
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20064810278815)、IC、INSPEC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊
摘 要:TFIDF是文档特征权值表示常用方法。该方法简单易行,但低估了在一个类中频繁出现的词条,该词条是能够代表这个类的文本特征的,应该赋予其较高的权重。通过修改TFIDF中IDF的表达式,来增加那些在一个类中频繁出现的词条的权重,用改进的TFIDF选择特征词条、用遗传算法训练分类器来验证其有效性。该方法优于其它算法,实验表明了改进的策略是可行的。
关 键 词:文本分类 特征选择 TFIDF 类别区分
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...