登录    注册    忘记密码

期刊文章详细信息

文本分类算法中词语权重计算方法的改进    

Modify the Method of Feature's Weight in Text Classfication

  

文献类型:期刊文章

作  者:赵小华[1] 马建芬[1]

ZHAO Xiao-hua,MA Jian-fen(Dept.of Computer and Software College,Taiyuan University of Techonology,Taiyuan 030024,China)

机构地区:[1]太原理工大学计算机与软件学院

出  处:《电脑知识与技术》

年  份:2009

卷  号:0

期  号:12X

起止页码:10626-10628

语  种:中文

收录情况:普通刊

摘  要:在自动文本分类中,TFIDF公式是常用的词语权重计算公式。该方法简单易行,但仅仅考虑了特征词出现的频率,而忽略了特征词对区分每个类的贡献。针对这个不足,该文提出了TFIDF-CHI,来修正各个特征词的权重,重新调整每个特征词对各个类别的区分度,并用KNN分类器来验证其有效性。实验证明该方法优于原来的TFIDF算法,表明了改进的策略是可行的。

关 键 词:文本分类 特征权值 TFIDF TFIDF-CHI  

分 类 号:TP391.1[计算机类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心