期刊文章详细信息
一种基于多重因子加权的文本特征项权值计算方法
A Method for Computing Weight of Text Characteristic Item Based on Multiple Factors Weighting
文献类型:期刊文章
机构地区:[1]湖南环境生物职业技术学院信息技术系,湖南衡阳421005 [2]湘潭大学信息工程学院,湖南湘潭411105
年 份:2007
卷 号:26
期 号:1
起止页码:81-83
语 种:中文
收录情况:ZGKJHX、普通刊
摘 要:根据中文文本的特点,不仅考虑文本中词汇概率信息,还结合文本语义等多方面信息来计算文本特征项的权值,从而提出一种基于多重因子加权的特征项权值计算方法,并给出具体算法。通过与基于词频及基于TF-IDF的特征项权值计算方法的比较试验,证明文中提出的特征项权值计算方法能有效提高文本聚类的正确率。
关 键 词:特征项 文本聚类 中文文本 自然语言处理
分 类 号:TP301]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...