期刊文章详细信息
改进的信息增益特征选择方法在文本聚类中的应用
Application of Improved Information Gain Feature Selection Methodto Text Clustering
文献类型:期刊文章
机构地区:[1]宁波大学管理科学与工程系,浙江315211 [2]南京大学工商管理系,江苏210093
基 金:国家社会科学基金项目部分研究成果 (项目编号 :0 0 BTQ0 15 );浙江省教育厅高校科研项目;编号为 2 0 0 40 997
年 份:2004
期 号:12
起止页码:7-9
语 种:中文
收录情况:BDHX、BDHX2000、CSSCI、CSSCI2004_2005、RWSKHX、核心刊
摘 要:利用改进的信息增益特征选择的方法 ,对文本进行了有效的自动聚类。从语料库中抽取了 2 5 0篇文本 ,利用向量空间模型和信息增益特征降维方法 ,构造文本特征向量 ,并最终利用 C-均值方法聚类 ,聚类结果精度、召回率、F- measure分别达到 0 .82、0 .88、0 .
关 键 词:信息增益 特征选择 聚类
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...