登录    注册    忘记密码

期刊文章详细信息

基于混合并行遗传算法的文本聚类研究    

Research of Text Clustering Based on Hybrid Parallel Genetic Algorithm

  

文献类型:期刊文章

作  者:何婷婷[1] 戴文华[1] 焦翠珍[2]

机构地区:[1]华中师范大学计算机科学系,湖北武汉430079 [2]咸宁学院计算机系,湖北咸宁437005

出  处:《中文信息学报》

基  金:国家自然科学基金资助项目(60442005);国家自然科学基金资助项目(60673040);国家社会科学基金资助项目(06BYY029);教育部科学技术研究重点项目资助(105117)

年  份:2007

卷  号:21

期  号:4

起止页码:55-60

语  种:中文

收录情况:BDHX、BDHX2004、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊

摘  要:针对传统K-Means聚类算法对初始聚类中心的选择敏感,易陷入局部最优解的问题,提出一种基于混合并行遗传算法的文本聚类方法。该方法首先将文档集合表示成向量空间模型,并在文档向量中随机选择初始聚类中心形成染色体,然后结合K-Means算法的高效性和并行遗传算法的全局优化能力,通过种群内的遗传、变异和种群间的并行进化、联姻,有效地避免了局部最优解的出现。实验表明该算法相对于K-Means算法、简单遗传算法等文本聚类方法具有更高的精确度和全局寻优能力。

关 键 词:计算机应用  中文信息处理 并行遗传算法 K—Means聚类  文本聚类 向量空间模型 特征抽取  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心