登录    注册    忘记密码

期刊文章详细信息

基于遗传算法的Web文档聚类算法    

Web documents clustering algorithm based on GA

  

文献类型:期刊文章

作  者:马艳英[1]

机构地区:[1]吉林工程技术师范学院传媒与数理学院,吉林长春130052

出  处:《现代电子技术》

基  金:吉林省教育科学"十二五"规划课题:应用型大学建设背景下大学生数学素养培养研究(GH150526);吉林工程技术师范学院校级课题:基于多元统计分析方法的矿产预测方法研究及应用(2015);2014年校级课题:应用型背景下<高等数学>教学模式的研究

年  份:2016

卷  号:39

期  号:1

起止页码:148-152

语  种:中文

收录情况:BDHX、BDHX2014、IC、RCCSE、ZGKJHX、核心刊

摘  要:考虑到传统Web文档聚类算法聚类效果差、速度慢等问题,针对Web文档聚类算法进行深入研究,使用目标优化策略将Web文档聚类认为是最佳划归文档集合的范畴,并通过引入优化算法进行聚类划分。针对使用SVD表示的Web文档向量存在高维稀疏性等问题,使用LDA对Web文档簇的潜在语义子空间进行重构,从而降低Web文档向量空间的维数,最后在低维空间使用遗传算法进行寻优。常规的GA算法通常存在算法早熟以及局部寻优能力弱等问题。故提出一种改进型GA算法,通过引入自适应对偶种群、自适应终止规则以及新的生成子代规则来保证种群在迭代过程中的多样性以解决算法早熟问题,并且要提高算法的搜索效率以提高算法对局部寻优的能力。最后通过实验验证提出的基于改进型GA算法的Web文档聚类算法的聚类有效性。

关 键 词:WEB文档聚类 遗传算法 自适应对偶种群  目标策略  

分 类 号:TN711-34] TP311]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心