登录    注册    忘记密码

会议论文详细信息

基于群体智能的半结构化藏文文本聚类算法       

文献类型:会议

作  者:康健 乔少杰 格桑多吉 韩楠 尼玛扎西 范晓刚

作者单位:西南交通大学 信息科学与技术学院 成都 610031 西南交通大学 生命科学与工程学院 成都 610031 西藏大学工学 院计算机科学系 拉萨 850000

会议文献:第十三届中国Rough集与软计算学术会议、第七届中国Web智能学术研讨会、第七届中国粒计算学术研讨会联合学术会议论文集

会议名称:第十三届中国Rough集与软计算学术会议、第七届中国Web智能学术研讨会、第七届中国粒计算学术研讨会联合学术会议

会议日期:20131018

会议地点:福建漳州

主办单位:中国计算机学会;中国人工智能学会

出版日期:20131018

语  种:中文

摘  要:为了将群体智能技术应用于半结构化的藏文Web文本聚类中,提出了基于群体智能的半结构化藏文Web文本聚类算法SCAST (A Semi-structured Tibetan Text Clustering Algorithm Based on Swarm Intelligence),充分考虑群体智能技术对藏文文本聚类准确性和时间效率的影响.SCAST算法包含三个主要步骤:(1)运用向量空间模型表示藏文文本信息,将藏文文本和智能蚁群随机地放置于文本向量空间中;(2)智能蚂蚁随机地选择藏文文本,计算藏文文本在当前局部区域内的相似性,获得拾起或者放下文本的概率,进而决定是否"拾起","移动","放下"藏文文本;(3)通过多次迭代训练,将藏文文本按其相似性聚集在一起,得到最终聚类结果.大量真实藏文Web文本数据上的实验结果表明:相比于传统的k-means聚类算法,基于群体智能的藏文文本聚类算法在聚类准确率上平均提高约7.8%.

关 键 词:群体智能 藏文 聚类技术 群体相似度  

分 类 号:TP311]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心