会议论文详细信息
文献类型:会议
作者单位:西南交通大学 信息科学与技术学院 成都 610031 西南交通大学 生命科学与工程学院 成都 610031 西藏大学工学 院计算机科学系 拉萨 850000
会议文献:第十三届中国Rough集与软计算学术会议、第七届中国Web智能学术研讨会、第七届中国粒计算学术研讨会联合学术会议论文集
会议名称:第十三届中国Rough集与软计算学术会议、第七届中国Web智能学术研讨会、第七届中国粒计算学术研讨会联合学术会议
会议日期:20131018
会议地点:福建漳州
主办单位:中国计算机学会;中国人工智能学会
出版日期:20131018
语 种:中文
摘 要:为了将群体智能技术应用于半结构化的藏文Web文本聚类中,提出了基于群体智能的半结构化藏文Web文本聚类算法SCAST (A Semi-structured Tibetan Text Clustering Algorithm Based on Swarm Intelligence),充分考虑群体智能技术对藏文文本聚类准确性和时间效率的影响.SCAST算法包含三个主要步骤:(1)运用向量空间模型表示藏文文本信息,将藏文文本和智能蚁群随机地放置于文本向量空间中;(2)智能蚂蚁随机地选择藏文文本,计算藏文文本在当前局部区域内的相似性,获得拾起或者放下文本的概率,进而决定是否"拾起","移动","放下"藏文文本;(3)通过多次迭代训练,将藏文文本按其相似性聚集在一起,得到最终聚类结果.大量真实藏文Web文本数据上的实验结果表明:相比于传统的k-means聚类算法,基于群体智能的藏文文本聚类算法在聚类准确率上平均提高约7.8%.
关 键 词:群体智能 藏文 聚类技术 群体相似度
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...