期刊文章详细信息
文献类型:期刊文章
机构地区:[1]沈阳航空工业学院自然语言处理研究室,辽宁沈阳110034 [2]沈阳航空工业学院北方软件学院,辽宁沈阳110034
基 金:国家863计划基金资助项目(2006AA01Z148);教育部科学技术研究重点项目(207148)
年 份:2008
卷 号:26
期 号:3
起止页码:198-201
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CAB、CAS、CSA、CSA-PROQEUST、IC、PROQUEST、RCCSE、WOS、ZGKJHX、ZMATH、ZR、核心刊
摘 要:基于划分的聚类算法是一种局部最优算法。聚类初始中心的选择对该聚类算法的收敛速度和聚类的性能都有很大的影响。初始中心点应该选择来自不同的类并且初始中心点文本之间的相似度应尽量小,为此提出了一种新的基于最小相似度的中心选取方法,该方法选择相似度最小的两个样本分别作为初始的两个中心,然后依次选择到已知中心相似度最小的样本作为其他类的中心。实验表明该方法能够选出来自不同类的样本作为聚类的初始中心,同其他初始中心选择方法比较,聚类算法的性能有明显提高。
关 键 词:K—Means 最小相似度 文本聚类
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...