期刊文章详细信息
基于约束优化传播的改进大规模数据半监督式谱聚类算法
Constrain optimal propagation-based improved semi-supervised spectral clustering algorithm for large-scale data
文献类型:期刊文章
Xu Dayu;Yu Yingjun;Feng Hailin;Zhang Xuyao(School of Information Engineering,Zhejiang A&F University,Hangzhou 311300,China;Sunyard System Engineering Co.,Ltd.,Hangzhou 310053,China)
机构地区:[1]浙江农林大学信息工程学院,杭州311300 [2]信雅达系统工程股份有限公司,杭州310053
基 金:国家自然科学基金资助项目(61272313);浙江省自然科学基金项目(LQ17G010003);浙江省重大科技专项项目(2015C03008)
年 份:2018
卷 号:35
期 号:5
起止页码:1325-1330
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD_E2017_2018、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:针对传统谱聚类算法在聚类过程中所出现的高计算复杂度、噪声敏感,以及聚类簇形态偏斜等问题,结合当前大规模数据聚类的特点与需求,建立基于约束优化传播的改进大规模数据半监督式谱聚类模型。该模型利用先验成对点约束信息构建微型相似性矩阵,在此基础上采用Gabow算法提取该微型相似性矩阵所对应连通图的各强连通分支,继而提出面向各强连通分支的新型约束优化传播算法以获取整个数据集的点对相似度,最后通过奇异值分解并运用加速K-means算法获得大规模数据的聚类结果。在多个标准测试数据集上的实验表明,相比于该领域其他前期研究成果,该聚类模型具有更高的聚类准确率和更低的计算复杂度,更适合大规模数据的聚类应用。
关 键 词:谱聚类 大规模数据 点对约束 相似性传播 奇异值分解
分 类 号:TP391] TP301.6[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...