登录    注册    忘记密码

期刊文章详细信息

基于样本稳定性的聚类方法    

Clustering method based on sample’s stability

  

文献类型:期刊文章

作  者:李飞江[1] 钱宇华[1,2] 王婕婷[1] 梁吉业[2] 王文剑[2]

Feijiang LI;Yuhua QIAN;Jieting WANG;Jiye LIANG;Wenjian WANG(Institute of Big Data Science and Industry,Shanxi University,Taiyuan 030006,China;Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education,Shanxi University,Taiyuan 030006,China)

机构地区:[1]山西大学大数据科学与产业研究院,太原030006 [2]山西大学计算智能与中文信息处理教育部重点实验室,太原030006

出  处:《中国科学:信息科学》

基  金:国家重点研发计划(批准号:2018YFB1004300);山西省重点研发计划(批准号:201903D421003);国家自然科学基金(批准号:61672332,U1805263,61872226,61802238,61673249);山西省海外归国人员研究项目(批准号:2017023,2016004)资助。

年  份:2020

卷  号:50

期  号:8

起止页码:1239-1254

语  种:中文

收录情况:BDHX、BDHX2017、CSCD、CSCD2019_2020、JST、RCCSE、ZGKJHX、核心刊

摘  要:数据类型和分布的复杂化导致样本间关系的不确定性增强,给有效挖掘数据的潜在类簇结构带来挑战.为降低样本关系不确定性对数据聚类带来的影响,本文将聚类集成中样本稳定性概念扩展至聚类分析中.本文从理论上分析样本稳定的合理性,并提出基于信息熵的样本稳定性度量方法.此外,本文提出一个基于样本稳定性的聚类方法,该方法先将数据分为稳定样本集和不稳定样本集,然后挖掘稳定样本的团簇结构,并将不稳定样本划分至该团簇结构中.最后,本文通过二维人造数据和图像分割场景可视化显示样本稳定性的合理性,并在基准数据集上验证本文所提聚类算法的有效性.

关 键 词:机器学习  无监督学习 聚类分析 样本稳定性  稳定性理论  

分 类 号:TP311.13]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心