期刊文章详细信息
文献类型:期刊文章
机构地区:[1]中国科学技术大学多媒体计算与通信教育部-微软重点实验室,合肥230027 [2]中国科学技术大学图书馆,合肥230027
基 金:国家"八六三"高技术研究发展计划项目(2008AA01Z117)资助;国家自然科学基金重点项目(60933013)资助;国家"八六三"重大专项项目(2010ZX03004-003)资助;博士学科点专项科研基金项目(20070358040)资助
年 份:2012
卷 号:33
期 号:3
起止页码:525-530
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:在社会化标记系统中,常采用聚类等数据挖掘技术来解决标签冗余和语意模糊的问题.现有标签聚类算法大多根据不同标签在对象中共同出现的次数来计算它们之间的相似度,但是这种方法聚类的精确度与召回率并不高.针对此问题,提出一种新的标签聚类算法,充分考虑标签的标记信息,采用基于对象的特征向量来精确地表征一个标签,根据余弦相似度公式得到较为准确的标签相似度,然后采用K-Means算法将用户标签进行聚类.实验结果表明该算法能够得到更加精确的聚类结果.
关 键 词:标签聚类 标记系统 特征向量 K-MEANS 余弦相似度
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...