期刊文章详细信息
文献类型:期刊文章
机构地区:[1]合肥工业大学计算机与信息学院,合肥230009 [2]安徽理工大学经济与管理学院,淮南232001 [3]安徽省科学技术情报研究所,合肥230001 [4]闽南师范大学计算机学院,漳州363000
基 金:国家自然科学基金项目(61273292,61303131,51374114,51474007)资助;教育部人文社会科学研究青年基金项目“社会化标注环境下的标签层次关系发现方法研究”(13YJCZH077)资助
年 份:2015
卷 号:34
期 号:2
起止页码:146-155
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CSA、CSA-PROQEUST、CSSCI、CSSCI2014_2016、INSPEC、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:社会化标注系统产生了大量歧义的、不受控制的标签,不仅会降低用户的体验,而且会限制资源的利用效率。标签聚类能够把具有相近语义的标签聚集在一起,反映标签的潜在语义结构,从而有效缓解上述问题。传统的标签聚类方法通常只利用资源的被标注信息进行聚类,由于忽略了用户的标注信息使得聚类结果不能表达准确的语义。本文提出一种基于LDA(Latent Dirichlet Allocation)模型的社会化标签综合聚类方法,该方法分别利用用户的标注信息和资源的被标注信息来建立主题学习模型,通过学习,获取基于用户的标签潜在主题和基于资源的标签潜在主题,综合标签在这两类主题上的概率分布结果,建立标签主题的二次学习模型,学习出标签的混合主题并在此基础上判定标签的聚类簇。与传统方法相比,本文的方法不仅可以有效地利用标签之间的语义关系,而且能够在一定程度上缓解传统标签聚类方法所面临的高维和稀疏性问题。实验结果表明,本文的方法具有较好的效果。
关 键 词:社会化标注系统 标签聚类 潜在语义 主题模型
分 类 号:G350]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...