期刊文章详细信息

基于LDA主题模型的文本相似度计算
Text Similarity Computing Based on Topic Model LDA

文献类型：期刊文章

作　　者：王振振[1] 何明[1] 杜永萍[1]

机构地区：[1]北京工业大学计算机学院,北京100124

出　　处：《计算机科学》

基　　金：国家自然科学基金(60803086);北京市自然科学基金(4123091);北京市教委科研计划(KM20110005013;KM200910005009)资助

年　　份：2013

卷　　号：40

期　　号：12

起止页码：229-232

语　　种：中文

收录情况：BDHX、BDHX2011、CSA、CSCD、CSCD2013_2014、IC、JST、RCCSE、UPD、ZGKJHX、核心刊

摘　　要：LDA(Latent Dirichlet Allocation)模型是近年来提出的一种具有文本表示能力的非监督学习模型。提出了一种基于LDA主题模型的文本相似度计算方法,该方法利用LDA为语料库建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,挖掘隐藏在文本内的不同主题与词之间的关系,得到文本的主题分布,并以此分布来计算文本之间的相似度,最后对文本相似度矩阵进行聚类实验来评估聚类效果。实验结果表明,该方法能够明显提高文本相似度计算的准确率和文本聚类效果。

关键词：主题模型 LDA 文本相似度 GIBBS抽样

分类号：TP301]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

基于LDA主题模型的文本相似度计算
Text Similarity Computing Based on Topic Model LDA

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

基于LDA主题模型的文本相似度计算 Text Similarity Computing Based on Topic Model LDA

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

基于LDA主题模型的文本相似度计算
Text Similarity Computing Based on Topic Model LDA