登录    注册    忘记密码

期刊文章详细信息

基于LDA模型的文本聚类研究    

Research on LDA Model Based on Text Clustering

  

文献类型:期刊文章

作  者:王鹏[1] 高铖[1] 陈晓美[2]

机构地区:[1]长春理工大学计算机科学技术学院,吉林长春130002 [2]吉林大学管理学院,吉林长春130022

出  处:《情报科学》

基  金:吉林省科技发展计划(20130416001ZG)

年  份:2015

卷  号:33

期  号:1

起止页码:63-68

语  种:中文

收录情况:BDHX、BDHX2014、CSSCI、CSSCI2014_2016、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:在Web2.0时代,网络文本数据呈现爆炸式增长,传统的文本聚类模型存在数据维数过高,数据稀疏,缺乏语义理解等问题。针对以上问题,本文提出了一种基于LDA模型,通过Gibbs算法估计文本的主题概率分布,利用JS(Jensen-Shannon)距离作为文本的相似性度量,然后采用层次聚类法进行聚类。实验得到较高的聚类纯度(Purity)和Fscore值,表明该方法是有效的。

关 键 词:文本聚类 LDA模型 文本相似度 层次聚类

分 类 号:G254[图书情报与档案管理类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心