登录    注册    忘记密码

期刊文章详细信息

基于隐含狄利克雷分布的文本主题提取对比研究    

Comparative Study of Text Topic Extraction Based on Latent Dirichlet Allocation

  

文献类型:期刊文章

作  者:王静茹[1] 陈震[1]

机构地区:[1]北华大学信息技术与传媒学院,吉林吉林132013

出  处:《情报科学》

基  金:吉林省教育科学"十三五"规划项目(GH170061);北华大学综合性;设计性实验项目

年  份:2018

卷  号:36

期  号:1

起止页码:102-107

语  种:中文

收录情况:BDHX、BDHX2017、CSSCI、CSSCI2017_2018、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数据时,主题提取效果较好。这为提高LDA模型的挖掘效率提供了一定的理论依据。

关 键 词:文本挖掘 LDA模型 主题提取效果  评价方法  

分 类 号:G254[图书情报与档案管理类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心