期刊文章详细信息
一种基于kmeans聚类算法和LDA主题模型的文本检索方法及有效性验证
A Text Retrieval Method Based on Kmeans Clustering Algorithm and LDA Topic Model and Its Effectiveness
文献类型:期刊文章
LIU Jiang- hua(Library of Gannan Teachers College, Ganzhou 341000, China)
机构地区:[1]赣南师范学院图书馆,江西赣州341000
年 份:2017
卷 号:35
期 号:2
起止页码:16-21
语 种:中文
收录情况:BDHX、BDHX2014、CSSCI、CSSCI2017_2018、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:【目的/意义】非常态分布状态下,LDA主题模型的检索效果较差;在数据量较小的情况下LDA主题模型计算出来的正确率较低。【方法/过程】本文提出一种基于Kmeans聚类算法的LDA主题模型检索方法,本检索方法以Kmeans算法为基础,对文本主题进行聚类和语义相关度分析,避免了传统LDA主题模型存在的诸多缺陷。【结果/结论】实验结果显示,不论是一般还是多义主题关键词的检索,本文的LDA主题模型在耗时和准确率上均比本文列出的其他三种主题模型具有明显的优势,进一步验证了本文提出方法的有效性。
关 键 词:LDA(潜在狄利克雷分布) 主题模型 聚类分析 文本检索
分 类 号:G254.9[图书情报与档案管理类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...