登录    注册    忘记密码

期刊文章详细信息

基于LDA模型的高校论坛热点提取系统  ( EI收录)  

The hot topics extraction system of college forum based on LDA model

  

文献类型:期刊文章

作  者:楼小帆[1] 吴军[1] 马严[1] 林昭文[1,2]

Lou Xiaofan;Wu Jun;Ma Yan;Lin Zhaowen(Network and Information Center of the Network Technology Institute,Beijing University of Posts and Telecommunications,Beijing 100876,China;Key Laboratory of Information Transmission and Dissemination Technology in Communication Networks,Shijiazhuang 050081,China)

机构地区:[1]北京邮电大学网络技术研究院信息网络中心,北京100876 [2]通信网信息传输与分发技术重点实验室,河北石家庄050081

出  处:《华中科技大学学报(自然科学版)》

年  份:2016

卷  号:44

期  号:S1

起止页码:186-189

语  种:中文

收录情况:AJ、BDHX、BDHX2014、CAS、CSCD、CSCD2015_2016、EI(收录号:20164603015868)、IC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:针对论坛缺乏热点话题提取方法的现状,提出一种将LDA(潜在狄利克雷分配)模型引入高校论坛场景主题的提取方式.在主题建模过程中,以回帖数量作为帖子热门程度的判定参数,根据帖子热门程度在语料中设置不同权重,随后使用Gibbs采样法提取主题.在此基础上设计并实现了包含数据抓取、文本预处理、主题提取三个模块的完整系统.将LDA模型引入系统并进行提取效果分析,实验结果表明LDA模型可以准确地提取出论坛文本中讨论的实时热点话题.

关 键 词:机器学习  潜在狄利克雷分配  主题模型 网络舆情 数据挖掘 高校论坛

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心