登录    注册    忘记密码

期刊文章详细信息

基于主题模型的微博重要话题发现与排序方法  ( EI收录)  

Detection and Ranking of Significant Topics on Sina Weibo Based on Topic Model

  

文献类型:期刊文章

作  者:姜晓伟[1] 王建民[1] 丁贵广[1]

机构地区:[1]清华大学软件学院信息系统与工程研究所,北京100084

出  处:《计算机研究与发展》

基  金:国家"八六三"高技术研究发展计划基金项目(2012AA040911)

年  份:2013

卷  号:50

期  号:S1

起止页码:179-185

语  种:中文

收录情况:AJ、BDHX、BDHX2011、CSA-PROQEUST、CSCD、CSCD2013_2014、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:近年来,以Twitter和新浪微博为代表的微博客正在世界范围内流行起来.根据微博的特点,提出一种与特定主题(比如某种产品)相关的话题发现和排序的新方法.首先,在互联网上收集并格式化出现了感兴趣的词的微博.对于这些微博中的所有词汇,综合考虑影响力、突发性和相关性3个要素对其重要性进行评估.其次,对词的重要性做出估量后,以含有同一关键词的微博的集合为输入文档训练LDA模型.然后通过对主题关键词的概率分布的推导,实现词的聚类和主题的挖掘.这一方法可以克服微博的长度限制所带来的数据稀缺性问题.最后,通过真实数据集上的实验表明了该方法的有效性.

关 键 词:微博客  关键词排序  主题发现 LDA 主题模型 文本挖掘

分 类 号:TP393.092] TP391.1[计算机类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心