期刊文章详细信息
基于主题模型的微博重要话题发现与排序方法 ( EI收录)
Detection and Ranking of Significant Topics on Sina Weibo Based on Topic Model
文献类型:期刊文章
机构地区:[1]清华大学软件学院信息系统与工程研究所,北京100084
基 金:国家"八六三"高技术研究发展计划基金项目(2012AA040911)
年 份:2013
卷 号:50
期 号:S1
起止页码:179-185
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CSA-PROQEUST、CSCD、CSCD2013_2014、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:近年来,以Twitter和新浪微博为代表的微博客正在世界范围内流行起来.根据微博的特点,提出一种与特定主题(比如某种产品)相关的话题发现和排序的新方法.首先,在互联网上收集并格式化出现了感兴趣的词的微博.对于这些微博中的所有词汇,综合考虑影响力、突发性和相关性3个要素对其重要性进行评估.其次,对词的重要性做出估量后,以含有同一关键词的微博的集合为输入文档训练LDA模型.然后通过对主题关键词的概率分布的推导,实现词的聚类和主题的挖掘.这一方法可以克服微博的长度限制所带来的数据稀缺性问题.最后,通过真实数据集上的实验表明了该方法的有效性.
关 键 词:微博客 关键词排序 主题发现 LDA 主题模型 文本挖掘
分 类 号:TP393.092] TP391.1[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...