登录    注册    忘记密码

期刊文章详细信息

基于实时词共现网络的微博话题发现    

Micro-blog hot-spot topic discovery based on real-time word co-occurrence network

  

文献类型:期刊文章

作  者:李亚星[1] 王兆凯[1] 冯旭鹏[2] 刘利军[1] 黄青松[1,3]

机构地区:[1]昆明理工大学信息工程与自动化学院,昆明650500 [2]昆明理工大学教育技术与网络中心,昆明650500 [3]云南省计算机技术应用重点实验室(昆明理工大学),昆明650500

出  处:《计算机应用》

基  金:国家自然科学基金资助项目(81360230)~~

年  份:2016

卷  号:36

期  号:5

起止页码:1302-1306

语  种:中文

收录情况:AJ、BDHX、BDHX2014、CSA、CSA-PROQEUST、CSCD、CSCD_E2015_2016、IC、INSPEC、JST、RCCSE、ZGKJHX、ZMATH、核心刊

摘  要:针对微博的实时性、稀疏性和海量性特点,提出基于实时词共现网络的话题发现模型。首先,从原始语料中筛选出主题词集合,再利用时间参数计算共现主题词的关系权重以实现词共现网络的构建,通过该网络推算出与话题关联性强的潜在特征词以解决微博特征词的稀疏性;其次,采用改进Single-Pass算法实现话题增量聚类;最后,对每个话题的主题词按热度计算进行排序,获得最具代表性的话题主题词。实验结果表明,该模型与经典Single-Pass聚类算法相比,话题发现准确率约提高6%,综合指标提高8%。实验结果证明所提模型的有效性和准确性。

关 键 词:话题发现  实时共现网络  短文本  Single-Pass聚类  热度计算  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心