期刊文章详细信息
文献类型:期刊文章
机构地区:[1]昆明理工大学信息工程与自动化学院,昆明650500 [2]昆明理工大学教育技术与网络中心,昆明650500 [3]云南省计算机技术应用重点实验室(昆明理工大学),昆明650500
基 金:国家自然科学基金资助项目(81360230)~~
年 份:2016
卷 号:36
期 号:5
起止页码:1302-1306
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CSA、CSA-PROQEUST、CSCD、CSCD_E2015_2016、IC、INSPEC、JST、RCCSE、ZGKJHX、ZMATH、核心刊
摘 要:针对微博的实时性、稀疏性和海量性特点,提出基于实时词共现网络的话题发现模型。首先,从原始语料中筛选出主题词集合,再利用时间参数计算共现主题词的关系权重以实现词共现网络的构建,通过该网络推算出与话题关联性强的潜在特征词以解决微博特征词的稀疏性;其次,采用改进Single-Pass算法实现话题增量聚类;最后,对每个话题的主题词按热度计算进行排序,获得最具代表性的话题主题词。实验结果表明,该模型与经典Single-Pass聚类算法相比,话题发现准确率约提高6%,综合指标提高8%。实验结果证明所提模型的有效性和准确性。
关 键 词:话题发现 实时共现网络 短文本 Single-Pass聚类 热度计算
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...