登录    注册    忘记密码

期刊文章详细信息

基于SOM聚类的微博话题发现    

Microblog topics detection based on SOM clustering

  

文献类型:期刊文章

作  者:宋莉娜[1] 冯旭鹏[2] 刘利军[1] 黄青松[1,3]

Song Lina;Feng Xupeng;Liu Lijun;Huang Qingsong(Faculty of Information Engineering&Automation,Kunming University of Science&Technology,Kunming 650500,China;Educational Technology&Network Center,Kunming University of Science&Technology,Kunming 650500,China;Yunnan Provincial Key Laboratory of Computer Technology Applications,Kunming University of Science&Technology,Kunming 650500,China)

机构地区:[1]昆明理工大学信息工程与自动化学院,昆明650500 [2]昆明理工大学教育技术与网络中心,昆明650500 [3]昆明理工大学云南省计算机技术应用重点实验室,昆明650500

出  处:《计算机应用研究》

基  金:国家自然科学基金资助项目(81360230;81560296)

年  份:2018

卷  号:35

期  号:3

起止页码:671-674

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD_E2017_2018、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊

摘  要:随着微博用户的增多,微博平台的信息更新频繁。针对微博文本的数据稀疏性、新词多、用语不规范等特点,提出了基于SOM聚类的微博话题发现方法。从原始语料中对文本进行预处理,通过词向量模型对短文本进行特征提取,降低了向量维度过高带来的计算量繁重问题。采用改进的SOM对话题进行聚类,该算法改善了传统文本聚类的不足,进而能有效地发现话题。实验表明该算法较传统文本聚类算法的综合指标F值有明显提高。

关 键 词:话题发现  词向量模型  文本相似度 短文本  SOM聚类

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心