期刊文章详细信息
文献类型:期刊文章
Song Lina;Feng Xupeng;Liu Lijun;Huang Qingsong(Faculty of Information Engineering&Automation,Kunming University of Science&Technology,Kunming 650500,China;Educational Technology&Network Center,Kunming University of Science&Technology,Kunming 650500,China;Yunnan Provincial Key Laboratory of Computer Technology Applications,Kunming University of Science&Technology,Kunming 650500,China)
机构地区:[1]昆明理工大学信息工程与自动化学院,昆明650500 [2]昆明理工大学教育技术与网络中心,昆明650500 [3]昆明理工大学云南省计算机技术应用重点实验室,昆明650500
基 金:国家自然科学基金资助项目(81360230;81560296)
年 份:2018
卷 号:35
期 号:3
起止页码:671-674
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD_E2017_2018、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:随着微博用户的增多,微博平台的信息更新频繁。针对微博文本的数据稀疏性、新词多、用语不规范等特点,提出了基于SOM聚类的微博话题发现方法。从原始语料中对文本进行预处理,通过词向量模型对短文本进行特征提取,降低了向量维度过高带来的计算量繁重问题。采用改进的SOM对话题进行聚类,该算法改善了传统文本聚类的不足,进而能有效地发现话题。实验表明该算法较传统文本聚类算法的综合指标F值有明显提高。
关 键 词:话题发现 词向量模型 文本相似度 短文本 SOM聚类
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...