登录    注册    忘记密码

期刊文章详细信息

基于隐含语义分析的微博话题发现方法    

Micro-blog topic detection method based on Latent Semantic Analysis

  

文献类型:期刊文章

作  者:马雯雯[1] 魏文晗[1] 邓一贵[1,2]

机构地区:[1]重庆大学计算机学院,重庆400044 [2]重庆大学信息与网络管理中心,重庆400044

出  处:《计算机工程与应用》

基  金:重庆市自然科学基金(No.cstc2011jjA40023)

年  份:2014

卷  号:50

期  号:1

起止页码:96-100

语  种:中文

收录情况:AJ、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、IC、INSPEC、JST、RCCSE、ZGKJHX、普通刊

摘  要:随着微博的大量普及和关注度的不断提高,微博热点话题发现已成为当前研究热点。针对于短文本、向量空间模型(VSM)文本表示方法存在高维度、稀疏,以及同义多义问题,导致难以准确度量文本相似度,提出一种基于隐含语义分析的两阶段聚类话题发现方法。引入话题热度的概念来选取具有一定关注度的微博文本,用隐含语义分析(LSA)对数据集进行建模;用层次聚类的CURE算法确定初始类中心;用K-means聚类得到热点话题的聚类结果。真实微博数据集的实验结果验证了该方法的有效性。

关 键 词:隐含语义分析 向量空间模型 话题发现  微博  两阶段聚类  LATENT SEMANTIC Analysis(LSA)  Vector  Space  Model(VSM)  

分 类 号:TP393]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心