登录    注册    忘记密码

期刊文章详细信息

基于Word2Vec的一种文档向量表示    

Document Vector Representation Based on Word2Vec

  

文献类型:期刊文章

作  者:唐明[1] 朱磊[1] 邹显春[1]

机构地区:[1]西南大学计算机与信息科学学院,重庆400715

出  处:《计算机科学》

年  份:2016

卷  号:43

期  号:6

起止页码:214-217

语  种:中文

收录情况:BDHX、BDHX2014、CSA、CSCD、CSCD_E2015_2016、IC、JST、RCCSE、UPD、ZGKJHX、核心刊

摘  要:在文本分类中,如何运用word2vec词向量高效地表达一篇文档一直是一个难点。目前,将word2vec模型与聚类算法结合形成的doc2vec模型能有效地表达文档信息。但是,这种方法很少考虑单个词对整篇文档的影响力。为了解决这个问题,利用TF-IDF算法计算每篇文档中词的权重,并结合word2vec词向量生成文档向量,最后将其应用于中文文档分类。在搜狗中文语料库上的实验验证了新方法的有效性。

关 键 词:TF-IDF word2vec  doc2vec  文本分类

分 类 号:TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心