登录    注册    忘记密码

期刊文章详细信息

融合Word2vec与TextRank的关键词抽取研究    

Using Word2vec with Text Rank to Extract Keywords

  

文献类型:期刊文章

作  者:宁建飞[1] 刘降珍[1]

机构地区:[1]罗定职业技术学院电子信息系,罗定527200

出  处:《现代图书情报技术》

年  份:2016

期  号:6

起止页码:20-27

语  种:中文

收录情况:CSSCI、CSSCI2014_2016、RWSKHX、普通刊

摘  要:【目的】通过融合单个文档内部结构信息和文档整体的词向量关系进行关键词抽取。【方法】利用Word2vec将文档集中所有词汇进行向量表征,并且通过词向量计算词汇之间的相似度,进而对Text Rank算法进行改进,将候选关键词的权重按照词汇之间的相似度和邻接关系进行非均匀分配,并构建对应的概率转移矩阵用于词汇图模型的迭代计算以及关键词抽取。【结果】实现Word2vec与Text Rank的有效融合,且当训练文档集词汇分布合理时,关键词抽取效果较明显。【局限】需要进行成本较高的文档集训练,获取词向量以及词关系矩阵。【结论】文档集中的词关系有助于修正单文档内部的词关系,提升单文档的关键词抽取准确性。

关 键 词:抽取 Word2vec  TextRank  图模型 词向量  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心