登录    注册    忘记密码

期刊文章详细信息

一种Word2vec构建词向量模型的实现方法    

A Method for Implementing Word2vec to Construct Word Embedding Model

  

文献类型:期刊文章

作  者:席宁丽[1] 朱丽佳[2] 王录通[3] 陈俊[1] 万晓容[1]

XI Ning-li;ZHU Li-jia;WANG Lu-tong;CHEN Jun;WANG Xiao-rong(School of Education,Guizhou Normal University,Guiyang 550025,China;School of Foreign Language,Guizhou Normal University,Guiyang 550025,China;School of Teacher Education,Guangxi Modern Vocational and Technical College,Hechi 547099,China)

机构地区:[1]贵州师范大学教育学院,贵州贵阳550025 [2]贵州师范大学外国语学院,贵州贵阳550025 [3]广西现代职业技术学院教师教育学院,广西河池547099

出  处:《电脑与信息技术》

基  金:贵州省教育厅高校人文社会科学研究项目(项目编号:2020GH015)。

年  份:2023

卷  号:31

期  号:1

起止页码:43-46

语  种:中文

收录情况:普通刊

摘  要:Word2vec是一种基于简单神经网络的自然语言处理方法,是一种词嵌入技术,可用于构建高维词向量。研究针对Word2vec词向量表示方法进行模型构建和分析,通过NLPCC2014语料训练,将词映射到高维词向量空间中,完成了Word2vec的功能实现以及可视化输出。实验中进一步针对CBOW模型与Skip-gram模型,这两种Word2vec中的重要模型进行对比研究,输出结果表明:在通过大语料训练中文词向量时,Skip-gram模型在新词识别上具有明显优势,综合模型准确性与时间性能来说,总体可靠性更优。

关 键 词:词向量  Word2vec  CBOW  Skip-gram  NLP

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心