期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京邮电大学信息与通信工程学院,北京100876 [2]北京邮电大学WTI实验室,北京100876
年 份:2015
卷 号:15
期 号:1
起止页码:43-48
语 种:中文
收录情况:AJ、CAS、CSA、CSA-PROQEUST、ZMATH、普通刊
摘 要:神经网络概率语言模型是一种新兴的自然语言处理算法,该模型通过学习训练语料获得词向量和概率密度函数,词向量是多维实数向量,向量中包含了自然语言中的语义和语法关系,词向量之间余弦距离的大小代表了词语之间关系的远近,词向量的加减代数运算则是计算机在"遣词造句".近年来,神经网络概率语言模型发展迅速,Word2vec是最新技术理论的合集.首先,重点介绍Word2vec的核心架构CBOW及Skip-gram;接着,使用英文语料训练Word2vec模型,对比两种架构的异同;最后,探讨了Word2vec模型在中文语料处理中的应用.
关 键 词:自然语言处理 Word2vec CBOW Skip-gram 中文语言处理
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...