登录    注册    忘记密码

期刊文章详细信息

基于不同语料的词向量对比分析    

Comparative analysis of word vector based on different corpora

  

文献类型:期刊文章

作  者:崔萌[1] 张春云[2]

机构地区:[1]滨州医学院网络信息中心,山东烟台256603 [2]山东财经大学计算机科学与技术学院,山东济南250014

出  处:《兰州理工大学学报》

基  金:国家自然科学基金(61401259)

年  份:2017

卷  号:43

期  号:3

起止页码:112-116

语  种:中文

收录情况:AJ、BDHX、BDHX2014、CAS、MR、RCCSE、ZGKJHX、ZMATH、核心刊

摘  要:通过对目前自然语言处理领域中基于深度学习的词向量表示方法对不同文本语料文本表达的有效性进行分析,将主流词向量训练方法用于不同的文本语料集,包括英文维基百科语料、新闻语料、论坛语料和Web语料进行训练,并采用三种评价指标:余弦相似度平均差、斯皮尔曼等级相关和米克罗夫类比方法对训练出的文本词向量表达方法进行比较.实验结果表明,针对上述四种语料,词向量能够实现对文本的有效表示,但各个语料训练出的词向量的通用性不同,其中维基百科语料训练的词向量的通用效果最好.

关 键 词:表示学习  词向量  相似性比较  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心