期刊文章详细信息
文献类型:期刊文章
机构地区:[1]滨州医学院网络信息中心,山东烟台256603 [2]山东财经大学计算机科学与技术学院,山东济南250014
基 金:国家自然科学基金(61401259)
年 份:2017
卷 号:43
期 号:3
起止页码:112-116
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CAS、MR、RCCSE、ZGKJHX、ZMATH、核心刊
摘 要:通过对目前自然语言处理领域中基于深度学习的词向量表示方法对不同文本语料文本表达的有效性进行分析,将主流词向量训练方法用于不同的文本语料集,包括英文维基百科语料、新闻语料、论坛语料和Web语料进行训练,并采用三种评价指标:余弦相似度平均差、斯皮尔曼等级相关和米克罗夫类比方法对训练出的文本词向量表达方法进行比较.实验结果表明,针对上述四种语料,词向量能够实现对文本的有效表示,但各个语料训练出的词向量的通用性不同,其中维基百科语料训练的词向量的通用效果最好.
关 键 词:表示学习 词向量 相似性比较
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...