期刊文章详细信息
基于词向量和条件随机场的领域术语识别方法
Domain-specific term recognition method based on word embedding and conditional random field
文献类型:期刊文章
机构地区:[1]大连海洋大学信息工程学院,辽宁大连116023 [2]辽宁省海洋信息技术重点实验室(大连海洋大学),辽宁大连116023 [3]大连海洋大学经济管理学院,辽宁大连116023
年 份:2016
卷 号:36
期 号:11
起止页码:3146-3151
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CSA、CSA-PROQEUST、CSCD、CSCD_E2015_2016、IC、INSPEC、JST、RCCSE、ZGKJHX、ZMATH、核心刊
摘 要:针对基于统计特征的领域术语识别方法忽略了术语的语义和领域特性,从而影响识别结果这一问题,提出一种基于词向量和条件随机场(CRF)的领域术语识别方法。该方法利用词向量具有较强的语义表达能力、词语与领域术语之间的相似度具有较强的领域表达能力这一特点,在统计特征的基础上,增加了词语的词向量与领域术语的词向量之间的相似度特征,构成基于词向量的特征向量,并采用CRF方法综合这些特征实现了领域术语识别。最后在领域语料库和Sogou CA语料库上进行实验,识别结果的准确率、召回率和F测度分别达到了0.985 5、0.943 9和0.964 3,表明所提的领域术语识别方法取得了较好的效果。
关 键 词:词向量 条件随机场 术语识别 相似度特征
分 类 号:TP391.4]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...