期刊文章详细信息
基于句法分析与词向量的领域新词发现方法
Newly-emerging Domain Word Detection Method Based on Syntactic Analysis and Term Vector
文献类型:期刊文章
ZHAO Zhi-bin;SHI Yu-xin;LI Bin-yang(School of Computer Science and Engineering,Northeastern University,Shenyang 110819,China;School of Information Science and Technology,University of International Relations,Beijing 100091,China)
机构地区:[1]东北大学计算机科学与工程学院,沈阳110819 [2]国际关系学院信息科技学院,北京100091
基 金:国家重点研发计划项目(2018YFB1004700);国家自然科学基金项目(61472070);航天专业部新技术研究高校合作项目(SKX182010023)资助
年 份:2019
卷 号:46
期 号:6
起止页码:29-34
语 种:中文
收录情况:BDHX、BDHX2017、CSA、CSCD、CSCD_E2019_2020、IC、JST、RCCSE、UPD、ZGKJHX、核心刊
摘 要:很多已经存在的词汇和词组可能会被运用于它们之前从未被运用过的领域文本中,这样的词汇或词组被称为领域新词。领域新词的发现可以为该领域的研究人员提供最新的领域发展动态,帮助其分析该领域的最新舆情,因此具有非常重要的意义。针对领域新词发现这一问题,文中提出了一种基于依存句法分析与词向量的领域新词发现方法。首先,提出了句法词典的概念,并基于依存句法分析,结合TF-IDF值的计算,提出了构建领域句法词典的方法;然后,使用领域句法词典,结合词向量技术,完成了领域新词发现方法的设计;最后,使用来自于护肤品论坛的真实文本数据集对所提方法进行了正确性验证。实验结果表明,构建的句法词典的质量较高,所提方法在进行领域新词发现时具有良好的性能。
关 键 词:句法分析 词向量 领域新词发现 句法词典
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...