期刊文章详细信息
基于术语长度和语法特征的统计领域术语抽取 ( EI收录)
A statistical domain terminology extraction method based on word length and grammatical feature
文献类型:期刊文章
LIU Li XIAO Yingyuan(Key Laboratory of Computer Vision and System, Ministry of Education, Tianjin University of Technology, Tianjin 300384, China Tianjin Key Laboratory of Intelligence Computing and Novel Software Technology, Tianjin University of Technology, Tianjin 300384, China)
机构地区:[1]天津理工大学计算机视觉与系统省部共建教育部重点实验室,天津300384 [2]天津理工大学天津市智能计算及软件新技术重点实验室,天津300384
基 金:国家自然科学基金项目(71501141;61301140);天津市科技特派员项目(15JCTPJC63800)
年 份:2017
卷 号:38
期 号:9
起止页码:1437-1443
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CAS、CSCD、CSCD2017_2018、EI、IC、JST、MR、PROQUEST、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:针对领域术语抽取中含字长度较大的术语被错误切分的问题,本文提出一种基于术语长度和语法特征的统计领域术语抽取方法。本方法在利用机器学习抽取候选术语时,加入基于术语长度和语法特征的约束规则;在使用统计方法确定候选术语的领域性时,充分考虑词长比这一概念的重要性,将其作为判断术语领域性的重要权值。实验表明,提出的方法能够正确抽取含字长度较大的领域术语,抽取结果的准确率和召回率相比以往的方法有所提高。
关 键 词:自然语言处理 术语抽取 支持向量机 术语长度 语法特征 词长比 领域相关性 领域一致性
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...