登录    注册    忘记密码

期刊文章详细信息

基于多分类器加权投票法的越南语组合歧义消歧    

Vietnamese Combinational Ambiguity Disambiguation Based on Weighted Voting Method of Multiple Classifiers

  

文献类型:期刊文章

作  者:李佳[1] 郭剑毅[1,2] 刘艳超[1] 余正涛[1,2] 线岩团[1,2] 阮氏青娥[3]

机构地区:[1]昆明理工大学信息工程与自动化学院,昆明650500 [2]昆明理工大学智能信息处理重点实验室,昆明650500 [3]昆明理工大学国际学院,昆明650093

出  处:《计算机科学》

基  金:国家自然科学基金(61262041;61562052;61472168);云南省自然科学基金重点项目(2013FA030)资助

年  份:2018

卷  号:45

期  号:1

起止页码:167-172

语  种:中文

收录情况:BDHX、BDHX2017、CSA、CSCD、CSCD_E2017_2018、IC、JST、RCCSE、UPD、ZGKJHX、核心刊

摘  要:组合歧义消解是分词中的关键问题之一,直接影响到分词的准确率。为了解决越南语组合歧义对分词的影响问题,结合越南语组合型词的特点,提出了一种基于集成学习的越南语组合歧义消解方法。该方法首先通过人工选取越南语组合歧义词,构建出越南语组合歧义字段库,对越南语语料与越南语组合词词典进行匹配,抽取出越南语组合歧义字段;其次,采用三类分类器引入越南语词频特征和上下文信息,构建三类分类器消解模型,得到三类分类器消解结果;最后,计算出各分类器权值,通过阈值对越南语组合歧义进行最终分类。实验表明,所提方法的正确率达到了83.32%,与消歧结果最好的单个分类器相比准确率提高了5.81%。

关 键 词:组合词词典  组合歧义消解  越南语 集成学习  加权投票法  

分 类 号:TP303]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心