期刊文章详细信息
基于多分类器加权投票法的越南语组合歧义消歧
Vietnamese Combinational Ambiguity Disambiguation Based on Weighted Voting Method of Multiple Classifiers
文献类型:期刊文章
机构地区:[1]昆明理工大学信息工程与自动化学院,昆明650500 [2]昆明理工大学智能信息处理重点实验室,昆明650500 [3]昆明理工大学国际学院,昆明650093
基 金:国家自然科学基金(61262041;61562052;61472168);云南省自然科学基金重点项目(2013FA030)资助
年 份:2018
卷 号:45
期 号:1
起止页码:167-172
语 种:中文
收录情况:BDHX、BDHX2017、CSA、CSCD、CSCD_E2017_2018、IC、JST、RCCSE、UPD、ZGKJHX、核心刊
摘 要:组合歧义消解是分词中的关键问题之一,直接影响到分词的准确率。为了解决越南语组合歧义对分词的影响问题,结合越南语组合型词的特点,提出了一种基于集成学习的越南语组合歧义消解方法。该方法首先通过人工选取越南语组合歧义词,构建出越南语组合歧义字段库,对越南语语料与越南语组合词词典进行匹配,抽取出越南语组合歧义字段;其次,采用三类分类器引入越南语词频特征和上下文信息,构建三类分类器消解模型,得到三类分类器消解结果;最后,计算出各分类器权值,通过阈值对越南语组合歧义进行最终分类。实验表明,所提方法的正确率达到了83.32%,与消歧结果最好的单个分类器相比准确率提高了5.81%。
关 键 词:组合词词典 组合歧义消解 越南语 集成学习 加权投票法
分 类 号:TP303]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...