期刊文章详细信息
融合词预测的半监督老挝语词性标注研究
Research on the Fusion of Semi-supervised Lao Part of Speech Tagging and Word Prediction
文献类型:期刊文章
WANG Xing-jin;ZHOU Lan-jiang;ZHANG Jin-peng;ZHOU Feng;GUO Jian-yi(The Key Laboratory of Intelligent Information Processing,Kunming University of Science and Technology,Kunming 650500,China;Information Management Center,Yunnan University of Finance and Economics,Kunming 650221,China)
机构地区:[1]昆明理工大学信息工程与自动化学院,智能信息处理重点实验室,昆明650500 [2]云南财经大学信息管理中心,昆明650221
基 金:国家自然科学基金项目(61662040,61562049)资助
年 份:2019
卷 号:40
期 号:12
起止页码:2500-2505
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:为有效对老挝语进行词性标注,提出一种融合词预测的半监督隐马尔科夫词性标注方法.首先,为解决未登录词标注问题,基于长短期记忆网络建立词预测模型,并改进维特比算法来将词预测模型融入隐马科夫模型中;其次,为提高隐马科夫模型标注的准确率与速度,使用规则与统计相结合的方法.制定了详细的老挝语法规则集,并将规则集与隐马科夫模型进行结合;再有,为扩展老挝语词性标注语料库规模,使用半监督学习方法,以得到正、反半监督隐马科夫模型;最后,为了解决隐马科夫模型未考虑后续词性对当前标注影响问题,使用正、反半监督隐马科夫模型进行词性标注,并优化了标注结果.实验结果证明,该方法可以有效标注老挝语词性,准确率达到92.55%.
关 键 词:词预测 老挝语词性标注 隐马科夫模型 半监督学习
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...