登录    注册    忘记密码

期刊文章详细信息

融合词预测的半监督老挝语词性标注研究    

Research on the Fusion of Semi-supervised Lao Part of Speech Tagging and Word Prediction

  

文献类型:期刊文章

作  者:王兴金[1] 周兰江[1] 张金鹏[2] 周枫[1] 郭剑毅[1]

WANG Xing-jin;ZHOU Lan-jiang;ZHANG Jin-peng;ZHOU Feng;GUO Jian-yi(The Key Laboratory of Intelligent Information Processing,Kunming University of Science and Technology,Kunming 650500,China;Information Management Center,Yunnan University of Finance and Economics,Kunming 650221,China)

机构地区:[1]昆明理工大学信息工程与自动化学院,智能信息处理重点实验室,昆明650500 [2]云南财经大学信息管理中心,昆明650221

出  处:《小型微型计算机系统》

基  金:国家自然科学基金项目(61662040,61562049)资助

年  份:2019

卷  号:40

期  号:12

起止页码:2500-2505

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:为有效对老挝语进行词性标注,提出一种融合词预测的半监督隐马尔科夫词性标注方法.首先,为解决未登录词标注问题,基于长短期记忆网络建立词预测模型,并改进维特比算法来将词预测模型融入隐马科夫模型中;其次,为提高隐马科夫模型标注的准确率与速度,使用规则与统计相结合的方法.制定了详细的老挝语法规则集,并将规则集与隐马科夫模型进行结合;再有,为扩展老挝语词性标注语料库规模,使用半监督学习方法,以得到正、反半监督隐马科夫模型;最后,为了解决隐马科夫模型未考虑后续词性对当前标注影响问题,使用正、反半监督隐马科夫模型进行词性标注,并优化了标注结果.实验结果证明,该方法可以有效标注老挝语词性,准确率达到92.55%.

关 键 词:词预测  老挝语词性标注  隐马科夫模型  半监督学习

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心