登录    注册    忘记密码

期刊文章详细信息

一种半监督的汉语词义消歧方法  ( EI收录)  

Semi-Supervised Method for Chinese Word Sense Disambiguation

  

文献类型:期刊文章

作  者:张春祥[1] 徐志峰[2] 高雪瑶[2]

ZHANG Chunxiang;XU Zhifeng;GAO Xueyao(School of Software and Microelectronics,Harbin University of Science and Technology,Harbin 150080,China;School of Computer Science and Technology,Harbin University of Science and Technology,Harbin 150080,China)

机构地区:[1]哈尔滨理工大学软件与微电子学院,黑龙江哈尔滨150080 [2]哈尔滨理工大学计算机科学与技术学院,黑龙江哈尔滨150080

出  处:《西南交通大学学报》

基  金:国家自然科学基金资助项目(61502124;60903082);中国博士后科学基金资助项目(2014M560249);黑龙江省自然科学基金资助项目(F201420;F2015041)

年  份:2019

卷  号:54

期  号:2

起止页码:408-414

语  种:中文

收录情况:BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD2019_2020、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:为了解决自然语言处理领域中的一词多义问题,本文提出了一种利用多种语言学知识和词义消歧模型的半监督消歧方法.首先,以歧义词汇左、右邻接词单元的词形、词性和译文作为消歧特征,来构建贝叶斯(Bayes)词义分类器,并以歧义词汇左、右邻接词单元的词形和词性作为消歧特征,来构建最大熵(maximum entropy,ME)词义分类器;其次,采用Co-Training算法并结合大量无标注语料来优化词义消歧模型;再次,进行了优化实验,在实验中,使用SemEval-2007:Task#5的训练语料和哈尔滨工业大学的无标注语料来优化贝叶斯分类器和最大熵分类器;最后,对优化后的词义消歧模型进行测试.测试结果表明:与基于支持向量机(support vector machine,SVM)的词义消歧方法相比,本文所提出方法的消歧准确率提高了0.9%.词义消歧的性能有所提高.

关 键 词:自然语言处理 词义消歧 最大熵 贝叶斯分类器

分 类 号:TP391.2]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心