登录    注册    忘记密码

期刊文章详细信息

CRF与规则相结合的维吾尔文地名识别研究    

Uyghur Location Names Recognition Based on Conditional Random Fields and Rules

  

文献类型:期刊文章

作  者:买合木提.买买提[1,2] 卡哈尔江.阿比的热西提[1,2] 艾山.吾买尔[1,2] 吐尔根.依布拉音[1,2] 王路路[1,2]

机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046 [2]新疆多语种信息技术实验室,新疆乌鲁木齐830046

出  处:《中文信息学报》

基  金:国家自然科学基金(61462083;61262060;61331011;61463048);国家重点基础研究发展计划(973)(2014CB340506);新疆多语种信息技术实验室开放课题项目(2016D03023);"自治区青年科技创新人才培养工程"青年博士项目(QN2015BS004)

年  份:2017

卷  号:31

期  号:6

起止页码:110-118

语  种:中文

收录情况:BDHX、BDHX2014、CSCD、CSCD2017_2018、JST、RCCSE、ZGKJHX、核心刊

摘  要:该文通过维吾尔文地名的分析研究,提出了一种基于条件随机场和规则的维吾尔文地名识别方法。根据维吾尔文地名黏着性、音译等特点,针对维吾尔文地名识别任务,在词汇和词性特征基础之上,引入音节、词向量获取的相似单词、常用地名词典、地名特征词、地名词缀等特征进行实验,结果表明这些特征对识别性能有较大的影响。通过对错误识别结果分析,该文提出了基于规则的后处理,进一步提高了识别性能,准确率达到94.68%,召回率达到89.52%,F值达到92.03%。

关 键 词:命名实体  维吾尔文 地名 条件随机场 词向量  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心