登录    注册    忘记密码

期刊文章详细信息

中文嵌套命名实体识别语料库的构建    

Chinese Nested Named Entity Recognition Corpus Construction

  

文献类型:期刊文章

作  者:李雁群[1,2] 何云琪[1,2] 钱龙华[1,2] 周国栋[1,2]

LI Yanqun;HE Yunqi;QIAN Longhua;ZHOU Guodong(Natural Language Processing Laboratory,Soochow University,Suzhou,Jiangsu 215006,China;School of Computer Science and Technology,Sooehow University,Suzhou,Jiangsu 215006,China)

机构地区:[1]苏州大学自然语言处理实验室,江苏苏州215006 [2]苏州大学计算机科学与技术学院,江苏苏州215006

出  处:《中文信息学报》

基  金:国家自然科学基金(61373096;61331011;61673290)

年  份:2018

卷  号:32

期  号:8

起止页码:19-26

语  种:中文

收录情况:BDHX、BDHX2017、CSCD、CSCD2017_2018、JST、RCCSE、ZGKJHX、核心刊

摘  要:嵌套命名实体含有丰富的实体和实体间语义关系,有助于提高信息抽取的效率。由于缺少统一的标准中文嵌套命名实体语料库,目前中文嵌套命名实体的研究工作难于比较。该文在已有命名实体语料的基础上采用半自动化方法构建了两个中文嵌套命名实体语料库。首先利用已有中文命名实体语料库中的标注信息自动地构造出尽可能多的嵌套命名实体,然后再进行手工调整以满足对中文嵌套实体的标注要求,从而构建高质量的中文嵌套命名实体识别语料库。语料内和跨语料嵌套实体识别的初步实验表明,中文嵌套命名实体识别仍是一个比较困难的问题,需要进一步研究。

关 键 词:中文嵌套命名实体识别  条件随机场 信息抽取 语料库

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心