期刊文章详细信息
基于多级注意力融合机制的藏文实体关系抽取
Tibetan entity relation extraction based on multi-level attention fusion mechanism
文献类型:期刊文章
WANG Like;SUN Yuan;LIU Sisi(School of Information Engineering,Minzu University of China,Beijing 100081,China;National Language Resource and Monitoring and Research Center of Minority Languages,Minzu University of China,Beijing 100081,China)
机构地区:[1]中央民族大学信息工程学院,北京100081 [2]中央民族大学国家语言资源监测与研究少数民族语言中心,北京100081
基 金:国家自然科学基金资助项目(No.61972436)。
年 份:2021
卷 号:3
期 号:4
起止页码:466-473
语 种:中文
收录情况:普通刊
摘 要:与中英文相比,藏文实体关系训练语料规模较小,传统有监督的学习方法难以获得较高的准确率。针对基于远程监督的实体关系抽取存在错误标记的问题,利用远程监督方法将知识库与文本对齐,构建藏文实体关系抽取的数据集,提出一个基于多级注意力融合机制的藏文实体关系抽取模型。在词级别引入自注意力机制来提取单词的内部特征,在句子级别引入注意力机制为每个实例分配权重,从而充分利用包含信息的句子,减少噪声实例的权重。同时引入联合评分函数,修正远程监督的错误标签,并将神经网络与支持向量机结合,实现藏文实体关系分类。实验结果表明,提出的模型有效提高了藏文实体关系抽取的准确率,且优于基线模型效果。
关 键 词:藏文 实体关系抽取 多级注意力融合机制 支持向量机
分 类 号:TP3[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...