登录    注册    忘记密码

期刊文章详细信息

基于多语BERT的无监督攻击性言论检测    

Detection of unsupervised offensive speech based on multilingual BERT

  

文献类型:期刊文章

作  者:师夏阳[1] 张风远[1] 袁嘉琪[2] 黄敏[1]

SHI Xiayang;ZHANG Fengyuan;YUAN Jiaqi;HUANG Min(College of Software Engineering,Zhengzhou University of Light Industry,Zhengzhou Henan 450001,China;College of Mathematics and Information Science,Zhengzhou University of light industry,Zhengzhou Henan 450001,China)

机构地区:[1]郑州轻工业大学软件学院,郑州450001 [2]郑州轻工业大学数学与信息科学学院,郑州450001

出  处:《计算机应用》

基  金:河南省重点研发与推广专项(212102210547)。

年  份:2022

卷  号:42

期  号:11

起止页码:3379-3385

语  种:中文

收录情况:AJ、BDHX、BDHX2020、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、ZGKJHX、ZMATH、核心刊

摘  要:攻击性言论会对社会安定造成严重不良影响,但目前攻击性言论自动检测主要集中在少数几种高资源语言,对低资源语言缺少足够的攻击性言论标注语料导致检测困难,为此,提出一种跨语言无监督攻击性迁移检测方法。首先,使用多语BERT(mBERT)模型在高资源英语数据集上进行对攻击性特征的学习,得到一个原模型;然后,通过分析英语与丹麦语、阿拉伯语、土耳其语、希腊语的语言相似程度,将原模型迁移到这四种低资源语言上,实现对低资源语言的攻击性言论自动检测。实验结果显示,与BERT、线性回归(LR)、支持向量机(SVM)、多层感知机(MLP)这四种方法相比,所提方法在丹麦语、阿拉伯语、土耳其语、希腊语这四种语言上的攻击性言论检测的准确率和F1值均提高了近2个百分点,接近目前的有监督检测,可见采用跨语言模型迁移学习和迁移检测相结合的方法能够实现对低资源语言的无监督攻击性检测。

关 键 词:跨语言模型  攻击性言论检测  BERT  无监督方法  迁移学习  

分 类 号:TP391.]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心