登录    注册    忘记密码

期刊文章详细信息

基于多卷积核DPCNN的维吾尔语文本分类联合模型    

Uyghur Text Categorization Joint Model Based on Multi-convolution Kernel DPCNN

  

文献类型:期刊文章

作  者:加米拉·吾守尔[1,3] 吴迪[2,3] 王路路[1,3] 古丽尼格尔·阿不都外力[1,3] 买合木提·买买提[1,3] 吐尔根·依布拉音[1,3]

JIAMILA Wushouer;WU Di;WANG Lulu;GULINIGEER Abudouwaili;MAIHEMUTI Maimaiti;TUERGEN Yibulayin(School of Information Science and Engineering,Xinjiang University,Urumqi,Xinjiang 830046,China;School of Software,Xinjiang University,Urumqi,Xinjiang 830046,China;Xinjiang Laboratory of Multi-language Information Technology,Urumqi,Xinjiang 830046,China)

机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046 [2]新疆大学软件学院,新疆乌鲁木齐830046 [3]新疆多语种信息技术实验室,新疆乌鲁木齐830046

出  处:《中文信息学报》

基  金:国家重点研发计划子课题(2017YFB1002103);国家自然科学基金(61762084)。

年  份:2021

卷  号:35

期  号:7

起止页码:63-71

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、JST、RCCSE、ZGKJHX、核心刊

摘  要:由于维吾尔语形态丰富且资源匮乏,因此直接使用现有的深度学习模型并不能很好地完成文本分类任务。基于此,该文提出了MDPLC文本分类模型,即首先将预先训练的词向量和经Bi-LSTM处理得到的语义信息进行融合,进而得到全句语义依赖,然后通过组合池化的CNN进一步加强局部语义学习,同时以双通道的方式使用多卷积核DPCNN捕获文本语义信息,最后融合两种模型提取到的信息完成文本分类任务。为验证该模型的有效性,该文分别采用中文、英文和维吾尔文短、长文本数据集进行实验,实验结果表明,该模型在多个分类任务中取得的性能都高于现有主流深度学习模型,验证了该模型在不同语种、语义表达稀疏和语义丰富各种情况下的鲁棒性。

关 键 词:维吾尔语 文本分类 多卷积核DPCNN  Bi-LSTM+CNN  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心