期刊文章详细信息
基于多卷积核DPCNN的维吾尔语文本分类联合模型
Uyghur Text Categorization Joint Model Based on Multi-convolution Kernel DPCNN
文献类型:期刊文章
JIAMILA Wushouer;WU Di;WANG Lulu;GULINIGEER Abudouwaili;MAIHEMUTI Maimaiti;TUERGEN Yibulayin(School of Information Science and Engineering,Xinjiang University,Urumqi,Xinjiang 830046,China;School of Software,Xinjiang University,Urumqi,Xinjiang 830046,China;Xinjiang Laboratory of Multi-language Information Technology,Urumqi,Xinjiang 830046,China)
机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046 [2]新疆大学软件学院,新疆乌鲁木齐830046 [3]新疆多语种信息技术实验室,新疆乌鲁木齐830046
基 金:国家重点研发计划子课题(2017YFB1002103);国家自然科学基金(61762084)。
年 份:2021
卷 号:35
期 号:7
起止页码:63-71
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、JST、RCCSE、ZGKJHX、核心刊
摘 要:由于维吾尔语形态丰富且资源匮乏,因此直接使用现有的深度学习模型并不能很好地完成文本分类任务。基于此,该文提出了MDPLC文本分类模型,即首先将预先训练的词向量和经Bi-LSTM处理得到的语义信息进行融合,进而得到全句语义依赖,然后通过组合池化的CNN进一步加强局部语义学习,同时以双通道的方式使用多卷积核DPCNN捕获文本语义信息,最后融合两种模型提取到的信息完成文本分类任务。为验证该模型的有效性,该文分别采用中文、英文和维吾尔文短、长文本数据集进行实验,实验结果表明,该模型在多个分类任务中取得的性能都高于现有主流深度学习模型,验证了该模型在不同语种、语义表达稀疏和语义丰富各种情况下的鲁棒性。
关 键 词:维吾尔语 文本分类 多卷积核DPCNN Bi-LSTM+CNN
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...