登录    注册    忘记密码

期刊文章详细信息

融合知识感知与双重注意力的短文本分类模型  ( EI收录)  

Short Text Classification Model Combining Knowledge Aware and Dual Attention

  

文献类型:期刊文章

作  者:李博涵[1,2,3] 向宇轩[1] 封顶[1] 何志超[1,4] 吴佳骏[1] 戴天伦[1] 李静[1]

LI Bo-Han;XIANG Yu-Xuan;FENG Ding;HE Zhi-Chao;WU Jia-Jun;DAI Tian-Lun;LI Jing(College of Computer Science and Technology,College of Artificial Intelligence and College of Software,Nanjing University of Aeronautics and Astronautics,Nanjing 211106,China;Key Laboratory for Safety-critical Software Development and Verification,Ministry of Industry and Information Technology(Nanjing University of Aeronautics and Astronautics),Nanjing 211016,China;Collaborative Innovation Center of Novel Software Technology and Industrialization,Nanjing 211106,China;Nanjing Municipal Public Security Bureau,Nanjing 211106,China)

机构地区:[1]南京航空航天大学计算机科学与技术学院/人工智能学院/软件学院,江苏南京211106 [2]高安全系统的软件开发与验证技术工业和信息化部重点实验室(南京航空航天大学),江苏南京211106 [3]软件新技术与产业化协同创新中心,江苏南京211106 [4]南京市公安局,江苏南京211106

出  处:《软件学报》

基  金:国家自然科学基金(62172351,61728204);高安全系统的软件开发与验证技术工业和信息化部重点实验室(NJ2018014);中国学位与研究生教育学会(B-2017Y0904-162);华为创新DB IRP(CCF-HUAWEI DBIR2020001A)。

年  份:2022

卷  号:33

期  号:10

起止页码:3565-3581

语  种:中文

收录情况:AJ、BDHX、BDHX2020、CSCD、CSCD2021_2022、EI、IC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:文本分类任务作为文本挖掘的核心问题,已成为自然语言处理领域的一个重要课题.而短文本分类由于稀疏性、实时性和不规范性等特点,已成为文本分类亟待解决的问题之一.在某些特定场景,短文本存在大量隐含语义,由此给挖掘有限文本内的隐含语义特征等任务带来挑战.已有的方法对短文本分类主要采用传统机器学习或深度学习算法,但该类算法的模型构建复杂且工作量大,效率不高.此外,短文本包含有效信息较少且口语化严重,对模型的特征学习能力要求较高.针对以上问题,提出了KAe RCNN模型,该模型在TextRCNN模型的基础上,融合了知识感知与双重注意力机制.知识感知包含了知识图谱实体链接和知识图谱嵌入,可以引入外部知识以获取语义特征,同时,双重注意力机制可以提高模型对短文本中有效信息提取的效率.实验结果表明,KAe RCNN模型在分类准确度、F1值和实际应用效果等方面显著优于传统的机器学习算法.对算法的性能和适应性进行了验证,准确率达到95.54%,F1值达到0.901,对比4种传统机器学习算法,准确率平均提高了约14%,F1值提升了约13%.与TextRCNN相比,KAe RCNN模型在准确性方面提升了约3%.此外,与深度学习算法的对比实验结果也说明,该模型在其他领域的短文本分类中也有较好的表现.理论和实验结果都证明,所提出的KAe RCNN模型对短文本分类效果更优.

关 键 词:短文本分类  知识图谱 注意力机制  TextRCNN  实体消歧  

分 类 号:TP18]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心