登录    注册    忘记密码

期刊文章详细信息

基于舆情新闻的中文关键词抽取综述    

Review of Chinese Keyword Extraction Based on Public Opinion News

  

文献类型:期刊文章

作  者:杨文忠[1,2] 丁甜甜[1] 康鹏[1] 卜文秀[1]

YANG Wenzhong;DING Tiantian;KANG Peng;BU Wenxiu(College of Information Science and Engineering,Xinjiang University,Urumqi 830046,China;Key Laboratory of Multilingual Information Technology in Xinjiang Uygur Autonomous Region,College of Information Science and Engineering,Xinjiang University,Urumqi 830046,China)

机构地区:[1]新疆大学信息科学与工程学院,乌鲁木齐830046 [2]新疆大学,信息科学与工程学院,新疆维吾尔自治区多语种信息技术重点实验室,乌鲁木齐830046

出  处:《计算机工程》

基  金:国家自然科学基金(U1603115,62262065);国家重点研发计划子课题(2017YFC0820702-3);新疆维吾尔自治区重点科技专项(2020A02001-1);四川省区域创新合作项目(2020YFQ0018);新疆维吾尔自治区自然科学基金(2021D01C080)。

年  份:2023

卷  号:49

期  号:3

起止页码:1-17

语  种:中文

收录情况:AJ、BDHX、BDHX2020、CAS、CSCD、CSCD_E2023_2024、IC、JST、RCCSE、UPD、ZGKJHX、核心刊

摘  要:基于舆情事件的关键词抽取算法作为舆情监测的基础技术之一,其目的是在不同的舆情事件中抽取出人们关注的核心词汇,从而快速了解新闻内容。随着深度学习的发展,传统的无监督关键词抽取技术和有监督算法中的分类模型已经逐渐被基于深度学习的序列标注模型所替代。梳理无监督关键词抽取的限制性、分类模型在关键词抽取中的优势与不足、以及现有的深度学习对关键词抽取技术发展的帮助,重点分析整体关键词抽取技术的发展中卷积神经网络、循环神经网络等深度学习的关键词抽取方法,并归纳现有方法的优缺点与发展趋势。此外,深度学习虽然在关键词抽取领域发挥了重要的作用,但其自身也存在着依赖大规模带标签样本、训练时间长与复杂度高等缺陷,需要在未来发展中进行解决。为确保分析过程的真实性,利用6个舆情新闻数据集和2个小型数据集进行实验复现,实验结果与文中理论分析一致。在此基础上,对关键词抽取技术及其所面临的困难和挑战进行梳理和分析,并针对现存问题对该领域的发展前景加以展望。

关 键 词:舆情监测 关键词抽取 核心词汇 深度学习  自然语言处理

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心