登录    注册    忘记密码

期刊文章详细信息

基于融合词性的BiLSTM-CRF的期刊关键词抽取方法    

Keyword Extraction for Journals Based on Part-of-Speech and BiLSTM-CRF Combined Model

  

文献类型:期刊文章

作  者:成彬[1] 施水才[1,2] 都云程[1,2] 肖诗斌[1,2]

Cheng Bin;Shi Shuicai;Du Yuncheng;Xiao Shibin(Computer School,Beijing Information Science&Technology University,Beijing 100185,China;Beijing TRS Information Technology Co.,Ltd.,Beijing 100101,China)

机构地区:[1]北京信息科技大学计算机学院,北京100185 [2]北京拓尔思信息技术股份有限公司,北京100101

出  处:《数据分析与知识发现》

年  份:2021

卷  号:5

期  号:3

起止页码:101-108

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD_E2021_2022、CSSCI、CSSCI2021_2022、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:【目的】利用CRF模型处理序列标注问题的优势,通过将词性信息和CRF模型融入BiLSTM网络,实现期刊关键词的自动抽取。【方法】将关键词抽取问题视为一个序列标注问题。对期刊文本进行分词和词性标注的预处理;对预处理后的文本使用Word2Vec模型进行Word Embedding向量化,获取字词的向量表达式;使用BiLSTM-CRF模型进行关键词的自动抽取。【结果】使用融合词性的BiLSTM-CRF网络,在采集的知网期刊文本上进行实验,在简单关键词方面,准确率较原始的BiLSTM模型提升3%;在复杂关键词方面,准确率较原始的BiLSTM模型提升12%。【局限】期刊关键词抽取模型无法准确抽取复杂关键词,需要针对复杂关键词层面进一步提升模型性能。【结论】融合词性的BiLSTM-CRF模型与传统方法相比,具有较高的识别准确率,是一种有效的关键词抽取方法。

关 键 词:抽取 条件随机场 深度学习  双向长短期记忆网络  

分 类 号:TP393]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心