期刊文章详细信息
基于改进TextRank的铁路文献关键词抽取算法
Keywords extraction algorithm of railway literature based on improved TextRank
文献类型:期刊文章
ZHAO Zhanfang;LIU Pengpeng;LI Xueshan(College of Information and Engineering,Hebei GEO University,Shijiazhuang 050031,China;Hebei Key Laboratory of Photoelectric Information and Earth Detection Technology,Shijiazhuang 050031,China;Scientific&Technical Information Research Institute,China Academy of Railway Sciences,Beijing 100081,China)
机构地区:[1]河北地质大学信息工程学院,石家庄050031 [2]河北省光电信息与地球探测技术重点实验室,石家庄050031 [3]中国铁道科学研究院科学技术信息研究所,北京100081
基 金:中国铁道科学研究院基金项目(2018YJ134);中国工程院项目(CKCEST-2019-2-11)。
年 份:2021
卷 号:45
期 号:2
起止页码:80-86
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CAS、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:实现铁路行业海量的铁路科技信息资源有效地组织管理并提供智能化、专业化的检索和服务,已经成为科研人员迫切期望解决的问题.关键词自动抽取技术是实现信息的智能检索和标引分类的核心技术,本文提出了一种改进TextRank的关键词抽取算法应用于铁路文献关键词的抽取,该算法融合多个特征因素改进词汇节点的初始权重设置,并利用Word2Vec训练的词向量表征改进词节点间的转移概率.实验结果表明:本文所提出的关键词抽取算法相对于经典的TextRank和TF-IDF算法在准确率,召回率以及F值上都有较大的提升.与TextRank相比,F值提升了13.9%.
关 键 词:抽取 Word2Vec模型 TextRank算法
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...