期刊文章详细信息
基于改进TextRank算法的中文文本摘要提取
Extraction of Chinese Text Summarization Based on Improved TextRank Algorithm
文献类型:期刊文章
XU Xintao;CHAI Xiaoli;XIE Bin;SHEN Chen;WANG Jingping(The 32nd Research Institute of China Electronics Technology Group Corporation,Shanghai 201808,China)
机构地区:[1]中国电子科技集团公司第三十二研究所,上海201808
基 金:国家部委基金
年 份:2019
卷 号:45
期 号:3
起止页码:273-277
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CAS、CSA、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊
摘 要:为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重影响因子的TextRank算法对文本语句进行排序,并提取主题句生成摘要。实验结果表明,DK-TextRank算法在摘要语句数量为7时F值达到79.36%,相比传统TF-IDF、TextRank算法提取的摘要质量更高。
关 键 词:Doc2Vec模型 K-MEANS算法 TextRank算法 摘要提取 权重影响因子
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...