登录    注册    忘记密码

期刊文章详细信息

基于图模型的多文档摘要生成算法    

Multi-document Summary Generation Algorithm Based on Graph Model

  

文献类型:期刊文章

作  者:张云纯[1] 张琨[1] 徐济铭[2] 袁卫平[2] 蔡颖[1] 高雅[1]

ZHANG Yunchun;ZHANG Kun;XU Jiming;YUAN Weiping;CAI Ying;GAO Ya(School of Computer Science and Engineering,Nanjing University of Science and Technology,Nanjing 210094,China;Department of Internet Information,Jiangsu Branch of National Computer Network and Information Security Management Center,Nanjing 210019,China)

机构地区:[1]南京理工大学计算机科学与工程学院,南京210094 [2]国家计算机网络与信息安全管理中心江苏分中心互联网信息处,南京210019

出  处:《计算机工程与应用》

基  金:南京理工大学自主科研专项(No.30918012204);江苏省研究生科研创新计划(No.KYCX19_0307)。

年  份:2020

卷  号:56

期  号:16

起止页码:124-131

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSCD、CSCD_E2019_2020、IC、JST、RCCSE、ZGKJHX、核心刊

摘  要:提出一种基于图模型的多文档摘要生成算法,对海外大量新闻文档进行主题划分,并提取每个主题的摘要。利用传统的基于图模型方法得到的摘要,其冗余度较高,亦不能够充分考虑新闻文本时效性强、主题明确的特征。在文本特征向量化方面,引入了热度系数,改进了传统的TF-IDF算法。在主题的划分方面,采用基于密度的两阶段聚类方法,改进了传统的基于K-Means进行聚类的方法的不足,同时对文本进行更明确、更具层次性的主题划分。在摘要抽取方面,为句子设计了符合新闻文本特征的重要度计算公式。实验结果表明,基于图模型的自动文本摘要生成算法的效果优于传统算法。

关 键 词:文本聚类 自动摘要  图模型 多特征融合

分 类 号:TP311]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心