登录    注册    忘记密码

期刊文章详细信息

一种基于演化算法进行句子抽取的多文档自动摘要系统SBGA    

SBGA:A Multi-Document Summarizer Using Genetic Algorithm-Based Sentence Extraction

  

文献类型:期刊文章

作  者:刘德喜[1] 何炎祥[2] 姬东鸿[3] 杨华[2]

机构地区:[1]襄樊学院,湖北襄樊441053 [2]武汉大学计算机学院,湖北武汉430079 [3]武汉大学语言与信息研究中心,湖北武汉430079

出  处:《中文信息学报》

基  金:国家自然科学基金重大研究计划资助项目(90104005)

年  份:2006

卷  号:20

期  号:6

起止页码:46-53

语  种:中文

收录情况:BDHX、BDHX2004、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊

摘  要:SBGA系统将多文档自动摘要过程视为一个从源文档集中抽取句子的组合优化过程,并用演化算法来求得近似最优解。与基于聚类的句子抽取方法相比,基于演化算法进行句子抽取的方法是面向摘要整体的,因此能获得更好的近似最优摘要。演化算法的评价函数中考虑了衡量摘要的4个标准:长度符合用户要求、信息覆盖率高、更多地保留原文传递的重要信息、无冗余。另外,为了提高词频计算的精度,SBGA采用了一种改进的词频计算方法TFS,将加权后词的同义词频率加到了原词频中。在DUC2004测试数据集上的实验结果表明,基于演化算法进行句子抽取的方法有很好的性能,其ROUGE-1分值比DUC2004最优参赛系统仅低0.55%。改进的词频计算方法TFS对提高文档质量也起到了良好的作用。

关 键 词:计算机应用  中文信息处理 多文档自动摘要 演化算法 句子抽取 评价函数  TFS  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心