期刊文章详细信息
基于聚类与语义相似分析的多文本自动摘要方法
Multi-document Automatic Summarization Based on Clustering and Semantic Similarity Analysis on Cloud Computing Platform
文献类型:期刊文章
机构地区:[1]广州航海学院图书馆,广州510725
年 份:2017
卷 号:36
期 号:6
起止页码:167-172
语 种:中文
收录情况:BDHX、BDHX2014、CSSCI、CSSCI2017_2018、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:[目的/意义]现有文本自动摘要算法普遍存在处理速度慢、压缩率不足或摘要质量不高等问题,如何高效处理、有效利用海量文本是图书馆信息管理及服务一个重要的研究方向。[方法/过程]提出了一种云计算平台下基于聚类与语义相似分析的多文本自动摘要方法。该方法在文本向量化基础上,通过MapReduce框架对多文本进行聚类、主题抽取、主题词及语义相似词频率统计等处理,然后摘取主题句构造出多文本摘要。[结果/结论]实验结果证实,基于聚类与语义相似分析的MapReduce自动摘要架构在生成大规模多文本摘要时,不但具有较好的时间性能,同时也具有较好的压缩效果并保证较高的摘要质量。
关 键 词:自动摘要 云计算 多文本 聚类 语义相似 分布式处理
分 类 号:G252.6[图书情报与档案管理类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...