期刊文章详细信息
文献类型:期刊文章
机构地区:[1]广东药科大学医药信息工程学院,广州510006 [2]华南理工大学计算机科学与工程学院,广州510640
基 金:广东省自然科学基金(2015A030310318);广东省医学科学技术研究基金项目(A2015065);国家自然科学基金资助项目(61103038)资助
年 份:2016
卷 号:43
期 号:6
起止页码:240-247
语 种:中文
收录情况:BDHX、BDHX2014、CSA、CSCD、CSCD_E2015_2016、IC、JST、RCCSE、UPD、ZGKJHX、核心刊
摘 要:经典的TextRank算法在文档的自动摘要提取时往往只考虑了句子节点间的相似性,而忽略了文档的篇章结构及句子的上下文信息。针对这些问题,结合中文文本的结构特点,提出一种改进后的iTextRank算法,通过将标题、段落、特殊句子、句子位置和长度等信息引入到TextRank网络图的构造中,给出改进后的句子相似度计算方法及权重调整因子,并将其应用于中文文本的自动摘要提取,同时分析了算法的时间复杂度。最后,实验证明iTextRank比经典的TextRank方法具有更高的准确率和更低的召回率。
关 键 词:中文文本 自动摘要提取 TextRank 篇章结构 无监督学习方法
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...