期刊文章详细信息
文献类型:期刊文章
Chen Xuewen(USTC-Birmingham Joint Research Institute in Intelligent Computation and Its Application(UBRI),School of Computer Science and Technology,University of Science and Technology of China,Hefei 230027,Anhui,China)
机构地区:[1]中国科学技术大学计算机科学与技术学院中国科大-伯明翰大学智能计算与应用联合研究所,安徽合肥230027
年 份:2020
卷 号:37
期 号:3
起止页码:202-208
语 种:中文
收录情况:BDHX、BDHX2017、CSA、CSA-PROQEUST、IC、JST、ZGKJHX、核心刊
摘 要:现有的生成式文本摘要方法存在一些局限,包括难以产生可靠的源文本表示,产生的摘要句与源文本的语义相似度较低,存在集外词问题等。对此提出一种混合神经网络编码器结构,对源文本的长距依赖和上下文信息进行捕捉,得到高质量的文本表示;提出一种基于关键短语的重排序机制,利用源文本中抽取的关键短语对集束搜索生成的候选序列进行重新排序,以减小其与源文本语义上的距离;对文本进行子词单元提取,利用更细粒度的单元对文本进行表示。该方法在不同长度的摘要数据集上进行实验,均取得了良好的效果。
关 键 词:生成式文本摘要 字节对编码 集束搜索 深度学习
分 类 号:TP3[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...