登录    注册    忘记密码

期刊文章详细信息

序列数据的数据增强方法综述    

Survey on Sequence Data Augmentation

  

文献类型:期刊文章

作  者:葛轶洲[1,2] 许翔[3] 杨锁荣[3] 周青[1,2] 申富饶[3]

GE Yizhou;XU Xiang;YANG Suorong;ZHOU Qing;SHEN Furao(Science and Technology on Communication Information Security Control Laboratory,Jiaxing,Zhejiang 314033,China;No.36 Research Institute,China Electronics Technology Group Corporation,Jiaxing,Zhejiang 314033,China;State Key Laboratory for Novel Software Technology,Nanjing University,Nanjing 210023,China)

机构地区:[1]通信信息控制和安全技术重点实验室,浙江嘉兴314033 [2]中国电子科技集团公司第三十六研究所,浙江嘉兴314033 [3]计算机软件新技术国家重点实验室(南京大学),南京210023

出  处:《计算机科学与探索》

基  金:国家自然科学基金(61876076)。

年  份:2021

卷  号:15

期  号:7

起止页码:1207-1219

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、IC、JST、ZGKJHX、核心刊

摘  要:为了追求精度,深度学习模型框架的结构越来越复杂,网络越来越深。参数量的增加意味着训练模型需要更多的数据。然而人工标注数据的成本是高昂的,且受客观原因所限,实际应用时可能难以获得特定领域的数据,数据不足问题非常常见。数据增强通过人为地生成新的数据增加数据量来缓解这一问题。数据增强方法在计算机视觉领域大放异彩,让人们开始关注类似方法能否应用在序列数据上。除了翻转、裁剪等在时间域进行增强的方法外,也描述了在频率域实现数据增强的方法;除了人们基于经验或知识而设计的方法以外,对一系列基于GAN的通过机器学习模型自动生成数据的方法也进行了详细的论述。介绍了应用在自然语言文本、音频信号和时间序列等多种序列数据上的数据增强方法,亦有涉及它们在医疗诊断、情绪判断等问题上的表现。尽管数据类型不同,但总结了应用在这些类型上的数据增强方法背后的相似的设计思路。以这一思路为线索,梳理应用在各类序列数据类型上的多种数据增强方法,并进行了一定的讨论和展望。

关 键 词:序列数据 数据增强  深度学习  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心