登录    注册    忘记密码

期刊文章详细信息

弱标签声音事件检测的空间-通道特征表征与自注意池化  ( EI收录)  

Spatial-Channel Feature Representation and Self-attention Pooling for Weakly-Labeled Sound Event Detection

  

文献类型:期刊文章

作  者:杨利平[1] 侯振威[1] 辜小花[2] 郝峻永[1]

YANG Li-ping;HOU Zhen-wei;GU Xiao-hua;HAO Jun-yong(Key Laboratory of Optoelectronic Technology and Systems,Ministry of Education,Chongqing University,Chongqing 400044,China;School of Electrical Engineering,Chongqing University of Science&Technology,Chongqing 401331,China)

机构地区:[1]重庆大学光电技术及系统教育部重点实验室,重庆400044 [2]重庆科技学院电气工程学院,重庆401331

出  处:《电子学报》

基  金:国家自然科学基金(No.61903054)。

年  份:2023

卷  号:51

期  号:2

起止页码:297-306

语  种:中文

收录情况:BDHX、BDHX2020、CAS、CSCD、CSCD2023_2024、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:深度神经网络声音事件检测方法需要大量标记声音事件类别和起止时间的强标签音频样本,然而强标签标注非常困难和耗时.弱标签声音事件检测是解决这一困难的有效途径.本文将弱标签声音事件检测作为多实例学习问题,并基于卷积循环神经网络提出弱标签声音事件检测的空间-通道特征表征与自注意池化方法.该方法研究多实例弱标签声音事件检测的特征表征和帧级预测结果池化两个方面的内容.在特征表征方面,为了增强卷积神经网络的特征表征能力,结合上下文门控和通道注意机制构建门控注意力结构并嵌入到卷积循环神经网络中,实现了音频样本特征的空间和通道特征选择;在预测结果池化方面,引入自注意思想设计音频帧预测结果的自注意池化方法,增强了音频样本中事件帧之间的相关度,使事件帧获得更大的权重.本文方法通过对卷积循环神经网络特征表征和预测结果池化的革新,有效提升了模型的检测性能.本文提出的方法在DCASE 2017任务4和DCASE 2018任务4数据集的评估集中分别取得了52.47%和31.00%的F1得分,性能优于当前绝大部分的弱标签声音事件检测方法.实验结果表明:本文提出的空间-通道特征表征与自注意池化方法能显著改善弱标签声音事件检测的综合性能.

关 键 词:特征表征  自注意池化  卷积循环神经网络  弱标签学习  声音事件检测  

分 类 号:TP391.4] TP37[计算机类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心