期刊文章详细信息
跨域注意力特征融合的说话人确认方法 ( EI收录)
Speaker verification method based on cross-domain attentive feature fusion
文献类型:期刊文章
YANG Zhen;WANG Tianlang;GUO Haiyan;WANG Tingting(College of Communication&Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China;National Local Joint Engineering Research Center for Communications and Network Technology,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)
机构地区:[1]南京邮电大学通信与信息工程学院,江苏南京210003 [2]南京邮电大学通信与网络技术国家地方联合工程研究中心,江苏南京210003
基 金:国家自然科学基金资助项目(No.62071242)。
年 份:2023
卷 号:44
期 号:8
起止页码:89-98
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD2023_2024、EAPJ、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:针对目前说话人确认系统中前端特征的语音信号样点间结构信息缺失问题,提出了跨域注意力特征融合的说话人确认方法。首先,提出了一种基于图信号处理的图频域特征提取方法来有效利用语音信号的结构信息,将语音信号帧的每个样点作为图节点,构建语音图信号,通过图傅里叶变换以及滤波器组提取图频域特征。其次,提出了一种由残差模块与挤压-激励模块构成的注意力特征融合网络,对传统时频域特征与图频域特征进行跨域融合,来提升说话人确认系统的性能。最后,在VoxCeleb、SITW和CN-Celeb数据集上进行实验。实验结果表明,所提方法在等错误率以及最小检测代价函数的评价指标上,优于基线模型ECAPA-TDNN。
关 键 词:说话人确认 图信号处理 注意力特征融合
分 类 号:TN912.34]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...