期刊文章详细信息
文献类型:期刊文章
LUO Chun-mei(School of Chemical and Mechanical Engineering,Eastern Liaoning Uni vers辻y,Dandong 118000,China)
机构地区:[1]辽东学院化工与机械学院,辽宁丹东118000
基 金:辽宁省教育厅科学研究项目(LNSJYT201904)。
年 份:2021
卷 号:51
期 号:17
起止页码:102-110
语 种:中文
收录情况:MR、RCCSE、ZGKJHX、ZMATH、普通刊
摘 要:为提高传统MFCC等声学特征及深度卷积神经网络的识别性能和对背景噪声的适应性,提出基于改进MFCC特征和改进RCNN网络的说话人识别算法.算法首先提取说话人语音的改进MFCC特征并进行了特征补偿和特征降维,以优化说话人的特征提取性能;然后采用池化层优化和残差卷积改进的DCNN网络进一步对准帧间信息,以提高说话人识别的特征学习准确性和对复杂背景干扰的适应性.实验结果表明,相比于i-vector和GMM-UBM识别框架及传统MFCC特征,文中算法取得最优的识别准确率和识别均方误差.
关 键 词:说话人识别 梅尔频率倒谱系数 深度卷积神经网络 高斯均值矩阵
分 类 号:TN912.3] TP183]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...