期刊文章详细信息
文献类型:期刊文章
机构地区:[1]长春理工大学理学院应用数学系,吉林 长春 [2]数学实验省级教学示范中心(长春理工大学),吉林 长春
年 份:2020
卷 号:9
期 号:1
起止页码:30-37
语 种:中文
收录情况:RCCSE、外刊、普通刊
摘 要:本文研究了小样本声纹识别问题。实验中采用梅尔倒谱系数与其动态差分系数组成的39维特征作为基本声学特征,再将基本声学特征通过由三层受限玻尔兹曼机堆叠而成的深度置信网络提取128维深度声学特征,最后通过支持向量机和随机森林进行分声纹识别。训练深度置信网络时,每个说话人选用短时语音信号组成的小样本数据作为该网络的训练集,同时将训练好的深度置信网络模型作为深度声学特征提取器,用该特征提取器对非训练集中说话人语音信号提取深度声学特征,进一步验证了该深度声学特征提取器的泛化能力。实验结果表明,本文设计的声纹识别模型识别准确率高,且深度特征提取器有较好的泛化能力。
关 键 词:声纹识别 深度置信网络 支持向量机 随机森林
分 类 号:TP3[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...