期刊文章详细信息
文献类型:期刊文章
CAI Qian;GAO Yong(College of Electronics and Information Engineering,Sichuan University,Chengdu 610065,China)
机构地区:[1]四川大学电子信息学院,四川成都610065 [2]四川大学电子信息学院通信教研室,四川成都610065
基 金:四川大学科研资助项目(0020505501743)。
年 份:2020
卷 号:50
期 号:6
起止页码:447-451
语 种:中文
收录情况:JST、普通刊
摘 要:提出了一种基于Gammatone滤波器倒谱系数(Gammatone Frequency Cepstral-Coefficients,GFCC)动态组合参数的卷积神经网络(Convolutional Neural Networks,CNN)结构来实现快速说话人识别的方法。提取语音样本的GFCC及其一阶差分和二阶差分系数作为代表语音的特征参数,对特征参数进行归一化处理,将得到的统计特征构造成CNN的输入形式。实验结果表明,与通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)相比,提出的模型方法学习速度更快,在提高识别率的同时减少了训练时间和识别时间。
关 键 词:动态组合参数 说话人识别 一阶差分 二阶差分 统计特征
分 类 号:TN912.34]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...