登录    注册    忘记密码

期刊文章详细信息

一种基于卷积神经网络的快速说话人识别方法    

A Fast Speaker Recognition Method Based on Convolutional Neural Network

  

文献类型:期刊文章

作  者:蔡倩[1] 高勇[2]

CAI Qian;GAO Yong(College of Electronics and Information Engineering,Sichuan University,Chengdu 610065,China)

机构地区:[1]四川大学电子信息学院,四川成都610065 [2]四川大学电子信息学院通信教研室,四川成都610065

出  处:《无线电工程》

基  金:四川大学科研资助项目(0020505501743)。

年  份:2020

卷  号:50

期  号:6

起止页码:447-451

语  种:中文

收录情况:JST、普通刊

摘  要:提出了一种基于Gammatone滤波器倒谱系数(Gammatone Frequency Cepstral-Coefficients,GFCC)动态组合参数的卷积神经网络(Convolutional Neural Networks,CNN)结构来实现快速说话人识别的方法。提取语音样本的GFCC及其一阶差分和二阶差分系数作为代表语音的特征参数,对特征参数进行归一化处理,将得到的统计特征构造成CNN的输入形式。实验结果表明,与通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)相比,提出的模型方法学习速度更快,在提高识别率的同时减少了训练时间和识别时间。

关 键 词:动态组合参数  说话人识别 一阶差分  二阶差分 统计特征

分 类 号:TN912.34]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心