登录    注册    忘记密码

期刊文章详细信息

基于参数迁移和卷积循环神经网络的语音情感识别    

Speech Emotion Recognition Model Based on Parameter Transfer and Convolutional Recurrent Neural Network

  

文献类型:期刊文章

作  者:缪裕青[1] 邹巍[1] 刘同来[1] 周明[2] 蔡国永[1]

MIAO Yuqing;ZOU Wei;LIU Tonglai;ZHOU Ming;CAI Guoyong(School of Computer Science and Information Security, Guilin University of Electronic Technology, Guilin, Guangxi541004, China;Guilin Hivision Technology Co. Ltd., Guilin, Guangxi 541004, China)

机构地区:[1]桂林电子科技大学计算机与信息安全学院,广西桂林541004 [2]桂林海威科技股份有限公司,广西桂林541004

出  处:《计算机工程与应用》

基  金:国家自然科学基金(No.61763007);广西自然科学基金(No.2014GXNSFAA118395);广西高校图像图形智能处理重点实验室研究项目(No.GIIP201706);广西自然科学基金重点项目(No.2017GXNSFDA198028);桂林电子科技大学研究生教育创新计划资助项目(No.2016YJCX72;No.2017YJCX50)

年  份:2019

卷  号:55

期  号:10

起止页码:135-140

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊

摘  要:在语音情感识别研究中,已有基于深度学习的方法大多没有针对语音时频两域的特征进行建模,且存在网络模型训练时间长、识别准确性不高等问题。语谱图是语音信号转换后具有时频两域的特殊图像,为了充分提取语谱图时频两域的情感特征,提出了一种基于参数迁移和卷积循环神经网络的语音情感识别模型。该模型把语谱图作为网络的输入,引入AlexNet网络模型并迁移其预训练的卷积层权重参数,将卷积神经网络输出的特征图重构后输入LSTM(Long Short-Term Memory)网络进行训练。实验结果表明,所提方法加快了网络训练的速度,并提高了情感识别的准确率。

关 键 词:语谱图 深度学习  参数迁移  卷积循环神经网络  语音情感识别

分 类 号:TP391.4]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心