期刊文章详细信息
采用多任务学习和循环神经网络的语音情感识别算法
Speech Emotion Recognition Algorithm Based on Multi Task Learning and Recurrent Neural Network
文献类型:期刊文章
Feng Tianyi;Yang Zhen(Key Lab of Broadband Wireless Communication and Sensor Network Technology,Ministry of Education,Nanjing University of Posts and Telecommunications,Nanjing,Jiangsu 210003,China;National Local Joint Engineering Research Center for Communications and Network Technology,Nanjing University of Posts and Telecommunications,Nanjing,Jiangsu 210003,China)
机构地区:[1]南京邮电大学宽带无线通信与传感网技术教育部重点实验室,江苏南京210003 [2]南京邮电大学通信与网络技术国家地方联合工程研究中心,江苏南京210003
基 金:国家“863”高技术研究发展计划项目(2006AA010102)
年 份:2019
卷 号:35
期 号:7
起止页码:1133-1140
语 种:中文
收录情况:BDHX、BDHX2017、CSA、CSCD、CSCD2019_2020、JST、RCCSE、ZGKJHX、核心刊
摘 要:随着机器学习的快速发展,许多研究者使用神经网络来解决语音识别领域中的各类问题。然而由于训练数据有限等原因,常规的神经网络分类器普遍存在泛化误差等问题。为了解决此问题,迁移学习中的多任务学习被引入到研究中。本文提出了一种采用多任务学习和循环神经网络的语音情感识别算法(MTL-RNN),将说话人情感识别作为主任务,性别识别和身份识别作为辅助任务,三个任务在神经网络中并行训练。算法模型通过RNN共享层共享网络参数、学习共享特征,通过属性依赖层学习独有特征,以提升模型的分类性能。实验结果表明,本文所提出的MTL-RNN算法在汉语和阿拉伯语、较少说话人和较多说话人的场景下均有较好的识别性能。
关 键 词:语音情感识别 多任务学习 循环神经网络
分 类 号:TN912.34]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...