登录    注册    忘记密码

期刊文章详细信息

基于感知掩蔽深度神经网络的单通道语音增强方法  ( EI收录)  

A Single-channel Speech Enhancement Approach Based on Perceptual Masking Deep Neural Network

  

文献类型:期刊文章

作  者:韩伟[1] 张雄伟[1] 闵刚[1,2] 张启业[3]

机构地区:[1]解放军理工大学 [2]西安通信学院 [3]中国人民解放军96637部队

出  处:《自动化学报》

基  金:国家自然科学基金(61471394;61402519);江苏省自然科学基金(BK20140071;BK20140074)资助~~

年  份:2017

卷  号:43

期  号:2

起止页码:248-258

语  种:中文

收录情况:BDHX、BDHX2014、CSCD、CSCD2017_2018、EI(收录号:20171703608968)、IC、JST、MR、PUBMED、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:本文将心理声学掩蔽特性应用于基于深度神经网络(Deep neural network,DNN)的单通道语音增强任务中,提出了一种具有感知掩蔽特性的DNN结构.首先,提出的DNN对带噪语音幅度谱特征进行训练并分别得到纯净语音和噪声的幅度谱估计.其次,利用估计的纯净语音幅度谱计算噪声掩蔽阈值.然后,将噪声掩蔽阈值和估计的噪声幅度谱联合计算得到一个感知增益函数.最后,利用感知增益函数从带噪语音幅度谱中估计出增强语音幅度谱.在TIMIT数据库上,对不同信噪比下的20种噪声进行的仿真实验表明,无论噪声类型是否在语音的训练集中出现,所提出的感知掩蔽DNN都能够在有效去除噪声的同时保持较小的语音失真,增强效果明显优于常见的DNN增强方法以及NMF(Nonnegative matrix factorization)增强方法.

关 键 词:语音增强 深度神经网络  感知增益函数  掩蔽阈值

分 类 号:TP183] TN912.35]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心