期刊文章详细信息
基于深度学习的听觉倒谱系数语音增强算法 ( EI收录)
Speech enhancement based on auditory cepstral coefficient with deep learning
文献类型:期刊文章
LI Ruwei;SUN Xiaoyue;LIU Yanan;LI Tao(College of Information and Communications Engineering Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China)
机构地区:[1]北京工业大学信息学部信息与通信工程学院
基 金:北京市教委科技计划面上项目(KM201510005007);国家自然科学基金资助项目(51477028)
年 份:2019
卷 号:47
期 号:9
起止页码:78-83
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2019_2020、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:针对现有语音增强算法在低信噪比(SNR)非平稳噪声环境下的表现并不理想这一问题,提出了一种基于深度学习的语音增强算法.首先,构建了一个深度神经网络(DNN),然后从四个不同分辨率的耳蜗中提取了多分辨率听觉倒谱系数(MRACC)作为神经网络的输入,该系数既关注了细节的高分辨率特征,又把握了全局性的低分辨率特征;其次,跟踪噪声变化构建了一个自适应掩蔽阈值(AM)作为神经网络的训练目标,该阈值能够依据噪声调节理想二值掩蔽(IBM)和理想软掩蔽(IRM)的权重;最后,将估计的自适应掩蔽阈值用于对含噪语音进行增强.实验结果表明:相较于对比算法,该算法不仅可以进一步提高语音质量和可懂度,而且能够抑制更多的噪声.
关 键 词:语音增强 深度神经网络 听觉倒谱系数 自适应掩蔽阈值 低信噪比 噪声跟踪
分 类 号:TN912.35] TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...