期刊文章详细信息
结合卷积平滑耳蜗谱和深度网络的语音增强技术
Speech Enhancement Based on Convolution Smoothing Cochleagram and Deep Networks
文献类型:期刊文章
BAI Liangze;GAO Yong(College of Electronics and Information Engineering,Sichuan University,Chengdu 610065,China)
机构地区:[1]四川大学电子信息学院,四川成都610065 [2]四川大学电子信息学院通信教研室,四川成都610065
基 金:四川大学科研资助项目(0020505501744)。
年 份:2020
卷 号:50
期 号:12
起止页码:1055-1062
语 种:中文
收录情况:JST、普通刊
摘 要:为了进一步提高基于深度神经网络的语音增强方法的性能,针对语音声学特征和网络的设计两方面进行优化。引入了一种声学特征卷积平滑耳蜗谱,组合了3个不同平滑度的耳蜗谱,能够有效捕捉语音局部和整体信息。网络结构上,使用深度双向长短时记忆网络可以有效提高网络的学习能力。采用一种后处理差分平均滤波,提高了特征参数在语音增强中的效果。实验结果表明,相比于传统算法和深度学习的方法,增强后的语音不管是清晰度还是质量都有显著提升。
关 键 词:语音增强 卷积平滑耳蜗谱 深度双向长短时记忆网络 差分平均滤波
分 类 号:TN912.3]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...