期刊文章详细信息
文献类型:期刊文章
机构地区:[1]中国科学技术大学信息科学技术学院语音及语言信息处理国家工程实验室
基 金:国家重点研发计划项目(2016YFB1001300)
年 份:2016
卷 号:56
期 号:11
起止页码:1190-1195
语 种:中文
收录情况:AMR、BDHX、BDHX2014、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2015_2016、EI(收录号:20164903092962)、IC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:该文提出一种适用于各种复杂噪声场景下的鲁棒性活动语音检测方法。采用能量、主频率分量和短时谱熵3种声学参数形成三维特征,这3种参数在各种各样的噪声中表现出很强的互补性;在活动语音脉冲检测中,采用K均值聚类算法自适应地选择特征并且计算语音检测过程中所用到的阈值。在美国国家标准与技术研究院说话人评测2008和2012年任务上进行实验,结果表明:所提出的方法在各种不同噪声环境下均具有较好的性能,相比传统的非监督和有监督活动语音检测算法更加鲁棒高效。
关 键 词:说话人识别 活动语音检测 谱熵 K均值聚类
分 类 号:TN912.34]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...