期刊文章详细信息
文献类型:期刊文章
机构地区:[1]重庆大学自动化学院,重庆400044 [2]重庆市公安局,重庆400010
基 金:重庆市自然科学基金计划(cstc2012jj A40046)项目资助
年 份:2016
卷 号:37
期 号:2
起止页码:256-262
语 种:中文
收录情况:BDHX、BDHX2014、CAS、CSCD、CSCD2015_2016、EI(收录号:20161502242440)、IC、JST、RCCSE、RSC、SCOPUS、ZGKJHX、核心刊
摘 要:基于总体空间差异模型的身份认证矢量(即i-vector)已经在说话人识别任务中得到了广泛应用。本文提出了一种基于受限玻尔兹曼机(RBM)的说话人特征向量提取方法来替代总体差异建模的特征提取方法。该方法通过训练得到RBM的模型参数,之后利用隐层输出来表征输入语音超向量的说话人信息。文中比较了不同结构和模块(包括构建RBM的2种单元分布、线性判别分析等)对说话人确认性能的影响。所提方法作为一种新的i-vector特征表示方法,在NIST SRE 2008上取得了和ivector说话人基线系统相当的性能。通过与i-vector基线系统进行融合,系统性能进一步提升。在NIST SRE 2008女性电话语音测试集和男性电话语音测试集上的等错误率分别降至6.83%和4.73%。
关 键 词:说话人确认 身份认证矢量 深度学习 受限玻尔兹曼机 线性判别分析
分 类 号:TP391.42] TP701[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...