登录    注册    忘记密码

专利详细信息

一种基于联合因子分析模型的移动设备声纹识别方法       

文献类型:专利

专利类型:发明专利

是否失效:

是否授权:

申 请 号:CN201310751242.X

申 请 日:20131231

发 明 人:李为 朱杰 姚国勤 钱传根 杭乐

申 请 人:上海交通大学无锡研究院

申请人地址:214135 江苏省无锡市新区大学科技园清源路立业楼C区

公 开 日:20140416

公 开 号:CN103730114A

代 理 人:许方

代理机构:32200 南京经纬专利商标代理有限公司

语  种:中文

摘  要:本发明公开了一种基于联合因子分析模型的移动设备声纹识别方法,包括背景模型库训练、用户声纹模型训练(说话人训练)和声纹确认(说话人确认)三大部分,并采用联合因子分析模型构建说话人空间、信道空间和残差空间三个子空间,利用联合因子分析模型技术,将声纹识别系统移植到移动设备端,使其成为一款可代替密码的身份确认应用产品。本发明对声纹识别在移动端应用的短板不足进行补充和改进,对说话人识别中的易变性干扰,包括信道易变性和会话易变性进行估计和补偿,使用户可以通过较短的语音进行训练和识别,并在不同背景环境下也能取得良好的识别效果。

主 权 项:1.一种基于联合因子分析模型的移动设备声纹识别方法,其特征在于:包括背景模型库训练、用户声纹模型训练和声纹确认三部分,并采用联合因子分析模型构建说话人空间、信道空间和残差空间三个子空间;所述联合因子分析模型的高斯均值向量表征为:Mki=mk+Ukxi+Vkys(i)+Dkzks(i)其中,k代表第k个高斯模型,i代表某一个语音段,s(i)表示说话人s的某一语音段,mk表示独立于说话人和会话内容的均值向量,Uk特征信道矩阵,Vk表示特征说话人矩阵,Dk表示残差空间矩阵;xi表示信道因子向量,ys(i)表示依赖于说话人的声纹因子向量,zks(i)表示依赖于说话人和单个高斯模型的残差因子向量;所述背景模型库训练、用户声纹模型训练和声纹确认,具体如下:一、背景模型库训练包括以下步骤:(1)采集移动设备端的语料作为训练数据;(2)对采集的语料进行平衡性分析,保持语音的长度相似,保证信道易变性和会话易变性的平衡;(3)对步骤(2)处理后的语料进行前端预处理,包括:(301)将语音信号分段加窗后经过计算得出梅尔幅倒谱系数的特征参数流;(302)以特征参数流数据训练通用背景模型(UBM);(303)将每一个语料利用最大后验准则将其自适应到说话人模型上,再用构建特征音空间的方法对表征特定说话人模型的参数进行降维处理;(304)通过稀疏数据的EM算法最大化所有训练数据中的整体似然度,针对所有说话人的语音段求统计量,构建特征说话人矩阵Vk;(4)构建特征信道矩阵Uk,针对语料中某个固定说话人的语音段求统计量,特征信道矩阵的维度固定为移动设备端型�

关 键 词:声纹 分析模型 联合因子  变性  移动设备  训练  背景环境  背景模型  模型训练  身份确认 系统移植  信道空间  应用产品  移动端  会话 和声 信道  语音  补偿  干扰  

IPC专利分类号:G10L15/06(20130101);G10L15/30(20130101)

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心