专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN202211597437.9
申 请 日:20221212
申 请 人:重庆科技学院
申请人地址:401331 重庆市沙坪坝区大学城东路20号
公 开 日:20230627
公 开 号:CN116343794A
代 理 人:穆祥维
代理机构:重庆信航知识产权代理有限公司
语 种:中文
摘 要:本发明提供一种语音识别系统解码方法、系统及存储介质,方法包括将待识别的语音数据进行预处理操作,得到语音特征帧序列;将语音特征帧序列送入已训练好的深度神经网络中,使用Dropout策略将深度神经网络在除输出层外的每一层随机执行Dropout,重复该操作N次,得到N个不同的深度神经网络,实现对同一个深度神经网络的充分采样;基于Dropout策略N个不同的深度神经网络对输入的语音特征帧序列进行前向传播过程,得到N路不同的深度神经网络的前向计算结果;将前向计算结果送入解码器中,使用本发明提出的同步合并无偏解码算法进行合并,得到无偏解码词图。本申请能消除语音识别系统解码结果的有偏性,得到高质量的无偏解码结果,提升了语音识别系统的性能。
主 权 项:1.一种语音识别系统解码方法,其特征在于,包括以下步骤:S1、将待识别的语音数据进行预处理操作,得到语音特征帧序列;S2、将语音特征帧序列送入已训练好的深度神经网络中,使用基于Dropout策略的蒙特卡洛采样方法,将深度神经网络在除输出层外的每一层随机执行Dropout,重复该操作N次,得到N个不同的深度神经网络,实现对同一个深度神经网络的充分采样;S3、基于Dropout策略的蒙特卡洛采样方法,N个不同的深度神经网络对输入的语音特征帧序列进行前向传播过程,得到N路不同的深度神经网络的前向计算结果;S4、将得到的N路不同的深度神经网络的前向计算结果送入解码器中,使用基于多路Dropout前向计算的同步合并无偏解码算法将N路不同的深度神经网络的前向计算结果在现有解码的集束搜索步骤中进行合并,得到无偏解码词图,其中合并的基本思想是:分别利用N路前向计算结果按照现有解码算法执行N路解码过程,N路解码过程同步、独立执行,且根据N路解码过程按照合并规则创建第N+1路虚拟的解码过程,第N+1路解码过程是前N路解码过程融合、合并的结果,第N+1路解码过程输出最终的解码结果。
关 键 词:神经网络 语音识别系统 语音特征 帧序列 解码 解码结果 前向计算 送入 预处理操作 解码器 存储介质 解码算法 前向传播 语音数据 合并 输出层 采样 重复 申请
IPC专利分类号:G10L15/26;G10L15/02;G10L15/16;G10L15/28
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...