专利详细信息

一种语音识别系统解码方法、系统及存储介质

文献类型：专利

专利类型：发明专利

是否失效：否

是否授权：否

申请号：CN202211597437.9

申请日：20221212

发明人：邱自成黄高测熊茜韩琦周保平邬欢欢吐尔洪江·马木提王成敏王双明

申请人：重庆科技学院

申请人地址：401331 重庆市沙坪坝区大学城东路20号

公开日：20230627

公开号：CN116343794A

代理人：穆祥维

代理机构：重庆信航知识产权代理有限公司

语　　种：中文

摘　　要：本发明提供一种语音识别系统解码方法、系统及存储介质，方法包括将待识别的语音数据进行预处理操作，得到语音特征帧序列；将语音特征帧序列送入已训练好的深度神经网络中，使用Dropout策略将深度神经网络在除输出层外的每一层随机执行Dropout，重复该操作N次，得到N个不同的深度神经网络，实现对同一个深度神经网络的充分采样；基于Dropout策略N个不同的深度神经网络对输入的语音特征帧序列进行前向传播过程，得到N路不同的深度神经网络的前向计算结果；将前向计算结果送入解码器中，使用本发明提出的同步合并无偏解码算法进行合并，得到无偏解码词图。本申请能消除语音识别系统解码结果的有偏性，得到高质量的无偏解码结果，提升了语音识别系统的性能。

主权项：1.一种语音识别系统解码方法，其特征在于，包括以下步骤：S1、将待识别的语音数据进行预处理操作，得到语音特征帧序列；S2、将语音特征帧序列送入已训练好的深度神经网络中，使用基于Dropout策略的蒙特卡洛采样方法，将深度神经网络在除输出层外的每一层随机执行Dropout，重复该操作N次，得到N个不同的深度神经网络，实现对同一个深度神经网络的充分采样；S3、基于Dropout策略的蒙特卡洛采样方法，N个不同的深度神经网络对输入的语音特征帧序列进行前向传播过程，得到N路不同的深度神经网络的前向计算结果；S4、将得到的N路不同的深度神经网络的前向计算结果送入解码器中，使用基于多路Dropout前向计算的同步合并无偏解码算法将N路不同的深度神经网络的前向计算结果在现有解码的集束搜索步骤中进行合并，得到无偏解码词图，其中合并的基本思想是：分别利用N路前向计算结果按照现有解码算法执行N路解码过程，N路解码过程同步、独立执行，且根据N路解码过程按照合并规则创建第N+1路虚拟的解码过程，第N+1路解码过程是前N路解码过程融合、合并的结果，第N+1路解码过程输出最终的解码结果。

关键词：神经网络语音识别系统语音特征帧序列解码解码结果前向计算送入预处理操作解码器存储介质解码算法前向传播语音数据合并输出层采样重复申请

IPC专利分类号：G10L15/26;G10L15/02;G10L15/16;G10L15/28

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

专利详细信息

一种语音识别系统解码方法、系统及存储介质

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：