专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN201911171941.0
申 请 日:20191126
申 请 人:新东方教育科技集团有限公司
申请人地址:100080 北京市海淀区海淀中街6号9层
公 开 日:20210611
公 开 号:CN112951277A
代 理 人:孙涛;毛威
代理机构:11329 北京龙双利达知识产权代理有限公司
语 种:中文
摘 要:本申请提供了一种评测语音的方法,包括:获取待测语音对应的第二音频特征数据和第二音素数据,所述待测语音与第二字符存在对应关系;通过神经网络处理所述第二音频特征数据和所述第二音素数据,生成第一特征向量,所述第一特征向量用于指示所述待测语音的音频特征,所述神经网络为使用训练语音对应的第一音素数据和第一音频特征数据训练得到的;根据所述第一特征向量评测所述待测语音。绝大部分字符的发音都可以归纳为音素集合中全部或部分音素的组合,因此,相比于单纯依靠一种数据训练神经网络,通过音素和音频特征联合训练神经网络能够提高神经网络的预测准确率,使用该神经网络进行语音评测能够提高语音评测的准确度。
主 权 项:1.一种评测语音的方法,其特征在于,包括:获取待测语音对应的第二音频特征数据和第二音素数据,所述待测语音与第二字符存在对应关系;通过神经网络处理所述第二音频特征数据和所述第二音素数据,生成第一特征向量,所述第一特征向量用于指示所述待测语音的音频特征,所述神经网络为使用第一音素数据和第一音频特征数据训练得到的,所述第一音素数据和第一音频特征数据为训练语音对应的数据,并且,所述训练语音与第一字符存在对应关系;根据所述第一特征向量评测所述待测语音。
关 键 词:音频特征 神经网络 语音 特征向量 音素数据 音素 评测 数据训练 语音评测 神经网络处理 训练神经网络 准确度 训练语音 准确率 发音 集合 归纳 预测 申请 联合
IPC专利分类号:G10L25/60(20130101);G10L25/78(20130101);G10L25/30(20130101)
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...