专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN202410462043.5
申 请 日:20240417
申 请 人:广东轩辕网络科技股份有限公司 暨南大学
申请人地址:510000 广东省广州市天河区高普路1033号第8层
公 开 日:20240614
公 开 号:CN118197282A
代 理 人:赖鑫银
代理机构:广州凯东知识产权代理有限公司
语 种:中文
摘 要:本发明公开了一种将带有不同口音文本进行语音转换的方法及系统,通过获取带有口音的文本数据,对带有口音的文本数据进行标准化处理,得到标准化的文本数据,能够有效解决现有技术所存在的多种口音时效果可能不佳的缺陷,同时,通过将标准化的文本数据中的字母序列进行音素转换,得到对应的音素序列,将音素序列输入预设好的韵律模型中进行语音合成,得到相对应的音频,能够有效保证用户接收到的合成语音在音质、音调、强调和节奏上尽可能地自然和清晰,有效解决现有技术所存在的无法充分考虑不同口音之间的语音特征差异的缺陷。
主 权 项:1.一种将带有不同口音文本进行语音转换的方法,其特征在于,具体包括:获取带有口音的文本数据;对带有口音的文本数据进行标准化处理,得到标准化的文本数据;将标准化的文本数据中的字母序列进行音素转换,得到对应的音素序列;将音素序列输入预设好的韵律模型中进行语音合成,得到相对应的音频,从而实现将带有不同口音文本转换成语音。
关 键 词:文本数据 音素序列 有效解决 标准化 标准化处理 音素转换 用户接收 语音合成 语音特征 语音转换 韵律模型 字母序列 音质 预设 音调 文本 语音 合成 节奏 清晰 保证
IPC专利分类号:G10L13/08;G10L25/30
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...