专利详细信息

一种将带有不同口音文本进行语音转换的方法及系统

文献类型：专利

专利类型：发明专利

是否失效：否

是否授权：否

申请号：CN202410462043.5

申请日：20240417

发明人：吴彩涵陈清亮黄永健胡国强洪育懋朱文彬

申请人：广东轩辕网络科技股份有限公司暨南大学

申请人地址：510000 广东省广州市天河区高普路1033号第8层

公开日：20240614

公开号：CN118197282A

代理人：赖鑫银

代理机构：广州凯东知识产权代理有限公司

语　　种：中文

摘　　要：本发明公开了一种将带有不同口音文本进行语音转换的方法及系统，通过获取带有口音的文本数据，对带有口音的文本数据进行标准化处理，得到标准化的文本数据，能够有效解决现有技术所存在的多种口音时效果可能不佳的缺陷，同时，通过将标准化的文本数据中的字母序列进行音素转换，得到对应的音素序列，将音素序列输入预设好的韵律模型中进行语音合成，得到相对应的音频，能够有效保证用户接收到的合成语音在音质、音调、强调和节奏上尽可能地自然和清晰，有效解决现有技术所存在的无法充分考虑不同口音之间的语音特征差异的缺陷。

主权项：1.一种将带有不同口音文本进行语音转换的方法，其特征在于，具体包括：获取带有口音的文本数据；对带有口音的文本数据进行标准化处理，得到标准化的文本数据；将标准化的文本数据中的字母序列进行音素转换，得到对应的音素序列；将音素序列输入预设好的韵律模型中进行语音合成，得到相对应的音频，从而实现将带有不同口音文本转换成语音。

关键词：文本数据音素序列有效解决标准化标准化处理音素转换用户接收语音合成语音特征语音转换韵律模型字母序列音质预设音调文本语音合成节奏清晰保证

IPC专利分类号：G10L13/08;G10L25/30

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

专利详细信息

一种将带有不同口音文本进行语音转换的方法及系统

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：