期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京大学言语听觉研究中心,机器感知与智能教育部重点实验室,北京100871
基 金:国家自然科学基金(91120001;61121002);国家社会科学基金重大项目(12&ZD119);国家重点基础研究发展计划(2013CB329304)资助
年 份:2014
卷 号:50
期 号:5
起止页码:791-796
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CAS、CSCD、CSCD2013_2014、EI、IC、INSPEC、JST、MR、PROQUEST、RCCSE、RSC、SCOPUS、WOS、ZGKJHX、ZMATH、ZR、核心刊
摘 要:针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法。首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题,优化了传统的训练流程,在不损失声学模型准确性的前提下,显著提高了模型的训练速度。主观实验表明,与具有精标注的小语料库相比,引入粗标注的大语料库可以带来0.5分左右的MOS提升。
关 键 词:语音数据筛选 声学模型训练 基于HMM的单元挑选与波形拼接
分 类 号:TN912.3]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...