登录    注册    忘记密码

期刊文章详细信息

汉语连续语音识别之音素声学模型的改进    

Improvement of Phoneme Acoustic Modeling in Large Vocabulary Continuous Mandarin Speech Recognition System

  

文献类型:期刊文章

作  者:吕丹桔[1] Mei-Yuh Huang[2] B Hoffmeister[3]

机构地区:[1]西南林学院计算机与信息科学系,云南昆明650224 [2]微软亚洲研究院,雷蒙得华盛顿美国98052 [3]亚琛工业大学计算机第六研究所,亚琛德国52056

出  处:《计算机仿真》

年  份:2010

卷  号:27

期  号:5

起止页码:355-358

语  种:中文

收录情况:BDHX、BDHX2008、CSCD、CSCD_E2011_2012、ZGKJHX、核心刊

摘  要:研究基于主元音音素基元的声学模型的改进。由于汉语语音特点,主元音模型得到了广泛的应用。通过分析主元音音素模型,发现该模型存在词组音节序列字界线有歧义,从而提出主元音的改进方法以明确音节序列中字的分界,减小基元规模,提高语音系统识别率。为了描述连续语意中的协同发音现象,还针对改进后的主元音基元,设计了相应的有调问题集,利用决策树的参数共享策略建立了上下文相关的音素模型。实验结果表明,改进后的有调音素集合在削减了原有基元个数的基础上,字误识率(CER)有0.4%-0.6%的明显改善。

关 键 词:大词汇量连续汉语语音识别  音素 主元音 决策树

分 类 号:TP912[自动化类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心