登录    注册    忘记密码

期刊文章详细信息

混合连接时间/注意力机制端到端语音识别    

End-to-end Speech Recognition of Hybrid Connection Time and Attention Mechanism

  

文献类型:期刊文章

作  者:陈聪[1] 贺杰[1] 陈佳[1]

CHEN Cong;HE Jie;CHEN Jia(School of Data Science and Sofware Engineering,Wuzhou University,Wuzhou 543002,China)

机构地区:[1]梧州学院大数据与软件工程学院,广西梧州543002

出  处:《控制工程》

基  金:国家自然科学基金项目(61562074,61961036);广西高校行业软件技术重点实验室资助项目。

年  份:2021

卷  号:28

期  号:3

起止页码:585-591

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD_E2021_2022、JST、ZGKJHX、核心刊

摘  要:为提高常规自动语音识别(ASR)系统的精度,提出基于隐式马尔可夫模型混合连接时间分类/注意力机制的端到端ASR系统设计方法。首先,针对可观测时变序列语音识别过程中存在的连续性强、词汇量大的语音识别难点,基于隐式马尔可夫模型对语音识别过程进行模拟,实现了语音识别模型参数化;其次,使用连接时间分类目标函数作为辅助任务,在多目标学习框架中训练语音识别过程的关注模型编码器,可降低序列级连接时间分类目标近似度,实现语音识别过程精度提升;最后,通过在自建语音识别库上的仿真实验,验证所提算法在识别效率和精度上的性能优势。

关 键 词:隐式马尔可夫  连接时间分类  注意力机制  端到端 语音识别

分 类 号:TP18]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心