期刊文章详细信息
文献类型:期刊文章
CHEN Cong;HE Jie;CHEN Jia(School of Data Science and Sofware Engineering,Wuzhou University,Wuzhou 543002,China)
机构地区:[1]梧州学院大数据与软件工程学院,广西梧州543002
基 金:国家自然科学基金项目(61562074,61961036);广西高校行业软件技术重点实验室资助项目。
年 份:2021
卷 号:28
期 号:3
起止页码:585-591
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD_E2021_2022、JST、ZGKJHX、核心刊
摘 要:为提高常规自动语音识别(ASR)系统的精度,提出基于隐式马尔可夫模型混合连接时间分类/注意力机制的端到端ASR系统设计方法。首先,针对可观测时变序列语音识别过程中存在的连续性强、词汇量大的语音识别难点,基于隐式马尔可夫模型对语音识别过程进行模拟,实现了语音识别模型参数化;其次,使用连接时间分类目标函数作为辅助任务,在多目标学习框架中训练语音识别过程的关注模型编码器,可降低序列级连接时间分类目标近似度,实现语音识别过程精度提升;最后,通过在自建语音识别库上的仿真实验,验证所提算法在识别效率和精度上的性能优势。
关 键 词:隐式马尔可夫 连接时间分类 注意力机制 端到端 语音识别
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...