期刊文章详细信息
文献类型:期刊文章
HUANG Qing;FANG Mu-yun(School of Computer Science and Technology,Anhui University of Technology,Anhui Maanshan 243000,China)
机构地区:[1]安徽工业大学计算机科学与技术学院,安徽马鞍山243000
基 金:国家自然科学基金项目资助(61971004).
年 份:2022
卷 号:39
期 号:5
起止页码:56-61
语 种:中文
收录情况:JST、普通刊
摘 要:针对传统的HMM模型中状态持续时间不长的不足,且在计算量大的情况下,语音识别精度不高,训练时间长,训练误差较高,提出了一种基于语音状态持续时间长的HMM模型。首先,令状态转移矩阵的对角线元素全为0,去掉自转移弧,再增添以参数化的函数描述持续时间的高斯分布,再通过帧与帧相互之间的关联程度,将每帧都计算进去;其次,通过重估公式反复计算每条弧被指定的转变概率和可见符号序列输出最原始的数值概率,直至收敛,停止运算。最后,在HMM模型改进前后实验中得到更小的训练误差,下降速度更快,计算量较之前减少多,更容易达到收敛,其概率输出与它前面一个概率输出的差值与该概率输出值的比值大于HMM模型设定的初始值。与传统HMM模型实验比较,基于持续时间状态的HMM模型可以在一定程度上降低训练次数和训练时间,提高识别语音的精确度,基本完成了语音识别系统的功能。
关 键 词:语音识别 传统HMM模型 状态持续时间的HMM
分 类 号:TP183]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...