会议论文详细信息
文献类型:会议
作者单位:北京大学言语听觉研究中心视觉与听觉信息处理国家重点实验室 北京大学言语听觉研究中心视觉与听觉信息处理国家重点实验室 北京大学言语听觉研究中心视觉与听觉信息处理国家重点实验室 北京大学言语听觉研究中心视觉与听觉信息处理国家重点实验室 北京大学言语听觉研究中心视觉与听觉信息处理国家重点实验室
会议文献:第八届全国人机语音通讯学术会议论文集
会议名称:第八届全国人机语音通讯学术会议
会议日期:20051000
会议地点:中国北京
主办单位:中国电子学会信号处理学会语音图象通讯专业委员会;中国计算机学会人工智能与模式识别专业委员会;中国声学学会语音听觉和音乐声学专业委员会;中国通信学会通信理论专业委员会;中国语言学会语音学专业委员会;中国中文信息学会语音信息专业委员会;中国自动化学会模式识别与机器智能专业委员会;国家863计划计算机软硬件技术主题专家组
出版单位:《声学技术》编辑部
出版日期:20051000
学会名称:中国中文信息学会
语 种:中文
摘 要:本文针对大词汇量连续语音识别系统实时性能优化问题开展研究。在声学模型得分计算阶段,实现了帧级降采样, 上下文无关音子模型选择加速算法,在搜索阶段,实现了音子Lookahead加速算法。同时,针对Intel 32位CPU实现了数据存储方式优化和单指令多数据(SIMD)指令集优化。综合应用上述优化方法,使系统在识别率降低小于5%的前提下,解码速度由3.1倍实时提高到了1.2倍实时。
关 键 词:大词汇量语音识别 帧级降采样 音子Lookahead
分 类 号:TN912.34]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...