期刊文章详细信息
基于动态贝叶斯网络的音视频双模态说话人识别 ( EI收录)
Audio-Visual Bimodal Speaker Identification Using Dynamic Bayesian Networks
文献类型:期刊文章
机构地区:[1]清华大学计算机科学与技术系普适计算教育部重点实验室,北京100084
基 金:国家自然科学基金项目(60275014;60418012)~~
年 份:2006
卷 号:43
期 号:3
起止页码:470-475
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:动态贝叶斯网络在描述具有多个通道的复杂随机过程方面具有优异的性能.基于动态贝叶斯网络进行音视频双模态说话人识别的工作.分析了音视频联合建模的层级结构,利用动态贝叶斯网络对不同层级的音视频关联关系建立模型,并基于该模型进行音视频说话人识别的实验.通过对不同层级的建模过程及说话人识别实验的结果进行分析,结果表明,动态贝叶斯网络为描述音视频间的时序相关性和特征相关性提供了有效的建模方法,在不同语音信噪比的情况下均能提高说话人识别的性能.
关 键 词:生物识别 说话人识别 音视频联合建模 融合 动态贝叶斯网络
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...