登录    注册    忘记密码

期刊文章详细信息

结合滑动窗口动态时间规整和CNN的视频人脸表情识别    

Video facial expression recognition combined with sliding window dynamic time warping and CNN

  

文献类型:期刊文章

作  者:胡敏[1] 张柯柯[1] 王晓华[1] 任福继[1,2]

Hu Min;Zhang Keke;Wang Xiaohua;Ren Fuji(Anhui Province Key Laboratory of Affective Computing and Advanced Intelligent Machine,School of Computer and Information Hefei University of Technology,Hefei 230009,China;Graduate School of Advanced Technology & Science,University of Tokushima,Tokushima 7708502,Japan)

机构地区:[1]合肥工业大学计算机与信息学院情感计算与先进智能机器安徽省重点实验室,合肥230009 [2]德岛大学先端技术科学教育部

出  处:《中国图象图形学报》

基  金:国家自然科学基金项目(61672202;61432004;61502141);国家自然科学基金-深圳联合基金重点项目(U1613217);安徽高校省级自然科学研究重点项目(KJ2017A368)~~

年  份:2018

卷  号:23

期  号:8

起止页码:1144-1153

语  种:中文

收录情况:BDHX、BDHX2017、CSCD、CSCD2017_2018、IC、JST、RCCSE、ZGKJHX、核心刊

摘  要:目的相比静态表情图片,视频序列中蕴含更多的情感信息,视频序列中的具有明显表情的序列在特征提取与识别中具有关键作用,但是视频中同时存在的中性表情也可能会对模型参数的训练造成干扰,影响最终的判别。为了减少这种干扰带来的误差,本文对动态时间规整算法进行改进,提出一种滑动窗口动态时间规整算法(SWDTW)来自动选取视频中表情表现明显的图片序列;同时,为了解决人脸图像受环境光照因素影响较大和传统特征提取过程中存在过多人为干预的问题,构建一种基于深度卷积神经网络的人脸视频序列处理方法。方法首先截取表情视频中人脸正面帧,用梯度方向直方图特征计算代价矩阵,并在代价矩阵上增加滑动窗口机制,计算所有滑动窗口的平均距离;然后通过平均距离最小值选取全局最优表情序列;最后采用深度卷积神经网络对规整后的人脸表情图像序列进行无监督学习和面部表情分类,统计视频序列图像分类概率和,进而得出视频序列的表情类别。结果在CK+与MMI数据库上进行5次交叉实验,分别取得了92.54%和74.67%的平均识别率,与随机选取视频序列相比,分别提高了19.86%和22.24%;此外,与目前一些优秀的视频表情识别方法相比,也表现出了优越性。结论本文提出的SWDTW不仅有效地实现了表情序列的选取,而且增强了卷积神经网络在视频面部表情分类中的鲁棒性,提高了视频人脸表情分析的自适应性度和识别率。

关 键 词:人脸表情识别 视频序列选取  滑动窗口动态时间规整  特征提取  卷积神经网络  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心