期刊文章详细信息
基于卷积神经网络的多模态视频场景分割优化算法
Multi-modal video scene segmentation optimization algorithm based on convolutional neural network
文献类型:期刊文章
Huang Qing;Feng Hongcai;Liu Li(School of Mathematics&Computer Sciences,Wuhan Polytechnic University,Wuhan 430023,China;Network&Information Center,Wuhan Polytechnic University,Wuhan 430023,China)
机构地区:[1]武汉轻工大学数学与计算机学院,武汉430023 [2]武汉轻工大学网络与信息中心,武汉430023
基 金:湖北省教育厅重点科研计划资助项目(D20101703)。
年 份:2022
卷 号:39
期 号:5
起止页码:1595-1600
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:针对基于内容的视频检索中场景分割效率有待提高的问题,提出了一种基于卷积神经网络提取特征的多模态视频场景分割优化算法。首先利用改进的VGG19网络从视频镜头中提取多种模态的底层特征和语义特征,再将这些特征组成向量,然后通过三重损失学习与镜头相似度计算等方法,使场景分割问题转换为对镜头边界的二分类问题,最后建立评分机制优化所得结果,获取分割好的视频场景及对应的场景边界,完成场景分割任务。实验结果表明,该算法能对视频场景进行有效分割,整体查全率与查准率分别能达到85.77%、87.01%。
关 键 词:场景分割 多模态 卷积神经网络 相似度度量 VGG19
分 类 号:TP37]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...