期刊文章详细信息

基于声音与视觉特征多级融合的鱼类行为识别模型U-FusionNet-ResNet50+SENet
A fish behavior recognition model based on multi-level fusion of sound and vision U-fusionNet-ResNet50+SENet

文献类型：期刊文章

作　　者：胥婧雯[1,2] 于红[1,2] 张鹏[1,2] 谷立帅[1,2] 李海清[1,2] 郑国伟[1,2] 程思奇[1,2] 殷雷明[3]

XU Jingwen;YU Hong;ZHANG Peng;GU Lishuai;LI Haiqing;ZHENG Guowei;CHENG Siqi;YIN Leiming(Key Laboratory of Marine Information Technology of Liaoning Province,College of Information Engineering,Dalian Ocean University,Dalian 116023,China;Key Laboratory of Environment Controlled Aquaculture(Dalian Ocean University),Ministry of Education,Dalian 116023,China;College of Fisheries and Life Science,Dalian Ocean University,Dalian 116023,China)

机构地区：[1]大连海洋大学信息工程学院,辽宁省海洋信息技术重点实验室,辽宁大连116023 [2]设施渔业教育部重点实验室(大连海洋大学),辽宁大连116023 [3]大连海洋大学水产与生命学院,辽宁大连116023

出　　处：《大连海洋大学学报》

基　　金：辽宁省教育厅重点科研项目(LJKZ0729);国家自然科学基金(31972846)。

年　　份：2023

卷　　号：38

期　　号：2

起止页码：348-356

语　　种：中文

收录情况：AJ、BDHX、BDHX2020、CAB、CAS、CSCD、CSCD2023_2024、JST、RCCSE、WOS、ZGKJHX、核心刊

摘　　要：为解决在光线昏暗、声音与视觉噪声干扰等复杂条件下,单模态鱼类行为识别准确率和召回率低的问题,提出了基于声音和视觉特征多级融合的鱼类行为识别模型U-FusionNet-ResNet50+SENet,该方法采用ResNet50模型提取视觉模态特征,通过MFCC+RestNet50模型提取声音模态特征,并在此基础上设计一种U型融合架构,使不同维度的鱼类视觉和声音特征充分交互,在特征提取的各阶段实现特征融合,最后引入SENet构成关注通道信息特征融合网络,并通过对比试验,采用多模态鱼类行为的合成加噪试验数据验证算法的有效性。结果表明:U-FusionNet-ResNet50+SENet对鱼类行为识别准确率达到93.71%,F1值达到93.43%,召回率达到92.56%,与效果较好的已有模型Intermediate-feature-level deep model相比,召回率、F1值和准确率分别提升了2.35%、3.45%和3.48%。研究表明,所提出的U-FusionNet-ResNet50+SENet识别方法,可有效解决单模态鱼类行为识别准确率低的问题,提升了鱼类行为识别的整体效果,可以有效识别复杂条件下鱼类的游泳、摄食等行为,为真实生产条件下的鱼类行为识别研究提供了新思路和新方法。

关键词：行为识别深度学习多模态融合 U-FusionNet ResNet50 SENet

分类号：S932.2] TP391[水产类]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

基于声音与视觉特征多级融合的鱼类行为识别模型U-FusionNet-ResNet50+SENet
A fish behavior recognition model based on multi-level fusion of sound and vision U-fusionNet-ResNet50+SENet

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

基于声音与视觉特征多级融合的鱼类行为识别模型U-FusionNet-ResNet50+SENet A fish behavior recognition model based on multi-level fusion of sound and vision U-fusionNet-ResNet50+SENet

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

基于声音与视觉特征多级融合的鱼类行为识别模型U-FusionNet-ResNet50+SENet
A fish behavior recognition model based on multi-level fusion of sound and vision U-fusionNet-ResNet50+SENet