登录    注册    忘记密码

期刊文章详细信息

基于多尺度线性全局注意力的运动员检测算法    

Athlete Detection Algorithm Based on Multi-scale Linear Global Attention

  

文献类型:期刊文章

作  者:林芷薇[1] 杨祖元[1] 王斯秋[1] 杨超[1]

LIN Zhiwei;YANG Zuyuan;WANG Siqiu;YANG Chao(Guangdong Key Laboratory of IoT Information Technology,School of Automation,Guangdong University and Technology,Guangzhou 510006,Guangdong,China)

机构地区:[1]广东工业大学自动化学院广东省物联网信息技术重点实验室,广东广州510006

出  处:《计算机工程》

基  金:国家自然科学基金(U1911401);广东省基础与应用基础研究基金联合基金-面上基金项目(2022A1515010688)。

年  份:2024

卷  号:50

期  号:7

起止页码:352-359

语  种:中文

收录情况:AJ、BDHX、BDHX2023、CAS、CSCD、CSCD_E2023_2024、INSPEC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊

摘  要:运动员在比赛过程中的快速移动且频繁遮挡,使得对视频中运动员检测容易出现漏检、多检、检测精度下降等问题。现有的主流方法对于移动和遮挡情况下的运动员检测表现不佳。当运动员受到遮挡后,检测目标框的尺度变化增大。引入cutout作为数据增强的方法来模拟遮挡情况,提出基于多尺度线性全局注意力Efficient ViT模块的运动员检测算法。使用线性全局注意力模块减少计算量,并辅以卷积模块来增强其局部的特征提取能力,通过轻量级小卷积聚合不同注意力头部的token获得多尺度信息,增强其全局特征提取能力。针对损失函数部分,选择EIo U作为边界框损失,加入检测框与目标框的宽高距离,使得检测框和真实目标框在尺度上更为贴近。在Sports MOT数据集中4个公开的篮球比赛视频数据集上的实验结果表明,该算法取得了98.0%准确率和98.2%的平均精度均值,相较于YOLOv5算法,其精度提升了4%,高置信度的平均精度均值提升了8.7%。

关 键 词:YOLOv5算法  运动员检测  多尺度线性全局注意力  数据增强  边界框损失  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心