期刊文章详细信息

P3C-MADDPG算法的多无人机协同追捕对抗策略研究
Research on multi-UAV cooperative pursuit and confrontation strategy based on P3C-MADDPG algorithm

文献类型：期刊文章

作　　者：高甲博[1,2] 肖玮[1] 何智杰[1,3]

GAO Jiabo;XIAO Wei;HE Zhijie(Army Logistics Academy,Military Logistics Department,Chongqing 400000,China;Unit 95019 of the People s Liberation Army,Xiangyang 441100,China;Unit 31680 of the People s Liberation Army,Chongzhou 611230,China)

机构地区：[1]中国人民解放军陆军勤务学院军事物流系,重庆400000 [2]中国人民解放军95019部队,湖北襄阳441100 [3]中国人民解放军31680部队,四川崇州611230

出　　处：《指挥控制与仿真》

基　　金：重庆市教委科学技术研究项目基金(KJZD-K202312903);陆军勤务学院研究生科研创新项目基金(LQ-ZD-202209);陆军勤务学院科研项目(LQ-ZD-202316);重庆市研究生科研创新项目(CYS23778)。

年　　份：2023

卷　　号：45

期　　号：6

起止页码：7-18

语　　种：中文

收录情况：DOAJ、IC、ZGKJHX、普通刊

摘　　要：针对策略未知逃逸无人机环境中多无人机协同追捕对抗任务,提出P3C-MADDPG算法的多无人机协同追捕对抗策略。首先,为解决多智能体深度确定性策略梯度(Multi-Agent Deep Deterministic Policy Gradient,MADDPG)算法训练速度慢和Q值高估问题,在MADDPG算法中分别采用基于树形结构储存的优先经验回放机制(Prioritized Experience Replay,PER)和设计的3线程并行Critic网络模型,提出P3C-MADDPG算法。然后基于构建的无人机运动学模型,设计追逃无人机的状态空间、稀疏奖励与引导式奖励相结合的奖励函数、加速度不同的追逃动作空间等训练要素。最后基于上述训练要素,通过P3C-MADDPG算法生成策略未知逃逸无人机环境中多无人机协同追捕对抗策略。仿真实验表明,P3C-MADDPG算法在训练速度上平均提升了11.7%,Q值平均降低6.06%,生成的多无人机协同追捕对抗策略能有效避开障碍物,能实现对策略未知逃逸无人机的智能追捕。

关键词：P3C-MADDPG 协同追捕对抗策略优先经验回放 Q值多无人机

分类号：E911]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

P3C-MADDPG算法的多无人机协同追捕对抗策略研究
Research on multi-UAV cooperative pursuit and confrontation strategy based on P3C-MADDPG algorithm

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

P3C-MADDPG算法的多无人机协同追捕对抗策略研究 Research on multi-UAV cooperative pursuit and confrontation strategy based on P3C-MADDPG algorithm

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

P3C-MADDPG算法的多无人机协同追捕对抗策略研究
Research on multi-UAV cooperative pursuit and confrontation strategy based on P3C-MADDPG algorithm