期刊文章详细信息
文献类型:期刊文章
ZHANG Yaozhong;Xu Jialin;YAO Kangjia;LIU Jieling(School of Electronics and Information,Northwestern Polytechnical Lniversity,Xi'an 710072,China;Xi'an North Electro-optic Science&Technology Co.Ltd.Xi'an 710043,China)
机构地区:[1]西北工业大学电子信息学院,西安710072 [2]西安北方光电科技防务有限公司,西安710043
基 金:航空科学基金(2017ZC53033)。
年 份:2020
卷 号:41
期 号:10
起止页码:309-321
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CAS、CSCD、CSCD2019_2020、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:无人机的集群化应用技术是近年来的研究热点,随着无人机自主智能的不断提高,无人机集群技术必将成为未来无人机发展的主要趋势之一。针对无人机集群协同执行对敌方来袭目标的追击任务,构建了典型的任务场景,基于深度确定性策略梯度网络(DDPG)算法,设计了一种引导型回报函数有效解决了深度强化学习在长周期任务下的稀疏回报问题,通过引入基于滑动平均值的软更新策略减少了DDPG算法中Eval网络和Target网络在训练过程中的参数震荡,提高了算法的训练效率。仿真结果表明,训练完成后的无人机集群能够较好地执行对敌方来袭目标的追击任务,任务成功率达到95%。可以说无人机集群技术作为一种全新概念的作战模式在军事领域具有潜在的应用价值,人工智能算法在无人机集群的自主决策智能化发展方向上具有一定的应用前景。
关 键 词:DDPG算法 无人机集群 任务决策 深度强化学习 稀疏回报
分 类 号:V279]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...