登录    注册    忘记密码

期刊文章详细信息

基于深度强化学习的导弹规避决策训练研究    

Missile Evasion Decision Training Based on Deep Reinforcement Learning

  

文献类型:期刊文章

作  者:范鑫磊[1,2] 李栋[3] 张尉[3] 王景志[4] 郭金文[5]

FAN Xinlei;LI Dong;ZHANG Wei;WANG Jingzhi;GUO Jinwen(Science and Technology on Electro-Optic Control Laboratory,Luoyang 471023,China;Luoyang Institute of Electro-Optical Equipment,AVIC,Luoyang 471000,China;Aviation and Military Representative Office of Luoyang District, Aviation and Military Representative Bureau,Army Equipment Department,Luoyang 471000,China;Shenyang AircraftDesign & Research Institute,AVIC,Shenyang 110035,China;No.94795 Unit of PLA,Nantong 226000,China)

机构地区:[1]光电控制技术重点实验室,河南洛阳471023 [2]中国航空工业集团公司洛阳电光设备研究所,河南洛阳471000 [3]陆军装备部航空军事代表局驻洛阳地区航空军事代表室,河南洛阳471000 [4]中航工业沈阳飞机设计研究所,沈阳110035 [5]中国人民解放军94795部队,江苏南通226000

出  处:《电光与控制》

基  金:航空科学基金(2019ZC013004)。

年  份:2021

卷  号:28

期  号:1

起止页码:81-85

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD_E2021_2022、RCCSE、UPD、ZGKJHX、核心刊

摘  要:针对载机面对敌方来袭导弹自主规避问题,采取一种基于改进的DDPG算法的深度强化学习方法进行训练学习,在奖励函数中,除考虑规避性能外,还分别针对本机的高度保持、速度保持,以及来袭导弹的相对高度变化、接近速度变化建立奖励模型。最后,基于飞机模型进行了训练仿真测试分析,通过仿真可以看出,训练所得结果可以有效实现针对来袭导弹的规避决策,所设计的奖励函数和输入参数也可以起到相应正确的作用,并且结果具备一定的泛化能力。

关 键 词:导弹 自主规避决策  改进的DDPG算法  训练仿真测试  

分 类 号:V37]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心