登录    注册    忘记密码

期刊文章详细信息

基于强化学习的飞行自动驾驶仪设计    

Design of autopilot for aircraft based on reinforcement learning

  

文献类型:期刊文章

作  者:南杨[1] 李中健[1] 叶文伟[2]

机构地区:[1]西北工业大学自动化学院 [2]中国人民解放军92261部队

出  处:《电子设计工程》

年  份:2013

卷  号:21

期  号:10

起止页码:45-47

语  种:中文

收录情况:RCCSE、ZGKJHX、普通刊

摘  要:针对强化学习在连续状态连续动作空间中的维度灾难问题,利用BP神经网络算法作为值函数逼近策略,设计了自动驾驶仪。并引入动作池机制,有效避免飞行仿真中危险动作的发生。首先,建立了TD强化学习算法框架;然后根据经验将舵机动作合理分割为若干组,在不同的飞行状态时,调取不同组中的动作;其次,构建了BP神经网络,通过飞行过程中的立即奖赏,更新网络的值函数映射;最后,通过数字仿真验证了强化学习自动驾驶仪的性能,仿真结果表明,该算法具有良好的动态和稳态性能。

关 键 词:强化学习  BP神经网络 动作池  飞行控制器 值函数逼近  

分 类 号:V249.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心