期刊文章详细信息

基于强化学习的飞行自动驾驶仪设计
Design of autopilot for aircraft based on reinforcement learning

文献类型：期刊文章

作　　者：南杨[1] 李中健[1] 叶文伟[2]

机构地区：[1]西北工业大学自动化学院 [2]中国人民解放军92261部队

出　　处：《电子设计工程》

年　　份：2013

卷　　号：21

期　　号：10

起止页码：45-47

语　　种：中文

收录情况：RCCSE、ZGKJHX、普通刊

摘　　要：针对强化学习在连续状态连续动作空间中的维度灾难问题,利用BP神经网络算法作为值函数逼近策略,设计了自动驾驶仪。并引入动作池机制,有效避免飞行仿真中危险动作的发生。首先,建立了TD强化学习算法框架;然后根据经验将舵机动作合理分割为若干组,在不同的飞行状态时,调取不同组中的动作;其次,构建了BP神经网络,通过飞行过程中的立即奖赏,更新网络的值函数映射;最后,通过数字仿真验证了强化学习自动驾驶仪的性能,仿真结果表明,该算法具有良好的动态和稳态性能。

关键词：强化学习 BP神经网络动作池飞行控制器值函数逼近

分类号：V249.1]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

基于强化学习的飞行自动驾驶仪设计
Design of autopilot for aircraft based on reinforcement learning

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

基于强化学习的飞行自动驾驶仪设计 Design of autopilot for aircraft based on reinforcement learning

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

基于强化学习的飞行自动驾驶仪设计
Design of autopilot for aircraft based on reinforcement learning