期刊文章详细信息
基于深度强化学习的自动驾驶策略学习方法
Training Method of Automatic Driving Strategy Based on Deep Reinforcement Learning
文献类型:期刊文章
XIA Wei LI Huiyun(Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, Shenzhen 518055, China Shenzhen College of Advanced Technology, University of Chinese Academy of Sciences, Shenzhen 518055, China)
机构地区:[1]中国科学院深圳先进技术研究院,深圳518055 [2]中国科学院大学深圳先进技术学院,深圳518055
年 份:2017
卷 号:6
期 号:3
起止页码:29-40
语 种:中文
收录情况:JST、RCCSE、普通刊
摘 要:自动驾驶是人工智能研究的重要应用领域,文章提出了一种基于深度强化学习的自动驾驶策略模型学习方法。首先采用在线交互式学习方法对深度网络模型进行训练,并基于专业司机的经验数据对模型进行预训练,进而结合经验池回放技术提高模型训练收敛速度,通过对状态空间进行聚类再采样,提高其独立同分布特性以及策略模型的泛化能力。通过与神经网络拟和Q-迭代算法的比较,所提方法的训练时间可缩短90%以上,稳定性能提高超过30%。以复杂度略高于训练集的测试道路长度为基准,与经验过滤的Q-学习算法相比,采用聚类再采样的方法可以使策略模型的平均行驶距离提高70%以上。
关 键 词:深度强化学习 自动驾驶 聚类 神经网络
分 类 号:U463.6]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...