登录    注册    忘记密码

期刊文章详细信息

基于深度强化学习的自动驾驶策略学习方法    

Training Method of Automatic Driving Strategy Based on Deep Reinforcement Learning

  

文献类型:期刊文章

作  者:夏伟[1,2] 李慧云[1,2]

XIA Wei LI Huiyun(Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, Shenzhen 518055, China Shenzhen College of Advanced Technology, University of Chinese Academy of Sciences, Shenzhen 518055, China)

机构地区:[1]中国科学院深圳先进技术研究院,深圳518055 [2]中国科学院大学深圳先进技术学院,深圳518055

出  处:《集成技术》

年  份:2017

卷  号:6

期  号:3

起止页码:29-40

语  种:中文

收录情况:JST、RCCSE、普通刊

摘  要:自动驾驶是人工智能研究的重要应用领域,文章提出了一种基于深度强化学习的自动驾驶策略模型学习方法。首先采用在线交互式学习方法对深度网络模型进行训练,并基于专业司机的经验数据对模型进行预训练,进而结合经验池回放技术提高模型训练收敛速度,通过对状态空间进行聚类再采样,提高其独立同分布特性以及策略模型的泛化能力。通过与神经网络拟和Q-迭代算法的比较,所提方法的训练时间可缩短90%以上,稳定性能提高超过30%。以复杂度略高于训练集的测试道路长度为基准,与经验过滤的Q-学习算法相比,采用聚类再采样的方法可以使策略模型的平均行驶距离提高70%以上。

关 键 词:深度强化学习  自动驾驶 聚类 神经网络

分 类 号:U463.6]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心