期刊文章详细信息
文献类型:期刊文章
Xue Naiyang;Ding Dan;Jia Yutong;Wang Zhiqiang;Liu Yuan(Graduate School,Space Engineering University,Beijing 101416,China;Department of Electronic and Optical Engineering,Space Engineering University,Beijing 101416,China;PLA 61646 Troops,Beijing 100192,China)
机构地区:[1]航天工程大学研究生院,北京101416 [2]航天工程大学电子与光学工程系,北京101416 [3]中国人民解放军61646部队,北京100192
年 份:2023
卷 号:35
期 号:2
起止页码:423-434
语 种:中文
收录情况:BDHX、BDHX2020、CAS、CSCD、CSCD2023_2024、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:以异构测控网资源联合调度为研究对象,提出一种基于强化学习的深度Q网络(deep Q network, DQN)算法。在充分分析异构测控资源联合调度问题特点后,用数学语言对影响问题求解的约束条件进行描述,建立了资源联合调度模型;从应用强化学习解决问题的角度,对求解的问题进行马尔科夫决策过程描述后,分别设计了2个结构相同的神经网络和基于ε贪婪算法的动作选择策略,并建立了DQN求解框架。仿真结果表明:基于DQN的异构测控资源调度方法较遗传算法能够找到调度收益更优的测控调度方案。
关 键 词:航天测控 异构测控资源联合调度 深度Q网络 调度收益 强化学习
分 类 号:TP273.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...