期刊文章详细信息
文献类型:期刊文章
PAN Xiaoqian;ZHANG Jiao;LIU Yan;WANG Shan;CHEN Haitao;ZHAO Haitao;WEI Jibo(College of Electronic Science and Technology,National University of Defense Technology,Changsha,Hunan 410073,China;Unit 91428 of PLA,Ningbo,Zhejiang 315456,China)
机构地区:[1]国防科技大学电子科学学院,湖南长沙410073 [2]中国人民解放军91428部队,浙江宁波315456
基 金:国家自然科学基金项目(62001483,62171449)。
年 份:2022
卷 号:38
期 号:12
起止页码:2572-2581
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、JST、RCCSE、ZGKJHX、核心刊
摘 要:无线通信系统的信道开放性使其极易受到外部恶意干扰、通信链路质量难以保证,针对以上问题,本文设计了一种基于深度强化学习的多域联合干扰规避决策方法。该方法联合频域、功率域、调制编码域三个域的抗干扰手段进行干扰规避,在考虑系统性能的同时实现可靠通信。首先,将联合智能干扰规避问题建模为一个马尔可夫决策过程(MDP,Markov Decision Process),动作空间包含切换信道、功率控制、改变调制编码方式。然后,采用基于剪裁的近端策略优化算法(PPO-Clip,Proximal Policy Optimization-Clip)求解获得系统的最优联合干扰规避策略。PPO-Clip算法在多回合训练中以小数量样本迭代更新,避免了策略梯度算法中步长难以确定和更新差异过大的问题。最后,分别在扫频干扰、随机扫频干扰和智能阻塞干扰环境下验证了所提算法的有效性和可靠性。
关 键 词:干扰规避 深度强化学习 近端策略优化
分 类 号:TP391.9] TN919.4[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...