登录    注册    忘记密码

期刊文章详细信息

基于多智能体强化学习的动态频谱分配方法综述  ( EI收录)  

Review of multi-agent reinforcement learning based dynamic spectrum allocation method

  

文献类型:期刊文章

作  者:宋波[1,2] 叶伟[1] 孟祥辉[2]

SONG Bo;YE Wei;MENG Xianghui(Department of Electronic and Optical Engineering, Space Engineering University, Beijing 101416, China;Unit 95801 of the PLA, Beijing 100076, China)

机构地区:[1]航天工程大学电子与光学工程系,北京101416 [2]中国人民解放军95801部队,北京100076

出  处:《系统工程与电子技术》

年  份:2021

卷  号:43

期  号:11

起止页码:3338-3351

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:认知无线电和动态频谱分配技术是解决频谱资源短缺问题的有效手段。随着近年来深度学习和强化学习等机器学习技术迅速发展,以多智能体强化学习为代表的群体智能技术不断取得突破,使得分布式智能动态频谱分配成为可能。本文详细梳理了强化学习和多智能体强化学习领域关键研究成果,以及基于多智能体强化学习的动态频谱分配过程建模方法与算法研究。并将现有算法归结为独立Q-学习、合作Q-学习、联合Q-学习和多智能体行动器评判器算法4种,分析了这些方法的优点与不足,总结并给出了基于多智能体强化学习的动态频谱分配方法的关键问题与解决思路。

关 键 词:频谱管理 认知无线电 动态频谱分配 机器学习  强化学习  多智能体强化学习

分 类 号:TN929.5]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心