登录    注册    忘记密码

期刊文章详细信息

一种基于修正机制和强化学习的作业车间调度问题的优化算法    

Optimization Algorithms for Job Shop Scheduling Problems Based on Correction Mechanisms and Reinforcement Learning

  

文献类型:期刊文章

作  者:苗宽[1] 李崇寿[1,2]

MIAO Kuan;LI Chongshou(School of Artificial Intelligence and Computing,Southwest Jiaotong University,Chengdu 610097,China;SWJTU-Leeds Joint School,Southwest Jiaotong University,Chengdu 610097,China)

机构地区:[1]西南交通大学计算机与人工智能学院,成都610097 [2]西南交通大学利兹学院,成都610097

出  处:《计算机科学》

基  金:国家自然科学基金(62202395);四川省自然科学基金(2022NSFSC0930);中央高校基本科研业务费专项资金(2682022CX067);四川省重点研发项目(2022YFG0028)。

年  份:2023

卷  号:50

期  号:6

起止页码:274-282

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD_E2023_2024、DOAJ、IC、JST、RCCSE、UPD、ZGKJHX、核心刊

摘  要:近年来,使用深度强化学习解决作业车间调度问题的研究主要集中于构造法,通过将作业车间调度问题视为顺序决策问题,逐步选择调度节点从而得到完整的解。尽管这种算法思想已经取得了不小的成果,但仍面临奖励构造困难、解决方案质量不高的问题,因此这一方法的发展受到制约。针对这些问题,设计了一种基于图神经网络和近端策略优化算法的强化学习构造框架。同时,针对因训练与测试数据分布不一致而带来的次优解问题,还设计了一种修正交换算子,以保证解的质量。最后,为了证明算法的有效性,在公开数据集和生成的数据集上进行了实验。实验结果表明,所提算法在中小规模实例上的结果优于目前最好的强化学习框架,不仅充分发挥了构造式强化学习框架求解迅速的优势,还通过修正机制有效缓解了次优选择问题,缩短了实例的最大完成时间。

关 键 词:调度 作业车间调度问题 强化学习  修正搜索算法  

分 类 号:TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心