新工件插入车间调度中,用强化学习解决车间调度问题,可以删除原始调度方案中的已加工工序与可加工机器的信息,根据未开始加工工序、新工件和各机器的结束时间重新初始化工序与可加工机器信息,得到新的调度方案。
用强化学习时,可以根据原调度中的工序、机器等信息,利用模型预测并根据给定的奖励进行调整,提高新的调度方案的质量。