买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于改进ID3QN算法的随机工时下柔性综合调度方法_西南交通大学_202311680525.X 

申请/专利权人:西南交通大学

申请日:2023-12-08

公开(公告)日:2024-04-05

公开(公告)号:CN117829463A

主分类号:G06Q10/0631

分类号:G06Q10/0631;G06Q10/0633;G06Q10/10;G06F30/27;G06F119/02

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.23#实质审查的生效;2024.04.05#公开

摘要:本发明公开了一种基于改进ID3QN算法的随机工时下柔性综合调度方法,具体为:首先构建随机工时柔性综合调度数学模型;其次从工序、机器及整体层面分别设计了三组状态特征;再采用与工时、加工顺序相关的工序规则以及与优化目标相关的机器规则组成的8组复合调度规则作为动作集,并将平均机器利用率差值作为即时奖励;最后,引入自注意力机制改进ID3QN算法求解数学模型。本发明充分考虑离散制造车间具有工时不确定的情况对实际车间造成的影响,建立柔性综合调度数学模型,使得排程结果更加符合实际生产场景;采用改进ID3QN算法具有更好的收敛效果和学习性能,同时求解效率与泛化能力更高。

主权项:1.一种基于改进ID3QN算法的随机工时下柔性综合调度方法,其特征在于,包括以下步骤:步骤1:构建随机工时柔性综合调度数学模型;目标函数为完工时间Cmax最小,如下式:f=minCmax1约束条件: sh+dih≤sl+L1-yihl3 sh≥0,ch≥08其中,sh为产品第h道工序开始加工时间,dih为产品第h道工序在机器i的实际加工时间,xih为决策变量,工序Oh是否选择机器i,Ph为产品第h道工序的直接紧前工序集合,yihl为决策变量,工序Oih是否先于Oil加工,L为一个足够大的正数,ch为产品第h道工序加工完成时间;i为机器序号,i=1,2,3,...,m,m为机器总数;h,l为工序索引号,h,l=1,2,3,...,n,n为产品工序总数;其中,公式2表示工序间先后顺序约束;公式3与4表示同一个时刻同一台机器只能加工一道工序;式5表示机器约束,即同一时刻同一道工序只能被一台机器加工;公式6和7分别表示存在每台机器上可以循环操作;公式8表示各个参数变量必须是正数;步骤2:从工序、机器及整体层面分别提取状态特征;1在工序层首先需要使用三个一维矩阵分别表示工序加工状态、加工时间及当前时刻工序的入度值;其中,入度值表示当前工序的前置工序数量;使用布尔量0和1表示工序加工状态,0代表改工序没有被调度,1代表改工序已被调度;如果该工序被加工,则更新该工序状态,并在加工时间矩阵对应的位置记录工序加工时间,最后更新所有工序的入度值;2对于机器层面,使用两个一维矩阵分别表示每一台当前的机器利用率和当前时刻空闲状态;其中在机器状态中布尔量0和1分别表示机器是否空闲,机器利用率这个矩阵数值表示当前机器利用率;3从整体层面引入了三个状态特征,具体描述如下:CROave表示当前状态工序完工率: Uave表示当前状态平均机器利用率: Ustd表示当前状态机器利用率的标准差: 步骤3:动作集与奖励函数设定;动作设定:在选取规则时,优先选择与工时相关的工序和机器规则组成的复合调度规则;工序规则从工时、加工顺序及结构树三个方面选取的SPT、LPT、FIFO、FCFS、层级优先规则,在机器层面的规则选择与优化目标相关的SPT、LPT规则,最后由工序规则和机器规则组成8组复合调度规则作为动作集,即:SPT+SPT:选择工序采用最短工时的工序,选择加工时间最短的机器;LPT+LPT:选择工序采用最短工时的工序,选择加工时间最长的机器;FIFO+SPT:选择工序采用先进先出规则,选择加工时间最短的机器;FIFO+LPT:选择工序采用先进先出规则,选择加工时间最长的机器;FCFS+SPT:选择工序采用先到先服务规则,选择加工时间最短的机器;FCFS+LPT:选择工序采用先到先服务规则,选择加工时间最长的机器;层级优先+SPT:优先选择工序所在工艺树结构中的层数小的工序,选择加工时间最短的机器;层级优先+LPT;优先选择工序所在工艺树结构中的层数小的工序,选择加工时间最长的机器;奖励函数设定:采用机器平均利用率之差的即时奖励,如下奖励函数所示:R=Uave-Uave_last12其中,R表示奖励值,Uave表示当前状态机器平均利用率,Uave_last表示上一个状态机器平均利用率;步骤4:基于改进ID3QN算法求解数学模型;改进ID3QN算法分别搭建自注意力机制层、一维卷积层和噪声层作为隐藏层;1自注意力机制层:第一层采用自注意力机制层,计算方法如下: 该式表示将一个查询向量Q、一组键-值对K和V,映射为一个输出,输出权重向量是由值的加权与Softmax函数计算得到;Q、K和V为设计的状态特征向量,dk是特征向量的维数;2一维卷积神经网络层:第二层采用一维卷积层提取特征;3噪声神经网络层:在第三层采用噪声层,最后通过全连接神经网络输出动作;神经网络每一层的隐藏层的节点数为128个,连接每层的激活函数采用Mish函数;损失值采用均方误差函数计算,并通过自适应动量的随机优化方法进行反向传播,不断优化神经网络中的参数θ。

全文数据:

权利要求:

百度查询: 西南交通大学 基于改进ID3QN算法的随机工时下柔性综合调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。