申请/专利权人:昆明理工大学
申请日:2023-11-22
公开(公告)日:2024-04-26
公开(公告)号:CN117519030B
主分类号:G05B19/418
分类号:G05B19/418
优先权:
专利状态码:有效-授权
法律状态:2024.04.26#授权;2024.02.27#实质审查的生效;2024.02.06#公开
摘要:本发明公开了一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法,在分布式装配流水车间调度问题的基础上,建立考虑机器阻塞的DABFSP的数学模型并设计调度优化算法;应用基于Q学习的QLHHEA对DABFSP的数学模型进行求解;将低层启发式LLH定义为状态,状态间的转移定义为动作,全局探索采用基于Q学习的高层策略,在特定状态下自动选择合适的动作,有效驱动搜索方向,局部开发采用基于问题特性的LLHs,有效地丰富了搜索行为。使用基于插入的加速策略有效节省了计算成本并提高搜索效率;提高了初始解的质量,本发明旨在确定DABFSP中各工厂的产品分配、工件的加工顺序和产品的装配顺序,使所有工厂的最大完工时间实现最小化。
主权项:1.一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法,其特征在于,具体包括如下步骤:步骤1:初始化种群、Q表,低层种群中的个体采用构造启发式方法生成,高层种群中的个体随机产生,两种群规模相同;设置相关参数;设置状态动作对的q值为零;步骤2:采用前向或后向计算方法来解码每个个体获取全局最优解πbest,同时在计算前执行基于插入的两种加速策略以节省评估解决方案的计算成本;步骤3:对低层个体中的可行调度解依次执行高层个体中的LLH,其中LLH定义为低层启发式,如果新解适应值更好,则用新解替换老解并更新全局最优解;计算每个高层个体的贡献率,据此选择个贡献率高的高层个体,采用更新机制更新Q表;同时设置count=0;步骤4:采样更新后的Q表生成新的高层个体,即利用基于Q学习的高层策略操作低层启发式以搜索解空间;步骤4.1:利用行动选择策略来选择状态st,获取动作at和下一个状态st+1;步骤4.2:将状态st+1应用于πbest上得到π′best;计算πbest的适应值Cπbest、Cπ′best、IR,获取奖励函数rst,at;更新Q值Qt+1st,at,概率εt和πbest;步骤4.3:如果Cπ′best<Cπbest,更新全局最优解πbest为π′best,否则跳转步骤4.1;步骤4.4:如果count=popsize,则跳转至步骤3,否则跳转到步骤4;步骤5:检查停止条件是否满足,如果不满足则跳转步骤4,否则输出πbest。
全文数据:
权利要求:
百度查询: 昆明理工大学 一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。