买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于DDQN算法的配送车辆动态调度优化方法_安徽农业大学_202311830634.5 

申请/专利权人:安徽农业大学

申请日:2023-12-27

公开(公告)日:2024-03-19

公开(公告)号:CN117726040A

主分类号:G06Q10/04

分类号:G06Q10/04;G06Q10/0631;G06Q10/067;G06Q10/0832;G06N3/006;G06N3/045;G06N3/092

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.05#实质审查的生效;2024.03.19#公开

摘要:本发明公开了一种基于DDQN算法的配送车辆动态调度优化方法,属于基于深度强化学习的生鲜配送车辆调度技术领域;本发明将生鲜配送动态车辆调度问题视为连续时间过程,基于SMDPSemi‑MarkovDecisionProcess框架进行建模,并采用DDQNDoubleDeepQ‑Learning算法来训练双Agent,在处理“新订单事件”和“车辆事件”时做出调度分配。该方法显著降低了分配空间的组合复杂性,在考虑多个分配限制因素的同时,表现出更好的平均分配时间。通过提高系统资源利用率和调度效率,解决了生鲜配送延迟导致生鲜产品时效性下降的问题。

主权项:1.一种基于DDQN算法的配送车辆动态调度优化方法,其特征在于,包括以下步骤:S1、将生鲜配送中的动态车辆调度问题视为基于SMDP框架的连续时间过程:根据生鲜配送订单随时间随机出现、连续分配之间时间间隔随机的特性,拟定基于事件的SMDP公式,并定义SMDP的基本构成:环境、状态、动作空间、奖励函数和环境动力学;在系统中,明确定义两个触发分配的重要事件:“新订单事件”和“车辆事件”,将原本的多对多分配调度问题简化为一对多分配调度问题;S2、利用离散事件模拟器进行模拟:使用Python配置离散事件模拟器;利用所述模拟器维护按时间顺序排列的订单列表,并使用特定的处理例程来处理“新订单事件”和“车辆事件”:在模拟过程中,用概率分布表示驾驶员拒绝的概率,并使用β密度函数对其进行建模,最后,Agent利用该概率执行伯努利试验来确定是否拒绝订单;S3、训练Agent:结合真实世界数据和模拟数据,运用DDQN算法来同时训练双Agent,使其针对“新订单事件”和“车辆事件”做出调度分配。

全文数据:

权利要求:

百度查询: 安徽农业大学 一种基于DDQN算法的配送车辆动态调度优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。