买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种面向约束可变相序的单交叉口自适应控制方法_华南理工大学_202311660251.8 

申请/专利权人:华南理工大学

申请日:2023-12-06

公开(公告)日:2024-03-29

公开(公告)号:CN117789457A

主分类号:G08G1/01

分类号:G08G1/01

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.16#实质审查的生效;2024.03.29#公开

摘要:本发明公开了一种面向约束可变相序的单交叉口自适应控制方法,本发明以双环结构为基础定义了一种约束可变相序,根据约束规则设计了无效动作屏蔽编码,在建立马尔可夫决策模型中定义了一种考虑交叉口渠化且与动作关联的状态向量,设计了结合无效动作屏蔽技术的A2C算法,实现了约束可变相序下的单交叉口自适应控制。本发明定义的约束可变相序能够灵活变换相序,具有各进口放行均衡、相位切换符合驾驶员习惯、保障行人连续通行等优点,采用结合无效动作屏蔽技术的A2C算法能够解决相序约束难题。本发明提出的自适应控制方法能够同时优化相序与相位时长,实现交叉口信号配时方案的实时优化。

主权项:1.一种面向约束可变相序的单交叉口自适应控制方法,其特征在于,包括下述步骤:步骤S1、定义一种面向双环结构的约束可变相序;可变相序的约束规则包括:同一信号周期内不重复放行同一相位;同一信号周期内各股车流均须连续放行;当相位执行到双环结构中的“隔断”时需要切换放行方向;步骤S2、设计无效动作屏蔽编码;所述无效动作是指当前状态下不符合所述可变相序的约束规则的相位;步骤S3、建立单交叉口自适应信号控制马尔可夫决策模型,利用马尔可夫决策模型将单交叉口信号机视为智能体,将整个交叉口视为环境,智能体根据环境当前时刻下的状态实时反馈对信号配时方案的优化;所述马尔可夫决策模型以元组S,A,P,R,γ表示,其中,S是有限数量的状态集,A是有限数量的动作集,P是各状态之间的转移概率矩阵,R是奖励函数,γ是折扣系数;步骤S4、训练结合无效动作屏蔽技术的A2C算法模型;步骤S5、利用训练完成的Actor网络和Critic网络,实现面向约束可变相序的单交叉口自适应信号控制。

全文数据:

权利要求:

百度查询: 华南理工大学 一种面向约束可变相序的单交叉口自适应控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。