【发明公布】自动驾驶汽车换道场景下对抗性测试评估方法_吉林大学_202410080251.9

导航：龙图腾网> 最新专利技术> 自动驾驶汽车换道场景下对抗性测试评估方法_吉林大学_202410080251.9

申请/专利权人：吉林大学

申请日：2024-01-19

公开（公告）日：2024-04-16

公开（公告）号：CN117892631A

主分类号：G06F30/27

分类号：G06F30/27;G06N3/092;G06F18/23;G06F18/214

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.03#实质审查的生效;2024.04.16#公开

摘要：一种自动驾驶汽车换道场景下对抗性测试评估方法，属于自动驾驶测试评估技术领域。本发明的目的是利用深度强化学习生成的对抗性环境中去测试评估车辆，采用了集成式DDPG深度强化学习算法，大大提高了训练效率的自动驾驶汽车换道场景下对抗性测试评估方法。本发明的步骤是：对抗性换道环境建模，强化学习算法和奖励函数设置，本车换道模型和对抗马尔可夫环境设置。本发明生成的对抗性环境比自然环境更加严峻，显著降低了测试车辆的性能，体现了方法的有效性。可以有效地找到罕见的风险场景，用于评估自动驾驶汽车。

主权项：1.一种自动驾驶汽车换道场景下对抗性测试评估方法，其特征在于：其步骤是：S1、对抗性换道环境建模将换道场景表述为一个由元组S,A1,A2,P,R1,R2,γ表示的二人马尔可夫博弈，其中S为状态空间，A1为自我车辆的动作空间，A2为背景车辆的动作空间，P：S×A1×A2×S为环境的动作转移概率，R1,R2为自我车辆和背景车辆的直接学习奖励；在马尔可夫决策过程中，每个主体的目标是通过策略πi:最大化自己的总期望收益T为时间步长；S2、强化学习算法和奖励函数设置μs∣θμ是一个参数化函数，Qs,a是动作值函数，是在状态st按照策略u采取动作at后的预期回报考虑用θQ参数化的函数近似器，通过使损失最小来优化临界： yt＝rst,at+γQst+1,μst+1∣θQ3其中β是不同的行为策略，θ表示状态分布；Actor通过策略梯度来更新参与者：创建Actor网络和Critic网络的副本：μ′s∣θμ′Q′s,a∣θQ′；目标网络的参数被缓慢的更新的模型：θ′＝τθ+1-τθ′；对手和自我代理的奖励函数是相反的：radv＝-rego5rego是自我车辆的驾驶性能；放松零和假设，并在对抗性奖励函数中添加了另一项：radv＝-rego+βrrule6其中rrule是对违反交通规则的惩罚，β是超参数；训练N个代理，随机初始化演员和评论家，省略探索，每个智能体，达到局部最优，或者一个情节的累积奖励已经达到某个边界c，则停止训练；S3、本车换道模型和对抗马尔可夫环境设置1基于规则的换道模型-间距接受模型Mgap临界间距为： gapg＝lead,lag8其中为目标车辆临界间距；2基于学习的换道模型Mrl对抗马尔可夫环境设置：MDP的状态空间S是9维向量空间：[xleader,xfollow,xtarget,vleader,vfollow,vtarget,vego,φego,yego]，其中x表示对抗车辆和ego车辆之间的距离，v表示车辆的速度，φego表示ego车辆的偏航角，并且yego表示ego车辆的横向位置；对抗性智能体的动作空间A是决定其纵向控制动作的三维向量空间：[aleader,afollow,atarget]。a是范围[-1，1]的浮点数，其中+1表示油门全开，-1表示刹车全开；对手的奖励函数是radv＝-rego+βrrule，rego是自我车辆的奖励函数，在换道场景中：函数奖励完成换道任务，并惩罚它的碰撞，敌对车辆违反交通规则，则rrule＝0，将β＝1设置为默认值。

全文数据：

权利要求：

百度查询：吉林大学自动驾驶汽车换道场景下对抗性测试评估方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种曲面抛光打磨装置中的双轴力控补偿机构_朝华力拓精密(深圳)有限公司_202410058832.2

下一篇：光学膜片与背光模块_四川龙华光电薄膜股份有限公司_202211299447.4

相关技术

一种曲面抛光打磨装置中的双轴力控补偿机构_朝华力拓精密(深圳)有限公司_202410058832.2

光学膜片与背光模块_四川龙华光电薄膜股份有限公司_202211299447.4

数字信号解析方法、装置、设备及车辆_北京罗克维尔斯科技有限公司_202211349864.5

一种短消息路由方法及相关设备_中国电信股份有限公司_202211350552.6

显示面板及其制备方法、显示装置_深圳市华星光电半导体显示技术有限公司_202410042140.9

一种司美格鲁肽口服固体药物组合物及其应用_齐鲁制药有限公司_202311407557.2

一种水龙头快速安装底座_崔樑明_202310464249.7

自适应型膜片式EFPI传感器及局放超声信号检测系统_国网黑龙江省电力有限公司电力科学研究院_202410006373.3

用于装配式面层支护设计的模拟设备及其模拟方法_中建八局广西建设有限公司_202311679130.8

信道状态信息的发送方法、接收方法、装置及存储介质_中兴通讯股份有限公司_202311656720.9

一种冷热负荷的预测方法及装置、存储介质、计算机设备_国网新疆电力有限公司昌吉供电公司_202410036837.5

一种用于废气净化的镍合金洗涤器_南京胜德金属装备有限公司_202311756686.2

龙图腾网&IPTOP

【发明公布】自动驾驶汽车换道场景下对抗性测试评估方法_吉林大学_202410080251.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务