买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】考虑前方障碍物影响的大型营运车辆防侧翻驾驶决策方法_东南大学_202210157766.5 

申请/专利权人:东南大学

申请日:2022-02-21

公开(公告)日:2024-04-30

公开(公告)号:CN114379540B

主分类号:B60W30/04

分类号:B60W30/04

优先权:

专利状态码:有效-授权

法律状态:2024.04.30#授权;2022.05.10#实质审查的生效;2022.04.22#公开

摘要:本发明公开了一种考虑前方障碍物影响的大型营运车辆防侧翻驾驶决策方法。首先,明确防侧翻驾驶决策方法适用的交通场景。其次,将防侧翻驾驶决策问题建模为马尔科夫决策过程,利用标准的策略梯度算法建立大型营运车辆的防侧翻驾驶决策模型。最后,对防侧翻驾驶决策模型进行训练,得到不同行驶工况下的防侧翻驾驶策略。本发明提出的决策方法,考虑了执行防侧翻驾驶策略过程中的安全隐患,克服了现有方法缺乏有效性和可靠性的不足,为营运车辆提供直行、转向、加速、减速等明确的驾驶策略,实现了有效、可靠的大型营运车辆防侧翻驾驶决策。

主权项:1.一种考虑前方障碍物影响的大型营运车辆防侧翻驾驶决策方法;首先,明确侧翻主动防控决策方法适用的交通场景;其次,利用传感器采集车辆的运动状态信息;最后,将侧翻主动防控决策问题建模为马尔科夫决策过程,利用标准的策略梯度算法建立大型营运车辆的侧翻主动防控决策模型,得到不同行驶工况下的防侧翻驾驶策略;其特征在于:步骤一:明确防侧翻驾驶决策方法适用的交通场景大型营运车辆,即自车C0行驶在多车道的高等级公路,其所在车道的前方存在交通参与者,即前车C1;当自车进行制动、变道或经过弯道时,为了保障行车安全,应有效、及时地为驾驶员提供决策策略包括,制动减速、转向;多车道是指车道的数量大于等于3;前车是指位于自车C0行驶道路前方,且位于同一车道线内、行驶方向相同、距离最近的车辆;步骤二:建立大型营运车辆的防侧翻驾驶决策模型采用标准的策略梯度算法,并基于步骤一所述的交通场景,建立防侧翻驾驶决策模型,研究前方障碍物存在情况下的营运车辆防侧翻驾驶策略;具体包括以下4个子步骤:子步骤1:定义防侧翻驾驶决策模型的基础参数考虑到大型营运车辆的未来运动状态同时受当前运动状态和当前动作影响,将防侧翻驾驶决策问题建模为马尔科夫决策过程,并对模型的基础参数进行定义:t时刻的状态空间St、t+1时刻的状态空间St+1、t时刻的动作空间At以及动作空间At对应的回报值Rt;具体地:1定义状态空间大型营运车辆的侧倾稳定性不仅与车辆自身的运动状态有关,还与道路状态有关;因此,利用车辆运动状态信息定义状态空间:St=[vlon,vhor,alon,ahor,ωyaw,θroll,θswa,δbrake,δthr,Lf,Drel]1其中,vlon,vhor分别表示大型营运车辆的纵向、横向速度,单位均为米每秒;alon,ahor分别表示纵向、侧向加速度,单位均为米每二次方秒,通过厘米级高精度组合导航系统测量获得;ωyaw,θroll分别表示横摆角速度和侧倾角,单位分别为弧度每秒、度,通过MEMS陀螺仪测量获得;θswa为车辆的方向盘转角,单位为度,δbrake,δthr分别表示制动踏板开度和节气门开度,单位均为百分数,通过读取车身CAN总线信息获得;Lf为板簧压力横向转移率,通过压力传感器测量的车轴钢板弹簧所受压力计算获得,Drel表示自车与前车的相对距离,单位为米,通过毫米波雷达采集获得;2定义动作空间将方向盘转角和制动踏板开度作为控制量,定义决策模型输出的驾驶策略,即t时刻的动作空间At=[θswa_out,δbrake_out];其中,θswa_out表示归一化后的方向盘转角控制量,范围为[-1,1],δbrake_out表示归一化后的制动踏板开度,范围为[0,1];当δbrake=0时,表示车辆未进行制动,当δbrake=1时,表示车辆以最大制动减速度进行制动;3定义奖励函数将奖励函数设计为:Rt=δ1·r1t+δ2·r2t+r3t2式中,Rt为t时刻的总奖励函数,r1t,r2t,r3t分别表示防侧翻奖励函数、防追尾奖励函数和惩罚函数;δ1,δ2分别表示防侧翻奖励函数的权重系数和防追尾奖励函数的权重系数;考虑到利用单个侧翻表征参数估计侧翻风险缺乏准确性的问题,综合考虑侧倾角、侧向加速度和板簧压力横向载荷转移率3个表征参数对侧翻的影响,建立防侧翻奖励函数r1t: 式中,athr,θthr,Lthr分别表示预设的侧向加速度阈值、侧倾角阈值和板簧压力横向转移率阈值,μ1表示奖励函数r1t的权重系数;为了降低执行防侧翻驾驶策略过程中的安全隐患,在防侧翻决策过程中,大型营运车辆应避免与前方障碍物发生碰撞;为此,建立前向防撞奖励函数r2t:r2t=μ2|Drel-Dsafe|4式中,Dsafe表示自车与前车的安全距离,μ2表示奖励函数r2t的权重系数;考虑到合理的安全距离,应同时兼顾通行效率和行车安全;为此,采用可变车头时距作为自动驾驶营运车辆的最小安全距离Dw;Dw=vlonτ+vforT+Lmin5式中,τ表示车间时距,单位为秒,vfor表示前方车辆的速度,单位为米每秒,Lmin表示临界距离,单位为米;为了纠正驾驶决策过程中的错误策略,建立惩罚函数r3t:r3t=-Spen6式中,Spen为惩罚值,取Spen=200,表示若车辆发生侧翻或追尾事故,决策模型会得到-200的惩罚;子步骤2:设计防侧翻驾驶决策模型的网络架构利用Actor-Critic框架搭建防侧翻驾驶决策模型,包括Actor网络和Critic网络两部分;其中,Actor网络将状态空间St作为输入,并对特征向量进行回归,从而输出连续动作At;Critic网络将状态空间St和动作At作为输入,从而评估当前“状态-动作”的价值;为Actor和Critic网络构建结构相同的三层全连接网络,三层网络的激活函数均为线性整流函数,其表达式为:fx=max0,x;步骤三:训练防侧翻驾驶决策模型对防侧翻驾驶决策模型中的参数进行训练,具体步骤包括:子步骤1:初始化策略函数的参数θ0和值函数的参数φ0;子步骤2:对策略函数和值函数的参数进行迭代更新,每一次迭代包括子步骤2.1至子步骤2.6,具体地:子步骤2.1:在环境中执行策略πk=πθk,搜集轨迹的集合Dk={τi};子步骤2.2:计算后续折扣奖励值子步骤2.3:基于当前的值函数将时序差分算法作为优势函数的估计量,计算优势函数的估计值;子步骤2.4:估计策略梯度;子步骤2.5:计算策略的更新;子步骤2.6:拟合值函数;子步骤3:按照子步骤1和子步骤2提供的方法进行迭代更新,使防侧翻驾驶决策模型逐渐收敛;在训练过程中,若车辆发生侧翻或碰撞,则终止当前回合并开始新的回合进行训练;当迭代达到最大次数或大型营运车辆利用模型输出的决策策略稳定有效地实现防侧翻时,表示迭代完成;最后,将大型营运车辆的运动状态信息输入到已训练的防侧翻驾驶决策模型中,可以在线输出防侧翻驾驶决策策略,实现了有效、可靠的大型营运车辆防侧翻驾驶决策。

全文数据:

权利要求:

百度查询: 东南大学 考虑前方障碍物影响的大型营运车辆防侧翻驾驶决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。