买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于模仿学习的可变驾驶风格的自动驾驶决策方法_电子科技大学长三角研究院(衢州)_202311710703.9 

申请/专利权人:电子科技大学长三角研究院(衢州)

申请日:2023-12-13

公开(公告)日:2024-04-02

公开(公告)号:CN117799637A

主分类号:B60W60/00

分类号:B60W60/00;B60W50/00;G06N3/0455;G06N3/0475;G06N3/042;G06N3/092;G06N3/0499;G06N3/0442;G06N3/096

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.19#实质审查的生效;2024.04.02#公开

摘要:本发明公开了一种基于模仿学习的可变驾驶风格的自动驾驶决策方法,本发明提出了一个支持增量学习的模仿学习模型,基础的模仿学习模型可以通过多种驾驶风格的专家数据进行训练,并在模仿专家驾驶行为方面实现超越专家的性能。通过增量学习,模型可以根据不断积累的数据不断改进性能,而无需每次重新训练整个模型。这将使自动驾驶车辆能够更及时地更新模型参数,以适应新的道路情境和交通条件。本发明能够根据不同的驾驶风格偏好快速微调基本的基于模仿学习自动驾驶决策模型,同时减少计算、存储和时间的大量开销。本发明基于注意力环境感知框架,以致力于使自动驾驶决策算法在多变的交通场景中关注更有用的关键信息。

主权项:1.一种基于模仿学习的可变驾驶风格的自动驾驶决策方法,其特征在于,包括数据收集、基础模型生成器和驾驶风格调整;所述数据收集包括来自不同传感器的环境数据和强化学习专家展示的动作分布,动作分布包括加速度和转向角的分布;环境数据通过数据采集模块对车道、车辆和交通信息的特征进行单独编码,然后整合采集的特征;整合环境数据和动作分布,形成了一个专为离线训练定制的合成数据集;所述基础模型生成器分为编码器和解码器,编码器利用转换器架构为环境数据分配权重,解码器中,模仿学习智能体接收权重分配的环境数据、专家驱动的路点和动作分布作为输入,并输出未来时间步的动作分布策略;所述驾驶风格调整根据基本模型生成器调整强化学习专家的动作分布,调整其输出的贝塔分布的α和β值来改变强化学习专家的驾驶风格以供后续本发明所设计的模仿学习模型微调。

全文数据:

权利要求:

百度查询: 电子科技大学长三角研究院(衢州) 一种基于模仿学习的可变驾驶风格的自动驾驶决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。