【发明公布】一种基于模仿学习的可变驾驶风格的自动驾驶决策方法_电子科技大学长三角研究院(衢州)_202311710703.9

申请/专利权人：电子科技大学长三角研究院(衢州)

申请日：2023-12-13

公开（公告）日：2024-04-02

公开（公告）号：CN117799637A

主分类号：B60W60/00

分类号：B60W60/00;B60W50/00;G06N3/0455;G06N3/0475;G06N3/042;G06N3/092;G06N3/0499;G06N3/0442;G06N3/096

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.19#实质审查的生效;2024.04.02#公开

摘要：本发明公开了一种基于模仿学习的可变驾驶风格的自动驾驶决策方法，本发明提出了一个支持增量学习的模仿学习模型，基础的模仿学习模型可以通过多种驾驶风格的专家数据进行训练，并在模仿专家驾驶行为方面实现超越专家的性能。通过增量学习，模型可以根据不断积累的数据不断改进性能，而无需每次重新训练整个模型。这将使自动驾驶车辆能够更及时地更新模型参数，以适应新的道路情境和交通条件。本发明能够根据不同的驾驶风格偏好快速微调基本的基于模仿学习自动驾驶决策模型，同时减少计算、存储和时间的大量开销。本发明基于注意力环境感知框架，以致力于使自动驾驶决策算法在多变的交通场景中关注更有用的关键信息。

主权项：1.一种基于模仿学习的可变驾驶风格的自动驾驶决策方法，其特征在于，包括数据收集、基础模型生成器和驾驶风格调整；所述数据收集包括来自不同传感器的环境数据和强化学习专家展示的动作分布，动作分布包括加速度和转向角的分布；环境数据通过数据采集模块对车道、车辆和交通信息的特征进行单独编码，然后整合采集的特征；整合环境数据和动作分布，形成了一个专为离线训练定制的合成数据集；所述基础模型生成器分为编码器和解码器，编码器利用转换器架构为环境数据分配权重，解码器中，模仿学习智能体接收权重分配的环境数据、专家驱动的路点和动作分布作为输入，并输出未来时间步的动作分布策略；所述驾驶风格调整根据基本模型生成器调整强化学习专家的动作分布，调整其输出的贝塔分布的α和β值来改变强化学习专家的驾驶风格以供后续本发明所设计的模仿学习模型微调。

全文数据：

权利要求：

百度查询：电子科技大学长三角研究院(衢州) 一种基于模仿学习的可变驾驶风格的自动驾驶决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种英语听力训练用耳机_大同师范高等专科学校_202322527447.1

下一篇：一种无人机使用高清摄像模组_陕西泰沃云科技有限公司_202322392870.5

相关技术

一种英语听力训练用耳机_大同师范高等专科学校_202322527447.1

一种无人机使用高清摄像模组_陕西泰沃云科技有限公司_202322392870.5

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种纺织纱线缠绕架_江苏金銮纺织科技股份有限公司_202322120043.0

一种机床零件用抛光装置_杭州盈动达精密机械有限公司_202322717477.9

4G/5G+北斗+Lora机车远程控制装置_宁夏宁东铁路有限公司_202322827126.3

一种方便拆装的瓦楞机用瓦楞辊_浙江永暉瓦楞辊有限公司_202322675014.0

管带纠偏装置_武汉巨沣工程技术有限公司_202322765867.3

一种无缝钢管送料设备_宁波东进钢管有限公司_202322167126.5

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

龙图腾网&IPTOP

【发明公布】一种基于模仿学习的可变驾驶风格的自动驾驶决策方法_电子科技大学长三角研究院(衢州)_202311710703.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务