买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】类脑智能驾驶控制模型升级方法及类脑智能驾驶方法_华中科技大学_202310884779.7 

申请/专利权人:华中科技大学

申请日:2023-07-17

公开(公告)日:2024-03-19

公开(公告)号:CN117077753B

主分类号:G06N3/08

分类号:G06N3/08;G06N3/092;G06N3/045;G06N3/0464;G06N3/044;B60W60/00;B60W50/00

优先权:

专利状态码:有效-授权

法律状态:2024.03.19#授权;2023.12.05#实质审查的生效;2023.11.17#公开

摘要:本发明公开了一种类脑智能驾驶控制模型升级方法及类脑智能驾驶方法,属于自动驾驶技术领域,升级方法包括:当训练驾驶新任务时,执行:步骤S1:获取已有的类脑智能驾驶控制模型,模型包括任务决策神经网络和任务融合神经网络;步骤S2:在任务决策神经网络的隐藏层新增神经元和突触、在输出层新增新任务的决策,上一层新增的神经元在输出方向只与下一层新增的神经元连接、每一层新增的神经元在输入方向与上一层每个神经元连接;步骤S3:固定更新后的任务决策神经网络中原有的突触权重,输入训练数据进行训练。通过上述方法,尽可能的复用旧任务学习到的特征等知识,增强新任务的泛化性,减少新任务的训练代价。

主权项:1.一种类脑智能驾驶控制模型升级方法,其特征在于,当训练驾驶新任务时,执行:步骤S1:获取已有的类脑智能驾驶控制模型,所述模型包括任务决策神经网络和任务融合神经网络,所述任务决策神经网络用于根据所采集的场景数据得到各个驾驶任务的决策,所述融合神经网络为深度强化学习神经网络并用于融合所有任务的决策,得到最终的驾驶动作;步骤S2:在所述任务决策神经网络的隐藏层新增神经元和突触、在输出层新增新任务的决策,上一层新增的神经元在输出方向只与下一层新增的神经元连接、每一层新增的神经元在输入方向与上一层每个神经元连接;步骤S3:固定更新后的任务决策神经网络中原有的突触权重,输入训练数据进行训练,更新新增突触的权重和所述任务融合神经网络的权重,以使最终的驾驶动作符合预期;其中,所述任务决策神经网络和所述深度强化学习神经网络分开进行训练,步骤S3包括:步骤S31:固定更新后的任务决策神经网络中原有的突触权重,输入训练数据对所述任务决策神经网络进行训练,更新新增突触的权重,得到训练好的任务决策神经网络;步骤S32:将采集到场景数据输入训练好的所述任务决策神经网络,将所述任务决策神经网络输出的各个任务的决策输入所述深度强化学习神经网络,得到对应场景数据下的驾驶动作;以t时刻采集的场景数据作为状态st,以决策出的驾驶动作作为动作at,在状态st下执行动作at后所得到的下一状态st+1是否好转计算奖励rst,at,基于马尔科夫决策算法,训练所述深度强化学习神经网络。

全文数据:

权利要求:

百度查询: 华中科技大学 类脑智能驾驶控制模型升级方法及类脑智能驾驶方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。