首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于社会价值取向的城市智能车辆拟人化决策方法_吉林大学_202410162274.4 

申请/专利权人:吉林大学

申请日:2024-02-05

公开(公告)日:2024-05-17

公开(公告)号:CN117709602B

主分类号:G06Q10/063

分类号:G06Q10/063;B60W60/00;G06Q50/40;G06N3/0464;G06N3/0442;G06N3/048;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2024.04.02#实质审查的生效;2024.03.15#公开

摘要:本发明公开了一种基于社会价值取向的城市智能车辆拟人化决策方法,包括:步骤一、采集车辆的运动几帧位图;步骤二、构建CNN‑LSTM混合网络并将所述CNN‑LSTM混合网络的输出进行特征融合,将所述车辆的运动几帧位图输入所述CNN‑LSTM混合网络获得不同目标的预测SVO值,以反映其社会价值取向,包括自身利益、他人利益和合作倾向;步骤三、基于SACER建立城市工况下的智能车辆决策模型,生成预测的驾驶员行为,包括加速、减速、变道等行为,以在交通中更好地与其他车辆互动。本发明具有提高拟人性和安全性的特点。

主权项:1.一种基于社会价值取向的城市智能车辆拟人化决策方法,其特征在于,包括如下步骤:步骤一、采集车辆的运动几帧位图;步骤二、构建CNN-LSTM混合网络并将所述CNN-LSTM混合网络的输出进行特征融合,将所述车辆的运动几帧位图输入所述CNN-LSTM混合网络获得不同目标的预测SVO值;所述CNN-LSTM混合网络包括一个CNN网络和一个LSTM网络;所述CNN网络包括依次连接的第一卷积层、第一激活函数层、第一最大池化层、第二卷积层、第二激活函数层、第二最大池化层、第三卷积层、第三激活函数层和第三最大池化层,且第一卷积层为32个过滤器,第二卷积层为64个过滤器,第三卷积层为128个过滤器,所述第一卷积层、第二卷积层和第三卷积层的过滤器尺寸均为3×3,所述第一激活函数层、第二激活函数层和第三激活函数层均为ReLU激活函数,所述第一最大池化层、第二最大池化层和第三最大池化层的窗口大小为2×2;所述CNN-LSTM混合网络的训练过程包括如下步骤:步骤1、对数据集中的样本点进行预处理并对齐车辆的时间戳;步骤2、计算不同样本点的实际SVO值: ;式中,为实际SVO值,为他车的速度,为他车到冲突点的距离,为自车的速度,为自车到冲突点的距离;步骤3、将样本点及其实际SVO值输入CNN-LSTM混合网络中,获得样本点的预测SVO值,将样本点的预测SVO值和实际SVO值进行对比,优化CNN-LSTM混合网络;步骤三、基于SACER建立城市工况下的智能车辆决策模型,生成预测的驾驶员行为;所述城市工况下的智能车辆决策模型的输出为: ;式中,表示在时刻的状态下采取的行动,表示策略网络在给定当前时刻状态的条件下选择动作的概率,表示动作采样的概率分布的均值,表示动作采样的概率分布的方差;所述城市工况下的智能车辆决策模型包括SAC网络和回合奖励重放;所述SAC网络的状态空间为车辆数据及道路状况;所述SAC网络的动作空间为车辆的动作;所述SAC网络的期望累计奖励函数满足: ;式中,是不同奖励项的权重,,表示基于SVO值的奖励,表示速度奖励,表示决策时间奖励,表示碰撞奖励,这些奖励项共同构成了车辆决策的优化目标;所述SAC网络的Q值网络损失函数满足: ;式中,为第个Q值网络的损失函数,为时刻的每个元组目标值,为经验回放池中的抽样分组数,为在当前状态下执行动作的Q值,为Q值分类,;Q值网络的更新满足: ;式中,为第一Q值网络的损失函数,为第二Q值网络的损失函数,为Q值网络的学习率,是神经网络的参数,为对第一Q值网络损失函数关于参数的梯度,为对第二Q值网络损失函数关于参数的梯度;所述SAC网络的策略网络损失函数满足: ; ;式中,是策略网络的损失函数,是神经网络的参数,是策略网络的学习率,为神经网络的参数的导数;所述策略网络的熵正则化系数满足: ;式中,为依赖熵正则化系数的损失函数,为期望操作符,表示状态是从经验回放池中采样得到的,表示动作是根据当前策略网络和给定状态的概率分布采样得到的,为熵正则化项系数,H0是目标熵。

全文数据:

权利要求:

百度查询: 吉林大学 一种基于社会价值取向的城市智能车辆拟人化决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。