买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种在行为克隆框架下基于群体方向一致性和稳定性的蜂拥涌现控制方法_中国人民解放军军事科学院国防科技创新研究院_202110954578.0 

申请/专利权人:中国人民解放军军事科学院国防科技创新研究院

申请日:2021-08-19

公开(公告)日:2023-07-25

公开(公告)号:CN113792843B

主分类号:G06N3/008

分类号:G06N3/008;G06N3/0499;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2023.07.25#授权;2021.12.31#实质审查的生效;2021.12.14#公开

摘要:本发明公开了一种在行为克隆框架下基于群体方向一致性和稳定性的蜂拥涌现控制方法,该方法用于控制智能体集群蜂拥运动,包括:确定智能体的感知范围内的所有邻域智能体;根据智能体的状态信息及智能体的所有邻域智能体的状态信息,构建智能体对应的虚拟邻域中心,确定虚拟邻域中心的状态信息;利用预设深度神经网络提取当前时刻的智能体的状态信息和虚拟邻域中心的状态信息的隐性特征,获取下一时刻的智能体的控制输出量,其中,预设深度神经网络的各个权重参数利用基于群体方向一致性和群体系统稳定性构建的代价函数训练确定。本发明能够基于局部感知信息,控制智能体集群产生满足群体方向一致性和群体系统稳定性要求的智能体集群蜂拥运动。

主权项:1.一种在行为克隆框架下基于群体方向一致性和稳定性的蜂拥涌现控制方法,其特征在于,所述方法用于控制智能体集群蜂拥运动,包括:确定智能体的感知范围内的所有邻域智能体;根据智能体的状态信息及智能体的所有邻域智能体的状态信息,构建智能体对应的虚拟邻域中心,确定虚拟邻域中心的状态信息;利用预设深度神经网络提取当前时刻的智能体的状态信息和虚拟邻域中心的状态信息的隐性特征,获取下一时刻的智能体的控制输出量,其中,预设深度神经网络的各个权重参数利用基于群体方向一致性和群体系统稳定性构建的代价函数训练确定;智能体的状态信息包括智能体的位置信息和速度信息,虚拟邻域中心的状态信息包括虚拟邻域中心的位置信息和速度信息;设定智能体集群中的第i个智能体Ai的邻域为利用以下公式确定智能体Ai对应的虚拟邻域中心的位置;Sπ=∑αjSj利用以下公式确定智能体Ai对应的虚拟邻域中心的速度;Vπ=∑αjVj其中,Aj表示智能体集群中的第j个智能体,Dij表示智能体Ai与智能体Aj间的距离,Ri表示智能体Ai的感知半径,Sπ表示虚拟邻域中心在空间中的位置,αj表示智能体Aj对应的权重,Sj表示智能体Aj在空间中的位置,Vπ表示虚拟邻域中心的速度,Vj表示智能体Aj的速度;所述预设深度神经网络包括:第一四层全连接前馈网络、第二四层全连接前馈网络、三层全连接前馈网络和一层线性网络;所述第一四层全连接前馈网络和所述第二四层全连接前馈网络与所述三层全连接前馈网络连接,所述第一四层全连接前馈网络和所述第二四层全连接前馈网络的各个权重参数相同,所述第一四层全连接前馈网络和所述第二四层全连接前馈网络中一个以智能体的状态信息为输入,另一个以虚拟邻域中心的状态信息为输入,所述第一四层全连接前馈网络和所述第二四层全连接前馈网络的输出通过维度级联方式输入所述三层全连接前馈网络;所述三层全连接前馈网络与所述一层线性网络连接,所述三层全连接前馈网络的输出为所述一层线性网络的输入;设定当前时刻为tk时刻,下一时刻为tk+1时刻;基于群体方向一致性和群体系统稳定性构建代价函数为: 其中,表示预设深度神经网络输出的tk+1时刻下智能体Ai的控制输出量,为tk+1时刻下智能体Ai的速度,表示训练样本对应的tk+1时刻下智能体Ai的控制输出量标签,θV表示速度偏差重要度,表示tk+1时刻下虚拟邻域中心的速度,θD表示距离偏差重要度,表示tk时刻下智能体Ai与虚拟邻域中心的距离,表示tk+1时刻下智能体Ai与虚拟邻域中心的距离,||·||表示2范数算子。

全文数据:

权利要求:

百度查询: 中国人民解放军军事科学院国防科技创新研究院 一种在行为克隆框架下基于群体方向一致性和稳定性的蜂拥涌现控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。