【发明公布】一种基于多智能体强化学习的水面目标协同围捕方法_上海交通大学;海之韵(苏州)科技有限公司;东北大学;大连海事大学_202311830670.1

申请/专利权人：上海交通大学;海之韵(苏州)科技有限公司;东北大学;大连海事大学

申请日：2023-12-28

公开（公告）日：2024-04-02

公开（公告）号：CN117806318A

主分类号：G05D1/43

分类号：G05D1/43;G05D1/622

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.19#实质审查的生效;2024.04.02#公开

摘要：本发明涉及一种基于多智能体强化学习的水面目标协同围捕方法，包括：构建基于多智能体强化学习的水面目标围捕模型，以各个无人船的状态作为输入，输出无人船的驱动力；采用集中训练、分布执行的训练框架对水面目标围捕模型进行训练，无人船作为强化学习中的智能体通过训练生成多智能体协同控制策略，根据获取到的有限的环境信息进行决策和协同，以完成对敌对目标围捕；其中，利用一个非线性映射函数将无人船趋近阶段和环绕阶段的不同目标合并为同一个，同时，在奖励函数中设有围捕角的惩罚项，使得无人船集群仅在所有无人船与围捕目标之间的距离小于预设阈值时才开始围捕和环绕。与现有技术相比，本发明具有结构简单、成功率高、泛化性好等优点。

主权项：1.一种基于多智能体强化学习的水面目标协同围捕方法，其特征在于，包括：构建基于多智能体强化学习的水面目标围捕模型，以各个无人船的状态作为输入，输出无人船的驱动力；采用集中训练、分布执行的训练框架对水面目标围捕模型进行训练，无人船作为强化学习中的智能体通过训练生成多智能体协同控制策略，根据获取到的有限的环境信息进行决策和协同，以完成对敌对目标围捕；其中，利用一个非线性映射函数将无人船趋近阶段和环绕阶段的不同目标合并为同一个，同时，在奖励函数中设有围捕角的惩罚项，使得无人船集群仅在所有无人船与围捕目标之间的距离小于预设阈值时才开始围捕和环绕。

全文数据：

权利要求：

百度查询：上海交通大学;海之韵(苏州)科技有限公司;东北大学;大连海事大学一种基于多智能体强化学习的水面目标协同围捕方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种煤矿井下局部通风机远程开停装置_贵州贵能投资股份有限公司_202322392209.4

下一篇：一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

相关技术

一种煤矿井下局部通风机远程开停装置_贵州贵能投资股份有限公司_202322392209.4

一种保温箱排水结构_苏州苏味轩食品有限公司_202322479258.1

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

一种用于负极材料粉尘除尘器_天津燃洁斯工业设备有限公司_202322051874.7

一种尺寸可调节的中药材切片装置_安徽盛林国药饮片有限公司_202322230535.5

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

夹具_新疆蓝晶新材料科技有限公司_202322100063.1

整形压块及焊接装置_宁德时代新能源科技股份有限公司_202321970130.9

一种组合式高低压配电柜_靖江市靖开电力电器有限公司_202322564432.2

一种接触器触头机构_杭州玛实迪电器科技有限公司_202322179096.X

一种用于汽车保险杠加工的旋转喷漆装置_重庆渝湘智成汽车配件有限公司_202322547178.5

一种电池叠放平台_济源市万洋绿色能源有限公司_202322480402.3

龙图腾网&IPTOP

【发明公布】一种基于多智能体强化学习的水面目标协同围捕方法_上海交通大学;海之韵(苏州)科技有限公司;东北大学;大连海事大学_202311830670.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务