【发明公布】一种基于深度强化学习的船舶自主靠离泊方法_天津大学_202311674770.X

导航：龙图腾网> 最新专利技术> 一种基于深度强化学习的船舶自主靠离泊方法_天津大学_202311674770.X

申请/专利权人：天津大学

申请日：2023-12-07

公开（公告）日：2024-03-29

公开（公告）号：CN117784777A

主分类号：G05D1/43

分类号：G05D1/43;G06N3/092

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.16#实质审查的生效;2024.03.29#公开

摘要：本发明涉及一种基于深度强化学习的船舶自主靠离泊方法，可解决目前船舶自主靠离泊的问题。包括下列步骤：建立船舶的数学模型，包含船舶的运动学模型和动力学模型，使船舶运动过程尽可能逼真；搭建船舶靠离泊的强化学习环境，确定船舶的初始状态和目标状态；基于TCPIP协议进行船舶模型和强化学习环境间的通信；根据船舶的运动特征和仿真环境的特点设计状态空间和动作空间；综合考虑任务需求，塑造合理的奖励函数；基于Actor‑critic框架引入最大熵的SAC算法进行仿真环境中进行船舶的自主靠离泊任务进行训练。本发明提出的基于深度强化学习的船舶自主靠离泊方法解决传统方法的分层问题，具有决策迅速且稳定，参数量较少的优点，可部署在船载计算机上。

主权项：1.一种基于深度强化学习的船舶自主靠离泊方法，其特征在于，步骤如下：第一步：使用matlab构建船舶数学模型；1构建船舶运动学模型。运动学模型描述了船舶这一动力学系统的系统输出舵角、位置、横向速度、纵向速度等等对系统输入偏航角度、螺旋桨转速的动态响应关系。2构建船舶动力学模型。动力学模型基于分离模型分析了船舶的船舶的附加质量和附加力矩、船舶流体粘性类流体力和船舶双螺旋桨水动力矩等，进行船舶的操作性仿真。第二步：构建强化学习环境；1设计船舶的状态空间。根据船舶实际的航行特点，设计状态空间为一组六维连续向量，包括船舶的位置信息即船舶的横纵坐标位置，以及船舶的艏向角以及船舶的运动信息即船舶的横纵速度以及角速度。2设计船舶的动作空间。动作空间为是一个二维向量，分别为船舶的偏航角度和舵机的转速，用来控制船舶的方向和速度。3设计船舶的奖励函数。为了让船舶完成路径任务，船舶的奖励函数一共包括包括五部分：R＝λ1||xc,yc-xt,yt||2+λ2||uc,vc-ut,vt||2+λ3||rc-rt||2+λ4||φc-φc||2+λ5rgoal其中，第一项为距离奖励，表示船舶当前位置与目标点之间的相对距离。将相对距离距离作为奖励可以为船舶运动指明方向，使其朝着目标点去运动；第二项表示船舶当前横纵向速度与目标点的速度的差距。此项奖励的目的是为了使船舶到达目标点时，横纵向速度也能减速至0；第三项表示角速度奖励，通过塑造该奖励，让船舶到达靠泊目标点时其角速度也能减为0；第四项表示船舶当前艏向角与目标艏向角的差距，该奖励可以让船舶到达靠泊目标点时艏向角满足一定的要求；第五项表示是否完成靠泊任务，若完成任务给一个较大的奖励，该奖励为船舶提供了较大的正向激励，有利于强化学习算法的收敛。第三步，基于TCPIP协议完成服务端matlab船舶数学模型和客户端python强化学习环境的通信。传输控制协议是位于网际层上层的传输协议，并且是最常用的网络协议之一。通过使用TCPIP协议来建立matlab段船舶模型和python强化学习环境之间的通信，将matlab端设置为服务器Server，将python端设置为客户Client。第四步，构建强化学习算法，收集经验进行模型训练。1基于随机策略进行经验采集。正在训练一开始时，没有收集到任何经验，此时软行动评论算法的温度系数较高，船舶随机选择动作，进行环境探索，并且收集经验存在到经验回放池中。2神经网络训练。在采集到一定量的经验后，按照一定的批次输入到神经网络中，对神经网络进行训练，包括策略网络，动作网络，以及温度系数的衰减。3与环境继续交互。神经网络在经过训练之后，会对所处的环境有一定的了解，智能体会继续进行经验收集，并且对神经网络进行训练，此时，温度系数较小，船舶会选择奖励值较大的动作，神经网络会不断朝着最优策略方向收敛。4不断重复2和3直到策略收敛到最优。

全文数据：

权利要求：

百度查询：天津大学一种基于深度强化学习的船舶自主靠离泊方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

下一篇：一种偏摆检查仪_长春一东离合器股份有限公司_202420407178.7

相关技术

一种环保型水处理设备_南京云涧环境科技有限公司_202322651322.X

一种偏摆检查仪_长春一东离合器股份有限公司_202420407178.7

再生废液处理系统_山东荣信集团有限公司_202322260404.1

一种园林绿化便携铲_马丽丽_202322375183.2

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

一种水泵节能增压装置_陕西海利智慧能源科技有限公司_202322218413.4

一种砂浆稠度仪_宜昌市科信水电工程质量检测有限公司_202322336666.1

一种无人机使用高清摄像模组_陕西泰沃云科技有限公司_202322392870.5

一种弹力按摩鞋_温岭市成奇鞋业有限公司_202322137663.5

一种吸音降噪窗帘面料_江苏洲际家居科技有限公司_202322672664.X

一种户外交流高压封闭式隔离开关_瑞芯科技(河北雄安)有限公司_202322554260.0

学习相关技术

具有降低的查找表学习速率的查找表学习方法及驱动电路_知微电子有限公司_202311208529.8

自学习照明群控系统及方法_非凡士智能科技(苏州)有限公司_202410150310.5

联邦学习方法、装置、设备及存储介质_杭州趣链科技有限公司_202011633747.2

一种学习用具和控制方法_张立华_201910399450.5

用于机器学习辅助预编码的设备和方法_矿业电信学校联盟_202080048329.9

利用模型增强的自监督学习_硕动力公司_202280060208.5

基于同态加密强化学习的电器负荷需求响应方法_河海大学_202210897543.2

用于工业机器人减速机故障学习方法_重庆工业职业技术学院_202310128261.0

一种分布式学习索引模型的构建方法及应用_华中科技大学_202111095824.8

基于深度学习的LED光源识别方法、装置、设备及介质_湖北经济学院_202410088953.1

船舶相关技术

船舶上用舱口盖开启装置_扬州海翼船舶工程有限公司_202322228848.7

剖分式油环船舶中间轴承_东台市远洋船舶配件有限公司_202322807598.2

吊舱式推进装置以及船舶_南京高精船用设备有限公司_202322543483.7

藏油式油环船舶中间轴承_东台市远洋船舶配件有限公司_202322718878.6

一种船舶特种机械生产用磨具_烟台盛源磨料磨具有限公司_202322707590.9

基于变分模态分解技术的大型船舶轴系状态智能识别系统_江苏兴卫机械有限公司_202111273029.3

一种适用于大型船舶的多层餐厨垃圾处理装置_广东伟烨船舶设备有限公司_202322412299.9

一种船舶舱室通风管道用的压力调节装置_江苏爱维特船舶设备有限公司_202321839331.5

一种基于AIS数据的船舶行为识别方法及系统_杭州电子科技大学_202111494779.3

船舶动力定位控制方法、装置、计算机设备及存储介质_哈尔滨工程大学三亚南海创新发展基地_202410043913.5

自主相关技术

控制车窗色调等级以保护自主车辆的内部车厢_福特全球技术公司_201811385669.1

用于车辆自主子系统的中间件软件层_瑞维安知识产权控股有限责任公司_202311024205.9

一种具有自主调控功能的草莓苗繁育设施_上海华维可控农业科技集团股份有限公司_202410072414.9

自主体定位方法、装置、自主体、芯片和存储介质_上海高仙自动化科技发展有限公司_202110892889.9

导航卫星时间系统及其自主恢复方法_中国科学院微小卫星创新研究院_201980020430.0

可扩展的远程操作自主机器人_宝马股份公司_201980048703.2

一种人机自主智能协同的跟踪方法_中国科学院沈阳自动化研究所_202110671009.5

实施自主车辆的回退行为的系统_伟摩有限责任公司_201980087773.9

侧面传感器组件和包括其的自主车辆_伟摩有限责任公司_201880084695.2

基于实时稠密点云地图的煤矿巷道孔眼自主识别方法_太原理工大学_202210288413.9

龙图腾网&IPTOP

【发明公布】一种基于深度强化学习的船舶自主靠离泊方法_天津大学_202311674770.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务