【发明公布】一种深度强化学习中基于涡量光滑的奖励机制_上海理工大学_202311524947.8

导航：龙图腾网> 最新专利技术> 一种深度强化学习中基于涡量光滑的奖励机制_上海理工大学_202311524947.8

申请/专利权人：上海理工大学

申请日：2023-11-15

公开（公告）日：2024-03-22

公开（公告）号：CN117742138A

主分类号：G05B13/02

分类号：G05B13/02;G06N3/006;G06N3/045;G06N3/092;G06N3/084;G06N3/0985

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.04.09#实质审查的生效;2024.03.22#公开

摘要：本发明涉及一种深度强化学习中基于涡量光滑的奖励机制，通过将翼型表面阻力系数、升力系数和探针点获取的涡量统计值结合构成奖励函数；根据该奖励函数对神经网络进行训练，获取合适的控制策略π，从而实现神经网络的主动流动控制，以期获得抑制流动分离最佳优化效果。解决了翼型流动分离的闭环主动控制的稳定性不足的问题，综合考虑了翼型表面阻力系数、升力系数和以探针获取的涡量统计值；通过人工深度神经网络与流场数值模拟环境不断交互，动态更新神经网络参数，获取最优策略，控制翼型射流装置，改变流场流动状态，实现翼型增升减阻的目的。通过涡量光滑抑制的翼型分离现象可实现有效减小和消去，稳定尾流振荡，翼型增升减阻效果更优。

主权项：1.一种深度强化学习中基于涡量光滑的奖励机制，其特征在于，通过将翼型表面阻力系数、升力系数和探针点获取的涡量统计值结合构成奖励函数；根据该奖励函数对神经网络进行训练，获取合适的控制策略π，从而实现神经网络的主动流动控制，以期获得抑制流动分离最佳优化效果，具体包括如下步骤：1搭建翼型绕流数值模拟与人工深度神经网络的深度强化学习框架；对翼型绕流进行数值模拟，通过提前设置于流场内不同数量、位置的探针，获取不同控制周期内最后一个瞬时时刻的速度与压力值并计算该周期内翼型表面的平均升阻力系数与涡量统计值作为智能体更新所需数据；人工深度神经网络作为框架内的智能体，包含策略神经网络π与价值神经网络；策略神经网络π根据流场提供的状态值输出动作分布参数；价值神经网络根据流场信息以及熵值评估当前状态的价值；2翼型绕流数值模拟环境提供智能体所需要的状态，首先获取无控制条件下不同攻角的流动情况，当流动发展至稳定状态的时刻，将该时刻作为不同攻角环境的初始状态，该时刻下，数值模拟流场中设置的探针所获得的速度或压力值作为初始状态值S0；3智能体根据当前时刻t环境输送的状态值St，输出动作值At,该动作值用来改变t时刻的翼型上表面所设有的主动流动控制装置所需参数，该控制装置根据该参数控制环境，进入到t+1时刻；4建立一种基于涡量光滑奖励函数，将翼型表面阻力系数、升力系数、涡量统计值考虑进奖励函数中，如下公式1：其中Rt表示t时刻的瞬时奖励值，α、β为涡量统计值大小变化的权重，根据不同流动条件而决定；表示初始时刻下的值；·T表示不同轨迹下的值；CD、CL分别表示翼型表面的阻力系数与升力系数；Ωmax、Ωmean分别为涡量最大值与涡量平均值；计算不同时刻获得的价值函数，记录n个轨迹后，获得当前瞬时时刻的累计回报Ut，组成经验池；5从经验池采用数据对价值神经网络进行更新。

全文数据：

权利要求：

百度查询：上海理工大学一种深度强化学习中基于涡量光滑的奖励机制

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

下一篇：用于电厂冷却塔内壁及淋水构架的修复涂层结构及冷却塔_北京易晟元环保工程有限公司_202321781851.5

相关技术

自动装盒设备_杭州永创智能设备股份有限公司_202322265646.X

用于电厂冷却塔内壁及淋水构架的修复涂层结构及冷却塔_北京易晟元环保工程有限公司_202321781851.5

一种带分励脱扣器组件的电子式断路器结构_杭州程翔电气有限公司_202322618372.8

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

一种新型加湿器_莆田市必捷电子有限公司_202322599727.3

一种机柜_珠海冠宇动力电源有限公司_202322495779.6

无功补偿柜柜体_广东澳江电气有限公司_202322547060.2

一种梳式烟夹的胶头自动组装设备_广州阿尔法精密机械有限公司_202322475952.6

一种精密小磨床用物料固定装置_昆山法尔霆机电科技有限公司_202322612017.X

一种具有安全防护的桥梁施工操作台_博信达建设集团有限公司_202322675828.4

一种饮料包装盒的快速消毒装置_赵唐玉玥_202322121652.8

一种卷帘门帘片成型机_重庆久广门业有限公司_202322413811.1

涡相关技术

一种涡壳清洗架_襄阳优程同创物流有限公司_202321973520.1

涡喷式燃烧机_大连恒通和科技有限公司_201810377629.6

一种径向涡节热管式低温省煤器_中化节能技术(北京)有限公司_202322626935.8

大宽高比截面结构涡激振动响应求解方法、系统和存储介质_重庆大学_202311842203.0

一种螺旋列板涡激振动抑制装置的动力学设计方法_海油发展珠海管道工程有限公司_202111674289.1

一种基于涡状线旋槽与圆锥滚子传动的减速机构_扬州大学_202322687522.0

双型线压缩机动涡盘防自转结构和涡旋压缩机_重庆超力高科技股份有限公司_202210555640.3

一种涡轴发动机尾喷管_中国航发湖南动力机械研究所_202410007992.4

蜗壳的涡孔自动检测装置_无锡蠡湖新质节能科技有限公司_202111557304.4

一种涡街流量计_太仓市锅炉自动化仪表厂有限公司_202322681411.9

量相关技术

冷量自利用半导体致冷除湿机_香河汇文节能科技有限公司_202322666428.7

贴片电阻绝缘耐压量测实验装置_丽智电子(南通)有限公司_202322162053.0

一种亚麻播种的播种量调节装置_浙江省园林植物与花卉研究所(浙江省萧山棉麻研究所)_202322362161.2

量测数据压缩采集方法及系统、电子设备、存储介质_国网湖南省电力有限公司_202310440393.7

一种低掺量厂拌热再生拌合楼_贵州省公路建设养护集团有限公司_202322517746.7

一种低开挖量且施工快速的拦蓄坝施工方法_北京城建道桥建设集团有限公司_202311150943.8

多区块链间轻量通讯协定装置及方法_香港应用科技研究院有限公司_202080004568.4

运用在车床上用于测量工件轮廓的量测系统_林彦均_202322105374.7

一种供液量自动调节的气雾生成装置_深圳市康唯普科技有限公司_202311752975.5

一种估算乘用车颗粒捕捉器累碳量的系统及方法_神龙汽车有限公司_202210247875.6

中相关技术

具有净空间的中底_云上股份有限公司_202180009985.2

一种中水回用装置_安徽德风膜环境技术有限公司_202322425486.0

管理IOT网络中的数据和数据使用_勤达睿公司_202080032483.7

运动的对象流中的对象的检测_西克股份公司_202311366013.6

一种多级中水回用设备_苏州同科工程咨询有限公司_202322600059.1

ONO工艺中的HTO氧化层工艺方法_上海华虹宏力半导体制造有限公司_202110719394.6

动态消息处理和消息传递中的数据聚合_利维帕尔森有限公司_202080024885.2

一种中框离子清洁装置_厦门微亚智能科技股份有限公司_202322462096.0

电镀装置中的电流密度的控制_朗姆研究公司_202010770564.9

LTE/NR共存中的CSI参考信令_瑞典爱立信有限公司_201880094231.X

龙图腾网&IPTOP

【发明公布】一种深度强化学习中基于涡量光滑的奖励机制_上海理工大学_202311524947.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务