【发明授权】一种基于强化学习的航空发动机过渡态寻优控制方法_大连理工大学_202210221726.2

导航：龙图腾网> 最新专利技术> 一种基于强化学习的航空发动机过渡态寻优控制方法_大连理工大学_202210221726.2

申请/专利权人：大连理工大学

申请日：2022-03-07

公开（公告）日：2024-04-02

公开（公告）号：CN114675535B

主分类号：G05B13/04

分类号：G05B13/04

优先权：

专利状态码：有效-授权

法律状态：2024.04.02#授权;2022.07.15#实质审查的生效;2022.06.28#公开

摘要：本发明提供一种基于强化学习的航空发动机过渡态寻优控制方法，属于航空发动机过渡态技术领域。包括：基于现有的某型双轴涡轮风扇发动机模型，将其调整为适用于调用强化学习算法的模型；为了同时满足实时模型的高位状态空间和连续动作输出，设计Actor‑Critic网络模型；设计基于Actor‑Critic框架的深度确定性策略梯度算法，以便同时解决高维状态空间和连续动作输出的问题；在将Actor‑Critic框架与DDPG算法结合之后，进行模型的训练；发动机加速过渡的控制规律是由上述训练过程得到的，应用此方法对发动机加速过程进行控制。

主权项：1.一种基于强化学习的航空发动机过渡态寻优控制方法，其特征在于，包括以下步骤：S1基于某双轴涡轮风扇发动机模型，将其调整为适用于调用强化学习算法的模型；S2为了同时满足实时模型的高位状态空间和连续动作输出，设计Actor-Critic网络模型；具体如下：S2.1采用Actor网络生成动作，Actor网络由传统深度神经网络组成，每一步的输出行为at可以通过确定性策略函数μst和输入状态s确定，采用深度神经网络对策略函数进行拟合，参数为θμ；S2.2设计相应的Actor网络结构，包括输入层、隐含层和输出层，其中隐含层将状态映射为特征，以及将前层输出归一化同时输入动作值；S2.3Critic网络用于评价执行动作的好坏程度，由深度神经网络组成，其输入为状态-动作组s,a，输出为状态-动作值函数Q值函数，参数为θQ；S2.4设计Critic网络结构，在其输入状态s后加入隐含层；同时，由于Critic网络的输入应有动作a，在与状态s的特征进行加权求和后再对其进行特征提取；最终的输出结果是与执行动作的好坏相关的Q值；S2.5将深度神经网络作为函数拟合器；S3设计基于Actor-Critic框架的深度确定性策略梯度DDPG算法，使用Critic网络预估Q值，Actor网络输出动作，同时解决高维状态空间和传统DQN算法无法解决的连续动作输出的问题；具体如下：S3.1采用经验回放方法和批规范化方法，减少样本之间的相关性；目标网络采用软更新模式，使网络权值参数缓慢接近原训练网络，保证网络训练的稳定性；确定性行为策略使得每一步的输出都是可以计算的；S3.2DDPG算法核心问题是处理训练目标，即最大化未来期望奖励函数Jμ，同时最小化Critic网络的损失函数LθQ；因此应当设置合适的奖励函数，使网络选择出最优策略；最优策略μ定义为最大化Jμ的策略，定义为μ＝argmaxμJμ，按照过渡态的目标要求，目标函数定义为最小化喘振裕度、涡轮前总温与加速时间；S3.3DDPG算法是异策略算法，在连续空间中进行学习探索的过程可以独立于学习算法；因此需要在Actor网络策略输出中添加噪声作为新的探索策略；S3.4对训练样本的每个维度进行标准化，使其具有单位均值和方差；S4在将Actor-Critic框架与DDPG算法结合之后，进行模型训练；具体如下：S4.1首先根据现有需求，搭建相应计算奖励，惩罚函数模块；S4.2将发动机模型与强化学习网络结合，进行分批次训练；在训练时，将目标奖励值范围调大，进行预训练，当满足基本要求后，依次减小目标奖励值范围，直到满足相应要求；S4.3为了使策略最优，且控制器具有鲁棒性，在参考目标上增加±5％的随机量，使当前控制器模型具有最优的控制量输出；S4.4为了设计满足多工况下的燃油供给规律，在保持高度、马赫数不变的前提下，改变转子目标转速，进行多次训练；S5由上述训练过程得到发动机加速过渡的控制规律，应用此方法对发动机加速过程进行控制，主要包含以下步骤：S5.1在训练结束后，得到相应的控制器参数，每一个工况对应一个控制器参数，此时的控制器输入为目标转速值，输出为供给发动机的燃油流量；S5.2在当前工况下，模型直接给出控制规律，将模型的输出与发动机的输入直接相通，即可对发动机加速过程的过渡态进行控制。

全文数据：

权利要求：

百度查询：大连理工大学一种基于强化学习的航空发动机过渡态寻优控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种超低能耗制备电解液及硫酸氧钒晶体的系统_广东中科天钒储能科技有限公司_202322441183.8

下一篇：电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

相关技术

一种超低能耗制备电解液及硫酸氧钒晶体的系统_广东中科天钒储能科技有限公司_202322441183.8

电池壳清洗用旋转框架安装槽的限位结构_无锡金杨丸伊电子有限公司_202322328357.X

电池包和用电装置_蔚来电池科技(安徽)有限公司_202322200695.5

一种用于负极材料粉尘除尘器_天津燃洁斯工业设备有限公司_202322051874.7

一种具备快接功能的汽车线束_天津博尔特科技有限公司_202322504460.5

一种具有除臭机构的集成中央气体处理装置_龙岩忠友环境科技有限公司_202322062347.6

一种印刷电路板加工用压膜装置_南通欧贝达电子科技有限公司_202322176231.5

高温堆直流调试防干扰回路_华能山东石岛湾核电有限公司_202322501565.5

一种醋酸酐含量检测装置_山东嘉驰新材料股份有限公司_202322220520.0

一种天然气管道不停输开孔装置_盐城新奥燃气有限公司_202322202238.X

一种钢带波纹螺旋管接头防护模具_吉林建工集团有限公司_202322063597.1

一种尺寸可调节的中药材切片装置_安徽盛林国药饮片有限公司_202322230535.5

态相关技术

用于溶解电站水汽中痕量胶态铁的混合催化剂_浙江西热利华智能传感技术有限公司_202210361398.6

一种F-T合成浆态床反应器的移热装置_内蒙古伊泰煤基新材料研究院有限公司_201810012901.0

一种基于薄膜铌酸锂的启钥式单孤子态光学微梳产生方法_浙江大学_202111216818.3

平板陶瓷干态膜净水设备_温州德安水处理有限公司_202410288359.7

流态冰蒸发器及使用该流态冰蒸发器的空调系统_中机十院国际工程有限公司_201810471365.0

一种极化混合纠缠态生成方法_南京邮电大学_202011229429.X

一种量子网络并行多跳受控隐形传态方法_西安邮电大学_202410215864.9

一种燃料电池系统冷态恒压启动控制方法_无锡威孚高科技集团股份有限公司_202410207041.1

一种基于LC谐振单元的可重构型三谐振态均衡电路_东方电气集团科学技术研究院有限公司_202311728009.X

一种三谐振态均衡电路及电池电压均衡优化控制方法_东方电气集团科学技术研究院有限公司_202311728010.2

过渡相关技术

一种旋转式防撞护栏和混凝土护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419697.3

一种旋转式防撞护栏和波形梁护栏的过渡连接结构_浙江飞虹交通设施有限公司_202322419695.4

加快悬挑脚手架搭设的斜撑过渡法_中冶建工集团有限公司_202210634461.9

一种风电机组叶片过渡电阻检测装置_中广核大悟阳平风力发电有限公司_202322383643.6

用于产生锂化的过渡金属氧化物的方法_巴斯夫公司_201980037208.1

一种浮法玻璃过渡辊台及其过渡辊台渣箱的清洁装置_蚌埠中光电科技有限公司_201910328193.6

一种使胶包裹过渡区域的方法_苏州安洁科技股份有限公司_202410024737.0

一种过渡式外墙保温板_日照汇新墙体建材科技有限公司_202322192378.3

一种具备过渡顶推功能的切割机_南阳市天泰新材智造科技有限公司_202322662937.2

一种双导线铜铝过渡设备线夹_唐山市环冶机电工业公司_202322214661.1

寻相关技术

基于最小阶跃扰动的负荷切换路径寻优方法_北京化工大学_202111090808.X

分隔组件、寻骨模块和圆领机_深圳速英科技有限公司_202410151716.5

一种手术室护理寻针器_六安市第四人民医院_202321850697.2

一种冷温水温差控制寻优节能方法_中瑞恒(北京)科技有限公司_202311052989.6

一种激光切割头的摆动机构及寻中机构_金世纪艾克森(江苏)激光科技有限公司_202410160119.9

一种可自动寻边的片材纠偏设备及其使用方法_深圳市联维智能装备有限公司_202410242800.8

一种磁保持极化继电器全寿命周期稳健参数寻优方法_哈尔滨工业大学_202210929175.5

平面对接工件焊接轨迹寻位方法和系统_山东大学_202210373010.4

一种基于SSA寻优的LMS均衡优化方法、设备及介质_中国民航大学_202410303673.8

数字化平台高效机房温度自适应寻优方法、装置及介质_广州崇实自动控制科技有限公司_202410297165.3

龙图腾网&IPTOP

【发明授权】一种基于强化学习的航空发动机过渡态寻优控制方法_大连理工大学_202210221726.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务