买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于AIoT的真空泵智能联动控制方法及系统_华土木(厦门)科技有限公司_202410075811.1 

申请/专利权人:华土木(厦门)科技有限公司

申请日:2024-01-18

公开(公告)日:2024-04-05

公开(公告)号:CN117588394B

主分类号:F04B49/06

分类号:F04B49/06;E02D3/10;F04B49/20;F04B49/22;F04B49/02

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2024.03.12#实质审查的生效;2024.02.23#公开

摘要:本发明公开了一种基于AIoT的真空泵智能联动控制方法及系统,方法包括数据采集与预处理、控制策略初始化、神经网络设计、神经网络训练、远程监测与控制。本方案使用传感器监测地基环境条件,通过马尔可夫决策过程描述地基环境条件,学习复杂的地基环境条件与真空泵控制策略之间的非线性映射关系;通过构建深度神经网络生成控制策略,采用强化学习算法训练神经网络,引入信任区域约束限制每次更新的策略变化,避免控制策略的过度更新,增加了地基处理中真空泵控制的灵活性,改善了地基处理过程的效率。

主权项:1.基于AIoT的真空泵智能联动控制方法,其特征在于:该方法包括以下步骤:步骤S1:数据采集与预处理,部署传感器监测地基环境条件包括真空压力、沉降、地下水位、孔隙水压力,使用物联网通信协议将传感器采集到的地基环境条件传输给控制中心,控制中心接收传感器传输的地基环境条件并进行分析和预处理;步骤S2:控制策略初始化,使用马尔可夫决策过程初始化真空泵的控制策略,马尔可夫决策过程包括真空泵的状态空间、动作空间、状态转移概率、奖励函数、折扣因子;步骤S3:控制策略更新,构建用于表示控制策略的深度神经网络,接收真空泵的状态空间作为输入,输出给定状态下执行每个动作的概率,使用TRPO算法训练深度神经网络,迭代优化深度神经网络的参数,生成最终的控制策略;步骤S4:远程监测与控制,将最终的控制策略部署到控制中心,生成控制指令通过物联网传输协议传递给真空泵和其他相关设备,通过远程监控实现对真空泵的实时调整;在步骤S2中,所述控制策略初始化,包括以下步骤:步骤S21:问题定义,定义控制策略的目标为最大化真空泵的运行效率,最小化真空泵的能源消耗,控制策略的约束为真空泵的操作范围;步骤S22:建立MDP模型,通过马尔可夫决策过程建模真空泵的控制策略,马尔可夫决策过程包括真空泵的状态空间、动作空间、状态转移概率、奖励函数、折扣因子,所用公式如下: ;式中,表示马尔可夫决策过程,表示状态空间,表示动作空间,表示状态转移概率,表示奖励函数,表示折扣因子;步骤S23:定义MDP参数,MDP的状态空间包括真空泵的运行状态、真空水平、沉降、地下水位、孔隙水压力,MDP的动作空间包括真空泵的转速、阀门开度、启停控制,定义奖励函数用线性加权求和方法,设置折扣因子为0.7,所用公式如下: ;式中,为真空泵的运行效率奖励,为真空泵的能源消耗奖励,为真空泵的操作范围奖励,、、为对应奖励项权重;步骤S24:定义累积奖励,通过选择最优策略来最大化期望奖励,所用公式如下: ;式中,表示最优策略,表示对策略的期望,表示时刻的状态,表示时刻的动作;在步骤S3中,所述控制策略更新,包括以下步骤:步骤S31:神经网络设计,构建用于表示控制策略的深度神经网络,深度神经网络由输入层、隐藏层、输出层组成,输入层输入MDP的状态空间,隐藏层使用tanh激活函数从输入数据中学习和表示复杂的函数关系,所用公式如下: ;式中,表示输入的状态信息;输出层输出在给定状态下执行相应动作的概率,使用softmax函数作为输出层的激活函数,所用公式如下: ;式中,表示输入向量的第个元素,表示输入向量的长度;步骤S32:前向传播,构建深度神经网络的前向传播过程,所用公式如下: ;式中,表示激活值,表示权重矩阵,表示偏置;步骤S33:设计目标函数,计算最大化期望累积奖励,所用公式如下: ;式中,是策略的参数,是初始状态到终止状态的轨迹,是策略,是在时刻处获得的奖励,是折扣因子;步骤S34:计算优势估计,估计每个状态-动作对的相对优越性,所用公式如下: ;式中,是状态-动作对的优势,状态-动作对的值函数,是状态的值函数;步骤S35:定义损失函数,使用策略梯度损失更新深度神经网络参数的方向,所用公式如下: ;式中,表示策略,表示对轨迹按照策略的分布进行期望值计算,表示策略中动作在状态下的对数概率关于参数的梯度;步骤S36:选择优化算法,使用梯度上升法更新策略网络的参数以增大目标函数值,所用公式如下: ;式中,是第次迭代的模型参数,是学习率,是损失函数对模型参数的梯度;步骤S37:计算信任区域,使用KL散度约束控制策略更新幅度的信任区域,所用公式如下: ;式中,表示旧策略在给定状态下的动作概率分布,表示当前策略在相同状态下的动作概率分布,表示对所有可能的动作进行积分,是预先设定的阈值;步骤S38:优化目标函数,在信任区域内最大化目标函数,所用公式如下: ;式中,是优化后的目标函数;步骤S39:生成控制策略,通过训练优化调整深度神经网络的参数,生成最终的控制策略。

全文数据:

权利要求:

百度查询: 华土木(厦门)科技有限公司 基于AIoT的真空泵智能联动控制方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术