买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种改进多头自注意力机制-BiLSTM的风机轴承故障诊断方法_河北工业大学_202311832901.2 

申请/专利权人:河北工业大学

申请日:2023-12-28

公开(公告)日:2024-03-29

公开(公告)号:CN117786558A

主分类号:G06F18/2431

分类号:G06F18/2431;G06N3/084;G06N3/0442;G06N3/049;G06N3/048;G06N3/047

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.16#实质审查的生效;2024.03.29#公开

摘要:本发明公开一种改进多头自注意力机制‑BiLSTM的风机轴承故障诊断方法,该方法首先由周期空洞自注意力和局部自注意力组成的改进多头自注意力机制对振动信号重新加权,给予故障数据点高权重,故障消失点低权重,也能减少特征增强过程中的时间消耗及随机干扰影响;然后,利用BiLSTM层能够同时考虑输入序列的过去和未来信息的特性,通过正向和反向两个方向的隐藏状态,这使得模型能够更全面地捕捉序列中的上下文信息,有助于更好提取振动信号长期依赖特征;最后,经全连接层和Softmax层输出风机轴承故障诊断结果。测试结果表明,本发明风机轴承故障诊断方法故障分类准确率为100%。

主权项:1.一种改进多头自注意力机制-BiLSTM的风机轴承故障诊断方法,其特征在于,该方法包括以下步骤:S1:获取训练数据S11:根据风机轴承故障的类型,在相同的风机转速下,以相同采样频率分别采集正常和各故障类型下的合计C种轴承状态的一定时长的轴承振动信号,并进行空缺值填补的预处理,得到正常和各故障类型下的轴承振动信号原始时序数据;空缺值填补即利用相邻两个时刻点的数据均值对空缺值进行填补;S12:将步骤S11中正常和各故障类型下的轴承振动信号原始时序数据采用Min-Max标准化,使得数据值落在指定的区间[0,1]内,得到振动相关时序数据;标准化公式如下: 其中,x′是标准化后的数据值,x是原始数据值,maxx和minx分别是原始时序数据中的最小值和最大值;S13:将S12中经过数据标准化后得到各振动相关时序数据,通过移动窗口分别进行采样,获取时序片段样本集,每个时序片段样本数据长度为N;并按固定数量比例将各类时序片段样本集进行划分,每一类中的不少于60%的数量均划分到训练集,每一类中的余下的数量划分到测试集,每一个时序片段样本均设置有对应的真实的轴承状态标签信息;S2:构建风机轴承故障诊断模型风机轴承故障诊断模型包括改进多头自注意力特征增强模块、BiLSTM神经网络模块、故障分类模块,所述特征增强模块对输入数据进行特征增强,特征增强后的数据作为BiLSTM神经网络模块的输入,BiLSTM神经网络模块的输出经过故障分类模块处理,得到输入数据的故障类型诊断结果;所述改进多头自注意力特征增强模块包括周期空洞自注意力分支和局部自注意力分支,对于输入的时序数据X1,X1=[x1,x2,…,xt,…,xN],周期空洞自注意力分支计算输入元素xt与它前后距离为T、2T、3T、…、nT的元素关联度,得到周期空洞自注意力加权后的元素xt′,如式1所示: 其中,t为时序数据X1的第t个采样时刻点,1≤t≤N,N为时序数据X1的采样时刻点的总数;n为正整数,T=1r,r为风机转速;中的T表示转置,下同;局部自注意力分支计算输入元素xt前后距离为T2的元素关联度,得到局部自注意力加权后的元素x″t,如式2所示: 式中,t为时序数据X1的第t个采样时刻点,1≤t≤N,N为时序数据X1的采样时刻点的总数,T=1r,r为风机转速;将周期空洞自注意力分支和局部自注意力分支的输出x′t、x″t拼接成矩阵,再乘以权重矩阵wo,得到经改进多头自注意力特征增强元素x″′t,如式3所示:x″′t=wo[x′t,x″t]T3输入的时序数据X1,经过特征增强模块的处理,得到经改进多头自注意力特征增强后的时序数据X2,X2=[x″′1,x″′2,...,x″′t,...,x″′N];BiLSTM神经网络模块包括正向隐含层和反向隐含层,每层神经元个数为128,对应128个采样时刻点数据长度的输入数据,对于输入数据中的第s个元素xs,BiLSTM神经网络模块进行正向和反向两个方向的隐藏状态传递,如式4所示: 其中是正向隐含层的第s个神经元输出隐含状态,并且是反向隐含层的第s个神经元输出隐含状态,为正向隐含层的第s-1个神经元输出隐含状态,为反向隐含层的第s+1个神经元输出隐含状态;by为训练参数,H是Sigmoid函数,ys表示联合预测结果;将经改进多头自注意力特征增强后的时序数据X2=[x″′1,x″′2,...,x″′t,...,x′N]输入到BiLSTM神经网络模块作进一步特征提取,将X2按连续的128个采样时刻点数据长度进行划分,分批输入到BiLSTM神经网络模块中,得到BiLSTM神经网络模块提取的故障特征Y=[y1,y2,…,yt,…,yN];故障分类模块对于BiLSTM神经网络模块提取的故障特征Y,依次进行全连接层和Softmax层的处理,对于故障特征Y,全连接层将其进行处理后,输出Z,具体公式为:Z=σwz·Y+bz5式中,式中σ是sigmoid函数,wz、bz为训练参数,其中wz为C×N维的权重矩阵,bz为C×1维的偏置矩阵;对于全连接层的输出Z,其为C×1维的序列数据,其每个元素zo都通过softmax函数映射到概率中: o=1,2,3,...C,依次对应全连接层的C个节点位置,也分别对应C种轴承状态标签;zo表示全连接层第o个节点的输出值,Po表示模型诊断的输入的时序数据X2所对应的轴承属于第o种状态的概率,概率最大值对应的状态标签,即为时序数据X2所对应的轴承状态的诊断结果,从而实现轴承故障诊断;S3:训练风机轴承故障诊断模型设置模型训练轮次为80epochs,模型的优化器采用Adam,损失函数设置为交叉熵损失函数,学习率为0.001,批量大小设置为128;采用随机赋值法初始化模型所有的训练参数;初始化的值为0;将S13中的训练集中的一个时序片段样本,输入到风机轴承故障诊断模型的改进多头自注意力特征增强模块中,得到BiLSTM神经网络模块的输入数据;BiLSTM神经网络模块对于输入数据,分批进行特征提取,故障分类模块对BiLSTM神经网络模块提取到的故障特征进行处理,得到该时序片段样本诊断的故障类型概率值;采用交叉熵损失函数作为损失函数,其公式为: Po表示该时序片段样本为第o类轴承状态的真实概率,Po表示模型对该时序片段样本诊断的属于第o类轴承状态的概率;根据该时序片段样本的损失函数的值,采用Adam优化器反向传播更新一次模型的训练参数,完成一个时序片段样本的训练;接着输入训练集中的下一个时序片段样本,将上一个时序片段样本训练完成时的模型的训练参数作为下一个时序片段样本训练时的初始参数,不断迭代,直至训练完训练集中的最后一个时序片段样本,完成训练集的一个轮次的训练;将上一个轮次训练完成时的模型的训练参数作为下一个轮次训练时的初始参数,不断迭代,直至训练轮次达到80,模型的训练完成;将测试集中的时序片段样本分别输入到完成训练的模型中,得到每个时序片段样本的故障诊断结果,将故障分类准确率作为用于评估模型性能的指标,其定义如式8所示: 当故障分类准确率为100%,则说明该模型为有效模型;否则,调整学习率和训练轮次,利用训练集重新执行模型训练的过程,直至测试集的故障分类准确率达到100%;S4:风机轴承故障诊断对待诊断的风机轴承,在与S11中相同的风机转速下,采样频率为25.6KHz,获取不少于连续的N个采样时刻点的轴承振动信号原始时序数据,对该原始时序数据进行空缺值填补的预处理后,再对其进行Min-Max标准化处理,得到振动相关时序数据;将连续的N个采样时刻点数据长度的振动相关时序数据输入到S3中的有效模型中,得到C种轴承状态的概率,其中概率值最大的状态即为该风机轴承状态的诊断结果。

全文数据:

权利要求:

百度查询: 河北工业大学 一种改进多头自注意力机制-BiLSTM的风机轴承故障诊断方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。