一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法

    专利2026-06-10  2


    本发明属于轴承故障诊断,尤其涉及高速旋转机械中的轴承故障诊断。


    背景技术:

    1、轴承是旋转机械的重要部件,在现代工业中有着广泛的应用。轴承在运行过程中由于其工作环境恶劣,往往伴随着复杂的工况,容易发生各种类型的故障。轴承故障诊断是旋转机械可以正常运行的重要保证。因此,全面系统地对轴承故障的监测及诊断方法展开研究,对保证旋转机械的安全运行、降低维护、维修费用以及保障人民的生命和财产安全具有重大的现实意义。

    2、传统的轴承故障诊断主要依靠经验分析和声音分析,以及温度和油液监测。通过监测声音和温度的变化,以及分析油液中的杂质,可以判断轴承是否存在故障。同时,可视检查也是一种常用的方法。综合运用这些技术手段,可以有效地进行传统轴承故障诊断。

    3、随着技术的发展,基于深度学习的轴承故障诊断方法受到了广泛关注。深度学习是一种强大的机器学习技术,通过多层神经网络结构和大规模数据训练,可以自动学习和提取数据中的特征,从而实现高度准确的故障诊断和预测。同时跨域诊断技术的发展对于轴承故障诊断领域带来了重要的影响和机会。它可以帮助解决在不同设备、不同工况或不同生产环境中进行轴承故障诊断时所面临的挑战。

    4、卷积神经网络(convolutional neural networks,cnn)是目前轴承故障方面的主要应用之一,基于cnn的轴承故障诊断方法,可以更好的关注到信号的局部特征,对于时间序列数据的局部模式识别非常有效。transformer是一种基于注意力机制的深度学习模型,用于处理序列数据,transformer模型通过引入自注意力机制,解决了这些问题,并提供并行计算能力,加速了训练过程,而基于transformer的轴承故障诊断方法,能够捕捉到时间序列数据中的全局依赖性和长程关系,这使得它在诊断复杂的轴承故障模式时具有优势。

    5、目前,轴承故障诊断中的一些常用方法还是存在诊断效果不理想的问题,源域和目标域之间的差异问题,领域的适应问题,以及如何更好的兼顾局部和全局特征之间的关系问题,这些都是需要解决的关键问题。


    技术实现思路

    1、本发明所要解决的技术问题在于针对上述现有技术中的不足,提出了一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法,利用采集的训练集对初始建立的神经网络模型进行训练,获取待诊断的轴承振动数据集,根据不同的运行工况设计迁移学习,将待诊断的轴承振动数据集输入到经过训练的轴承故障诊断神经网络模型架构中获得轴承故障诊断结果。

    2、为达到上述目的,本发明的技术解决方案是:

    3、一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法,具体包括以下步骤:

    4、步骤一、获取轴承原始振动数据集,对于每个迁移学习任务,将源域(sd)的数据集划分为训练集和验证集,目标域(td)作为迁移验证集;

    5、步骤二、将transformer和cnn模型相结合,提出了一种名为uniformer的模型架构,它可以在效率和有效性之间取得更好的平衡,具体为:

    6、所述uniformer模型架构由三个核心模块组成,即动态位置嵌入(dpe),多头关系聚合器(mhra)和前馈网络(ffn);

    7、所述dpe通过扩展条件位置编码(cpe)进行设计,用于适应更长的信号长度和不同时间振动的编码位置;

    8、所述mhra中提出了一种创新的relationship aggregator(ra),用于在紧凑的transformer框架中无缝地集成了卷积和自我关注;

    9、所述ffn的作用是最后附加一个由两个线性层组成的ffn来分别增强每个标记,完成一个uniformer模块的搭建;

    10、所述uniformer模型架构和传统的transformer之间存在的主要区别在于本发明中关系聚合器的设计,具体为:

    11、所述关系聚合器不是在所有层都使用自我注意机制,而是分别处理冗余和依赖性:在浅层中,该聚合器通过一个小的可学习参数矩阵来学习局部关系,在深层中,该聚合器通过相似性来比较学习全局关系;

    12、步骤三、分层叠加uniformer模块构建神经网络;

    13、步骤四、利用训练集训练步骤三构建的uniformer神经网络模型架构;

    14、步骤五、通过源域的数据集训练过的模型迁移到目标域上,对目标域进行故障诊断,并且利用jmmd算法缩小源域和目标域之间的分布差异。

    15、进一步地,所述步骤一包括以下步骤:

    16、首先,通过轴承试验台提取参数采集轴承原始振动数据集,获得若干样本;

    17、然后,将样本划分为训练集和验证集,并分别设定类别标签。

    18、进一步地,所述步骤二的三个关键组件为:

    19、x=dpe(xin)+xin   (1)

    20、y=mhz(norm(x))+x   (2)

    21、z=ffn(norm(y))+y   (3)

    22、其中,公式1是引入dpe,将位置信息动态集成到每个令牌中,公式2是利用mhra将每个令牌与其相应的上下文令牌合并,公式3是附加一个由两个线性层组成的ffn,以单独增强每个令牌。

    23、进一步地,分别设计uniformer模型架构的三个核心模块:

    24、所述步骤二中mhra的设计,通过多头融合的方式进行令牌关系学习,如下式:

    25、

    26、

    27、其中an∈rt×h×w和xj指的是中的任何相邻标记,(i-j)指的是标记i和j之间的相对位置;

    28、

    29、其中xj表示全局上下文中的任何标记,维度为t×w,而qn(·)和kn(·)表示两个独立的线性变换。

    30、进一步地,所述步骤二中dpe的设计,如下式:

    31、dpe(xin)=dwconv(xin)   (7)

    32、其中,其中dwconv表示具有零填充的简单深度卷积。

    33、进一步地,添加具有两个线性层的ffn以逐点增强每个标记。

    34、进一步地,所述步骤三中jmmd的设计,如下式:

    35、

    36、

    37、其中,ns和nt分别代表sd和td的样本量;

    38、

    39、

    40、其中,ks和kt表示内核矩阵;

    41、

    42、其中,公式12表示jmmd算法通过计算差分矩阵的frobenius范数来测量sd和td均值之间的差值。

    43、本发明的有益效果为:

    44、本发明的目的在于提供一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法,解决源域和目标域之间的差异问题,以及如何更好地兼顾局部和全局特征之间的关系问题,从而保证故障诊断方法的准确率和稳定性。本发明提出的uniformer方法结合了cnn和transformer网络模型,更好地捕捉局部和全局特征之间的关系,进一步提高了无监督跨域轴承诊断模型的性能;多头关系聚合器是针对浅层和深层设计的,这种设计不仅减少了计算负担,而且促进了全局关系的建立;以分层的方式逐步整合uniformer模块来构建模型,采用jmmd算法缩小源域和目标域之间的差距,提高了跨域轴承故障诊断效率和准确性;通过采用该神经网络架构,实时、高效、准确的诊断轴承故障类型,及时采取相应的维修和保养措施,提高旋转机械的可靠性和安全性,降低运维成本。


    技术特征:

    1.一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法,其特征在于所述方法具体过程为:获取待诊断的轴承振动数据集,根据不同的运行工况设计迁移学习,将待诊断的轴承振动数据集输入到轴承故障诊断模型架构中获得轴承故障诊断结果;

    2.根据权利要求1所述的一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法,其特征在于:所述步骤一包括以下步骤:

    3.根据权利要求1所述的一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法,其特征在于:所述步骤三中的三个关键组件为:

    4.根据权利要求1所述的一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法,其特征在于:所述步骤三中mhra通过多头融合进行令牌关系学习:

    5.根据权利要求1所述的一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法,其特征在于:所述步骤三中dpe的设计:

    6.根据权利要求1所述的一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法,其特征在于:所述步骤三中jmmd的设计:

    7.所述的一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法,其特征在于:其核心在于uniformer模型的搭建,以及三个关键组件dpe、mhra和ffn的嵌入和利用jmmd算法弥补源域和目标域间隙。

    8.一种电子设备,其特征在于:所述电子设备用于实现权利要求1-7任一项所述的一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法;


    技术总结
    本发明公开了一种将卷积与自注意力综合在迁移学习中的轴承故障诊断方法,其核心是提出了一个名为UniFormer的模型架构,由三个核心模块组成,即动态位置嵌入(DPE)、多头关系聚合器(MHRA)和前馈网络(FFN),它结合了Transformer和CNN模型的优点。具体来说,首先,通过扩展条件位置编码(CPE)设计DPE,其次在UniFormer模型中设计了具有不同浅层和深层结构的多头关系聚合器,浅层聚合器使用一个小的可学习矩阵来学习局部关系,深层聚合器通过比较来学习全局关系;随后由两个线性层组成的FFN来分别增强每个标记,完成一个UniFormer模块的搭建;再次,以分层的方式逐步整合UniFormer模块来构建模型;最后,将最初在源域(SD)训练的模型应用到目标域(TD)进行故障诊断,并且采用JMMD(Joint Maximum Mean Discrepancy)方法来缩小SD与TD之间的分布差异,弥补源域和目标域的间隙,提高跨域轴承故障诊断的准确性。

    技术研发人员:李学艺,蒋恩发,苏凯宇,李岱优,解志杰
    受保护的技术使用者:东北林业大学
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-97617.html

    最新回复(0)