点击下方卡片,关注「AI视界引擎」公众号
( 添加时备注:方向+学校/公司+昵称/姓名 )
感应电机(IMs)在工业和日常生活中不可或缺,但它们容易受到各种故障的影响,这些故障可能导致过热、能源浪费和服务中断。早期故障检测对于保护电机和延长其使用寿命至关重要。本文提出了一种将BYOL与CNNs相结合的混合方法,用于对感应电机的 Heatmap 像进行分类以实现故障检测。
本工作中使用的热数据集包括电机的不同运行状态,如正常运行、过载和故障状态。作者为BYOL技术采用了多种深度学习(DL)模型,包括流行的架构如ResNet-50、DenseNet-121、DenseNet169、EfficientNetB0、VGG16和MobileNetV2。
此外,作者引入了一个名为BYOL-IMNet的新型高性能轻量级CNN模型,该模型包含四个专为 Heatmap 像故障分类而定制的自定义设计模块。作者的实验结果表明,所提出的BYOL-IMNet实现了99.89%的测试准确率和每张图像5.7毫秒的推理时间,优于最先进的模型。
这项研究突显了CNNBYOL混合方法在提高感应电机故障检测准确性方面的卓越性能,为工业环境中的在线监测提供了一种稳健的方法论。
unsetunset1 引言unsetunset
旋转机器,如感应电机(IMs),在过去的十年中在工业部门的发展中发挥了关键作用。感应电机的高效率使制造业、交通运输和纺织业等行业受益[1]。然而,感应电机通常在恶劣条件下运行,由于运行时间长、电气和机械应力、过载以及材料磨损/不平衡等因素,导致过早退化和故障。为解决这些问题,已开发出监测系统来检测和防止资源浪费或损坏[2]。及时检测异常和故障,如短路、转子和定子电气故障,可以延长电机的使用寿命,提高效率,并减少停机时间。自监督学习技术,如卷积神经网络(CNNs)[3, 4]和Bootstrap Your Own Latent(BYOL)[5],已应用于航空航天领域。BYOL消除了训练过程中对负样本的需求,使模型能够仅使用无标签数据进行高效训练。这种方法通过从无标签数据中学习判别性特征,并根据特定任务需求进行微调,在提高图像分类任务的模型性能方面显示出潜力。在本文中,作者提出将CNNs与BYOL相结合,开发一种混合方法来对感应电机的 Heatmap 像进行分类。通过利用深度CNNs和BYOL的自监督学习技术,作者的目标是实现更好的分类准确性,并减少对标签数据的依赖。这种方法在工业监测中特别有价值,因为在工业监测中,标签数据通常稀缺,但高精度对于有效的维护和缺陷检测至关重要。
本文的主要贡献如下:
基于 Heatmap 像的故障分类轻量级CNN模型:作者提出了一个基于CNN的轻量级模型BYOL-IMNet,专为使用 Heatmap 像对感应电机进行故障分类而设计。尽管体积紧凑,该模型的性能优于预训练模型。该模型仅有0.5276百万参数,压缩文件大小为2.01MB,非常适合在计算资源有限的工业场景中部署。该模型具有四个自定义设计的BYOL块,可增强特征学习和故障分类,以最小的计算成本提高其检测与电机故障相对应的微小温度变化的能力。
新的BYOL适应工业故障检测框架:本文还介绍了一种新的BYOL适应框架,用于IDIM问题中的工业故障检测。它比较了多种深度学习架构,如ResNet50、VGG16和EfficientNetB0,所有这些架构都使用了BYOL训练策略。BYOL方法通过学习更具区分性的特征,显著提高了故障检测性能,即使在有限 Token 的 Heatmap 像数据情况下也是如此。这项比较研究为实时工业故障检测提供了关于最合适的DL模型和设置的有价值的见解。
unsetunset2 文献综述unsetunset
这篇综述重点关注2023年至2025年间深度学习[6-8]在 Heatmap 像分类领域的最新进展。它回顾了关键贡献、方法和结果,提供了该领域研究现状的概述。Wang等人[9]通过引入特定于 Heatmap 像的预处理阶段来增强温度梯度特征,从而修改了Vision Transformer (ViT)架构以用于 Heatmap 像分类。他们使用具有较小 Patch 大小的分层transformer来提高热模式的细粒度,在FLIR热数据集上以
的准确率优于传统CNN[10],比CNN高出
。该模型在低光条件下也表现良好,而基于CNN的模型性能下降。由Rodriguez等人[11]提出的ThermalNet是一种专为边缘热相机设计的高效CNN模型。
通过采用深度可分离卷积和温度感知归一化层,ThermalNet在FLIR数据集上达到了
的准确率,参数比大型模型少
,推理速度快
。它还能在嵌入式热相机系统上高效运行,在受限设备上提供每秒24帧的实时检测。Patel等人[12]引入了一种结合 Heatmap 像和可见光谱图像的多模态融合方法。他们的模型为每种模态使用并行处理流,并采用交叉注意力机制根据上下文自适应地重新加权信息。这种方法在自定义工业监控数据集上达到了
的准确率,比仅使用 Heatmap 像的技术高出
,并在蒸汽、烟雾和波动的环境温度等具有挑战性的条件下展示了93%的准确率。
unsetunset3 Datasetunsetunset
在本研究中,作者利用文献[6]中介绍的数据集来开发所yinqin-CNN-BYOL。该数据集包含6,400张图像,每张图像大小为360
240,分布在11个状态中。这些状态包括正常条件、8种匝间故障(ITFs)、绕组和转子堵转故障的组合以及冷却风扇故障。该数据集相当平衡,没有显著的类别不平衡,因此没有应用处理类别不平衡的特定方法。训练和测试数据集都反映了这种平衡分布。为了确保深度学习模型的一致性和可重复性训练,本论文工作使用了一个稳定的自定义实验环境。所有实验都在一台配备Intel
Core
i5-13600K CPU、NVIDIA GeForce RTX 4090 GPU和128 GB DDR4 3200 MHz RAM的Windows 11(版本23H2)计算机上执行。模型使用CNN架构进行训练,该架构在其隐藏层中使用ReLU作为激活函数,在其输出层使用Softmax。损失函数为Sparse分类交叉熵,使用Adam优化器进行训练。数据集被划分为训练集(80%)、验证集(10%)和测试集(10%)。主要超参数为学习率(0.001)、批量大小(64)和输入图像大小(224
224)。为了调节过拟合,作者通过提前停止来控制正则化,并进行了最多100个周期的训练。
3.1 数据预处理
所谓预处理,作者指的是为将数据集输入到学习算法做准备而对其应用的转换[13]。在本研究中,引入了数据增强方法来提高模型的泛化能力并防止过拟合。应用的增强技术包括20度的随机旋转、宽度和高度偏移最大为图像尺寸的
、剪切变换(0.2范围)和缩放(0.2范围)。应用了水平翻转,并使用"最近邻"填充模式来处理变换后的空白像素[14]。这些方法有助于人工扩大数据集,同时保持重要的图像属性。
3.2 提出的模型架构:BYOLIMNet
从图2可以看出,BYOL-IMNet模型由4个卷积块组成。每个块包含一个卷积层、一个maxpooling2D层和一个BatchNormalization层。其图像输入尺寸为224×224,通道数为3(R、G、B)。在模型末端,还有一个Globalaveragepooling层以及用于分类的FullyConnected层。
3.3 Bootstrap Your Own Latent (BYOL) 框架
使用BYOL进行ego监督预训练
BYOL是一种ego监督学习,其中模型学习在不使用标注样本的情况下生成数据的表示。这是通过对比学习过程完成的,模型致力于对齐同一图像的两个增强视图。主要思想是作者希望最大化"目标"表示(由缓慢更新的网络计算)和"在线"表示(使用作者的主网络计算)之间的相似性。yinqin-CNN-BYOL架构和常见的BYOL框架如图2和图3所示。
在线网络 作者将在线网络定义为一个可训练的网络,它从数据的增强视图中学习编码。该网络由一个编码器、一个投影头和一个预测器组成。编码器是一个CNN,它接收输入图像的特征表示。投影头是一个小型多层感知机(MLP),它将编码器的输出(特征向量)投影到更低维度。预测头是一个额外的MLP,它中介投影头的输出,并尝试预测目标网络在目标投影后的输出(特征)。在线网络的作用是从输入图像的增强视图(两个中的一个)生成特征向量和投影图,该视图中的投影可以被目标网络预测。
目标网络 目标网络与在线网络具有相同的架构,但其参数不同(表示为
)。它们被更新为 Token 为
的在线网络权重的指数移动平均(EMA)。这使得目标网络能够产生平稳且缓慢变化的表示,这些表示可以作为在线网络预测的目标。从数学上讲,目标网络权重在每个训练步骤后的更新规则如下:
其中
是一个衰减因子(通常接近1,例如0.99),它决定了 target network 权重变化的速度。Target network 不接收任何梯度,并在 online network 的训练过程中保持固定。
4.1 Data Augmentation
在每个训练步骤,从数据集
中选择一张图像
,并生成该图像的两个增强:
其中
和
分别表示从增强分布
和
中采样的不同增强函数。这些增强是关键,因为BYOL学习对这些增强不变的表示。
网络前向传播
在线网络接收增强视图
作为输入,并输出表示
,其中
是编码器。投影头
将表示
映射到投影空间,产生:
该投影是online network将尝试匹配target network投影的内容。
类似地,目标网络接收第二个增强视图
,产生一个表示
和一个投影:
4.2 目标投影预测与Loss Function
然后,在线网络通过应用预测器头
尝试从其自身的投影
预测目标投影
:
在线网络的目标是学习从其自身的投影
预测目标网络的投影
。BYOL的本质是在线网络和目标网络投影之间的相似性。这种相似性通常是cosine similarity,它比较投影的方向。具体而言,BYOL损失函数依赖于最小化在线网络投影与目标网络投影之间的余弦距离。这由下式给出:
其中 · 表示点积,
是向量
的 L2 范数。损失函数中的 cosine similarity 项是衡量两个投影向量对齐程度的指标。损失函数鼓励 online network 的投影变得与目标投影相似。请注意,两个投影
和
在计算相似度之前都进行了 L2-normalized,这意味着它们位于投影空间的单位球面上。这种归一化确保了训练专注于投影之间的角度相似性,而不是它们的大小。
4.3 训练步骤
在在线网络的训练过程中,损失函数相对于其权重θ的梯度被应用于该网络。这些梯度通过反向传播损失函数进行计算,然后作者使用诸如Adam之类的优化器来优化模型。目标网络的权重ξ在每一步训练后根据上述的指数移动平均规则进行更新。这种缓慢的更新过程可以使目标网络为正在训练的在线模型提供稳定可靠的目标。
4.4 使用监督学习的微调
然后,该模型通过BYOL预训练在下游监督任务(本例中为图像分类)上进行微调。微调利用 Token 数据来为任务微调学习到的表示。监督模型是一个标准的CNN分类器,具有与BYOL相同的架构。但在CNN之后有以下几层。GAP层在所有空间位置上聚合特征图:它执行平均池化操作以生成总结空间信息的向量表示。数学上,如果
是特征图,则GAP层的输出为:
其中
和
分别是特征图的高度和宽度。经过GAP后,输出通过密集层进行分类。最终输出层使用softmax激活函数来预测类别概率。
其中
和
是最终全连接层的权重和偏置。该模型通过交叉熵损失进行训练,交叉熵损失适用于多类分类任务。
unsetunset5 结果unsetunset
在本节中,作者比较了各种DL模型在热数据集上的性能,包括ResNet50、DenseNet121、VGG-16、DenseNet169、MobileNetV2、EfficientNetB0以及yinqin-CNN-BYOLBYOLIMNet。
5.1 结果:与State of the Art模型的性能比较
这些模型使用CNN-Byol模型进行训练,所有用于比较的测试模型都包含相同的训练和测试条件,因此它们可以以公平的方式进行比较,以了解准确性和泛化问题。这些实验的结果以及与标准模型(如ResNet50、DenseNet121、DenseNe169)和其他网络(如VGG-16、MobilenetV2、EfficientnetB0)的比较,与yinqin-CNN-BYOLBYOL-IMNet的对比呈现在表1中,表明它们在测试集上实现了超过99.89%的测试准确率。BYOL-IMNet的混淆矩阵如图(a)所示。混淆矩阵告诉作者,至少该模型没有做出任何错误的预测。图(b)显示了BYOL-IMNet的ROC曲线。AUC为1表示一个完美的分类器。这意味着该模型可以完美区分这两个类别;在分配任一类别时不会出错。
5.2 BYOL框架的消融研究
消融研究有助于展示每个组件,特别是BYOL框架,如何对模型的总体性能做出贡献。表3和表2中的消融研究突显了BYOL在各种架构中的优势。BYOL-IMNet模型相比非BYOL版本显示出
的准确率提升。传统架构如ResNet50、DenseNet121和EfficientNetB0在使用BYOL后也获得了
至
的准确率提升。此外,所有模型的精确率、召回率和F1分数的改进都证明了BYOL对模型性能的积极影响,增强了真正例的识别并减少了假正例。总体而言,BYOL框架有助于从 Heatmap 像中学习鲁棒特征,从而改善了感应电机的故障检测。
5.3
折交叉验证
为了全面验证所提出的BYOL-IMNet模型的泛化能力,对CNN-BYOL混合框架进行了5折交叉验证。在这种情况下,数据被分成五个等大小的分区,依次用于验证集,使用四个折进行训练。表4展示了结果,显示在所有五个折上表现一致,平均准确率为
,精确率为
,召回率为
,F1分数为
,以及AUC性能为
。各折之间的微小差异证明了模型具有稳定且高的泛化能力,并表明它适用于实际环境中的感应电机故障监测。
unsetunset6 结论unsetunset
在本研究中,作者展示了一种结合CNNs和BYOL的混合深度学习(DL)策略在利用 Heatmap 像进行感应电机(IMs)高效故障诊断方面的有效性。研究重点在于早期故障检测,这对于确保电机可靠性并防止工业环境中代价高昂的停机时间至关重要。作者在一个包含正常、过载和故障状态下电机 Heatmap 像的数据集上训练了多种DL模型。
新提出的BYOL-IMNet架构优于所有模型,达到了99.89%的高测试准确率。当与BYOL对比学习方法结合时,它还超越了流行的CNN模型,如ResNet-50、DenseNet121、DenseNet-69、VGG16Mobile、NetV2和EfficientNetB0。BYOL-IMNet采用四个专为故障识别定制的自定义块开发,被证明是一种用于检测电机故障的高效且有效的解决方案,特别适用于实时监控。
结果表明,BYOL和CNNs的结合提高了故障检测性能,同时实现了可扩展、资源高效的模型设计,这对工业应用是有益的。可靠且及时的电机状态分类可以改善维护决策,延长电机寿命,减少能源浪费,并降低灾难性故障的风险。
总体而言,这项研究丰富了工业电机监控中先进DL应用的工作体系,提供了一种强大且具有弹性的故障检测方法,适合集成到在线监控系统中。
unsetunset参考unsetunset
[1]. Hybrid CNN-BYOL Approach for Fault. Detection in Induction Motors Using Thermal Images
点击上方卡片,关注「AI视界引擎」公众号
