基于改进的深度学习的隧道渗水检测方法与流程

专利2022-07-08 110

本发明涉及图像检测方法，尤其是隧道渗水图像，具体涉及一种基于改进的深度学习的隧道渗水检测方法。

背景技术：

隧道渗水检测是对隧道衬砌表面渗水进行识别。及时检测出隧道渗水损伤，防止渗水损伤造成更大的损伤和威胁铁路线路的运营安全。目前，隧道渗水检测大多采用人工巡检的方式，人工方式会受到主观因素的影响，造成判别偏差，另外严重威胁巡检人员的安全。随着计算机视觉技术的发展，尤其深度学习技术的发展，基于深度学习的无损检测成为了国内外隧道病害检测的研究热点。

通过深度学习算法对隧道表面图像进行处理分析，得到包含渗水区域位置以及大小的标签图。标签图可以为隧道养护工作提供信息准确信息。目前基于深度学习方法的隧道渗水检测，大部分是应用现有的深度学习模型，通过深度学习模型隧道衬砌表面图像进行渗水检测。

深度学习包含多个卷积层，不同的卷积阶段得到不同语义信息的特征图，低级特征图包含更多的细节信息和位置信息，但其对噪声敏感；高级特征图包含更多的高级的语义信息，表现出更好的抗噪能力。将不同等级的特征图进行融合，融合后的特征图包含细节和位置信息，同时表现出很好的抗噪能力。深度学习通过数据自我训练获得了提取丰富特征的能力，但由于隧道衬砌表面的复杂性和渗水区域大小的多变性，造成其中也包含一些无用的特征图，这些不利于检测渗水区域完成准确的渗水识别。

技术实现要素：

本发明拟针对隧道衬砌表面图像特征，利用深度学习方法提取不同语义信息特征，同时采用注意力机制对特征图进行修正，利用不同语义信息特征融合，提供一种基于改进的深度学习的隧道渗水检测方法。

本发明采用如下技术方案：

一种基于改进的深度学习的隧道渗水检测方法，其包括如下步骤：

（1）基于残差网络的图像特征提取；

（2）注意力机制：在残差网络的每个阶段后加入一个注意力模块，将包含更多语义信息的特征图进行加强，抑制包含无用信息的特征图；

（3）将高级语义信息进行传播：采用自顶向下的方式，将高级语义信息传播到低阶特征图中；

（4）获得上下文信息：将不同尺度的特征图进行通道拼接，包含更多的渗水区域上下文信息，后面跟着一个通道注意力机制模块，对特征图进行修正；

（5）渗水预测：将经步骤（4）得到的修正后的特征图输入分类层中，进行图像像素点分类。

其中，所述步骤（1）为：将隧道衬砌图像输入到残差网络中，得到不同尺度的特征图。

其中，所述残差网络为resnet101。

其中，所述步骤（2）为：步骤（1）的残差网络中，在每两个阶段中间添加一个注意力机制模块，对步骤（1）得到的不同尺度的特征图进行修正。

其中，所述注意力机制模块包括：

（a）通道注意力修正：对输入图像进行全局最大池化和全局平均池化，得到不同的通道注意力向量，两个不同的通道注意力向量经过两个全连接层，得到两个通道注意力特征向量vm与va，将vm与va相加，然后将其送入sigmoid激活函数得到最终的通道注意力特征向量vc；将vc与输入特征图相乘；

（b）空间注意力修正：对输入图像进行全局最大池化和全局平均池化，得到不同的两个空间特征图，然后对两个空间特征图进行拼接，将其输入到一个7*7卷积层，后面跟着一个sigmoid激活函数得到最终的空间注意力特征图fc；将fc与输入特征图相乘；

（c）将步骤（a）与（b）通过串联方式对残差网络提取的特征进行修正：先对输入特征图进行通道注意力修正，然后对输入特征图进行通道注意力修正。

其中，所述步骤（3）中将高级语义信息自顶向下传播到低阶特征图中进行特征融合时，采用双线性内插的方法，当维度与尺寸大小都统一后，采用通道拼接的方式，最后通过3*3卷积实现最后的特征融合。

其中，所述步骤（4）为：首先对齐进行双线性插值法进行放大尺度，将其各自尺度调整到与输入隧道图像尺度一样的大小，然后将不同等级的特征图进行通道拼接，最后将通道拼接后的特征图输入通道注意力模块。

其中，所述步骤（5）为：步骤（4）得到的修正后的特征图与网络输入图像大小一致，然后将特征图输入到一个1*1卷积层中，最后得到的通道数为1，最后再经过一个sigmoid激活函数进行分类；得到最终的预测图p。

本发明的有益效果在于：本发明利用残差网络（resnet101）进行图像特征提取；然后将网络输出的不同尺度的特征图送入到注意力模块中，最后通过自顶向下的方式，将高阶特征图与低阶特征图进行融合，使得高级语义信息向低阶特征图传播，使得低阶特征图呈现更好的抗噪能力，最后将不同尺度的特征图进行通道拼接，通过注意力机制，实现准确的隧道渗水检测。

附图说明

图1为本发明的网络模型结构图。

具体实施方式

下面将结合附图1，对本申请的技术方案进行清楚、完整地描述。

步骤1：基于残差网络（resnet101）的图像特征提取方法。将隧道衬砌图像输入到残差网络中，得到不同尺度的特征图。

采用的深度学习模型为公开的resnet101模型，输入图像的尺度为1024*1024*3,构建隧道渗水图像训练集合，包括隧道渗水图像1000张和隧道非渗水图像1000张。最后选择800张渗水图像与800张非渗水图像进行训练，剩下的400张图像用于测试。利用resnet101网络进行图像特征提取。提取的特征图像为以下5种不同尺度的特征图，他们的维度分别为64，128，256，512和1024，尺度分别为输入图像的1/2，1/4，1/8，1/16和1/32。

步骤2：注意力机制，在残差网络（resnet101）的每个阶段后加入一个注意力模块，将包含更多语义信息的特征图进行加强，抑制包含无用信息的特征图（如图1所示）。

步骤1的resnet101网络，一共分为五个阶段，每个阶段包含多个卷积层与最大池化层，因此，不同的阶段得到不同尺度的图像特征，另外不同尺度的特征图也包含不同的语义信息。为了更好的提取特征图，在每两个阶段中间添加一个convolutionalblockattentionmodule（cbam）注意力机制模块。

cbam共分为三个部分：

（1）通道注意力修正。首先，对输入图像进行全局最大池化和全局平均池化，得到不同的通道注意力向量，尺度由h*w*c变为1*1*c，两个不同的通道注意力向量经过两个全连接层，得到两个通道注意力特征向量vm与va，将vm与va相加，然后将其送入sigmoid激活函数得到最终的通道注意力特征向量vc。通过vc与输入特征图相乘，提高包含水浸语义信息的特征图的响应，降低不包含水浸语义信息的特征图的响应。

（2）空间注意力修正。首先，对输入图像进行全局最大池化和全局平均池化，得到不同的两个空间特征图，尺度由h*w*c变为h*w*1，然后对两个空间特征图进行拼接，得到尺度为h*w*2的空间特征图，将其输入到一个7*7卷积层，可以包含更多感受野的语义信息，得到更好的空间特征图，后面跟着一个sigmoid激活函数得到最终的空间注意力特征图fc。通过fc与输入特征图相乘，得到包含水浸语义信息空间位置的响应，降低噪声区域的响应。

（3）最后将通道注意力与空间注意力进行串行相连，先对输入特征图进行通道注意力修正，这样可以降低无用特征图的影响，然后对输入特征图进行通道注意力修正，因为经过了通道注意力修正，所以可以更好的提取空间注意力特征图，以对特征图进行更好的空间维度修正。

步骤3：将高级语义信息进行传播，采用自顶向下的方式，将高级语义信息传播到低阶特征图中。

通过步骤1与步骤2总共得到五个不同尺寸大小的图像特征图，分别为c1，c2，c3，c4，c5。尺度依次减小，但抗噪能力依次增加，提取语义信息能力依次增加。进行特征融合时，首先进行自顶向下的特征融合，选择c5通过双线性插值法将尺度放大2倍，然后通过一个3*3卷积层进行降维操作，记为f5，将f5与c4通道拼接，最后通过一个一个3*3卷积层进行特征融合，得到f4。然后依次融合c3，c2，c1，得到融合特征图f3，f2，f1。在进行特征融合时，首先要实现维度的统一，还要实现尺度的统一，实现尺度的统一是采用双线性内插的方法；当维度与尺寸大小都统一后，采用通道拼接的方式，最后通过3*3卷积实现最后的特征融合。

步骤4：获得上下文信息，将不同尺度的特征图进行通道拼接，包含更多的渗水区域上下文信息，后面跟着一个通道注意力机制模块，对特征图进行修正。

通过以上步骤得到特征图f4，f3，f2，f1。尺度不一样，另外包含的语义信息也不一样，为了获得不同上下文语义信息，需要进行统一尺寸以融合上下文语义信息。将c5，f4，f3，f2进行双线性插值将尺度恢复到与原图一样的尺度。将放大后的c5，f4，f3，f2与f1进行通道拼接，得到包含更多上下文语义信息的特征图ff，最后将ff输入一个channelattentionmodule（通道注意力模块），首先将ff进行全局最大池化操作，得到压缩后的特征向量，然后经过两个全连接层，得到最终的通道修正向量v，最后v与输入特征图进行相乘，使突出更重要的特征通道。

进行了自顶向下的特征融合后，低阶特征图保留细节与位置信息之外，同时包含了高级语音信息，而高阶特征图虽然细节信息丢失，但其对大范围的渗水区域提取了更好的语义信息，因此将不同等级的特征图进行融合，首先对齐进行双线性插值法进行放大尺度，将其各自尺度调整到与输入隧道图像尺度一样的大小，然后将不同等级的特征图进行通道拼接，实现保留更多的上下文语义信息。最后在通过一个squeeze-and-excitation模块，实现对不同尺度渗水区域的检测。

步骤5：渗水预测，将修正后的特征图输入分类层中，进行图像像素点分类。

经过以上步骤得到最终与网络输入图像大小一致的特征图，然后将特征图输入到一个1*1卷积层中，最后得到的通道数为1，最后再进过一个sigmoid激活函数进行分类，最终输出为与输入图像尺度相同的预测图p。

以上实施方式仅为本发明的优选实施例，而并非本发明可行实施的穷举。对于本领域一般技术人员而言，在不背离本发明原理和精神的前提下对其所做出的任何显而易见的改动，都应当被认为包含在本发明的权利要求保护范围之内。

技术特征：

1.一种基于改进的深度学习的隧道渗水检测方法，其特征在于，其包括如下步骤：

（1）基于残差网络的图像特征提取；

（2）注意力机制：在残差网络的每个阶段后加入一个注意力模块，将包含更多语义信息的特征图进行加强，抑制包含无用信息的特征图；

（3）将高级语义信息进行传播：采用自顶向下的方式，将高级语义信息传播到低阶特征图中；

（4）获得上下文信息：将不同尺度的特征图进行通道拼接，包含更多的渗水区域上下文信息，后面跟着一个通道注意力机制模块，对特征图进行修正；

（5）渗水预测：将经步骤（4）得到的修正后的特征图输入分类层中，进行图像像素点分类。

2.根据权利要求1所述的基于改进的深度学习的隧道渗水检测方法，其特征在于，所述步骤（1）为：将隧道衬砌图像输入到残差网络中，得到不同尺度的特征图。

3.根据权利要求2所述的基于改进的深度学习的隧道渗水检测方法，其特征在于，所述残差网络为resnet101。

4.根据权利要求3所述的基于改进的深度学习的隧道渗水检测方法，其特征在于，所述步骤（2）为：步骤（1）的残差网络中，在每两个阶段中间添加一个注意力机制模块，对步骤（1）得到的不同尺度的特征图进行修正。

5.根据权利要求4所述的基于改进的深度学习的隧道渗水检测方法，其特征在于，所述注意力机制模块包括：

6.根据权利要求5所述的基于改进的深度学习的隧道渗水检测方法，其特征在于，所述步骤（3）中将高级语义信息自顶向下传播到低阶特征图中进行特征融合时，采用双线性内插的方法，当维度与尺寸大小都统一后，采用通道拼接的方式，最后通过3*3卷积实现最后的特征融合。

7.根据权利要求6所述的基于改进的深度学习的隧道渗水检测方法，其特征在于，所述步骤（4）为：首先对齐进行双线性插值法进行放大尺度，将其各自尺度调整到与输入隧道图像尺度一样的大小，然后将不同等级的特征图进行通道拼接，最后将通道拼接后的特征图输入通道注意力模块。

8.根据权利要求7所述的基于改进的深度学习的隧道渗水检测方法，其特征在于，所述步骤（5）为：步骤（4）得到的修正后的特征图与网络输入图像大小一致，然后将特征图输入到一个1*1卷积层中，最后得到的通道数为1，最后再经过一个sigmoid激活函数进行分类；得到最终的预测图p。

技术总结
本发明涉及一种基于改进的深度学习的隧道渗水检测方法，其包括如下步骤：（1）基于残差网络的图像特征提取；（2）注意力机制：在残差网络的每个阶段后加入一个注意力模块，将包含更多语义信息的特征图进行加强，抑制包含无用信息的特征图；（3）将高级语义信息进行传播：采用自顶向下的方式，将高级语义信息传播到低阶特征图中；（4）获得上下文信息：将不同尺度的特征图进行通道拼接，后面跟着一个通道注意力机制模块，对特征图进行修正；（5）渗水预测。本发明针对隧道衬砌表面图像特征，利用深度学习方法提取不同语义信息特征，同时采用注意力机制对特征图进行修正，利用不同语义信息特征融合，使得低阶特征图呈现更好的抗噪能力，实现准确的隧道渗水检测。

技术研发人员：尚艳亮;耿鹏;马洪涛;吴薇娜;党宏倩
受保护的技术使用者：石家庄铁路职业技术学院;石家庄铁道大学
技术研发日：2020.11.23
技术公布日：2021.03.12

转载请注明原文地址:https://wp.8miu.com/read-16538.html

专利

最新回复(0)