本发明涉及图像识别技术领域,尤其是一种船只水尺定位方法。
背景技术:
目前散装货运船只货物交付以水尺计量方式进行贸易结算。水尺计量是以船四周均匀分布的6个刻度尺为依据,取其平均值计算得到的结果,以这样的方式对船的毛重和皮重两个状态分别进行测量、计算,其差值为货物的重量。水尺测量虽然直观,但受江面波浪和人的目测等因素的影响,往往导致测量结果误差大,容易在结算过程有失公允。另外,在整个测量过程中,基本上依赖人工测量,现场测量和计算一般需要近3个小时,效率低影响卸船时间。
采用计算机图像识别技术,处理手机拍摄的视频数据获得水尺读值能够减少人工目测的误差。在水尺计量过程中包括水尺定位、水面分界线定位、水尺读值、装卸量计算四个主要过程,水尺是指印制在船只上用于标定船只吃水深度的计量刻度,水尺定位就是利用视频图像识别技术排除各类干扰因素识别出图像中船只水尺图像区域,本专利主要是实现了船只水尺计量中关键步骤水尺定位的算法。
图像识别技术的水尺定位主要受以下因素困扰:
1.散装货船外形、船体颜色多样,船只水尺划定标准多样(连续线条状、不连续线条),水尺周围常印有其他标志符干扰水尺识别,需要解决不同类型船只的水尺位置问题;
2.受现场拍摄条件影响,水尺在视频图像中存在倾斜、畸变、水尺上下比例严重失调等问题;
3.由于船泊靠港停靠时无法做到精准,无法安装固定摄像投,采用了移动便携终端进行拍摄,水尺定位需要解决2-20米间距视频水尺定位问题;
4.后尺测量(空载状态),船只底部水尺常锈蚀不清问题。
技术实现要素:
本发明的目的是提供了一种安全、可靠的船只水尺定位方法。
本发明解决上述技术问题采用的技术方案为:一种船只水尺定位方法,包括以下步骤:
步骤1,应用边缘检测技术确定船体区域;
步骤2,应用区域快速搜素算法,对符合色彩、大小、长宽比的兴趣区进行标记;
步骤3,测量兴趣区字符椭圆属性初步判定字符的大小、倾斜、畸变度等特征;
步骤4,基于卷积神经网络的学习框架及印刷体书记和字符库的识别;
步骤5,对已识别出的兴趣区域进行关联性检测,首先对字符有序排列,参照水尺相似矩阵权值表,构成多个水尺对象集合,计算水尺对象符合水尺特征相识度,输出相识度最高的水尺对象集合。
进一步,所述卷积神经网络输入是移动终端拍摄的视频图像、水尺所属位置;算法的输出是水尺区域图像、水尺对象集合。
进一步,所述卷积神经网络结构为,包括三层,卷积层一、第一层池化层一和归一化层一,卷积层一的卷积核大小为5×5,步长为4,共155个卷积核;卷积层二和归一化层二,卷积层二的卷积核大小为4×4,步长为3,共158个卷积核;池化层三和归一化层三,卷积层三的卷积核大小为3×3,步长为2,共144个卷积核;分类器采用softmax分类。
本发明与现有技术相比的优点在于:水尺定位是船舶水尺测量的关键技术,本算法解决了船只水尺视频图像严重倾斜、严重畸变、视频拍摄距离1-20米间的自由拍摄情况下的水尺定位问题,为水尺测量提供了基础。
附图说明
图1为本发明方法流程图。
具体实施方式
下面结合附图以及具体实施方式进一步说明本发明。
如图1所示,本发明的目的是提供了一种安全、可靠的船只水尺定位方法。本发明解决上述技术问题采用的技术方案为:该算法基于卷积神经网络的学习框架及印刷体书记和字符库的水尺数值识别,应用了边缘检测、区域快速搜索、水平与垂直投影兴趣区域分割技术,提出了字符区域相关性检测技术实现快速定位水尺区域。
水尺定位算法的定位流程为a边缘检测->b字符区域快速搜索->锈蚀区域字符补充搜索->c字符区域倾斜椭圆算法->d字符识别->e字符区域相关性检测->f水尺位置确认;
水尺定位算法的输入是移动终端拍摄的视频图像、水尺所属位置;
水尺定位算法的输出是水尺区域图像、水尺对象集合a(一种链表化字符对象集合,字符对象的属性包括文本区域、区域图像、文本椭圆属性、左关联字符对象、右关联字符对象、上关联字符对象、下关联字符对象、字符识别精确度、字符识别值、临接对象距离);
本算法一是应用边缘检测技术确定船体区域,二是应用区域快速搜素算法,对符合色彩、大小、长宽比的兴趣区进行标记(锈蚀区域字符补充搜索是基于已知水面分界线进行的),三是测量兴趣区字符椭圆属性初步判定字符的大小、倾斜、畸变度等特征,四是基于卷积神经网络的学习框架及印刷体书记和字符库的识别,五是对已识别出的兴趣区域进行关联性检测,首先对字符有序排列,参照水尺相似矩阵权值表m(邻接字符间大小比、邻接间距、字符倾斜度、邻接字符间距与字符大小横向比、邻接字符间距与字符大小纵向比、邻接字符横向比、邻接纵向比)构成多个水尺对象集合(链表化字符对象集合),计算水尺对象符合水尺特征相识度,输出相识度最高的水尺对象集合a。
本发明的水尺定位是船舶水尺测量的关键技术,本算法解决了船只水尺视频图像严重倾斜、严重畸变、视频拍摄距离1-20米间的自由拍摄情况下的水尺定位问题,为水尺测量提供了基础。
本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
1.一种船只水尺定位方法,其特征在于,包括以下步骤:
步骤1,应用边缘检测技术确定船体区域;
步骤2,应用区域快速搜素算法,对符合色彩、大小、长宽比的兴趣区进行标记;
步骤3,测量兴趣区字符椭圆属性初步判定字符的大小、倾斜、畸变度等特征;
步骤4,基于卷积神经网络的学习框架及印刷体书记和字符库的识别;
步骤5,对已识别出的兴趣区域进行关联性检测,首先对字符有序排列,参照水尺相似矩阵权值表,构成多个水尺对象集合,计算水尺对象符合水尺特征相识度,输出相识度最高的水尺对象集合。
2.根据权利要求1所述的一种船只水尺定位方法,其特征在于,所述卷积神经网络输入是移动终端拍摄的视频图像、水尺所属位置;算法的输出是水尺区域图像、水尺对象集合。
3.根据权利要求2所述的一种船只水尺定位方法,其特征在于,所述卷积神经网络结构为,包括三层,卷积层一、第一层池化层一和归一化层一,卷积层一的卷积核大小为5×5,步长为4,共155个卷积核;卷积层二和归一化层二,卷积层二的卷积核大小为4×4,步长为3,共158个卷积核;池化层三和归一化层三,卷积层三的卷积核大小为3×3,步长为2,共144个卷积核;分类器采用softmax分类。
技术总结