本发明涉及图像识别技术领域,尤其涉及一种车位号识别方法、装置、电子设备及存储介质。
背景技术:
自动泊车是指汽车通过自动泊车系统自动泊车入位,不需要人工控制。
不同的自动泊车系统采用不同的方法来检测汽车周围的物体。有些在汽车前后保险杠四周装上了感应器,它们既可以充当发送器,也可以充当接收器。这些感应器会发送信号,当信号碰到车身周边的障碍物时会反射回来。然后,车上的计算机会利用其接收信号所需的时间来确定障碍物的位置。其他一些系统则使用安装在保险杠上的摄像头或雷达来检测障碍物。但最终结果都是一样的:汽车会检测到已停好的车辆、停车位的大小以及与路边的距离,然后将车子驶入停车位。
车位号确定以及与车位之间的匹配是无人驾驶车辆在泊车环境下,进行自动泊车的基础,现有技术对车位号的识别容易出现字符识别出错,导致车位号识别错误的问题。
技术实现要素:
本发明提供了一种车位号识别方法、装置、电子设备及存储介质,用于解决或部分解决现有技术对车位号的识别容易出现字符识别出错,导致车位号识别错误的技术问题。
本发明提供的一种车位号识别方法,应用于车载终端,所述车载终端与安装在车辆上的图像采集装置通信;所述方法包括:
接收所述图像采集装置采集的车位号图像;
将所述车位号图像输入预设深度学习网络中,得到输出特征集;所述输出特征集包括背景通道输出特征;
在所述背景通道输出特征中提取点列表;
依次获取所述点列表中各像素点的位置信息;
根据所述位置信息和所述输出特征集,确定所述点列表中各像素点的字符类别;
根据所述点列表中各像素点的所述字符类别和所述位置信息,确定车位号。
可选地,所述将所述车位号图像输入预设深度学习网络中,得到输出特征集的步骤,包括:
确定所述车位号图像的字符类别通道数n,并根据所述图片通道数确定输出维度;
将所述车位号图像输入预设深度学习网络中,得到与所述输出维度对应的输出特征集;
其中,所述输出维度包括n个字符类别通道和1个背景通道。
可选地,所述在所述背景通道输出特征中提取点列表的步骤,包括:
采用预设8邻域极值法,在所述背景通道输出特征中提取点列表。
可选地,所述根据所述位置信息和所述输出特征集,确定所述点列表中各像素点的字符类别的步骤,包括:
基于所述位置信息,在所述输出特征集中依次匹配各个所述像素点在各个所述字符类别通道输出的置信度;
将输出的置信度最大的字符类别通道对应的字符类别确定为所述像素点的字符类别。
本发明还提供了一种车位号识别装置,应用于车载终端,所述车载终端与安装在车辆上的图像采集装置通信;所述装置包括:
车位号图像接收模块,用于接收所述图像采集装置采集的车位号图像;
输出特征集生成模块,用于将所述车位号图像输入预设深度学习网络中,得到输出特征集;所述输出特征集包括背景通道输出特征;
点列表提取模块,用于在所述背景通道输出特征中提取点列表;
位置信息获取模块,用于依次获取所述点列表中各像素点的位置信息;
字符类别确定模块,用于根据所述位置信息和所述输出特征集,确定所述点列表中各像素点的字符类别;
车位号确定模块,用于根据所述点列表中各像素点的所述字符类别和所述位置信息,确定车位号。
可选地,所述输出特征集生成模块,包括:
输出维度确定子模块,用于确定所述车位号图像的字符类别通道数n,并根据所述图片通道数确定输出维度;
输出特征集生成子模块,用于将所述车位号图像输入预设深度学习网络中,得到与所述输出维度对应的输出特征集;
其中,所述输出维度包括n个字符类别通道和1个背景通道。
可选地,所述点列表提取模块,包括:
点列表提取子模块,用于采用预设8邻域极值法,在所述背景通道输出特征中提取点列表。
可选地,所述字符类别确定模块,包括:
置信度匹配子模块,用于基于所述位置信息,在所述输出特征集中依次匹配各个所述像素点在各个所述字符类别通道输出的置信度;
字符类别确定子模块,用于将输出的置信度最大的字符类别通道对应的字符类别确定为所述像素点的字符类别。
本发明还提供了一种电子设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行如上任一项所述的车位号识别方法。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行如上任一项所述的车位号识别方法。
从以上技术方案可以看出,本发明具有以下优点:本发明通过接收图像采集装置采集的车位号图像,并将车位号图像输入预设的深度学习网络中,得到输出特征集,根据输出特征集中携带的背景通道输出特征,提取可能为车位号字符的像素点,生成点列表;通过获取点列表中每个像素点的位置信息,以根据位置信息在确定各个像素点的字符类别,从而完成对车位号的识别。本发明通过对背景通道中的像素点进行分析,从而提取可能为车位号字符的点列表,通过对点列表中各像素点的位置信息进行识别,结合输出特征集,可以分析出点列表中每个像素点的字符类别,从而确定车位号。减少了车位号字符识别出错的概率,提高了车位识别准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种车位号识别方法的步骤流程图;
图2为本发明另一实施例提供的一种车位号识别方法的步骤流程图;
图3为本发明实施例提供的一种车位号识别装置的结构框图。
具体实施方式
本发明实施例提供了一种车位号识别方法、装置、电子设备及存储介质,用于解决或部分解决现有技术对车位号的识别容易出现字符识别出错,导致车位号识别错误的技术问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,图1为本发明实施例提供的一种车位号识别方法的步骤流程图。
本发明提供的一种车位号识别方法,应用于车载终端,车载终端与安装在车辆上的图像采集装置通信。
其中,车载终端是车辆监控管理系统的前端设备,也可以叫做车辆调度监控终端。其集成了定位,通信、汽车行驶记录仪等多项功能;具有强大的业务调度功能和数据处理能力。本发明主要应用了车载终端的数据处理能力。
其中,图像采集装置安装在车身上,用于采集车位号图像,其可以为摄像头、扫描仪等设备,可以安装在车身两侧,也可以安装于车顶等,本领域技术人员可以根据需要选择图像采集装置的种类和安装位置,本发明实施例对图像采集装置的种类和安装位置不作具体限定。
方法具体可以包括以下步骤:
步骤101,接收图像采集装置采集的车位号图像;
在本发明实施例中,车辆在行驶到停车区域时,可以采集停车区域内停车位的图像信息,该图像信息中包含了停车位的车位号。
需要说明的是,车位号图像中,可以包括一个车位号的信息,也可以包括多个车位号的信息,本发明实施例对车位号图像中的车位号数量不作具体限定。
步骤102,将车位号图像输入预设深度学习网络中,得到输出特征集;输出特征集包括背景通道输出特征;
在本发明实施例中,可以通过深度学习网络对车位号图像进行分析,以获取输出特征集。其中,该深度学习网络包括多个字符类别输出通道和一个背景通道。分别用于输出字符类别特征和点特征。
步骤103,在背景通道输出特征中提取点列表;
在本发明实施例中,背景通道的特征层中记录了从车位号图像中采集的各个像素点的信息,根据对点特征的位置关系的判断,可以大致推测出哪些像素点可能为车位号字符所对应的像素点。将这些可能为车位号字符对应的像素点提取出来,可得到表征车位号字符信息的点列表。
步骤104,依次获取点列表中各像素点的位置信息;
在从背景通道的特征层中提取了点列表后,依次从点列表中提取各像素点的位置信息,用于根据各像素点的位置信息之间的相关性,来进一步筛选可能为车位号字符的像素点。
步骤105,根据位置信息和输出特征集,确定点列表中各像素点的字符类别;
根据点列表中像素点的位置信息,结合字符类别通道输出的特征信息,可以确定每个点在不同字符类别通道中的输出结果,进而根据该输出结果,可以分析得到该点的字符类别。
步骤106,根据点列表中各像素点的字符类别和位置信息,确定车位号。
在确定了点列表中各像素点的字符类别和位置信息后,可以根据位置信息排列各像素点的字符类别,得到完整的车位号。该车位号可用于引导车辆停车。
本发明通过接收图像采集装置采集的车位号图像,并将车位号图像输入预设的深度学习网络中,得到输出特征集,根据输出特征集中携带的背景通道输出特征,提取可能为车位号字符的像素点,生成点列表;通过获取点列表中每个像素点的位置信息,以根据位置信息在确定各个像素点的字符类别,从而完成对车位号的识别。本发明通过对背景通道中的像素点进行分析,从而提取可能为车位号字符的点列表,通过对点列表中各像素点的位置信息进行识别,结合输出特征集,可以分析出点列表中每个像素点的字符类别,从而确定车位号。减少了车位号字符识别出错的概率,提高了车位识别准确率。
请参阅图2,图2为本发明另一实施例提供的一种车位号识别方法的步骤流程图。该方法具体可以包括以下步骤:
步骤201,接收图像采集装置采集的车位号图像;
步骤201与步骤101类似,具体内容可参见步骤101,此处不再赘述。
步骤202,确定车位号图像的图片通道数n,并根据图片通道数确定输出维度;
步骤203,将车位号图像输入预设深度学习网络中,得到与输出维度对应的输出特征集;其中,输出维度包括n个字符类别通道和1个背景通道;
在本发明实施例中,根据车位号的构成元素,可以为深度学习网络设置字符类别通道的数量。该字符类别通道可设置为输出字符的置信度。在一个示例中,假设车位号是以纯数字的形式构成,可字符类别通道的数量可以设置为10个,分别用于输出字符0-9的置信度。在另一个示例中,假设车位号是以纯英文字母的形式构成,则字符类别通道可以为26个,分别用于输出不同字母的置信度;此外,考虑到大小写的因素,字符类别通道也可以为52个,本领域技术人员可以根据车位号的实际构成元素,灵活地选择字符类别通道的数量和种类。
需要说明的是,字符类别通道输出字符的置信度只是本发明实施例的一个具体示例,本领域技术人员还可以选择输出其他数据,例如,字符的出现概率等,本发明对此不作具体限制。
在一个示例中,假设输入的车位号图像大小为(w,h,c),其中w为图片宽度,h为图片高度,c为图片通道数(rgb图片为3),可识别的字符类别总共有n种,则深度学习网络输出的特征fout维度为(1,w/2,h/2,n 1),其中n 1个通道中包含n个代表字符类别的通道和1个背景通道
步骤204,在背景通道输出特征中提取点列表;
在本发明实施例中,背景通道的特征层中记录了从车位号图像中采集的各个像素点的信息,根据对点特征的位置关系的判断,可以大致推测出哪些像素点可能为车位号字符所对应的像素点。将这些可能为车位号字符对应的像素点提取出来,可得到表征车位号字符信息的点列表。
在本发明实施例中,在背景通道输出特征中提取点列表的步骤,可以为:采用预设8邻域极值法,在背景通道中的特征层中提取点列表。
8邻域极值法是指将背景通道中的各像素点与相邻8个像素点的灰度值进行比较,如果该点为最大值或最小值,则认为该点为目标像素点,将所有目标像素点提取出来,可以得到点列表。
步骤205,依次获取点列表中各像素点的位置信息;
在从背景通道的特征层中提取了点列表后,依次从点列表中提取各像素点的位置信息,用于根据各像素点的位置信息之间的相关性,来进一步筛选可能为车位号字符的像素点。
在一个示例中,在获取到各像素点的位置信息后,可以根据像素点之间的位置关系,找到距离相近的像素点,保留其中一个,然后将其余的剔除;原因在于,距离相近的像素点很大可能是同一个字符的像素点。
步骤206,根据位置信息和输出特征集,确定点列表中各像素点的字符类别;
根据点列表中像素点的位置信息,结合字符类别通道输出的特征信息,可以确定每个点在不同字符类别通道中的输出结果,进而根据该输出结果,可以分析得到该点的字符类别。
在本发明实施例中,步骤206具体可以包括:
基于位置信息,在输出特征集中依次匹配各个像素点在各个字符类别通道输出的置信度;
将输出的置信度最大的字符类别通道对应的字符类别确定为像素点的字符类别。
置信度也称为可靠度,或置信水平、置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这个相应的概率称作置信度。
在本发明实施例中,在获取到点列表后,可以依次对点列表中的像素点进行分类,再根据像素点的位置信息,找到输出特征集中的字符类别特征,其维度为n(此处,每个维度代表一个字符通道,深度学习网络会输出该像素点在各个字符类别的置信度),将输出的置信度最大的字符类别通道对应的字符类别确定为该像素点的字符类别。
步骤207,根据点列表中各像素点的字符类别和位置信息,确定车位号。
在确定了点列表中各像素点的字符类别和位置信息后,可以根据位置信息排列各像素点的字符类别,得到完整的车位号。该车位号可用于引导车辆停车。
本发明通过接收图像采集装置采集的车位号图像,并将车位号图像输入预设的深度学习网络中,得到输出特征集,根据输出特征集中携带的背景通道输出特征,提取可能为车位号字符的像素点,生成点列表;通过获取点列表中每个像素点的位置信息,以根据位置信息在确定各个像素点的字符类别,从而完成对车位号的识别。本发明通过对背景通道中的像素点进行分析,从而提取可能为车位号字符的点列表,通过对点列表中各像素点的位置信息进行识别,结合输出特征集,可以分析出点列表中每个像素点的字符类别,从而确定车位号。减少了车位号字符识别出错的概率,提高了车位识别准确率。
请参阅图3,图3为本发明实施例提供的一种车位号识别装置的结构框图。
本发明实施例提供了一种车位号识别装置,应用于车载终端,车载终端与安装在车辆上的图像采集装置通信;装置具体可以包括:
车位号图像接收模块301,用于接收图像采集装置采集的车位号图像;
输出特征集生成模块302,用于将车位号图像输入预设深度学习网络中,得到输出特征集;输出特征集包括背景通道输出特征;
点列表提取模块303,用于在背景通道输出特征中提取点列表;
位置信息获取模块304,用于依次获取点列表中各像素点的位置信息;
字符类别确定模块305,用于根据位置信息和输出特征集,确定点列表中各像素点的字符类别;
车位号确定模块306,用于根据点列表中各像素点的字符类别和位置信息,确定车位号。
在本发明实施例中,输出特征集生成模块302,包括:
输出维度确定子模块,用于确定车位号图像的字符类别通道数n,并根据图片通道数确定输出维度;
输出特征集生成子模块,用于将车位号图像输入预设深度学习网络中,得到与输出维度对应的输出特征集;
其中,输出维度包括n个字符类别通道和1个背景通道。
在本发明实施例中,点列表提取模块303,包括:
点列表提取子模块,用于采用预设8邻域极值法,在背景通道输出特征中提取点列表。
在本发明实施例中,字符类别确定模块305,包括:
置信度匹配子模块,用于基于位置信息,在输出特征集中依次匹配各个像素点在各个字符类别通道输出的置信度;
字符类别确定子模块,用于将输出的置信度最大的字符类别通道对应的字符类别确定为像素点的字符类别。
本发明还提供了一种电子设备,设备包括处理器以及存储器:
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行本发明实施例的车位号识别方法。
本发明还提供了一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行本发明实施例的车位号识别方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
1.一种车位号识别方法,其特征在于,应用于车载终端,所述车载终端与安装在车辆上的图像采集装置通信;所述方法包括:
接收所述图像采集装置采集的车位号图像;
将所述车位号图像输入预设深度学习网络中,得到输出特征集;所述输出特征集包括背景通道输出特征;
在所述背景通道输出特征中提取点列表;
依次获取所述点列表中各像素点的位置信息;
根据所述位置信息和所述输出特征集,确定所述点列表中各像素点的字符类别;
根据所述点列表中各像素点的所述字符类别和所述位置信息,确定车位号。
2.根据权利要求1所述的方法,其特征在于,所述将所述车位号图像输入预设深度学习网络中,得到输出特征集的步骤,包括:
确定所述车位号图像的字符类别通道数n,并根据所述图片通道数确定输出维度;
将所述车位号图像输入预设深度学习网络中,得到与所述输出维度对应的输出特征集;
其中,所述输出维度包括n个字符类别通道和1个背景通道。
3.根据权利要求2所述的方法,其特征在于,所述在所述背景通道输出特征中提取点列表的步骤,包括:
采用预设8邻域极值法,在所述背景通道输出特征中提取点列表。
4.根据权利要求3所述的方法,其特征在于,所述根据所述位置信息和所述输出特征集,确定所述点列表中各像素点的字符类别的步骤,包括:
基于所述位置信息,在所述输出特征集中依次匹配各个所述像素点在各个所述字符类别通道输出的置信度;
将输出的置信度最大的字符类别通道对应的字符类别确定为所述像素点的字符类别。
5.一种车位号识别装置,其特征在于,应用于车载终端,所述车载终端与安装在车辆上的图像采集装置通信;所述装置包括:
车位号图像接收模块,用于接收所述图像采集装置采集的车位号图像;
输出特征集生成模块,用于将所述车位号图像输入预设深度学习网络中,得到输出特征集;所述输出特征集包括背景通道输出特征;
点列表提取模块,用于在所述背景通道输出特征中提取点列表;
位置信息获取模块,用于依次获取所述点列表中各像素点的位置信息;
字符类别确定模块,用于根据所述位置信息和所述输出特征集,确定所述点列表中各像素点的字符类别;
车位号确定模块,用于根据所述点列表中各像素点的所述字符类别和所述位置信息,确定车位号。
6.根据权利要求5所述的装置,其特征在于,所述输出特征集生成模块,包括:
输出维度确定子模块,用于确定所述车位号图像的字符类别通道数n,并根据所述图片通道数确定输出维度;
输出特征集生成子模块,用于将所述车位号图像输入预设深度学习网络中,得到与所述输出维度对应的输出特征集;
其中,所述输出维度包括n个字符类别通道和1个背景通道。
7.根据权利要求6所述的装置,其特征在于,所述点列表提取模块,包括:
点列表提取子模块,用于采用预设8邻域极值法,在所述背景通道输出特征中提取点列表。
8.根据权利要求7所述的装置,其特征在于,所述字符类别确定模块,包括:
置信度匹配子模块,用于基于所述位置信息,在所述输出特征集中依次匹配各个所述像素点在各个所述字符类别通道输出的置信度;
字符类别确定子模块,用于将输出的置信度最大的字符类别通道对应的字符类别确定为所述像素点的字符类别。
9.一种电子设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-4任一项所述的车位号识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-4任一项所述的车位号识别方法。
技术总结