图像定位方法、装置、介质和电子设备与流程

    专利2025-04-08  22


    本公开涉及定位,具体地,涉及一种图像定位方法、装置、介质和电子设备。


    背景技术:

    1、图像定位方法是使用一张图像对物体或场景的位置进行定位。相关技术中,通常通过特征点匹配算法从图像中提取特征点,计算对应的特征值,再和地图或者其它图像进行匹配,计算缩放、旋转和平移等变换,来进行图像的定位。然而,由于在低纹理区域无法提取出有效的特征点,因此,这种图像定位方法容易导致局部过拟合,并且无法适用于低纹理的图像,定位的鲁棒性和精度都较低。


    技术实现思路

    1、本公开的目的是提供一种图像定位方法、装置、介质和电子设备,能够适用于低纹理图像场景,提高定位的鲁棒性和精度。

    2、为了实现上述目的,本公开提供一种图像定位方法,包括:

    3、获取输入图像;

    4、基于所述输入图像进行三维场景重建,得到三维重建场景;

    5、基于所述三维重建场景,生成不同位置和朝向的第一二维生成图像;

    6、基于所述第一二维生成图像的颜色特征向量和所述输入图像的颜色特征向量,确定所述输入图像所对应的位置。

    7、可选地,所述基于所述三维重建场景,生成不同位置和朝向的第一二维生成图像,包括:

    8、对所述三维重建场景进行网格划分,得到多个网格;

    9、在每个所述网格内,生成不同位置和朝向的所述第一二维生成图像。

    10、可选地,所述输入图像附带所述输入图像所对应的gps信息;

    11、所述对所述三维重建场景进行网格划分,得到多个网格,包括:对所述三维重建场景进行网格划分,得到多个网格,而且每个所述网格附带所述网格所对应的gps信息;

    12、所述图像定位方法还包括:基于所述输入图像所对应的gps信息和各个所述网格所对应的gps信息,确定多个所述网格中gps信息与所述输入图像所对应的gps信息最近邻的m个网格;

    13、所述在每个所述网格内,生成不同位置和朝向的所述第一二维生成图像,包括:在所确定的m个网格内,生成不同位置和朝向的所述第一二维生成图像。

    14、可选地,所述基于所述第一二维生成图像的颜色特征向量和所述输入图像的颜色特征向量,确定所述输入图像所对应的位置,包括:

    15、确定颜色特征向量与所述输入图像的颜色特征向量最相近的n个所述第一二维生成图像;

    16、基于所述n个所述第一二维生成图像,确定所述输入图像所对应的位置。

    17、可选地,所述确定颜色特征向量与所述输入图像的颜色特征向量最相近的n个所述第一二维生成图像,包括:

    18、检索所述多个网格中颜色特征向量与所述输入图像的颜色特征向量最相近的n个所述第一二维生成图像;

    19、基于所述三维重建场景,在所述n个所述第一二维生成图像所对应的网格中重新生成不同位置和朝向的新的第一二维生成图像;

    20、对所述检索的步骤和所述重新生成的步骤进行迭代,直至满足迭代结束条件。

    21、可选地,所述基于所述n个所述第一二维生成图像,确定所述输入图像所对应的位置,包括:

    22、将所述n个所述第一二维生成图像所对应的位置和角度中、与所述输入图像的位置和角度最匹配的位置和角度作为初始位置和初始角度;

    23、基于所述三维重建场景、所述初始位置和所述初始角度,生成第二二维生成图像;

    24、确定所述第二二维生成图像与所述输入图像之间的距离;

    25、基于所述距离对所述初始位置和所述初始角度进行修正,直至所述距离满足预设误差,得到所述输入图像所对应的位置。

    26、可选地,所述确定所述第二二维生成图像与所述输入图像之间的距离,包括:

    27、确定所述第二二维生成图像与所述输入图像之间的l2距离。

    28、本公开还提供一种图像定位装置,包括:

    29、获取模块,用于获取输入图像;

    30、重建模块,用于基于所述输入图像进行三维场景重建,得到三维重建场景;

    31、生成模块,用于基于所述三维重建场景,生成不同位置和朝向的第一二维生成图像;

    32、确定模块,用于基于所述第一二维生成图像的颜色特征向量和所述输入图像的颜色特征向量,确定所述输入图像所对应的位置。

    33、本公开还提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开中任一项所述方法的步骤。

    34、本公开还提供一种电子设备,包括:

    35、存储器,其上存储有计算机程序;

    36、处理器,用于执行所述存储器中的所述计算机程序,以实现本公开中任一项所述方法的步骤。

    37、通过采用上述技术方案,利用输入图像来进行三维场景重建,基于三维重建场景生成不同位置和朝向的第一二维生成图像,通过第一二维生成图像的颜色特征向量和输入图像的颜色特征向量来确定输入图像所对应的位置,因此,本公开的图像定位方法基于输入图像数据,将传统图像定位方法和三维场景重建相结合,提升了定位的准确度和鲁棒性,同时支持低纹理场景的图像定位。相比于相关技术中利用特征点进行定位的方法,本公开的图像定位方法利用了整张图像的信息,具有更好的鲁棒性和更好的定位精度,并且能处理低纹理场景的图像定位。相比于相关技术中利用纯深度学习的定位算法,本公开的图像定位方法不需要对整个场景进行稠密空间拍照训练,大大节省了训练时间和成本,能处理低纹理场景的图像定位,具有更好的鲁棒性和更好的定位精度。

    38、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。



    技术特征:

    1.一种图像定位方法,其特征在于,包括:

    2.根据权利要求1所述的图像定位方法,其特征在于,所述基于所述三维重建场景,生成不同位置和朝向的第一二维生成图像,包括:

    3.根据权利要求2所述的图像定位方法,其特征在于,所述输入图像附带所述输入图像所对应的gps信息;

    4.根据权利要求2或3所述的图像定位方法,其特征在于,所述基于所述第一二维生成图像的颜色特征向量和所述输入图像的颜色特征向量,确定所述输入图像所对应的位置,包括:

    5.根据权利要求4所述的图像定位方法,其特征在于,所述确定颜色特征向量与所述输入图像的颜色特征向量最相近的n个所述第一二维生成图像,包括:

    6.根据权利要求5所述的图像定位方法,其特征在于,所述基于所述n个所述第一二维生成图像,确定所述输入图像所对应的位置,包括:

    7.根据权利要求6所述的图像定位方法,其特征在于,所述确定所述第二二维生成图像与所述输入图像之间的距离,包括:

    8.一种图像定位装置,其特征在于,包括:

    9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。

    10.一种电子设备,其特征在于,包括:


    技术总结
    本公开涉及一种图像定位方法、装置、介质和电子设备,属于定位技术领域,能够适用于低纹理图像场景,提高定位的鲁棒性和精度。一种图像定位方法,包括:获取输入图像;基于所述输入图像进行三维场景重建,得到三维重建场景;基于所述三维重建场景,生成不同位置和朝向的第一二维生成图像;基于所述第一二维生成图像的颜色特征向量和所述输入图像的颜色特征向量,确定所述输入图像所对应的位置。

    技术研发人员:刘宁,李昊鑫,侯杰虎,李谣顺
    受保护的技术使用者:达闼机器人股份有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-85221.html

    最新回复(0)