车辆控制方法、装置、设备、存储介质及程序产品与流程

    专利2022-07-08  78


    本发明涉及无人驾驶技术领域,尤其涉及一种车辆控制方法、装置、设备、存储介质及程序产品。



    背景技术:

    无人驾驶是当前智慧城市建设非常重要的一个应用。无人驾驶技术需要对路况进行实时的监控以便做出决策。当前无人驾驶技术对路况的判断预测主要是通过车载设备提供的实时路面图像数据,依托于深度学习技术,对图像进行分析,判断当前车辆前方的路面情况,以便车辆做出决策(继续前进,拐弯还是刹车等)。

    但是仅对单台车载设备进行数据分析,每台车只能得到路面的局部信息,为此,可以联合其他无人车中的车载设备数据和街道上的摄像头数据作出决策预测。但无人驾驶的路况分析是一个实时场景,如果多个设备的数据不能做到时空一致性,就会导致用于预测的路面数据与真实的路面状况有误差,进而导致预测出错。



    技术实现要素:

    本发明的主要目的在于提供一种车辆控制方法、装置、设备、存储介质及程序产品,旨在目前解决多个设备的数据不能做到时空一致性,从而导致车辆决策出错的问题。

    为实现上述目的,本发明提供一种车辆控制方法,所述方法应用于第一车辆,所述方法包括以下步骤:

    接收卫星设备广播的标准时间和各外部设备的设备位置;

    根据所述标准时间对所述第一车辆采集的第一路面数据标记时间戳;

    根据所述设备位置从所述外部设备中确定联邦设备;

    采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆,其中,所述联邦设备采用与所述第一路面数据具有相同时间戳的第二路面数据参与联邦预测。

    可选地,接收卫星设备广播的各外部设备的设备位置的步骤包括:

    接收卫星设备广播的处于所述第一车辆周围预设范围的外部设备的设备位置,其中,所述外部设备包括第二车辆和路边摄像设备。

    可选地,所述根据所述标准时间对所述第一车辆采集的第一路面数据标记时间戳的步骤包括:

    根据所述标准时间对所述第一车辆的时钟进行校准;

    对于所述第一车辆采集的第一路面数据,将校准后的时钟在采集时刻所指示的时间作为所述第一路面数据的时间戳。

    可选地,所述根据所述设备位置从所述外部设备中确定联邦设备的步骤包括:

    接收各所述外部设备发送的路面数据角度;

    将与所述第一路面数据的角度满足预设互补关系的所述路面数据角度对应的外部设备作为联邦设备。

    可选地,所述采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆,其中,所述联邦设备采用与所述第一路面数据具有相同时间戳的第二路面数据参与联邦预测的步骤包括:

    将所述第一路面数据输入第一预测模型的第一特征提取层进行特征提取,得到第一特征数据;

    将所述第一路面数据的时间戳发送给所述联邦设备,以供所述联邦设备确定所采集的与所述时间戳相同的第二路面数据,并将所述第二路面数据输入第二预测模型的第二特征提取层进行特征提取得到第二特征数据;

    接收所述联邦设备返回的所述第二特征数据,将所述第一特征数据和所述第二特征数据输入所述第一预测模型的预测层进行预测得到控制决策,并按照所述控制决策控制所述第一车辆。

    可选地,所述采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆的步骤之后,还包括:

    获取所述第一车辆作出所述控制决策后的反馈数据;

    将所述第一路面数据、所述第二特征数据和所述反馈数据作为一条训练数据添加至预设的训练数据库;

    当检测到更新指令时,采用所述训练数据库中的各条训练数据对所述第一预测模型进行训练,以更新所述第一预测模型。

    可选地,所述当检测到更新指令时,采用所述训练数据库中的各条训练数据对所述第一预测模型进行训练,以更新所述第一预测模型的步骤包括:

    当检测到更新指令时,将所述训练数据库的训练数据中的路面数据输入所述第一特征提取层进行特征提取得到第三特征数据;

    将所述第三特征数据和所述训练数据中的第四特征数据输入所述预测层进行预测得到预测决策;

    根据所述预测决策和所述训练数据中的反馈数据计算损失值,并根据所述损失值计算所述第一特征提取层和所述预测层中模型参数对应的梯度值;

    根据所述梯度值更新所述模型参数,以更新所述第一预测模型。

    为实现上述目的,本发明提供一种车辆控制装置,所述装置部署于第一车辆,所述装置包括:

    接收模块,用于接收卫星设备广播的标准时间和各外部设备的设备位置;

    标记模块,用于根据所述标准时间对所述第一车辆采集的第一路面数据标记时间戳;

    确定模块,用于根据所述设备位置从所述外部设备中确定联邦设备;

    控制模块,用于采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆,其中,所述联邦设备采用与所述第一路面数据具有相同时间戳的第二路面数据参与联邦预测。

    为实现上述目的,本发明还提供一种车辆控制设备,所述车辆控制设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的车辆控制程序,所述车辆控制程序被所述处理器执行时实现如上所述的车辆控制方法的步骤。

    此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有车辆控制程序,所述车辆控制程序被处理器执行时实现如上所述的车辆控制方法的步骤。

    此外,为实现上述目的,本发明还提出一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上所述的车辆控制方法的步骤。

    本发明中,通过由卫星设备来向各个设备广播标准时间和设备位置,第一车辆接收标准时间和各个外部设备的设备位置,根据标准时间来第一车辆采集的第一路面数据标记时间戳,根据设备位置从各个外部设备中确定联邦设备,采用第一路面数据联合联邦设备采用与第一路面数据具有相同时间戳的第二路面数据来进行联邦预测得到控制决策,并按照控制决策控制第一车辆行驶。也即,本发明中,通过卫星设备广播标准时间的方式,统一各个设备所采集的路面数据的时间戳,使得各个设备采集的路面数据达到时间一致性;又通过卫星设备来广播各个设备的设备位置,使得车辆可以根据设备位置准确地定位其周围的外部设备,实现车辆与其他外部设备所采集的路面数据达到空间一致性;车辆联合与其具有时空一致性的他外部设备采集的路面数据进行控制决策预测,极大地提高了其控制决策的精确度。

    附图说明

    图1为本发明实施例方案涉及的硬件运行环境的结构示意图;

    图2为本发明车辆控制方法第一实施例的流程示意图;

    图3为本发明实施例涉及的一种卫星协同的车辆控制场景示意图;

    图4为本发明车辆控制装置较佳实施例的功能示意图模块图。

    本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

    具体实施方式

    应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

    如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。

    需要说明的是,本发明实施例车辆控制设备可以是智能手机、个人计算机和服务器等设备,在此不做具体限制。

    如图1所示,该车辆控制设备可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

    本领域技术人员可以理解,图1中示出的设备结构并不构成对车辆控制设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

    如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及车辆控制程序。其中,操作系统是管理和控制设备硬件和软件资源的程序,支持车辆控制程序以及其它软件或程序的运行。在图1所示的设备中,用户接口1003主要用于与客户端进行数据通信;网络接口1004主要用于服务器建立通信连接;处理器1001可以用于调用存储器1005中存储的车辆控制程序,并执行以下操作:

    接收卫星设备广播的标准时间和各外部设备的设备位置;

    根据所述标准时间对所述第一车辆采集的第一路面数据标记时间戳;

    根据所述设备位置从所述外部设备中确定联邦设备;

    采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆,其中,所述联邦设备采用与所述第一路面数据具有相同时间戳的第二路面数据参与联邦预测。

    进一步地,接收卫星设备广播的各外部设备的设备位置的步骤包括:

    接收卫星设备广播的处于所述第一车辆周围预设范围的外部设备的设备位置,其中,所述外部设备包括第二车辆和路边摄像设备。

    进一步地,所述根据所述标准时间对所述第一车辆采集的第一路面数据标记时间戳的步骤包括:

    根据所述标准时间对所述第一车辆的时钟进行校准;

    对于所述第一车辆采集的第一路面数据,将校准后的时钟在采集时刻所指示的时间作为所述第一路面数据的时间戳。

    进一步地,所述根据所述设备位置从所述外部设备中确定联邦设备的步骤包括:

    接收各所述外部设备发送的路面数据角度;

    将与所述第一路面数据的角度满足预设互补关系的所述路面数据角度对应的外部设备作为联邦设备。

    进一步地,所述采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆,其中,所述联邦设备采用与所述第一路面数据具有相同时间戳的第二路面数据参与联邦预测的步骤包括:

    将所述第一路面数据输入第一预测模型的第一特征提取层进行特征提取,得到第一特征数据;

    将所述第一路面数据的时间戳发送给所述联邦设备,以供所述联邦设备确定所采集的与所述时间戳相同的第二路面数据,并将所述第二路面数据输入第二预测模型的第二特征提取层进行特征提取得到第二特征数据;

    接收所述联邦设备返回的所述第二特征数据,将所述第一特征数据和所述第二特征数据输入所述第一预测模型的预测层进行预测得到控制决策,并按照所述控制决策控制所述第一车辆。

    进一步地,所述采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆的步骤之后,处理器1001还可以用于调用存储器1005中存储的车辆控制程序,并执行以下操作:

    获取所述第一车辆作出所述控制决策后的反馈数据;

    将所述第一路面数据、所述第二特征数据和所述反馈数据作为一条训练数据添加至预设的训练数据库;

    当检测到更新指令时,采用所述训练数据库中的各条训练数据对所述第一预测模型进行训练,以更新所述第一预测模型。

    进一步地,所述当检测到更新指令时,采用所述训练数据库中的各条训练数据对所述第一预测模型进行训练,以更新所述第一预测模型的步骤包括:

    当检测到更新指令时,将所述训练数据库的训练数据中的路面数据输入所述第一特征提取层进行特征提取得到第三特征数据;

    将所述第三特征数据和所述训练数据中的第四特征数据输入所述预测层进行预测得到预测决策;

    根据所述预测决策和所述训练数据中的反馈数据计算损失值,并根据所述损失值计算所述第一特征提取层和所述预测层中模型参数对应的梯度值;

    根据所述梯度值更新所述模型参数,以更新所述第一预测模型。

    基于上述的结构,提出车辆控制方法的各实施例。

    参照图2,图2为本发明车辆控制方法第一实施例的流程示意图。需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。本发明车辆控制方法执行主体可以是智能手机、个人计算机、服务器和车载控制器等设备,部署于车辆中,以下各个实施例中以第一车辆(以区别于其他车辆)为执行主体进行描述。在本实施例中,车辆控制方法包括:

    步骤s10,接收卫星设备广播的标准时间和各外部设备的设备位置;

    在本实施例中,卫星设备向各个设备广播标准时间以及各个设备的设备位置。对于第一车辆而言,第一车辆接收到卫星设备广播的标准时间和各个外部设备的设备位置。其中,外部设备是指独立于第一车辆以外的设备,例如路上行驶的第一车辆以外的其他车辆,或路边设置的摄像头、激光雷达等传感器设备。卫星设备可以实时或每隔一段时间广播一次标准时间,为提高时间统一的精度,标准时间的最小刻度可以设置得较小,例如最小刻度可以是微秒。设备位置可以是采用经纬度或地图坐标等方式表示。卫星设备获取各个设备的设备位置的方式有很多种,可参照现有的卫星定位方式,在此不作详细赘述。

    进一步地,所述步骤s10中接收卫星设备广播的各外部设备的设备位置的步骤包括:

    步骤s101,接收卫星设备广播的处于所述第一车辆周围预设范围的外部设备的设备位置,其中,所述外部设备包括第二车辆和路边摄像设备。

    在一实施方式中,如图3所示,卫星设备对于每个车辆,可以向该车辆发送处于该车辆周围预设范围内的外部设备的设备位置。其中,预设范围可以是以该车辆所在位置为圆心,以一定距离为半径的圆形范围。外部设备可以是其他车辆(称为第二车辆以示区别)和路面摄像设备。当然,在其他实施方式中,外部设备也可以只包括第二车辆或路面摄像设备,或者,还可以包括路边设置的其他种类的传感器设备,例如激光雷达。

    步骤s20,根据所述标准时间对所述第一车辆采集的第一路面数据标记时间戳;

    第一车辆上设置有摄像头、激光雷达等车载设备,用于采集车辆周围的路面数据,对应地,路面数据可包括摄像头采集的图像数据、激光雷达采集的雷达数据等。第一车辆在行驶过程中,通过车载设备实时采集路面数据(以下称为第一路面数据以示区分),可根据接收到的标准时间对第一路面数据标记时间戳。具体地,在一实施方式中,第一车辆可以接收卫星设备实时广播的标准时间,将采集第一路面数据时刻所接收到的标准时间作为该第一路面数据的时间戳。

    进一步地,在另一实施方式中,所述步骤s20包括:

    步骤s201,根据所述标准时间对所述第一车辆的时钟进行校准;

    步骤s202,对于所述第一车辆采集的第一路面数据,将校准后的时钟在采集时刻所指示的时间作为所述第一路面数据的时间戳。

    第一车辆也可以是在接收到标准时间后,根据标准时间对第一车辆的时钟进行校准,也即,将第一车辆中的时钟对准该标准时间。第一车辆可每隔一段时间校准一次。第一车辆通过车载设备采集第一路面数据后,将校准后的时钟在采集时刻所指示的时间作为该第一路面数据的时间戳,也即,实时地为采集的第一路面数据打上时间戳。

    可以理解的是,各个外部设备也接收卫星设备广播的标准时间,并根据标准时间对各自采集的路面数据标记时间戳。

    步骤s30,根据所述设备位置从所述外部设备中确定联邦设备;

    第一车辆可根据接收到的各个外部设备的设备位置,从外部设备中确定联邦设备。具体地,第一车辆可以先确定一个区域范围,该区域范围可以是以其当前位置为中心的一个圆形或方形范围,例如,可以该第一车辆当前位置为圆心、2米半径的圆形作为区域范围。第一设备可判断各个外部设备的设备位置是否处于该区域范围内,将处于该区域范围内的外部设备作为联邦设备。也即,第一车辆在行驶过程中,周围的环境在不断变化,从而需要及时地更新进行联合决策预测的外部设备,从而保证第一车辆与其他外部设备所采集的数据在空间上的一致性。

    步骤s40,采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆,其中,所述联邦设备采用与所述第一路面数据具有相同时间戳的第二路面数据参与联邦预测。

    第一车辆在确定联邦设备后,可与联邦设备建立通信连接,采用第一路面数据联合联邦设备进行联邦预测得到控制决策。其中,联邦设备采用与第一路面数据具有相同时间戳的第二路面数据参与联邦预测。具体地,联邦预测的方式可采用现有纵向联邦的方式,或者,当联邦设备与第一车辆之间是可信任关系时,联邦设备可以将第二路面数据发送给第一车辆,由第一车辆根据第一路面数据和第二路面数据进行控制决策的预测。其中,第一车辆可以是采用预先训练好的预测模型来进行控制决策预测,预测模型可采用常用的机器学习模型来实现,在此不作详细赘述。控制决策可以是加速、减速、刹车等等控制决策,第一车辆在得到控制决策后,按照该控制决策控制第一车辆,进而实现自动驾驶。

    在本实施例中,通过由卫星设备来向各个设备广播标准时间和设备位置,第一车辆接收标准时间和各个外部设备的设备位置,根据标准时间来第一车辆采集的第一路面数据标记时间戳,根据设备位置从各个外部设备中确定联邦设备,采用第一路面数据联合联邦设备采用与第一路面数据具有相同时间戳的第二路面数据来进行联邦预测得到控制决策,并按照控制决策控制第一车辆行驶。也即,本实施例中,通过卫星设备广播标准时间的方式,统一各个设备所采集的路面数据的时间戳,使得各个设备采集的路面数据达到时间一致性;又通过卫星设备来广播各个设备的设备位置,使得车辆可以根据设备位置准确地定位其周围的外部设备,实现车辆与其他外部设备所采集的路面数据达到空间一致性;车辆联合与其具有时空一致性的他外部设备采集的路面数据进行控制决策预测,极大地提高了其控制决策的精确度。

    进一步地,基于上述第一实施例,提出本发明车辆控制方法第二实施例,在本实施例中,所述步骤s30包括:

    步骤s301,接收各所述外部设备发送的路面数据角度;

    第一车辆可以与各个外部设备建立通信连接,向各个外部设备发送数据请求,各个外部设备在接收到数据请求后,向第一车辆发送各自的路面数据角度。具体地,外部设备可以以其当前所在位置为中心,由南向北方向为y轴正方向,由西向东方向为x轴正方向构成一个坐标系,该坐标系由x轴正轴起逆时针旋转一周回到x轴正轴是360度,可以以该外部设备所采集的路面数据在该坐标系所跨的角度范围作为路面数据角度。例如,外部设备是一个由南向北行驶的车辆,该车辆通过设置在车头的摄像头采集正前方的路面数据,则该车辆返回的路面数据角度可以是0~180度。或者,该外部设备可直接将其所采集的路面数据在地图上的坐标范围或者经纬度范围作为路面数据角度。

    步骤s302,将与所述第一路面数据的角度满足预设互补关系的所述路面数据角度对应的外部设备作为联邦设备。

    第一车辆也按照与各个外部设备相同的方式确定第一路面数据的角度。第一车辆在接收到各个外部设备发送的路面数据角度后,可确定各个路面数据角度是否与第一路面数据的角度满足预设互补关系。具体地,预设互补关系可以预先根据需要进行设置。

    例如,当外部设备发送的路面数据角度是用角度范围表示时,将第一路面数据对应的角度范围记为第一角度范围,将外部设备发送的角度范围记为第二角度范围;第一车辆可以确定该外部设备的位置与自己的位置之间的相对关系,也即,确定该外部设备相对于第一车辆的方向和距离;第一车辆根据该相对关系,将该第二角度范围转换为相对于第一角度范围所对应的坐标系的角度范围,将转换后的角度范围记为第三角度范围;计算该第三角度范围相对于该第一角度范围非重合的部分(记为第四角度范围),并判断第四角度范围的跨度值是否大于一定的值,若大于,则确定该外部设备的路面数据角度与该第一路面数据的角度满足预设互补关系,否则,不满足。

    又如,当外部设备发送的路面数据角度是用坐标范围表示时,将第一路面数据对应的坐标范围记为第一坐标范围,将外部设备发送的坐标范围记为第二坐标范围;第一车辆可计算第二坐标范围相对于第一坐标范围的非重合部分,并判断该非重合部分的面积是否大于一定的值,若大于,则确定该外部设备的路面数据角度与该第一路面数据的角度满足预设互补关系,否则,不满足。

    需要说明的是,当卫星设备发送给第一车辆的外部设备的设备位置没有距离限制时,第一车辆可先从各个外部设备中选择与其距离小于预设距离的外部设备,再从选取的外部设备中选择角度互补的外部设备作为联邦设备。

    在本实施例中,通过接收各个外部设备发送的路面数据角度,并选取与第一路面数据的角度满足预设互补关系的路面数据角度对应的外部设备作为联邦设备,例如,第一路面数据是第一车辆前方的路面数据,联邦设备可以补充第一车辆左右两侧和后方的路面数据,从而进一步提高了各个设备数据在空间上的一致性,进而进一步地提高了车辆控制决策的精准度。

    进一步地,所述步骤s40包括:

    步骤s401,将所述第一路面数据输入第一预测模型的第一特征提取层进行特征提取,得到第一特征数据;

    在一实施方式中,各个设备中可以分别预先设置预测模型,预测模型可包括一个特征提取层,和连接在该特征提取层后的一个预测层。特征提取层可采用常用的机器学习模型中常用的特征提取网络结构来实现,用于提取输入数据的特征得到特征数据,预测层也可以采用常用的多分类器来实现,用于预测各类决策的概率,具体在此不作限制。预测模型可以预先训练好后配置到各个设备中,各个设备中的预测模型的模型结构可相同。需要说明的是,路边的摄像头设备由于不需要做控制决策预测,可以只设置特征提取层而不用设置预测层。第一车辆中的预测模型称为第一预测模型以示区分。第一车辆将第一路面数据输入第一预测模型的第一特征提取层进行特征提取,得到第一特征数据。

    步骤s402,将所述第一路面数据的时间戳发送给所述联邦设备,以供所述联邦设备确定所采集的与所述时间戳相同的第二路面数据,并将所述第二路面数据输入第二预测模型的第二特征提取层进行特征提取得到第二特征数据;

    第一车辆将第一路面数据的时间戳发送给联邦设备。联邦设备在接收到时间戳后,确定联邦设备采集的时间戳与接收到的该时间戳相同的第二路面数据,并将该第二路面数据输入联邦设备中的第二预测模型的第二特征提取层进行特征提取得到第二特征数据,再将第二特征数据返回给第一车辆。

    步骤s403,接收所述联邦设备返回的所述第二特征数据,将所述第一特征数据和所述第二特征数据输入所述第一预测模型的预测层进行预测得到控制决策,并按照所述控制决策控制所述第一车辆。

    第一车辆在接收到联邦设备返回的第二特征数据后,可将第一特征数据和第二特征数据一并输入到第一预测模型的预测层进行预测,得到控制决策,并按照控制决策控制第一车辆行驶。由于预测层不仅依据第一车辆本身采集的路面数据进行预测,还依据了其他外部设备所采集的路面数据对应的特征数据来进行预测,丰富了预测层作出控制决策的数据依据,从而提高了控制决策的精准度。并且联邦设备发送的不是其采集的原始路面数据,而是通过预测层进行特征提取后的特征数据,一方面可避免隐私数据泄露的问题,另一方面特征数据是通过特征提取层对原始路面数据进行降维特征抽取得到的,所以相比于原始路面数据数据量更小,从而减少了各个设备之间的通信成本,提高了通信效率,进而提高了控制决策预测的时间精度。

    进一步地,基于上述第二实施例,提出本发明车辆控制方法第三实施例,在本实施例中,所述步骤s40之后,还包括:

    步骤s50,获取所述第一车辆作出所述控制决策后的反馈数据;

    在本实施例中,第一车辆在按照该控制决策进行控制后,也即作出控制决策后,可以获取与该控制决策对应的反馈数据。具体地,第一车辆可通过对各个车载设备所采集的数据进行综合分析得到,其能够表示车辆在按照控制决策进行控制后的控制效果的好坏。例如,根据车载激光雷达采集的与周围车辆、行人或障碍物的距离,若确定距离小于一定值,则说明车辆作出控制决策后,很可能会发生碰撞,控制效果较差。反馈数据具体可以采用标签的方式进行量化,例如,0表示控制效果好,1表示控制效果差,还可以设置其他更细化的标签类型。

    步骤s60,将所述第一路面数据、所述第二特征数据和所述反馈数据作为一条训练数据添加至预设的训练数据库;

    第一车辆将第一路面数据、第二特征数据和对应的反馈数据作为一条训练数据添加至预设的训练数据库。可以理解的是,其中第一路面数据和第二特征数据是作为训练数据中的输入数据,反馈数据是作为训练数据中的标签数据。第一车辆在行驶过程中每隔一段时间做出一个控制决策,那么每个控制决策都能够对应形成一条训练数据。进一步地,第一设备可以在训练数据库中的数据量达到一定数量时,即不再添加新的训练数据至数据库。进一步地,第一设备也可以主要收集表示控制效果差的反馈数据对应的训练数据。

    步骤s70,当检测到更新指令时,采用所述训练数据库中的各条训练数据对所述第一预测模型进行训练,以更新所述第一预测模型。

    当第一车辆检测到更新指令时,采用训练数据库中的各条训练数据对第一预测模型进行训练,以更新第一预测模型。其中,第一车辆可以是每隔一段时间自动触发一次更新指令,例如,每隔一个星期;也可以是在第一车辆检测到处于停止状态时,自动触发更新指令;还可以是其他条件下触发更新指令。第一车辆采用训练数据库中的训练数据对第一预测模型进行训练的过程可以参照现有的机器学习模型训练过程。

    进一步地,所述步骤s70包括:

    步骤s701,当检测到更新指令时,将所述训练数据库的训练数据中的路面数据输入所述第一特征提取层进行特征提取得到第三特征数据;

    在一实施方式中,当检测到更新指令时,第一车辆可将训练数据库的训练数据中的路面数据输入第一预测模型的第一特征提取层进行特征提取,得到第三特征数据。需要说明的是,训练数据库中有多条训练数据,第一车辆将各个训练数据的路面数据分别输入第一特征提取层进行提取,得到各条训练数据分别对应的第三特征数据。

    步骤s702,将所述第三特征数据和所述训练数据中的第四特征数据输入所述预测层进行预测得到预测决策;

    第一车辆将第三特征数据和训练数据中的第四特征数据输入预测层进行预测得到预测决策。需要说明的是,第一车辆对于每条训练数据,将该训练数据对应的第三特征数据和第四特征数据作为一组,输入预测层进行预测,得到该训练数据对应的预测决策,进而得到每条训练数据分别对应的预测决策。

    步骤s703,根据所述预测决策和所述训练数据中的反馈数据计算损失值,并根据所述损失值计算所述第一特征提取层和所述预测层中模型参数对应的梯度值;

    第一车辆根据预测决策和训练数据中的反馈数据计算损失值,其中第一车辆可采用预先设置的第一预测模型的损失函数,计算损失值。损失函数可采用常用的分类模型损失函数,具体损失值的计算方法,可参照现有的机器学习模型训练中损失值的计算方法,在此不作详细赘述。在计算得到损失值后,可根据损失值按照梯度下降算法和链式法则,计算得到损失函数相对于第一特征提取层和预测层中各个模型参数分别对应的梯度值。

    步骤s704,根据所述梯度值更新所述模型参数,以更新所述第一预测模型。

    在计算得到梯度值后,可根据各个模型参数的梯度值对应更新各个模型参数,进而得到更新后的第一预测模型。

    进一步地,第一车辆也可以按照上述的更新方法,对第一预测模型进行多轮更新,每一轮更新是在上一轮更新后的模型基础上进行更新。第一车辆可以在检测到损失函数收敛、达到预先设置的一个最大训练轮次或预先设置的一个最大训练时长时停止更新。第一车辆后续采用更新后的第一预测模型进行控制决策预测。

    在本实施例中,通过将第一车辆的第一路面数据、第二特征数据和反馈数据作为训练数据添加至训练数据库,使得第一车辆可以在行驶过程中不断地收集实际路面数据作为预测模型的训练数据;一方面能够快速地扩充训练数据的数据量,以提升预测模型的预测准确率;另一方面车辆在行驶过程中收集到的都是实际的路面数据,相比于在实验室由实验人员通过仿真模型生成训练数据,更加能够反映真实复杂的路况,进而能够从快充训练数据的丰富度,以提升预测模型的预测准确率;再一方面,车辆不仅通过自身采集的路面数据作为训练数据,还通过将其他设备采集的路面数据对应的特征数据作为训练数据,使得预测模型能够学习到如何依据更多的特征数据来进行控制决策预测,从而提升了预测模型的预测准确率;并且,实现了在训练过程中不需要其他外部设备的参与的情况下,仍然能够利用其他外部设备的数据进行预测。

    此外本发明实施例还提出一种车辆控制装置,参照图4,所述装置部署于第一车辆,所述装置包括:

    接收模块10,用于接收卫星设备广播的标准时间和各外部设备的设备位置;

    标记模块20,用于根据所述标准时间对所述第一车辆采集的第一路面数据标记时间戳;

    确定模块30,用于根据所述设备位置从所述外部设备中确定联邦设备;

    控制模块40,用于采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆,其中,所述联邦设备采用与所述第一路面数据具有相同时间戳的第二路面数据参与联邦预测。

    进一步地,所述接收模块10包括:

    第一接收单元,用于接收卫星设备广播的处于所述第一车辆周围预设范围的外部设备的设备位置,其中,所述外部设备包括第二车辆和路边摄像设备。

    进一步地,所述标记模块20包括:

    校准单元,用于根据所述标准时间对所述第一车辆的时钟进行校准;

    标记单元,用于对于所述第一车辆采集的第一路面数据,将校准后的时钟在采集时刻所指示的时间作为所述第一路面数据的时间戳。

    进一步地,所述确定模块30包括:

    第二接收单元,用于接收各所述外部设备发送的路面数据角度;

    确定单元,用于将与所述第一路面数据的角度满足预设互补关系的所述路面数据角度对应的外部设备作为联邦设备。

    进一步地,所述控制模块40包括:

    第一提取单元,用于将所述第一路面数据输入第一预测模型的第一特征提取层进行特征提取,得到第一特征数据;

    发送单元,用于将所述第一路面数据的时间戳发送给所述联邦设备,以供所述联邦设备确定所采集的与所述时间戳相同的第二路面数据,并将所述第二路面数据输入第二预测模型的第二特征提取层进行特征提取得到第二特征数据;

    控制单元,用于接收所述联邦设备返回的所述第二特征数据,将所述第一特征数据和所述第二特征数据输入所述第一预测模型的预测层进行预测得到控制决策,并按照所述控制决策控制所述第一车辆。

    进一步地,所述装置还包括:

    获取模块,用于获取所述第一车辆作出所述控制决策后的反馈数据;

    添加模块,用于将所述第一路面数据、所述第二特征数据和所述反馈数据作为一条训练数据添加至预设的训练数据库;

    更新模块,用于当检测到更新指令时,采用所述训练数据库中的各条训练数据对所述第一预测模型进行训练,以更新所述第一预测模型。

    进一步地,所述更新模块包括:

    第二提取单元,用于当检测到更新指令时,将所述训练数据库的训练数据中的路面数据输入所述第一特征提取层进行特征提取得到第三特征数据;

    预测单元,用于将所述第三特征数据和所述训练数据中的第四特征数据输入所述预测层进行预测得到预测决策;

    计算单元,用于根据所述预测决策和所述训练数据中的反馈数据计算损失值,并根据所述损失值计算所述第一特征提取层和所述预测层中模型参数对应的梯度值;

    更新单元,用于根据所述梯度值更新所述模型参数,以更新所述第一预测模型。

    本发明车辆控制装置的具体实施方式的拓展内容与上述车辆控制方法各实施例基本相同,在此不做赘述。

    此外,本发明实施例还提出一种计算机可读存储介质,所述存储介质上存储有车辆控制程序,所述车辆控制程序被处理器执行时实现如上所述的车辆控制方法的步骤。

    本发明还提出一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上所述的车辆控制方法的步骤。

    本发明车辆控制设备、计算机可读存储介质和计算机产品的各实施例,均可参照本发明车辆控制方法各实施例,此处不再赘述。

    需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

    上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

    通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各实施例所述的方法。

    以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。


    技术特征:

    1.一种车辆控制方法,其特征在于,所述方法应用于第一车辆,所述方法包括以下步骤:

    接收卫星设备广播的标准时间和各外部设备的设备位置;

    根据所述标准时间对所述第一车辆采集的第一路面数据标记时间戳;

    根据所述设备位置从所述外部设备中确定联邦设备;

    采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆,其中,所述联邦设备采用与所述第一路面数据具有相同时间戳的第二路面数据参与联邦预测。

    2.如权利要求1所述的车辆控制方法,其特征在于,接收卫星设备广播的各外部设备的设备位置的步骤包括:

    接收卫星设备广播的处于所述第一车辆周围预设范围的外部设备的设备位置,其中,所述外部设备包括第二车辆和路边摄像设备。

    3.如权利要求1所述的车辆控制方法,其特征在于,所述根据所述标准时间对所述第一车辆采集的第一路面数据标记时间戳的步骤包括:

    根据所述标准时间对所述第一车辆的时钟进行校准;

    对于所述第一车辆采集的第一路面数据,将校准后的时钟在采集时刻所指示的时间作为所述第一路面数据的时间戳。

    4.如权利要求1所述的车辆控制方法,其特征在于,所述根据所述设备位置从所述外部设备中确定联邦设备的步骤包括:

    接收各所述外部设备发送的路面数据角度;

    将与所述第一路面数据的角度满足预设互补关系的所述路面数据角度对应的外部设备作为联邦设备。

    5.如权利要求1至4任一项所述的车辆控制方法,其特征在于,所述采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆,其中,所述联邦设备采用与所述第一路面数据具有相同时间戳的第二路面数据参与联邦预测的步骤包括:

    将所述第一路面数据输入第一预测模型的第一特征提取层进行特征提取,得到第一特征数据;

    将所述第一路面数据的时间戳发送给所述联邦设备,以供所述联邦设备确定所采集的与所述时间戳相同的第二路面数据,并将所述第二路面数据输入第二预测模型的第二特征提取层进行特征提取得到第二特征数据;

    接收所述联邦设备返回的所述第二特征数据,将所述第一特征数据和所述第二特征数据输入所述第一预测模型的预测层进行预测得到控制决策,并按照所述控制决策控制所述第一车辆。

    6.如权利要求5所述的车辆控制方法,其特征在于,所述采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆的步骤之后,还包括:

    获取所述第一车辆作出所述控制决策后的反馈数据;

    将所述第一路面数据、所述第二特征数据和所述反馈数据作为一条训练数据添加至预设的训练数据库;

    当检测到更新指令时,采用所述训练数据库中的各条训练数据对所述第一预测模型进行训练,以更新所述第一预测模型。

    7.如权利要求6所述的车辆控制方法,其特征在于,所述当检测到更新指令时,采用所述训练数据库中的各条训练数据对所述第一预测模型进行训练,以更新所述第一预测模型的步骤包括:

    当检测到更新指令时,将所述训练数据库的训练数据中的路面数据输入所述第一特征提取层进行特征提取得到第三特征数据;

    将所述第三特征数据和所述训练数据中的第四特征数据输入所述预测层进行预测得到预测决策;

    根据所述预测决策和所述训练数据中的反馈数据计算损失值,并根据所述损失值计算所述第一特征提取层和所述预测层中模型参数对应的梯度值;

    根据所述梯度值更新所述模型参数,以更新所述第一预测模型。

    8.一种车辆控制装置,其特征在于,所述装置部署于第一车辆,所述装置包括:

    接收模块,用于接收卫星设备广播的标准时间和各外部设备的设备位置;

    标记模块,用于根据所述标准时间对所述第一车辆采集的第一路面数据标记时间戳;

    确定模块,用于根据所述设备位置从所述外部设备中确定联邦设备;

    控制模块,用于采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆,其中,所述联邦设备采用与所述第一路面数据具有相同时间戳的第二路面数据参与联邦预测。

    9.一种车辆控制设备,其特征在于,所述车辆控制设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的车辆控制程序,所述车辆控制程序被所述处理器执行时实现如权利要求1至7中任一项所述的车辆控制方法的步骤。

    10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有车辆控制程序,所述车辆控制程序被处理器执行时实现如权利要求1至7中任一项所述的车辆控制方法的步骤。

    11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的车辆控制方法的步骤。

    技术总结
    本发明公开了一种车辆控制方法、装置、设备、存储介质及程序产品,所述方法包括:接收卫星设备广播的标准时间和各外部设备的设备位置;根据所述标准时间对所述第一车辆采集的第一路面数据标记时间戳;根据所述设备位置从所述外部设备中确定联邦设备;采用所述第一路面数据联合所述联邦设备进行联邦预测得到控制决策,并按照所述控制决策控制所述第一车辆,其中,所述联邦设备采用与所述第一路面数据具有相同时间戳的第二路面数据参与联邦预测。本发明实现了车辆联合与其具有时空一致性的他外部设备采集的路面数据进行控制决策预测,极大地提高了其控制决策的精确度。

    技术研发人员:黄安埠
    受保护的技术使用者:深圳前海微众银行股份有限公司
    技术研发日:2020.12.10
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-24195.html

    最新回复(0)