本申请属于智慧交通技术领域,特别涉及一种公路交通状态预测方法、系统、终端以及存储介质。
背景技术:
随着gdp的增长,中国的汽车保有量不断上升。据公安部统计,截至2019年底,全国汽车保有量达2.6亿辆,与2018年底相比,增长8.83%。不断增长的汽车保有量给公路网带来了运营压力,造成交通拥堵、交通事故、环境污染等一系列问题。为了增强公路网络的运营能力,构建智能公路网络,重要措施之一是提前对公路交通数据进行准确预测。准确的交通数据预测能有效地疏导车流,缓解交通堵塞,提高人们的出行效率。近年来,越来越多的传感器、摄像头等智能设备已经被大量部署在公路网络中。这些设备能不断收集车流量、车速度、车流密度、路面状况等各种交通数据,这些维度丰富的交通大数据为交通数据的准确预测提供了新的解决思路。
目前,交通数据预测领域已经有了大量的研究成果。在早期的研究中,统计学方法较为流行,包括自回归模型、差分整合移动平均自回归模型、线性回归模型等。这类模型有着严谨的数学基础和较强的可解释性,因此被广泛应用。但这类模型只能提取到交通数据中的线性特征,而交通数据具有高度的非线性特征,因此在较为复杂的交通场景中表现较差。随着机器学习的兴起,使用支持向量机、k近邻法、随机森林、梯度下降树等机器学习模型进行交通数据的预测。上述机器学习模型能够提取交通数据中高度的非线性特征,尤其是在大量交通数据的支持下,其模型性能优于传统的统计方法,应用场景也更为广泛。
相比于传统的机器学习方法,深度学习可以提供端到端的训练,从而避免了机器学习依赖于专家知识的特征工程环节。且深度学习能处理更大量的数据、更丰富和异构的数据特征,在理论上能逼近任意函数,这种特质有助于它提取交通领域中更为复杂的交通模式。因而,越来越多的学者转向用深度学习中的各种算法进行交通数据的预测。其中,循环神经网络及其变种常用于提取交通数据中的长期时间依赖性(时间依赖性指的是公路网络中的每个区域的未来交通数据受到自身历史交通数据的影响),序列到序列模型用于交通数据多步预测,卷积神经网络用于将交通网络划分为网格,提取交通网络的空间依赖性(空间依赖性指的是公路网络中每个区域的未来交通数据受到其他区域的历史交通数据的影响)。但是,大部分的交通网络都并非规则的网格结构,它本质上更接近非欧几里得距离的图结构,基于网格划分的空间依赖性提取算法只能粗略、近似地模拟空间性质,无法准确地刻画基于图结构的交通网络。
图神经网络可以将交通网络构建为图,并将深度学习算法迁移到图上来,提取基于图的公路网络的空间依赖性,用循环神经网络去提取交通数据中的时间依赖性,用序列到序列模型去进行交通数据多步预测。然而,交通网络中的时空依赖性并不是相互独立的,而是相互交织的。现有算法都是相对独立地提取时空依赖性,它们只考虑目标区域受到其他区域在过去一段时间内的交通数据的影响,并没有考虑到其他区域过去各个时间段的交通数据对目标区域在给定时间段内的交通数据影响是不同的,导致对交通网络中时空依赖性的提取较为粗糙,而时空依赖性的准确提取对交通数据预测的精度有着重要的影响。
技术实现要素:
本申请提供了一种公路交通状态预测方法、系统、终端以及存储介质,旨在至少在一定程度上解决现有技术中的上述技术问题之一。
为了解决上述问题,本申请提供了如下技术方案:
一种公路交通状态预测方法,包括:
获取交通路网,根据所述交通路网构建有向有权图,将所述交通路网中的每个传感器所在区域作为所述有向有权图上的一个节点,将每个传感器所收集的历史交通数据作为对应节点的原始时间序列数据;
基于所述有向有权图,采用最短路径算法计算任意两个区域的最短花费时间,基于所述最短花费时间计算目标区域与其他区域在给定时间段内的空间注意力因子;其中,所述空间注意力因子表示其他区域i在输入时间步p的交通数据vip对目标区域j在输出时间步q的交通数据vjq的影响程度;
基于所述空间注意力因子,在每个历史时间步聚合其他区域的交通数据,并将聚合后的交通数据与目标区域的交通数据进行拼接,生成包含动态时空信息的新的交通数据;
将所述新的交通数据输入序列到序列模型中,对所述目标区域的交通状况进行多步预测。
本申请实施例采取的技术方案还包括:所述根据所述交通路网构建有向有权图包括:
定义有向有权图g=(v,e,a),图中每个顶点代表所述交通路网中每个传感器所在的区域,v={v1,…,vn}是顶点集,代表图g中共有n个顶点,vi是第个i顶点,即为区域i;
设所述路网中每个传感器在每个时间段分别会产生fi个交通数据,则区域i在时间段p产生的交通数据为
本申请实施例采取的技术方案还包括:所述基于所述最短花费时间计算目标区域与其他区域在给定时间段内的空间注意力因子包括:
将所述输入时间步p与输出时间步q的时间差记为q-p(p<q),将目标区域j与其他区域i之间的最短路径长度记为mij,假设车辆在时间步p从区域i出发到目标区域j,则有以下判定条件:
如果q-p<mij,表示车辆无法在时间步q前到达目标区域j,则判定vip对vjq的影响强度小;
如果ts>q-p≥mij,且ts与q-p的差值小于设定阈值,表示车辆能够在时间步q前到达目标区域j,则vip对vjq的影响强度大;其中,ts表示车辆不走最短路径或发生堵塞,花费的时间大于mij但仍然在预设时间范围内;
如果p-q>>mij,表示车辆在时间步q前已经到达目标区域j且已经离开,则vip对vjq的影响强度小;
基于所述判定规则,所述空间注意力因子计算公式为:
上述公式中,空间注意力因子
本申请实施例采取的技术方案还包括:所述基于所述最短花费时间计算目标区域与其他区域在给定时间段内的空间注意力因子后还包括:
通过图嵌入算法对所述空间注意力因子进行修正;所述空间注意力因子修正方式具体为:
假设所有区域均学习一个隐藏向量,记目标区域j在时间步q的隐藏向量为
定义所述共现概率与空间注意力因子之间的距离为
对所述优化目标进行训练,得到修正后的空间注意力因子
本申请实施例采取的技术方案还包括:所述基于所述空间注意力因子,在每个历史时间步聚合其他区域的交通数据,并将聚合后的交通数据与目标区域的交通数据进行拼接,生成包含动态时空信息的新的交通数据包括:
重构整个网络在输入时间步p对目标区域j在时间步q的影响:
上式中,向量
本申请实施例采取的技术方案还包括:所述生成包含动态时空信息的新的交通数据后还包括:
对所述拼接后的每个输入时间步p的交通数据进行线性增强:
上式中,
本申请实施例采取的技术方案还包括:所述将所述新的交通数据输入序列到序列模型中,对所述目标区域的交通状况进行多步预测具体为:
本申请实施例采取的另一技术方案为:一种公路交通状态预测系统,包括:
图构建模块:用于获取交通路网,根据所述交通路网构建有向有权图,将所述交通路网中的每个传感器所在区域作为所述有向有权图上的一个节点,将每个传感器所收集的历史交通数据作为对应节点的原始时间序列数据;
空间注意力因子计算模块:用于基于所述有向有权图,采用最短路径算法计算任意两个区域的最短花费时间,基于所述最短花费时间计算目标区域与其他区域在给定时间段内的空间注意力因子;其中,所述空间注意力因子表示其他区域j在输入时间步p的交通数据vip对目标区域j在输出时间步q的交通数据vjq的影响程度;
数据重构模块:用于基于所述空间注意力因子,在每个历史时间步聚合其他区域的交通数据,并将聚合后的交通数据与目标区域的交通数据进行拼接,生成包含动态时空信息的新的交通数据;
交通预测模块:用于将所述新的交通数据输入序列到序列模型中,对所述目标区域的交通状况进行多步预测。
本申请实施例采取的又一技术方案为:一种终端,所述终端包括处理器、与所述处理器耦接的存储器,其中,
所述存储器存储有用于实现所述公路交通状态预测方法的程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以控制公路交通状态预测。
本申请实施例采取的又一技术方案为:一种存储介质,存储有处理器可运行的程序指令,所述程序指令用于执行所述公路交通状态预测方法。
相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的公路交通状态预测方法、系统、终端及存储介质通过将交通网络建模为图,结合区域之间的可达性先验知识、最短路径算法和图嵌入技术计算交通网络中每个区域在不同时间段内的交通数据对目标区域在不同预测时间段的交通数据的空间注意力因子,并基于空间注意力因子重构包含时空联动信息的新交通数据,将重构的新交通数据输入序列到序列模型进行目标区域的交通数据多步预测,可以更准确、更全面地考虑到整个交通网络的时空特征对目标区域在不同预测时间段内的交通数据影响,从而取得精度更高的预测效果。
附图说明
图1是本申请实施例的公路交通状态预测方法的流程图;
图2为本申请实施例的公路交通状态预测系统结构示意图;
图3为本申请实施例的终端结构示意图;
图4为本申请实施例的存储介质的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
请参阅图1,是本申请实施例的公路交通状态预测方法的流程图。本申请实施例的公路交通状态预测方法包括以下步骤:
s10:获取交通路网,根据交通路网构建有向有权图,将路网中用于收集交通数据的每个传感器所在区域作为图上的一个节点,将每个传感器所收集的历史交通数据作为对应节点的原始时间序列特征数据;
本步骤中,首先,定义有向有权图g=(v,e,a),图中每个顶点代表路网中每个传感器所在的区域,v={v1,…,vn}是顶点集,代表图g中共有n个顶点,vi是第个i顶点,本发明实施例称其为区域i。
路网中每个传感器都在不断地产生新的交通数据,设路网中每个传感器在每个时间段分别会产生fi个交通数据,则区域i在时间段p产生的交通数据为
公式(1)中,gj是图g中与区域j有关的结构信息,f为基于图的深度学习框架本发明中使用的损失函数是均方误差,具体为:
s20:基于有向有权图,采用dijkstra最短路径算法结合交通路网的带权邻接矩阵计算任意两个区域(节点)的最短花费时间,基于最短花费时间计算目标区域与其他区域在各自给定的时间段内由于可达性而产生的空间注意力因子,并通过图嵌入算法对该空间注意力因子进行修正,使其自适应当前交通数据并动态提取交通数据中的时空依赖性;
本步骤中,由于车辆在交通网络中会不断移动,从而导致各区域之间的交通数据相互作用,因此,目标区域的交通数据会受到其他相关区域的历史交通数据的影响。基于该规律,本发明实施例利用区域间可达性先验知识计算空间注意力因子,又由于基于可达性先验知识计算的空间注意力因子缺乏灵活性,进一步结合图嵌入算法对空间注意力因子进行修正,从而准确全面地刻画不同区域在不同时间段的连接强度,精确捕获交通网络中的时空联动依赖性,便于后续更加有效地进行交通数据的多步预测。
具体的,空间注意力因子计算方式为:将目标区域j在输出时间步q的交通数据记为vjq,将其他区域i在输入时间步p的交通数据记为vip,将输入时间步p与输出时间步q的时间差记为q-p,(p<q),将目标区域j与其他区域i之间的最短路径长度记为mij(采用时间衡量),如果车辆在时间步p从区域i出发到目标区域j,则有以下判定条件:
(1)如果q-p<mij,表示车辆无法在时间步q前到达目标区域j,此时,则判定vip对vjq的影响强度很小。
(2)如果ts>q-p≥mij,且ts与q-p的差值小于设定阈值(相互接近),表示车辆能够在时间步q前到达目标区域j,此时,判定vip对vjq的影响强度很大。其中,ts表示车辆可能不走最短路径,或者路上发生了堵塞,花费的时间大于mij但仍然在预设时间范围内。
(3)如果p->>mij,表示车辆可能在时间步q前已经到达目标区域j且已经离开了一段时间,此时,判定vip对vjq的影响很小。且时间差p-q越大,vip对vjq的影响强度越小。
基于上述判定规则,本发明实施例通过计算空间注意力因子以衡量其他区域与目标区域之间基于可达性的交通数据影响强度,空间注意力因子计算公式如下:
公式(3)中,空间注意力因子
进一步地,由于基于先验可达性定义的空间注意力因子缺乏灵活性,无法自适应当前数据,因此本发明实施例采用图嵌入技术对空间注意力因子进行修正。空间注意力因子修正方式具体为:假设所有区域均学习一个隐藏向量,记目标区域j在时间步q的隐藏向量为
由于∑ejqiplog(ejqip)是常数,不影响优化,因此优化目标变为:
该优化目标可以单独训练,此时修正后的空间注意力因子便具备随机性。该优化目标也可以跟预测目标一起训练,此时修正后的空间注意力因子便能自适应交通数据。总目标函数公式如下:
经过数据训练后,得到修正后的空间注意力因子
s30:基于修正后的空间注意力因子,在每个历史时间步聚合其他区域的原始交通数据,并将聚合后的原始交通数据与目标区域的原始交通数据拼接以及线性增强,生成包含动态时空信息的新的交通数据;
本步骤中,新的交通数据中包含了每个历史时间步中整个网络对目标区域在未来不同时间步的交通数据的影响;交通数据重构方式具体为:
首先,重构整个网络在输入时间步p对目标区域j在时间步q的影响,公式如下:
公式(7)中,向量
由于目标区域自身的历史交通数据也会对自身的未来交通数据产生影响,因此本发明通过将所有其他区域的交通数据聚合与目标区域在输入时间步p的历史交通数据进行拼接,记为
公式(8)中,
s40:将新的交通数据输入序列到序列模型中,对目标区域在多个时间步的交通状况进行多步预测;
本步骤中,序列到序列模型多步预测公式如下:
本发明实施例中,序列到序列模型(seq2seq)包含一个编码器和一个解码器,编码器和解码器均为门控循环单元网络gru,具体为:
hp=gru_encoder(xp,hp-1)(10)
c=hp(11)
sq=gru_decoder([||yq-1],sq-1)(12)
上式中,p是输入时间步,q是输出时间步,
基于上述,本发明实施例采用门控循环单元网络gru作为序列到序列模型的编码器和解码器,能够捕获时间序列数据中的长期时间依赖性,且参数量适中,训练时间短,性能更好。
本申请实施例的公路交通状态预测方法通过将交通网络建模为图,结合区域之间的可达性先验知识、最短路径算法和图嵌入技术计算交通网络中每个区域在不同时间段内的交通数据对目标区域在不同预测时间段的交通数据的空间注意力因子,并基于空间注意力因子重构包含时空联动信息的新交通数据,将重构的新交通数据输入序列到序列模型进行目标区域的交通数据多步预测,可以更准确、更全面地考虑到整个交通网络的时空特征对目标区域在不同预测时间段内的交通数据影响,从而取得精度更高的预测效果。
请参阅图2,是本申请实施例的公路交通状态预测系统的结构示意图。本申请实施例的公路交通状态预测系统40包括:
图构建模块41:用于获取交通路网,根据交通路网构建有向有权图,将路网中用于收集交通数据的每个传感器所在区域作为图上的一个节点,将每个传感器所收集的历史交通数据作为对应节点的原始时间序列特征数据;
空间注意力因子计算模块42:用于基于有向有权图,采用dijkstra最短路径算法结合交通路网的带权邻接矩阵计算任意两个区域(节点)的最短花费时间,基于最短花费时间计算目标区域与其他区域在各自给定的时间段内由于可达性而产生的空间注意力因子,并通过图嵌入算法对该空间注意力因子进行修正,使其自适应当前交通数据并动态提取交通数据中的时空依赖性;其中,所述空间注意力因子表示其他区域i在输入时间步p的交通数据vip对目标区域j在输出时间步q的交通数据vjq的影响程度;
数据重构模块43:用于基于修正后的空间注意力因子,在每个历史时间步聚合其他区域的原始交通数据,并将聚合后的原始交通数据与目标区域的原始交通数据拼接以及线性增强,生成包含动态时空信息的新的交通数据;
交通预测模块44:用于将新的交通数据输入序列到序列模型中,对目标区域在多个时间步的交通状况进行多步预测。
请参阅图3,为本申请实施例的终端结构示意图。该终端50包括处理器51、与处理器51耦接的存储器52。
存储器52存储有用于实现上述公路交通状态预测方法的程序指令。
处理器51用于执行存储器52存储的程序指令以控制公路交通状态预测。
其中,处理器51还可以称为cpu(centralprocessingunit,中央处理单元)。处理器51可能是一种集成电路芯片,具有信号的处理能力。处理器51还可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
请参阅图4,为本申请实施例的存储介质的结构示意图。本申请实施例的存储介质存储有能够实现上述所有方法的程序文件61,其中,该程序文件61可以以软件产品的形式存储在上述存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本申请中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本申请所示的这些实施例,而是要符合与本申请所公开的原理和新颖特点相一致的最宽的范围。
1.一种公路交通状态预测方法,其特征在于,包括:
获取交通路网,根据所述交通路网构建有向有权图,将所述交通路网中的每个传感器所在区域作为所述有向有权图上的一个节点,将每个传感器所收集的历史交通数据作为对应节点的原始时间序列数据;
基于所述有向有权图,采用最短路径算法计算任意两个区域的最短花费时间,基于所述最短花费时间计算目标区域与其他区域在给定时间段内的空间注意力因子;其中,所述空间注意力因子表示其他区域i在输入时间步p的交通数据vip对目标区域j在输出时间步q的交通数据vjq的影响程度;
基于所述空间注意力因子,在每个历史时间步聚合其他区域的交通数据,并将聚合后的交通数据与目标区域的交通数据进行拼接,生成包含动态时空信息的新的交通数据;
将所述新的交通数据输入序列到序列模型中,对所述目标区域的交通状况进行多步预测。
2.根据权利要求1所述的公路交通状态预测方法,其特征在于,所述根据所述交通路网构建有向有权图包括:
定义有向有权图g=(v,e,a),图中每个顶点代表所述交通路网中每个传感器所在的区域,v={v1,…,vn}是顶点集,代表图g中共有n个顶点,vi是第个i顶点,即为区域i;
设所述路网中每个传感器在每个时间段分别会产生fi个交通数据,则区域i在时间段p产生的交通数据为
3.根据权利要求2所述的公路交通状态预测方法,其特征在于,所述基于所述最短花费时间计算目标区域与其他区域在给定时间段内的空间注意力因子包括:
将所述输入时间步p与输出时间步q的时间差记为q-p(p<q),将目标区域j与其他区域i之间的最短路径长度记为mij,假设车辆在时间步p从区域i出发到目标区域j,则有以下判定条件:
如果q-p<mij,表示车辆无法在时间步q前到达目标区域j,则判定vip对vjq的影响强度小;
如果ts>q-p≥mij,且ts与q-p的差值小于设定阈值,表示车辆能够在时间步q前到达目标区域j,则vip对vjq的影响强度大;其中,ts表示车辆不走最短路径或发生堵塞,花费的时间大于mij但仍然在预设时间范围内;
如果p-q>>mij,表示车辆在时间步q前已经到达目标区域j且已经离开,则vip对vjq的影响强度小;
基于所述判定规则,所述空间注意力因子计算公式为:
上述公式中,空间注意力因子
4.根据权利要求3所述的公路交通状态预测方法,其特征在于,所述基于所述最短花费时间计算目标区域与其他区域在给定时间段内的空间注意力因子后还包括:
通过图嵌入算法对所述空间注意力因子进行修正;所述空间注意力因子修正方式具体为:
假设所有区域均学习一个隐藏向量,记目标区域j在时间步q的隐藏向量为
定义所述共现概率与空间注意力因子之间的距离为
对所述优化目标进行训练,得到修正后的空间注意力因子
5.根据权利要求4所述的公路交通状态预测方法,其特征在于,所述基于所述空间注意力因子,在每个历史时间步聚合其他区域的交通数据,并将聚合后的交通数据与目标区域的交通数据进行拼接,生成包含动态时空信息的新的交通数据包括:
重构整个网络在输入时间步p对目标区域j在时间步q的影响:
上式中,向量
6.根据权利要求5所述的公路交通状态预测方法,其特征在于,所述生成包含动态时空信息的新的交通数据后还包括:
对所述拼接后的每个输入时间步p的交通数据进行线性增强:
上式中,
7.根据权利要求6所述的公路交通状态预测方法,其特征在于,所述将所述新的交通数据输入序列到序列模型中,对所述目标区域的交通状况进行多步预测具体为:
8.一种公路交通状态预测系统,其特征在于,包括:
图构建模块:用于获取交通路网,根据所述交通路网构建有向有权图,将所述交通路网中的每个传感器所在区域作为所述有向有权图上的一个节点,将每个传感器所收集的历史交通数据作为对应节点的原始时间序列数据;
空间注意力因子计算模块:用于基于所述有向有权图,采用最短路径算法计算任意两个区域的最短花费时间,基于所述最短花费时间计算目标区域与其他区域在给定时间段内的空间注意力因子;其中,所述空间注意力因子表示其他区域i在输入时间步p的交通数据vip对目标区域j在输出时间步q的交通数据vjq的影响程度;
数据重构模块:用于基于所述空间注意力因子,在每个历史时间步聚合其他区域的交通数据,并将聚合后的交通数据与目标区域的交通数据进行拼接,生成包含动态时空信息的新的交通数据;
交通预测模块:用于将所述新的交通数据输入序列到序列模型中,对所述目标区域的交通状况进行多步预测。
9.一种终端,其特征在于,所述终端包括处理器、与所述处理器耦接的存储器,其中,
所述存储器存储有用于实现权利要求1-7任一项所述的公路交通状态预测方法的程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以控制公路交通状态预测。
10.一种存储介质,其特征在于,存储有处理器可运行的程序指令,所述程序指令用于执行权利要求1至7任一项所述公路交通状态预测方法。
技术总结