一种基于算法模型分析的车流量预测方法与流程

    专利2022-07-08  113


    本申请属于智能公共交通数据处理技术领域,具体涉及一种基于算法模型分析的车流量预测方法。



    背景技术:

    伴随经济社会高速发展、城镇化进程不断加快,我国机动车量正在逐年递增。车流量预测对于公共交通出行、调度等工作具有很高的指导意义。但在现有的车流量预测方式中,基本是根据时间点、天气、节假日等影响因素进行的简单预测,考虑的影响因素单一,导致最终车流量预测结果不够准确,使数据的可参考性大大降低。

    目前基于时间序列的预测方法所需参数少、预测适用范围广,像目前的arima模型、sarima模型和var模型在短期预测车流量上已取得一定成就。但是在利用上述各模型进行预测时,往往只着眼于模型本身,对于输入模型的数据目前还没有较好的处理方式,这就导致了即使模型在预测上的准确率较高,也会因为获取的多因素影响的数据的不准确而导致预测结果不准确。



    技术实现要素:

    本申请的目的在于提供一种基于算法模型分析的车流量预测方法,旨在克服现有技术中对车流量预测准确度不高的问题。

    为实现上述目的,本申请所采取的技术方案为:

    一种基于算法模型分析的车流量预测方法,用于公共智能交通中的车流分析预警,所述基于算法模型分析的车流量预测方法,包括:

    步骤1、获取历史车流量数据,基于天气、周期、季节以及路口环境这四个影响因素对所述历史车流量数据进行主成分分析归类,得到包含归类至四个不同组别的初始待测数据,并计算各组别中的数据量在初始待测数据中的占比;

    步骤2、根据分割系数将初始待测数据重新划分为多个集合,分别对每个集合中的所有历史车流量数据进行编号,根据编号将每个集合中的所有历史车流量数据组成一维待测序列,将所有一维待测序列分别输入至基于mse函数进行迭代优化的lstm模型中得到对应的多个待测时间序列,所述分割系数根据初始待测数据中各组别的占比计算得到;

    步骤3、根据历史车流量数据的自相关系数和偏自相关系数判断待测时间序列的平稳性,若待测时间序列为平稳序列,则进行白噪声过程处理;否则进行一阶差分处理后重新判断是否为平稳序列,若一阶差分处理后的待测时间序列为平稳序列,则进行白噪声过程处理;否则进行二阶差分处理后再进行白噪声过程处理;

    步骤4、基于进行白噪声过程处理后的待测时间序列,利用arima模型进行车流量预测,若arima模型输出的置信水平小于置信阈值,则丢弃当前arima模型输出的预测结果;否则保留arima模型输出的预测结果;

    步骤5、针对进行白噪声过程处理后的每一待测时间序列执行步骤4,得到多个预测结果,融合多个预测结果得到历史车流量数据对应路口的车流量预测值。

    以下还提供了若干可选方式,但并不作为对上述总体方案的额外限定,仅仅是进一步的增补或优选,在没有技术或逻辑矛盾的前提下,各可选方式可单独针对上述总体方案进行组合,还可以是多个可选方式之间进行组合。

    作为优选,所述将所有一维待测序列分别输入至基于mse函数进行迭代优化的lstm模型中得到对应的多个待测时间序列,包括:

    取一个一维待测序列输入至lstm模型中;

    基于当前的一维待测序列以及lstm模型输出的待测时间序列,通过均方误差mse函数计算损失函数;

    若根据损失函数计算得到的损失值大于预设的损失阈值,则调整lstm模型的参数并重新将该一维待测序列输入至参数调整后的lstm模型中进行处理;否则将当前lstm模型输出的待测时间序列作为最终的待测时间序列;

    取新的一个一维待测序列并重复上述步骤,直至完成所有一维待测序列的处理。

    作为优选,所述步骤2还包括,在根据分割系数将初始待测数据重新划分为多个集合之前,对初始待测数据进行平滑处理,所述平滑处理包括:

    根据各组别中的所有历史车流量数据计算各组别的平均车流量;

    将每个组别中与平均车流量的差值的绝对值大于平均车流量预设倍数的历史车流量数据剔除。

    作为优选,所述白噪声过程处理包括:

    定义车流量数据的观测值zt:

    zt=λ1zt 1 λ2zt-2 λ3zt-3 … pzt-p vt

    式中,观测值zt即为t时刻的滞后变量数的自回归模型,λp为历史车流量数据与影响因素之间的回归参数,p为车流高峰期时的滞后变量数,vt表示将t时刻的历史车流量数据进行白噪声处理过程的噪声值;

    将待测时间序列中的每一历史车流量数据代入自回归模型中,得到对应的观测值,完成白噪声过程处理。

    作为优选,所述基于算法模型分析的车流量预测方法还包括计算车流量数据变化趋势,所述计算车流量数据变化趋势包括:

    构建增比指标,其表达式为:

    式中,zi表示本次预测得到的车流量预测值,zi-1表示相对于本次车流量预测值所在时间段i而言的上一时间段i-1的车流量数据。

    本申请提供的基于算法模型分析的车流量预测方法,与现有技术相比,具有以下有益效果:

    (1)不同于现有的单影响因素进行数据分析的方式,本申请将与车流量变化相关的多种影响因素(例如天气,周期,季节以及路口环境等)进行主成分分析划分归类,能使预测值更具代表性;

    (2)在arima模型对数据序列使用前,将lstm模型得到的数值通过mse函数得到数据的损失函数进行迭代优化,增加数据黏度,得到最佳的待测时间序列,提高预测数据的准确性,为大数据处理提供了一个新思路;

    (3)在学习预测初始序列时已经进行了降维分割等相关处理,可提升后续算法计算的运行速度。

    附图说明

    图1为本申请的基于算法模型分析的车流量预测方法的流程图。

    具体实施方式

    下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

    除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是在于限制本申请。

    实时准确的道路短时交通预测是智能交通系统的核心内容和重要基础,而且有利于交通管理者实施动态交通诱导、保证交通控制与安全、实现先进的交通管理。本申请提供的基于算法模型分析的车流量预测方法,能够综合考虑各影响因素对车流量预测的影响,得到准确率较高的车流量预测结果,为智能交通系统的运行奠定基础,在基于车流量预测值实现的交通资源调度、保障交通运输安全等方面具有较高的应用价值。

    尤其是应用于高速公路收费站的车流量预测,可以基于车流量预测值,实现高速公路收费人员的动态配置,对交通部门掌握高速公路车流量情况以及实施车流诱导、分流、信息发布等均具有重要参考意义。

    如图1所示,本实施例的基于算法模型分析的车流量预测方法,包括以下步骤:

    步骤1、获取历史车流量数据,基于天气、周期、季节以及路口环境这四个影响因素对所述历史车流量数据进行主成分分析归类,得到包括归类至四个不同组别的初始待测数据,并计算各组别中的数据量在初始待测数据中的占比。

    需要说明的是,这里的历史车流量数据可以是同一来源(即同一平台获取)的数据,也可以是多个来源的数据,本实施例中不对数据的来源进行限制。但相同的是,不论历史车流量数据的来源是哪里,每条历史车流量数据都带有相应标签以标识该历史车流量数据对应的天气、周期、季节以及路口环境。

    容易理解的是,为了识别不同时段下的车流量数据,设置标签是交通数据处理技术领域的常规手段,这里不对标签如何设置进行说明。而标签的内容也是根据实际应用进行多种设置的,例如天气可以是包含雨天、晴天、雪天,甚至可以将雨天细化为大雨天、小雨天等,周期是指以年月日或是周,季度以及具体时间间隔点等作为计算周期,路口环境可分为人形路口,三叉路口,十字路口,是否投放信号灯等。但不论如何设置标签内容,每条历史车流量数据均能够被划分至与某一影响因素最近接的组别中,而具体的划分过程为主成分分析法的执行步骤,本实施例采用现有的主成分分析法实现即可,这里不对归类过程进行赘述。

    在获取历史车流量数据时,根据设置的天气、周期、季节以及路口环境为筛选条件进行选取,得到想要预测的路口、以及设定周期下预测得到的下一周期的预测结果。

    本实施例中进行分类后,各个组别中包含不同的数据量,为了后续更好的融合各组别中的数据,计算各个组别中的数据量占总数据量(即初始待测数据)的比重,得到百分比模型。获取的历史车流量数据中包含了多条历史车流量数据,因此这里的数据量是指各个组别中历史车流量数据的条数。步骤2、根据分割系数将初始待测数据重新划分为多个集合,分别对每个集合中的所有历史车流量数据进行编号,根据编号将每个集合中的所有历史车流量数据组成一维待测序列,将所有一维待测序列分别输入至基于mse函数进行迭代优化的lstm模型(long-shorttermmemory,长短期记忆模型)中得到对应的多个待测时间序列,所述分割系数根据初始待测数据中各组别的占比计算得到。

    为了使集合的划分与原始获取的历史车流量数据更加贴合,本实施例中基于步骤1中计算得到的占比确定分割系数,可以是直接将占比作为划分比例进行重新划分,也可以将各占比的归一化均值作为分割系数进行重新划分,本实施例不对具体的分割系数确定方式进行限制,可根据实际操作进行调整。

    本实施例将步骤1中归类后的初始待测数据重新进行分割,即将所有组别中的数据重新进行混合,并基于混合打乱顺序后的数据进行重新划分,使得每个集合中包含各个影响因素的数据,避免历史数据过于单一化导致最终的预测结果不准确。

    并且利用lstm模型对一维待测序列进行处理输出时序性更强的待测时间序列。通常现有在使用lstm模型使,事先对lstm模型进行训练优化,以得到针对训练数据的最优的lstm模型,而本申请考虑到历史车流量数据中影响因素的复杂性,不对lstm模型进行事先训练优化,而是采用基于mse函数进行迭代优化的lstm模型进行输出,具体的本实施例在得到待测时间序列时采用以下方式:

    1)取一个一维待测序列输入至lstm模型中;

    2)基于当前的一维待测序列以及lstm模型输出的待测时间序列,通过均方误差mse函数计算损失函数;

    3)若根据损失函数计算得到的损失值大于预设的损失阈值,则调整lstm模型的参数(包括每一个神经元内各个层次的梯度进行权重更新)并重新将该一维待测序列输入至参数调整后的lstm模型中进行处理,即将lstm模型的参数更新后重新执行步骤2);否则将当前lstm模型输出的待测时间序列作为最终的待测时间序列;

    4)取新的一个一维待测序列并重复上述步骤2)、3),直至完成所有一维待测序列的处理。

    lstm模型在处理前具有默认参数,第一个一维待测序列第一次处理基于默认参数进行,而其他的一维待测序列可以是基于默认参数的lstm模型开始处理,也可以是基于上一个一维待测序列最终更新后的参数开始处理。本实施例中在利用lstm模型时,基于mse函数将每一一维待测序列本身作为训练数据优化lstm模型,并利用优化后的lstm模型输出最终的待测时间序列,该方式不仅能够保留每一集合中原始数据的原始特征,并且对影响因素众多的历史车流量数据也具有较优的适应性,增加最终得到的待测时间序列的黏度,使得车流量数据在原有的影响因素分析的基础上更具代表性。

    其中均方误差mse函数的计算公式如下:

    式中,n为当前集合(即一维待测序列)的平均车流量值,m为当前集合的数据量,i为当前集合中的第i个编号,ωi为当前集合中的第i个编号对应的权重,yi为当前集合中的第i个编号的历史车流量数据,为lstm模型输出的与yi对应的预测车流量数据。

    采用mse函数得到数据的损失函数进行迭代优化,计算每一个神经元内各个层次的梯度进行权重更新,不同时间点数据通过大量训练时间序列进行机器学习,得到车流量相关的影响因素以及时间点之间的权重比。这样将结果进行缩放后可得到新的车流量待测时间序列。

    对于车流量而言,通常变化幅度较小,变化幅度较大的数据通常不具有代表性,因此在另一个实施例中,为避免数据变化幅度过大或过小的数值对预测结果的影响,本实施例中将初始待测数据中每个组别中的数据进行平缓处理,具体包括:

    根据各组别中的所有历史车流量数据计算各组别的平均车流量;

    将每个组别中与平均车流量的差值绝对值大于平均车流量预设倍数的历史车流量数据剔除。

    即,若则需要将历史车流量数据xj剔除,其中为xj所在组别的所有历史车流量数据的平均车流量,b为预设倍数。通常b取值在5%以内,以保证具有较优的数据平滑效果。

    步骤3、根据历史车流量数据的自相关系数和偏自相关系数判断待测时间序列的平稳性,若待测时间序列为平稳序列,则进行白噪声过程处理;否则进行一阶差分处理后重新判断是否为平稳序列,若一阶差分处理后的待测时间序列为平稳序列,则进行白噪声过程处理;否则进行二阶差分处理后再进行白噪声过程处理。

    在判断待测时间序列是否为平稳序列时,将判断的待测时间序列代入自相关和偏相关系数计算公式中,根据平稳序列的平稳性主要体现在均值不变、方差有限,其余限制很弱这一特性判断。需要说明的是,判断序列的平稳性为时间序列应用的常规处理,这里不再进行赘述。

    本申请基于平稳序列进行后续的预测处理,是因为平稳序列中,往往(x1,…,xn)与xn 1不独立,所以利用历史样本来预测未来时间就有了可能。

    本实施例中进行白噪声过程处理的具体步骤为:

    定义车流量数据的观测值zt:

    zt=λ1zt-1 λ2zt-2 λ3zt-3 … λpzt-p vt

    式中,观测值zt即为t时刻的滞后变量数的自回归模型,λp为历史车流量数据与影响因素之间的回归参数,p为车流高峰期时的滞后变量数,vt表示将t时刻的历史车流量数据进行白噪声处理过程的噪声值;

    将待测时间序列中的每一历史车流量数据代入自回归模型中,得到对应的观测值,完成白噪声过程处理。白噪声过程处理将普通的时间序列数据转化为arima模型(autoregressiveintegratedmovingaveragemodel,自回归积分滑动平均模型)所能识别的数据格式,以便于进行预测,是利用arima模型进行预测的基本处理步骤。

    步骤4、基于进行白噪声过程处理后的待测时间序列,利用arima模型进行车流量预测,若arima模型输出的置信水平小于置信阈值,则丢弃当前arima模型输出的预测结果;否则保留arima模型输出的预测结果。

    本实施例进行车流量预测时,丢弃预测结果不符合要求的预测结果,仅保留置信水平较高的预测结果,可进一步对最终的预测结果进行筛选,以提高最终的预测值。常置信阈值设置为95%,避免循环次数过程带来较大的计算压力,又可以保证得到准确度较高的预测结果。

    步骤5、针对进行白噪声过程处理后的每一待测时间序列执行步骤4,得到多个预测结果,融合多个预测结果得到历史车流量数据对应路口的车流量预测值。

    若对每一待测时间序列执行步骤4以后,无保留的预测结果,则表示本次集合划分代表性较低,因此返回步骤2进行重新划分并执行;若仅保留一个预测结果,则将该预测结果作为当前路口(该路口即为步骤1中获取历史车流量数据时对应的路口)的车流量预测值;若保留多个预测结果,则融合多个预测结果,这里的融合可以是选择多个预测结果中的随机一个,也可以是取多个预测结果的均值、中值作为最终的车流量预测结果。

    在实际应用中,所有预测结果的置信水平均未达到置信阈值的情况是比较少的,因此通常考虑多个预测结果的情况,而多个预测结果得到最终的车流量预测值的方式也是可以具有多种方式的,其优选方式为取均值。

    预测的车流量预测值是针对下一时间段的车流量预测值,这里的下一时间段根据预设的开始预测时间以及时间间距而定,时间间距即为步骤1中设置的周期,开始预测时间通常为当前时间,也可以是历史车流量数据中的最新时间。

    在一个实施例中,为了增加对预测值的变化率情况分析,有效来进一步判定此算法分析下的车流量预测值在天气、周期、季节以及路口环境多影响因素下的车流量变化趋势。本实施例引入增比指标,其表达式为:

    式中,zi表示本次预测得到的车流量预测值,zi-1表示相对于本次车流量预测值所在时间段i而言的上一时间段i-1的车流量数据。

    经过导入计算可以得到时间段区间内车流量值的变化率,判断车流量变化趋势,以便于对车流量进行前瞻预判。

    本发明得到的车流量相较于以往的预测模型,由于预设的分割系数将已过滤的车流量初始待测数据划分到多个集合中,将已处理好的数据集合划分所在的集合编号组成的一维待测序列,结合lstm模型再采用mse函数得到数据的损失函数进行迭代优化,得到所述最终确认的车流量待测时间序列,这样得到的检测数据更具代表性以及专业性,可以有效的提升车流量预测结果的准确性。

    应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

    以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

    以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。


    技术特征:

    1.一种基于算法模型分析的车流量预测方法,用于公共智能交通中的车流分析预警,其特征在于,所述基于算法模型分析的车流量预测方法,包括:

    步骤1、获取历史车流量数据,基于天气、周期、季节以及路口环境这四个影响因素对所述历史车流量数据进行主成分分析归类,得到包含归类至四个不同组别的初始待测数据,并计算各组别中的数据量在初始待测数据中的占比;

    步骤2、根据分割系数将初始待测数据重新划分为多个集合,分别对每个集合中的所有历史车流量数据进行编号,根据编号将每个集合中的所有历史车流量数据组成一维待测序列,将所有一维待测序列分别输入至基于mse函数进行迭代优化的lstm模型中得到对应的多个待测时间序列,所述分割系数根据初始待测数据中各组别的占比计算得到;

    步骤3、根据历史车流量数据的自相关系数和偏自相关系数判断待测时间序列的平稳性,若待测时间序列为平稳序列,则进行白噪声过程处理;否则进行一阶差分处理后重新判断是否为平稳序列,若一阶差分处理后的待测时间序列为平稳序列,则进行白噪声过程处理;否则进行二阶差分处理后再进行白噪声过程处理;

    步骤4、基于进行白噪声过程处理后的待测时间序列,利用arima模型进行车流量预测,若arima模型输出的置信水平小于置信阈值,则丢弃当前arima模型输出的预测结果;否则保留arima模型输出的预测结果;

    步骤5、针对进行白噪声过程处理后的每一待测时间序列执行步骤4,得到多个预测结果,融合多个预测结果得到历史车流量数据对应路口的车流量预测值。

    2.如权利要求1所述的基于算法模型分析的车流量预测方法,其特征在于,所述将所有一维待测序列分别输入至基于mse函数进行迭代优化的lstm模型中得到对应的多个待测时间序列,包括:

    取一个一维待测序列输入至lstm模型中;

    基于当前的一维待测序列以及lstm模型输出的待测时间序列,通过均方误差mse函数计算损失函数;

    若根据损失函数计算得到的损失值大于预设的损失阈值,则调整lstm模型的参数并重新将该一维待测序列输入至参数调整后的lstm模型中进行处理;否则将当前lstm模型输出的待测时间序列作为最终的待测时间序列;

    取新的一个一维待测序列并重复上述步骤,直至完成所有一维待测序列的处理。

    3.如权利要求1所述的基于算法模型分析的车流量预测方法,其特征在于,所述步骤2还包括,在根据分割系数将初始待测数据重新划分为多个集合之前,对初始待测数据进行平滑处理,所述平滑处理包括:

    根据各组别中的所有历史车流量数据计算各组别的平均车流量;

    将每个组别中与平均车流量的差值的绝对值大于平均车流量预设倍数的历史车流量数据剔除。

    4.如权利要求1所述的基于算法模型分析的车流量预测方法,其特征在于,所述白噪声过程处理包括:

    定义车流量数据的观测值zt:

    式中,观测值zt即为t时刻的滞后变量数的自回归模型,λp为历史车流量数据与影响因素之间的回归参数,p为车流高峰期时的滞后变量数,vt表示将t时刻的历史车流量数据进行白噪声处理过程的噪声值;

    将待测时间序列中的每一历史车流量数据代入自回归模型中,得到对应的观测值,完成白噪声过程处理。

    5.如权利要求1所述的基于算法模型分析的车流量预测方法,其特征在于,所述基于算法模型分析的车流量预测方法还包括计算车流量数据变化趋势,所述计算车流量数据变化趋势包括:

    构建增比指标,其表达式为:

    式中,zi表示本次预测得到的车流量预测值,zi-1表示相对于本次车流量预测值所在时间段i而言的上一时间段i-1的车流量数据。

    技术总结
    本发明公开了一种基于算法模型分析的车流量预测方法,不同于现有的单影响因素进行数据分析的方式,本发明将与车流量变化相关的多种影响因素进行主成分分析划分归类,能使预测值更具代表性。并且在ARIMA模型对数据序列使用前,将LSTM模型得到的数值通过mse函数得到数据的损失函数进行迭代优化,增加数据黏度,得到最佳的待测时间序列,提高预测数据的准确性,为大数据处理提供了一个新思路。

    技术研发人员:董辉;李娜;吴祥;郭方洪;俞立;张文安
    受保护的技术使用者:浙江工业大学
    技术研发日:2020.11.19
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-15265.html

    最新回复(0)