一种基于多任务学习的多模式出行需求预测方法与流程

    专利2022-07-08  122


    本发明涉及交通需求预测
    技术领域
    ,特别是一种基于多任务学习的多模式出行需求预测方法。
    背景技术
    :近年来,网约车、共享单车等新型出行方式逐渐受到人们的欢迎,人们对于新型交通资源的需求也与日俱增。因此,通过准确地预测出行需求,更好地调度交通资源、降低企业运行成本、提升出行服务的质量,显得越来越重要。在已有的出行需求预测方法中,一部分采用了传统的线性模型以及机器学习的方法,还有一部分采用了深度学习方法。已有的方法大多属于单任务学习,没有考虑融合多种交通方式的出行需求预测任务。技术实现要素:本发明所要解决的技术问题是克服现有技术的不足而提供一种基于多任务学习的多模式出行需求预测方法,本发明融合多种出行需求预测任务,提高出行需求的预测精度。本发明为解决上述技术问题采用以下技术方案:根据本发明提出的一种基于多任务学习的多模式出行需求预测方法,包括以下步骤:步骤1、采集多种交通方式的非集计出行数据,对非集计出行数据进行预处理,预处理后的非集计出行数据作为标准化出行记录数据;非集计出行数据包括出发时间以及出发点经纬度字段;步骤2、构造出行需求网格图;具体如下:采用网格划分研究区域,得到空间网格图gi×j,gi×j中的空间网格的行坐标用i表示、列坐标用j表示,用于统计出行记录数量的时间粒度设定为t,按照时间粒度将一日划分为时间片,依据出发时间以及出发点经纬度字段将标准化出行记录数据中的每条出行记录匹配到对应的时间片和空间网格,统计每个空间网格在每个时间片内的出行记录的数量并将其作为出行需求,从而得到出行需求以及出行需求网格图dt,i×j;其中,gi×j表示包含i行、j列的空间网格图,表示第i行第j列的空间网格在第t时间片的出行需求,dt,i×j表示包含i行、j列的空间网格图在第t时间片的出行需求网格图,i表示空间网格图的行数,j表示空间网格图的列数;步骤3、构造局部出行需求网格图的时间序列,具体如下:使用s×s的滑动窗口在出行需求网格图上滑动,使得滑动窗口的中心网格遍历过所有空间网格,从而得到局部出行需求网格图lt,将局部出行需求网格图按照时间顺序排列,得到局部出行需求网格图的时间序列;其中,lt表示在第t时间片的局部出行需求网格图,s为滑动窗口的边长;步骤4、构造多任务学习样本集,将局部出行需求网格图的时间序列构造为多任务学习样本集d;步骤5、构造基于多任务学习的出行需求预测模型,基于多任务学习的出行需求预测模型包括n个前置模块、共享模块和n个后置模块,前置模块包括m个卷积神经网络cnn层、m个全连接层和长短时记忆神经网络lstm层,m个卷积神经网络cnn层一一对应地连接m个全连接层,m个全连接层分别连接长短时记忆神经网络lstm层,共享模块、后置模块均分别包括依次顺序连接的第一全连接层、弃置层和第二全连接层;其中,n是交通方式的种类数,m表示d中输入至所构造基于多任务学习的出行需求预测模型的局部出行需求网格图的时间序列的长度;步骤6、使用步骤4中的多任务学习样本集,训练步骤5中所述基于多任务学习的出行需求预测模型,得到训练好的出行需求预测模型;步骤7、利用步骤6训练好的出行需求预测模型即能进行多模式的出行需求预测。作为本发明所述的一种基于多任务学习的多模式出行需求预测方法进一步优化方案,步骤1中预处理是指:去除非集计出行数据中字段信息缺失以及不在研究区域内的数据;步骤1中非集计出行数据包括的字段有:出发时间、出发点经纬度;缺少以上任意一个字段的数据视为信息不完整的数据,不在研究区域内的数据视为冗余数据,都进行去除。作为本发明所述的一种基于多任务学习的多模式出行需求预测方法进一步优化方案,步骤2中将标准化出行记录数据中的每条出行记录匹配到对应的时间片,是指:将出行时间在第t时间片内的出行记录匹配到第t时间片,出行记录匹配到时间片具体为,为标准化出行记录数据添加时间片字段;步骤2中将标准化出行记录数据中的每条出行记录匹配到对应的空间网格,是指:计算空间网格的边界的经度和纬度,将出行经纬度位于第i行、第j列的空间网格的边界内的出行记录匹配到第i行、第j列的空间网格,将出行记录匹配到空间网格具体为,为标准化出行记录数据添加空间网格的行坐标和列坐标字段。作为本发明所述的一种基于多任务学习的多模式出行需求预测方法进一步优化方案,空间网格图的尺寸i、j为10或15或20,时间粒度t=30min。作为本发明所述的一种基于多任务学习的多模式出行需求预测方法进一步优化方案,步骤3中滑动窗口的边长s设置为5,使用5×5的滑动窗口在出行需求网格图上选取局部出行需求网格图;按照时间顺序排列得到局部出行需求网格图的时间序列。作为本发明所述的一种基于多任务学习的多模式出行需求预测方法进一步优化方案,步骤4中,多任务学习样本集d={d1,d2,…,dn,…,dn},其中dn表示第n种交通方式的样本集,n为大于等于1小于等n的整数,dn中的第k个样本表示为其中,表示第n种交通方式的样本集的第k个样本的特征,表示在第(t-m)时间片第n种交通方式的局部出行需求网格图,m=1,2,3,…,m,表示第n种交通方式第k个样本的标签,表示第n种交通方式在第t时间片的出行需求。作为本发明所述的一种基于多任务学习的多模式出行需求预测方法进一步优化方案,n=2或3,m取值为8。作为本发明所述的一种基于多任务学习的多模式出行需求预测方法进一步优化方案,步骤5中基于多任务学习的出行需求预测模型的层与层的具体连接关系包括:步骤51、将第n种交通方式的样本集的第k个样本的特征输入至第n个前置模块,前置模块首先对进行卷积和全连接处理,然后进行长短时记忆处理,第n个前置模块的输出作为出行需求时空特征其中,表示第t时间片的第n种交通方式的出行需求时空特征;步骤52、将所述出行需求时空特征输入到共享模块,共享模块对进行全连接、弃置以及全连接处理,得到融合出行需求特征ht,其中,ht表示第t时间片的融合出行需求特征;步骤53、将所述融合出行需求特征ht输入所有后置模块,后置模块分别对ht进行全连接、弃置以及全连接处理,第n个后置模块的输出为其中,表示第t时间片的第n种交通方式的出行需求。本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明的基于多任务学习的多模式出行需求预测方法,融合多模式出行需求预测任务,设计了基于多任务学习的出行需求预测模型,模型共分为三个模块:前置模块、共享模块以及后置模块,前置模块负责接收输入特征,共享模块将不同交通方式的中间特征拼接并输出融合特征,后置模块接收前一模块的融合特征并输出不同方式的出行需求量。本方法可以同时预测多种交通方式的出行需求,本方法通过融合不同交通方式的出行需求的中间特征,使得多种交通方式的出行需求的预测效果优于单一交通方式的出行需求的预测效果。附图说明图1是本发明的技术路线示意图。图2是本发明的前置模块的示意图。图3是本发明的共享模块的示意图。图4是本发明的后置模块的示意图。图5是本发明的实施例的学习曲线展示图。图6是本发明的实施例的预测效果展示图。具体实施方式为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。本发明具体实施方式包括以下步骤和内容:本发明的技术路线如图1所示,主要包括七步,分别为预处理非集计出行数据、划分空间网格及时间片、统计出行记录数量、构造出行需求网格图、构造多任务学习样本集、训练多任务学习模型以及预测多模式出行需求。城市居民出行的交通方式主要包括公交车、地铁、网约车、出租车、公共自行车、共享单车以及私家车等。当交通方式种类数n取值为2时,那么所研究的交通方式可以为前述交通方式中的任意两种;当交通方式种类数n取值为3时,那么所研究的交通方式可以为前述交通方式中的任意三种。在本实施方式中,n=2,研究的交通方式为出租车和公共自行车。1)预处理非集计出行数据:本实施例选用了苏州市出租车订单数据和公共自行车数据作为研究对象,原始数据的基本字段如表1所示:表1非集计出行数据字段其中,出租车数据中的fstartlon、fstartlat、fstarttime字段以及自行车数据中的leasetime、借车经度、借车纬度字段是本实施例需要使用的字段。在预处理原始数据的过程中,主要进行了以下操作:删除含有缺失值的记录,将地理坐标系经纬度转换为utm投影坐标系统下的坐标,同时将时间字段拆分为月、日、小时以及分钟字段。预处理后的数据字段如表2所示:表2已处理数据字段交通方式处理后数据字段出租车mouth,day,hour,min,x,y公共自行车mouth,day,hour,min,x,y2)划分空间网格:本实施例的研究区域为苏州古城部分城区,以苏州古城(x=271551.6m,y=3466875.9m)位置为中心,空间网格的大小设置为400m×400m,选取10×10的空间网格区域作为研究区域;3)构造多任务学习样本集;4)实现多任务学习预测模型:本实例使用基于python语言的pytorch包编写多任务学习预测模型的代码,多任务学习预测模型包括三个模块:前置模块、共享模块以及后置模块;前置模块的层与层之间的连接关系如图2所示,共享模块的层与层之间的连接关系如图3所示,后置模块的层与层之间的连接关系如图4所示;5)训练模型:选择均方根误差作为模型的损失函数,设置训练轮数为60,模型在本实施例的数据集上的均方根误差随训练轮数的变化曲线如图5所示;由模型的训练曲线可知,在训练轮数达到50次左右时,损失函数趋于不变,因此把第50次训练得到的模型参数作为最优参数,即最优模型的参数;6)实现预测:将新的数据输入到需求预测模型,得到出行需求的预测值,预测值与实际值的对比图如图6所示,其中,横坐标为时间片的标签,纵坐标为订单数量。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
    技术领域
    的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围内。当前第1页1 2 3 
    技术特征:

    1.一种基于多任务学习的多模式出行需求预测方法,其特征在于,包括以下步骤:

    步骤1、采集多种交通方式的非集计出行数据,对非集计出行数据进行预处理,预处理后的非集计出行数据作为标准化出行记录数据;非集计出行数据包括出发时间以及出发点经纬度字段;

    步骤2、构造出行需求网格图;具体如下:

    采用网格划分研究区域,得到空间网格图gi×j,gi×j中的空间网格的行坐标用i表示、列坐标用j表示,用于统计出行记录数量的时间粒度设定为t,按照时间粒度将一日划分为时间片,依据出发时间以及出发点经纬度字段将标准化出行记录数据中的每条出行记录匹配到对应的时间片和空间网格,统计每个空间网格在每个时间片内的出行记录的数量并将其作为出行需求,从而得到出行需求以及出行需求网格图dt,i×j;其中,gi×j表示包含i行、j列的空间网格图,表示第i行第j列的空间网格在第t时间片的出行需求,dt,i×j表示包含i行、j列的空间网格图在第t时间片的出行需求网格图,i表示空间网格图的行数,j表示空间网格图的列数;

    步骤3、构造局部出行需求网格图的时间序列,具体如下:

    使用s×s的滑动窗口在出行需求网格图上滑动,使得滑动窗口的中心网格遍历过所有空间网格,从而得到局部出行需求网格图lt,将局部出行需求网格图按照时间顺序排列,得到局部出行需求网格图的时间序列;其中,lt表示在第t时间片的局部出行需求网格图,s为滑动窗口的边长;

    步骤4、构造多任务学习样本集,将局部出行需求网格图的时间序列构造为多任务学习样本集d;

    步骤5、构造基于多任务学习的出行需求预测模型,基于多任务学习的出行需求预测模型包括n个前置模块、共享模块和n个后置模块,前置模块包括m个卷积神经网络cnn层、m个全连接层和长短时记忆神经网络lstm层,m个卷积神经网络cnn层一一对应地连接m个全连接层,m个全连接层分别连接长短时记忆神经网络lstm层,共享模块、后置模块均分别包括依次顺序连接的第一全连接层、弃置层和第二全连接层;其中,n是交通方式的种类数,m表示d中输入至所构造基于多任务学习的出行需求预测模型的局部出行需求网格图的时间序列的长度;

    步骤6、使用步骤4中的多任务学习样本集,训练步骤5中所述基于多任务学习的出行需求预测模型,得到训练好的出行需求预测模型;

    步骤7、利用步骤6训练好的出行需求预测模型即能进行多模式的出行需求预测。

    2.根据权利要求1所述的一种基于多任务学习的多模式出行需求预测方法,其特征在于,步骤1中预处理是指:去除非集计出行数据中字段信息缺失以及不在研究区域内的数据;步骤1中非集计出行数据包括的字段有:出发时间、出发点经纬度;缺少以上任意一个字段的数据视为信息不完整的数据,不在研究区域内的数据视为冗余数据,都进行去除。

    3.根据权利要求1所述的一种基于多任务学习的多模式出行需求预测方法,其特征在于,步骤2中将标准化出行记录数据中的每条出行记录匹配到对应的时间片,是指:将出行时间在第t时间片内的出行记录匹配到第t时间片,出行记录匹配到时间片具体为,为标准化出行记录数据添加时间片字段;步骤2中将标准化出行记录数据中的每条出行记录匹配到对应的空间网格,是指:计算空间网格的边界的经度和纬度,将出行经纬度位于第i行、第j列的空间网格的边界内的出行记录匹配到第i行、第j列的空间网格,将出行记录匹配到空间网格具体为,为标准化出行记录数据添加空间网格的行坐标和列坐标字段。

    4.根据权利要求1所述的一种基于多任务学习的多模式出行需求预测方法,其特征在于,空间网格图的尺寸i、j为10或15或20,时间粒度t=30mmin。

    5.根据权利要求1所述的一种基于多任务学习的多模式出行需求预测方法,其特征在于,步骤3中滑动窗口的边长s设置为5,使用5×5的滑动窗口在出行需求网格图上选取局部出行需求网格图;按照时间顺序排列得到局部出行需求网格图的时间序列。

    6.根据权利要求1所述的一种基于多任务学习的多模式出行需求预测方法,其特征在于,步骤4中,多任务学习样本集d={d1,d2,...,dn,...,dn},其中dn表示第n种交通方式的样本集,n为大于等于1小于等n的整数,dn中的第k个样本表示为其中,表示第n种交通方式的样本集的第k个样本的特征,表示在第(t-m)时间片第n种交通方式的局部出行需求网格图,m=1,2,3,...,m,表示第n种交通方式第k个样本的标签,表示第n种交通方式在第t时间片的出行需求。

    7.根据权利要求1所述的一种基于多任务学习的多模式出行需求预测方法,其特征在于,n=2或3,m取值为8。

    8.根据权利要求1所述的一种基于多任务学习的多模式出行需求预测方法,其特征在于,步骤5中基于多任务学习的出行需求预测模型的层与层的具体连接关系包括:

    步骤51、将第n种交通方式的样本集的第k个样本的特征输入至第n个前置模块,前置模块首先对进行卷积和全连接处理,然后进行长短时记忆处理,第n个前置模块的输出作为出行需求时空特征其中,表示第t时间片的第n种交通方式的出行需求时空特征;

    步骤52、将所述出行需求时空特征输入到共享模块,共享模块对进行全连接、弃置以及全连接处理,得到融合出行需求特征ht,其中,ht表示第t时间片的融合出行需求特征;

    步骤53、将所述融合出行需求特征ht输入所有后置模块,后置模块分别对ht进行全连接、弃置以及全连接处理,第n个后置模块的输出为其中,表示第t时间片的第n种交通方式的出行需求。

    技术总结
    本发明公开了一种基于多任务学习的多模式出行需求预测方法,涉及交通需求预测技术领域,具体如下:采集多种交通方式的非集计出行数据,对非集计出行数据进行预处理;构造出行需求网格图;构造局部出行需求网格图的时间序列,构造多任务学习样本集,将局部出行需求网格图的时间序列构造为多任务学习样本集;构造基于多任务学习的出行需求预测模型;使用上述中的多任务学习样本集,训练所述基于多任务学习的出行需求预测模型,得到训练好的出行需求预测模型;利用训练好的出行需求预测模型即能进行多模式的出行需求预测。本发明融合多种出行需求预测任务,提高出行需求的预测精度。

    技术研发人员:王升;芦志强;张文波;刘志远;张奇
    受保护的技术使用者:东南大学
    技术研发日:2020.12.16
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-18278.html

    最新回复(0)