本发明涉及大数据,尤其涉及一种基于od分析的客流分布预测方法、装置、设备及存储介质。
背景技术:
od(origindestination,起始点)调查即交通起止点调查又称od交通量调查,od交通量就是指起终点间的交通出行量。对于人流量的od调查内容主要有起止点分布、出行目的、出行方式、出行时间、出行距离、出行次数等,确定个交通道路中的乘客平均乘距及乘客平均乘行时间,建立居民出行量与车流量之间的换算关系。
od分析需求普遍存在,但都是基于国、省、市这种大范围的od分析,或者是基于行政区域间的od分析。该类区域的od分析利用现有的行政区域划分,即可直接进行人流量的od分析,而对于更小区域的od现象,比如小区、屋村、工业园区、公园等区域,通常存在界限不清而难以进行划分的问题。故如何能更精准的反应出小范围的od分析是现今需解决的一个问题。
技术实现要素:
本发明的主要目的在于解决如何进行小范围的精准od分析的技术问题。
本发明第一方面提供了一种基于od分析的客流分布预测方法,包括:
获取目标城市内各出行站点的坐标信息,并根据所述坐标信息,对符合预置规则的所述各出行站点进行合并,得到多个出行片区;
获取所述目标城市中市民多条历史的出行数据,并根据所述各出行数据,确定所述各市民的出行起点和出行终点;
计算所述各市民的出行起点和出行终点所属的出行片区,并根据所述各市民的出行起点和出行终点所属的出行片区,生成所述目标城市中市民的出行特征信息;
将所述出行特征信息作为训练样本输入预置预训练模型中,预测所述目标城市的客流分布,直到所述预训练模型收敛,得到客流分布预测模型;
接收当前出行数据,并将当前出行数据信息输入所述客流特征预估模型中,预测所述目标城市当前的客流分布,以供提前部署相关交通策略。
可选的,在本发明第一方面的第一种实现方式中,所述获取目标城市内各出行站点的坐标信息包括:
爬取所述目标城市内各出行站点的当前坐标信息,并统计当前坐标信息的数量;
判断所述当前坐标信息的数量是否小于预置爬取阈值;
若所述当前坐标信息的数量小于预置爬取阈值,则将当前坐标信息作为所述目标城市内各出行站点的最终坐标信息;
若所述当前坐标信息的数量等于预置爬取阈值,则对所述目标城市划分成多个城市分区,并分别爬取所述各城市分区内各出行站点的当前坐标信息;
分别统计所述各城市分区中当前坐标信息的数量,并依次判断所述各城市分区中当前坐标信息的数量是否小于所述爬取阈值;
若所述城市分区中当前坐标信息的数量小于所述爬取阈值,则将对应城市分区中的当前坐标信息作为最终坐标信息;
若所述城市分区中当前坐标信息的数量等于所述爬取阈值,则将对应城市分区再次划分成多个城市分区,并跳转至分别统计所述各城市分区中当前坐标信息的数量的步骤,直到各城市分区中当前坐标信息的数量小于所述爬取预置,并将各城市分区中的当前坐标信息作为最终坐标信息。
可选的,在本发明第一方面的第二种实现方式中,所述根据所述坐标信息,对符合预置规则的所述各出行站点进行合并,得到多个出行片区包括:
根据所述坐标信息,按照预置扩展尺寸对所述各出行站点进行区域扩展,得到多个出行区域;
判断所述各出行区域是否存在相交;
若存在,则对所述相交的各出行区域进行区域融合,得到对应的出行片区,否则将所述未相交的出行区域单独作为出行片区。
可选的,在本发明第一方面的第三种实现方式中,所述计算所述各市民的出行起点和出行终点所属的出行片区包括:
每隔预设距离,分别记录所述各出行片区的外围轮廓的第二坐标,并根据所述各第二坐标,确定所述各出行片区的坐标范围;
确认所述各市民的出行起点和出行终点的第一坐标,并依次判断所述第一坐标是否在所述各坐标范围之内;
若在所述各坐标范围之内,则根据所述第一坐标所在的坐标范围,确定对应出行起点或出行终点所属的出行片区。
可选的,在本发明第一方面的第四种实现方式中,所述根据所述各市民的出行起点和出行终点所属的出行片区,生成所述目标城市中市民的出行特征信息包括:
分别计算所述各出行片区对应第二坐标的坐标均值,并将所述坐标均值作为所述各出行片区内各市民的出行起点和出行终点的第三坐标;
根据所述第三坐标,连接所述各市民的出行起点与出行终点,生成所述目标城市中市民的出行特征信息,其中,所述出行特征信息包含历史客流分布od图。
可选的,在本发明第一方面的第五种实现方式中,所述出行数据存储于区块链中。
本发明第二方面提供了一种基于od分析的客流分布预测装置,包括:
合并模块,用于获取目标城市内各出行站点的坐标信息,并根据所述坐标信息,对符合预置规则的所述各出行站点进行合并,得到多个出行片区;
确定模块,用于获取所述目标城市中市民多条历史的出行数据,并根据所述各出行数据,确定所述各市民的出行起点和出行终点;
生成模块,用于计算所述各市民的出行起点和出行终点所属的出行片区,并根据所述各市民的出行起点和出行终点所属的出行片区,生成所述目标城市中市民的出行特征信息;
训练模块,用于将所述出行特征信息作为训练样本输入预置预训练模型中,预测所述目标城市的客流分布,直到所述预训练模型收敛,得到客流分布预测模型;
预测模块,用于接收当前出行数据,并将当前出行数据信息输入所述客流特征预估模型中,预测所述目标城市当前的客流分布,以供用于部署相关交通策略。
可选的,在本发明第二方面的第一种实现方式中,所述合并模块包括:
爬取单元,用于爬取所述目标城市内各出行站点的当前坐标信息,并统计当前坐标信息的数量;
第一判别单元,用于判断所述当前坐标信息的数量是否小于预置爬取阈值;若所述当前坐标信息的数量小于预置爬取阈值,则将当前坐标信息作为所述目标城市内各出行站点的最终坐标信息;若所述当前坐标信息的数量等于预置爬取阈值,则对所述目标城市划分成多个城市分区,并分别爬取所述各城市分区内各出行站点的当前坐标信息;
第二判别单元,用于分别统计所述各城市分区中当前坐标信息的数量,并依次判断所述各城市分区中当前坐标信息的数量是否小于所述爬取阈值;若所述城市分区中当前坐标信息的数量小于所述爬取阈值,则将对应城市分区中的当前坐标信息作为最终坐标信息;
跳转单元,用于若所述城市分区中当前坐标信息的数量等于所述爬取阈值,则将对应城市分区再次划分成多个城市分区,并跳转至分别统计所述各城市分区中当前坐标信息的数量的步骤,直到各城市分区中当前坐标信息的数量小于所述爬取预置,并将各城市分区中的当前坐标信息作为最终坐标信息。
可选的,在本发明第二方面的第二种实现方式中,所述合并模块还包括:
扩展单元,用于根据所述坐标信息,按照预置扩展尺寸对所述各出行站点进行区域扩展,得到多个出行区域;
第三判别单元,用于判断所述各出行区域是否存在相交;若存在,则对所述相交的各出行区域进行区域融合,得到对应的出行片区,否则将所述未相交的出行区域单独作为出行片区。
可选的,在本发明第二方面的第三种实现方式中,所述生成模块包括:
记录单元,用于每隔预设距离,分别记录所述各出行片区的外围轮廓的第二坐标,并根据所述各第二坐标,确定所述各出行片区的坐标范围;
第四判别单元,用于确认所述各市民的出行起点和出行终点的第一坐标,并依次判断所述第一坐标是否在所述各坐标范围之内;若在所述各坐标范围之内,则根据所述第一坐标所在的坐标范围,确定对应出行起点或出行终点所属的出行片区。
可选的,在本发明第二方面的第四种实现方式中,所述生成模块还包括:
计算单元,用于分别计算所述各出行片区对应第二坐标的坐标均值,并将所述坐标均值作为所述各出行片区内各市民的出行起点和出行终点的第三坐标;
生成单元,用于根据所述第三坐标,连接所述各市民的出行起点与出行终点,生成所述目标城市中市民的出行特征信息,其中,所述出行特征信息包含历史客流分布od图。
可选的,在本发明第二方面的第五种实现方式中,所述出行数据存储于区块链中。
本发明第三方面提供了一种基于od分析的客流分布预测设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于od分析的客流分布预测设备执行上述的基于od分析的客流分布预测方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于od分析的客流分布预测方法。
本发明提供的技术方案中,利用城市出行站点的坐标位置,对多个出行站点进行合并,以此从城市划分出多个出行片区,再统计各出行片区中市民的出行起点与出行终点的数量,以生成城市内小范围出行片区的od交通出行特征信息,并将出行特征信息用于人流交通特征的预测,以供相关的企业或部门提前部署交通策略。本发明实现了在城市中进行小范围区域的精准od分析,以预测目标城市在各小范围区域的客流分布情况。
附图说明
图1为本发明基于od分析的客流分布预测方法的第一个实施例示意图;
图2为本发明基于od分析的客流分布预测方法的第二个实施例示意图;
图3为本发明基于od分析的客流分布预测方法的第三个实施例示意图;
图4为本发明基于od分析的客流分布预测方法的第四个实施例示意图;
图5为本发明基于od分析的客流分布预测装置的一个实施例示意图;
图6为本发明基于od分析的客流分布预测装置的另一个实施例示意图;
图7为本发明基于od分析的客流分布预测设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种基于od分析的客流分布预测方法、装置、设备及存储介质,对目标城市内符合预置规则的各出行站点进行合并,得到多个出行片区;获取目标城市中市民的出行数据,以确定各市民的出行起点和出行终点,并计算所属的出行片区,生成目标城市中市民的出行特征信息;将出行特征信息输入预置预训练模型中进行训练,得到客流分布预测模型;将市民当前的出行数据信息输入客流特征预估模型中,预测目标城市当前的客流分布,以供用于部署相关交通策略。本发明实现了在城市内进行小范围区域的od分析,以预测各小范围区域的客流分布情况。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中基于od分析的客流分布预测方法的第一个实施例包括:
101、获取目标城市内各出行站点的坐标信息,并根据所述坐标信息,对符合预置规则的所述各出行站点进行合并,得到多个出行片区;
可以理解的是,本发明的执行主体可以为基于od分析的客流分布预测装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。需要强调的是,为进一步保证上述出行数据的私密和安全性,上述出行数据还可以存储于一区块链的节点中。
本实施例中,目标城市内各出行站点包括目标城市的poi(pointofinformation,信息点)感兴趣点、网约车出行平台的推荐上车点等热门点;而坐标信息的获取则是通过利用爬虫技术抓取互联网地图上的目标城市的poi感兴趣点、网约车出行平台的推荐上车点等热门点的gps(globalpositioningsystem,全球定位系统)信息,并以经纬度进行表示。
本实施例中,本方案在于对城市内多个不同属性区域进行od分析,比如公园、景点、商场、小区、工业园区、科技园区、软件园区等,则可以对属于同一个属性区域的出行站点进行合并,作为一个市民出行的特征区域,即出行片区。
本实施例中,根据坐标信息,确定距离相近的多个出行站点,并将距离相近的多个出行站点进行合并,得到对应的出行片区。其中,出行片区指示的地区包括:公园、景点、商场、小区、工业园区、科技园区、软件园区等。
102、获取所述目标城市中市民多条历史的,并根据所述各出行数据,确定所述各市民的出行起点和出行终点;
本实施例中,市民的出行数据通过收集目标城市的现有出租车管理平台、网约车出行平台、地铁公交的出行订单数据、或者互联网地图个人用户的出行数据得到,其中出行订单数据、出行数据需要包括起点o点、终点d点)。对城市内各属性区域的od分析仅在于确定点到点的出行密度、出行频率、平行喜好、出行时间节点等,故只需提取出行数据中各市民的出行起点与出行终点即可。
103、计算所述各市民的出行起点和出行终点所属的出行片区,并根据所述各市民的出行起点和出行终点所属的出行片区,生成所述目标城市中市民的出行特征信息;
本实施例中,出行片区具有固定的经纬度区域范围,此处只需计算出行片区的外围轮廓坐标,根据外围轮廓坐标即可确定各出行片区的坐标范围;然后判断各市民出行起点和出行终点坐落在哪一个出行片区的外围轮廓坐标之内,即可确定出行起点和出行终点所属的出行片区。其中,在计算各出行片区的外围轮廓坐标时,可每隔预设距离在出行片区的外围轮廓取点,确定各个取点的坐标,并通过常规方法拟合各个取点坐标,得到一条封闭曲线,封闭曲线内的区域范围即为出行片区划定的区域。
本实施例中,出行特征信息可以是历史客流分布od图。具体可通过计算各出行片区的轮廓坐标均值;若市民的出行起点或出行终点属于某个出行片区,则将该出行片区的轮廓坐标均值作为该市民出行起点或出行终点的出行坐标;将每个市民的出行起点与出行终点进行连接,即可得到历史客流分布od图。
104、将所述出行特征信息作为训练样本输入预置预训练模型中,预测所述目标城市的客流分布,直到所述预训练模型收敛,得到客流分布预测模型;
本实施例中,客流分布预测模型的生成如下所示:
步骤1:选择一个时间标度t,其中,时间标度可以为小时、天或月;根据不同时间标度确定对应的调整系数w,调整系数w取值可以为:当时间标度为小时,w=12;当时间标度为天,w=7;当时间标度为月,w=1。
步骤2:根据所选择的时间标度,按照目标城市的出行起点i到出行终点j的客流hij,建立客流分布矩阵od=(hij),其中i=1,2,...,m,j=1,2,...,n;
步骤3:依照步骤2的方法建立k个时间上连续的客流分布矩阵,得到带出行时序的多个客流分布矩阵:od1,od2,...,odk;
步骤4:根据出行时序,计算各客流分布矩阵对应的效用系数矩阵wod=(pij),得到带出行时序的效用系数矩阵wod1,wod2,...,wodk;其中,
步骤5:计算流量分布矩阵
步骤6:根据流量分布矩阵od0计算每一个出行起点的客流量
步骤7:根据流量分布矩阵od0,预测相同时间标度下的每一个出行起点的客流量oi和每一个出行终点的客流量dj,计算每一个出行起点客流量的初始产生变化率
步骤8:令r=0,其中r为迭代算子;
步骤9:计算流量分布变化函数
步骤11:判断是否满足
105、接收当前出行数据,并将当前出行数据信息输入所述客流特征预估模型中,预测所述目标城市当前的客流分布,以供用于部署相关交通策略。
本实施例中,将当前的出行数据输入客流特征模型中,得到预测的客流分布矩阵odr 1,根据预测的客流分布矩阵odr 1,计算每一个出行起点的客流量
步骤12:将r 1替换为r,跳转至104中的步骤9,即可得到目标城市当前的客流分布。
本发明实施例中,利用城市出行站点的坐标位置,对多个出行站点进行合并,以此从城市划分出多个出行片区,再统计各出行片区中市民的出行起点与出行终点的数量,以生成城市内小范围出行片区的od交通出行特征信息,并将出行特征信息用于人流交通特征的预测,以供相关的企业或部门提前部署交通策略。本发明实现了在城市中进行小范围区域的精准od分析,以预测目标城市在各小范围区域的客流分布情况。
请参阅图2,本发明实施例中基于od分析的客流分布预测方法的第二个实施例包括:
201、爬取所述目标城市内各出行站点的当前坐标信息,并统计当前坐标信息的数量;
本实施例中,可以采用爬取脚本爬取目标城市内各出行站点的当前坐标信息,其中,爬取目标可以是常规的卫星地图平台数据库、公共交通平台数据库、网约车平台数据库等。具体可以采用多边形地图区域搜索方式进行爬取,即根据目标城市区域范围,划定爬取的多边形区域,然后将多边形区域转移到爬取目标的地图坐标区域上,并开始爬取。
另外,由于当前坐标信息属于第三方平台,受数据爬取接口的数量限制,每次只能爬取预置爬取阈值的坐标信息,超过该预置爬取阈值即无法继续爬取,故需先统计当前爬取到的坐标信息的数量,以确定是否超过预置爬取阈值。
202、判断所述当前坐标信息的数量是否小于预置爬取阈值;
203、若所述当前坐标信息的数量小于预置爬取阈值,则将当前坐标信息作为所述目标城市内各出行站点的最终坐标信息;
本实施例中,若当前坐标信息的数量小于预置爬取阈值,则确定当前爬取到的坐标信息为目标城市的全部坐标信息,故直接停止爬取,将当前爬取到的全部坐标信息作为目标城市各出行站点的最终坐标信息即可。
204、若所述当前坐标信息的数量等于预置爬取阈值,则对所述目标城市划分成多个城市分区,并分别爬取所述各城市分区内各出行站点的当前坐标信息;
205、分别统计所述各城市分区中当前坐标信息的数量,并依次判断所述各城市分区中当前坐标信息的数量是否小于所述爬取阈值;
206、若所述城市分区中当前坐标信息的数量小于所述爬取阈值,则将对应城市分区中的当前坐标信息作为最终坐标信息;
207、若所述城市分区中当前坐标信息的数量等于所述爬取阈值,则将对应城市分区再次划分成多个城市分区,并跳转至分别统计所述各城市分区中当前坐标信息的数量的步骤,直到各城市分区中当前坐标信息的数量小于所述爬取预置,并将各城市分区中的当前坐标信息作为最终坐标信息;
本实施例中,爬取到的坐标信息数量最多只能为预置爬取阈值,故只要坐标信息的数量等于预置爬取阈值,即判定目标城市的坐标信息未爬取完毕;比如预置爬取预置为1000,如果目标城市的多边形区域返回坐标信息的数量=1000,就说明当前矩形块需要分割,可以将矩形块在水平中心和垂直分心分割,多边形区域即可分割成4个城市分区;然后分别爬取四个城市分区的坐标信息。
另外,若4个城市分区(比如分别为a、b、c、d)中,三个城市分区(a、b、c)爬取到的坐标信息的数量小于预置爬取阈值,一个城市分区(d)爬取到的坐标信息的数量大于预置爬取阈值,则城市分区a、b、c无需进一步进行划分与爬取,而城市分区d则需要进一步分割成4个城市分区(d1、d2、d3、d4),再分别对4个城市分区d1、d2、d3、d4进行坐标信息的爬取,直到所有城市分区的当前坐标信息数量均小于预置爬取阈值为止。
208、根据所述坐标信息,对符合预置规则的所述各出行站点进行合并,得到多个出行片区;
209、获取所述目标城市中市民多条历史的出行数据,并根据所述各出行数据,确定所述各市民的出行起点和出行终点;
210、计算所述各市民的出行起点和出行终点所属的出行片区,并根据所述各市民的出行起点和出行终点所属的出行片区,生成所述目标城市中市民的出行特征信息;
211、将所述出行特征信息作为训练样本输入预置预训练模型中,预测所述目标城市的客流分布,直到所述预训练模型收敛,得到客流分布预测模型;
212、接收当前出行数据,并将当前出行数据信息输入所述客流特征预估模型中,预测所述目标城市当前的客流分布,以供用于部署相关交通策略。
本发明实施例中,详细介绍了市民历史出行数据的获取方式,由于技术限制,每次只能爬取脚本的爬取阈值数量的出行数据,故为了获取全部的出行数据,在每一次爬取数据后,判别出行数据数量是否达到爬取阈值,若是,则对爬取区域进行进一步的划分,再从各个城市分区中重新爬取出行数据,以此循环,直到各个城市分区的出行数据数量小于爬取阈值为止,保证爬取到全部目标城市的历史出行数据。
请参阅图3,本发明实施例中基于od分析的客流分布预测方法的第三个实施例包括:
301、获取目标城市内各出行站点的坐标信息;
302、根据所述坐标信息,按照预置扩展尺寸对所述各出行站点进行区域扩展,得到多个出行区域;
本实施例中,出行站点一般具体到某一个坐标点,此处通过将各个出行站点进行扩展,以初步得到该出行站点所辐射的周边属性区域,初步划分出初始出行片区(即为出行区域);此处预置扩展尺寸可以根据实际需求进行设定,比如对于建筑群密集程度比较低的城市,可以设定较大的拓展尺寸,而对于建筑占地面积普遍较小的城市,可以设定较小的拓展尺寸。
303、判断所述各出行区域是否存在相交;
本实施例中,同一属性区域的出行站点进行区域扩张后,一般存在区域重叠的情况,可通过判断不同出行区域是否相交进行同一属性区域的大致划分,得到每个属性区域对应的出行片区。
304、若存在,则对所述相交的各出行区域进行区域融合,得到对应的出行片区,否则将所述未相交的出行区域单独作为出行片区;
本实施例中,本方案在于对城市内多个不同属性区域进行od分析,比如公园、景点、商场、小区、工业园区、科技园区、软件园区等,则可以对属于同一个属性区域的出行站点进行合并,作为一个市民出行的特征区域,即出行片区。
本实施例中,为进一步将相邻的不同出行片区划分开,可以设置两个出行区域的重叠面积超过预设百分比(比如20%、30%、40%等),才判定这两个出行区域存在相交,而预设百分比根据城市的属性区域规划情况进行设置。比如目标城市范围内多为旅游景点,不同旅游景点对应的出行片区之间较难存在重叠,则可以较低的预设百分比。
305、获取所述目标城市中市民多条历史的出行数据,并根据所述各出行数据,确定所述各市民的出行起点和出行终点;
306、计算所述各市民的出行起点和出行终点所属的出行片区;
307、分别计算所述各出行片区对应第二坐标的坐标均值,并将所述坐标均值作为所述各出行片区内各市民的出行起点和出行终点的第三坐标;
本实施例中,目标城市客流分布的od分析最小分析细粒度为出行片区,故此处将各出行片区内包含的所有出行站点坐标集中表示为出行片区内的某一个点,此处可以循环遍历出行片区外围轮廓的经纬度p(lat,lng)信息(第二坐标);然后分别累加电子围栏的经度和纬度sum(lat)、sum(lng);最后求平均值即可得到中心点的经纬度信息(第三坐标)。具体的,可采用以下公式计算:
其中,sum(lat,lng)为第三坐标,pi(lat,lng)为第i个第二坐标,i∈n,n为第二坐标的总数量,且n正整数。
308、根据所述第三坐标,连接所述各市民的出行起点与出行终点,生成所述目标城市中市民的出行特征信息,其中,所述出行特征信息包含历史客流分布od图;
本实施例中,将各市民的出行起点和出行站点对应第三坐标进行连接,即可得到各市民的出行线路;将相同出行线路按照数量,转换成不同数量、不同颜色以及不同线条宽度的连接线,即可得到历史客流分布od图。
309、将所述出行特征信息作为训练样本输入预置预训练模型中,预测所述目标城市的客流分布,直到所述预训练模型收敛,得到客流分布预测模型;
310、接收当前出行数据,并将当前出行数据信息输入所述客流特征预估模型中,预测所述目标城市当前的客流分布,以供用于部署相关交通策略。
本发明实施例中,详细介绍了出行片区的形成过程,根据扩展出行站点得到出行区域、对相交的出行区域进行融合,得到最终的出行片区,通过设置不同的扩展尺寸,契合对应区域用地的属性特征,并对同一区域用地的各个站点进行融合,使得得到的出行片区涵盖整个区域用地,可以用于后续目标城市的精准od分析。
请参阅图4,本发明实施例中基于od分析的客流分布预测方法的第四个实施例包括:
401、获取目标城市内各出行站点的坐标信息,并根据所述坐标信息,对符合预置规则的所述各出行站点进行合并,得到多个出行片区;
402、获取所述目标城市中市民多条历史的出行数据,并根据所述各出行数据,确定所述各市民的出行起点和出行终点;
403、每隔预设距离,分别记录所述各出行片区的外围轮廓的第二坐标,并根据所述各第二坐标,确定所述各出行片区的坐标范围;
本实施例中,将各出行片区的外围轮廓每个预设距离进行取点,然后记录取点的坐标(第二坐标),再对各出行片区的第二坐标进行曲线拟合,通过拟合后的曲线,限定各出行片区的坐标范围;根据得到的坐标范围。
404、确认所述各市民的出行起点和出行终点的第一坐标,并依次判断所述第一坐标是否在所述各坐标范围之内;
405、若在所述各坐标范围之内,则根据所述第一坐标所在的坐标范围,确定对应出行起点或出行终点所属的出行片区;
本实施例中,判断各市民出行起点和出行终点坐落在哪一个出行片区的外围轮廓坐标之内,即可确定出行起点和出行终点所属的出行片区。具体可根据坐标范围对应的拟合曲线,确定其曲线方程,然后将第一坐标代入曲线方程中,以判断该第一坐标是否在坐标范围之内。其中,要求曲线方程与拟合曲线的拟合优度大于或等于0.9。
406、根据所述各市民的出行起点和出行终点所属的出行片区,生成所述目标城市中市民的出行特征信息;
407、将所述出行特征信息作为训练样本输入预置预训练模型中,预测所述目标城市的客流分布,直到所述预训练模型收敛,得到客流分布预测模型;
408、接收当前出行数据,并将当前出行数据信息输入所述客流特征预估模型中,预测所述目标城市当前的客流分布,以供用于部署相关交通策略。
本发明实施例中,详细介绍了如何计算市民出行起点与出行终点所述的出行片区,通过计算出行片区的外围轮廓,判断出行起点与出行终点在哪个外围轮廓的坐标范围之类,已确定所属的出行片区,以用于准确统计市民在目标城市的出行特征。
上面对本发明实施例中基于od分析的客流分布预测方法进行了描述,下面对本发明实施例中基于od分析的客流分布预测装置进行描述,请参阅图5,本发明实施例中基于od分析的客流分布预测装置一个实施例包括:
合并模块501,用于获取目标城市内各出行站点的坐标信息,并根据所述坐标信息,对符合预置规则的所述各出行站点进行合并,得到多个出行片区;
确定模块502,用于获取所述目标城市中市民多条历史的出行数据,并根据所述各出行数据,确定所述各市民的出行起点和出行终点;
生成模块503,用于计算所述各市民的出行起点和出行终点所属的出行片区,并根据所述各市民的出行起点和出行终点所属的出行片区,生成所述目标城市中市民的出行特征信息;
训练模块504,用于将所述出行特征信息作为训练样本输入预置预训练模型中,预测所述目标城市的客流分布,直到所述预训练模型收敛,得到客流分布预测模型;
预测模块505,用于接收当前出行数据,并将当前出行数据信息输入所述客流特征预估模型中,预测所述目标城市当前的客流分布,以供用于部署相关交通策略。
本发明实施例中,利用城市出行站点的坐标位置,对多个出行站点进行合并,以此从城市划分出多个出行片区,再统计各出行片区中市民的出行起点与出行终点的数量,以生成城市内小范围出行片区的od交通出行特征信息,并将出行特征信息用于人流交通特征的预测,以供相关的企业或部门提前部署交通策略。本发明实现了在城市中进行小范围区域的精准od分析,以预测目标城市在各小范围区域的客流分布情况。
请参阅图6,本发明实施例中基于od分析的客流分布预测装置的另一个实施例包括:
合并模块501,用于获取目标城市内各出行站点的坐标信息,并根据所述坐标信息,对符合预置规则的所述各出行站点进行合并,得到多个出行片区;
确定模块502,用于获取所述目标城市中市民多条历史的出行数据,并根据所述各出行数据,确定所述各市民的出行起点和出行终点;
生成模块503,用于计算所述各市民的出行起点和出行终点所属的出行片区,并根据所述各市民的出行起点和出行终点所属的出行片区,生成所述目标城市中市民的出行特征信息;
训练模块504,用于将所述出行特征信息作为训练样本输入预置预训练模型中,预测所述目标城市的客流分布,直到所述预训练模型收敛,得到客流分布预测模型;
预测模块505,用于接收当前出行数据,并将当前出行数据信息输入所述客流特征预估模型中,预测所述目标城市当前的客流分布,以供用于部署相关交通策略。
具体的,所述合并模块包括:
爬取单元5011,用于爬取所述目标城市内各出行站点的当前坐标信息,并统计当前坐标信息的数量;
第一判别单元5012,用于判断所述当前坐标信息的数量是否小于预置爬取阈值;若所述当前坐标信息的数量小于预置爬取阈值,则将当前坐标信息作为所述目标城市内各出行站点的最终坐标信息;若所述当前坐标信息的数量等于预置爬取阈值,则对所述目标城市划分成多个城市分区,并分别爬取所述各城市分区内各出行站点的当前坐标信息;
第二判别单元5013,用于分别统计所述各城市分区中当前坐标信息的数量,并依次判断所述各城市分区中当前坐标信息的数量是否小于所述爬取阈值;若所述各城市分区中当前坐标信息的数量小于所述爬取阈值,则将对应城市分区中的当前坐标信息作为最终坐标信息;
跳转单元5014,用于若所述各城市分区中当前坐标信息的数量等于所述爬取阈值,则将对应城市分区再次划分成多个城市分区,并跳转至分别统计所述各城市分区中当前坐标信息的数量的步骤,直到各城市分区中当前坐标信息的数量小于所述爬取预置,并将各城市分区中的当前坐标信息作为最终坐标信息。
具体的,所述合并模块还包括:
扩展单元5015,用于根据所述坐标信息,按照预置扩展尺寸对所述各出行站点进行区域扩展,得到多个出行区域;
第三判别单元5016,用于判断所述各出行区域是否存在相交;若存在,则对所述相交的各出行区域进行区域融合,得到对应的出行片区,否则将所述未相交的出行区域单独作为出行片区。
具体的,所述生成模块包括:
记录单元5031,用于每隔预设距离,分别记录所述各出行片区的外围轮廓的第二坐标,并根据所述各第二坐标,确定所述各出行片区的坐标范围;
第四判别单元5032,用于确认所述各市民的出行起点和出行终点的第一坐标,并依次判断所述第一坐标是否在所述各坐标范围之内;若在所述各坐标范围之内,则根据所述第一坐标所在的坐标范围,确定对应出行起点或出行终点所属的出行片区。
具体的,所述生成模块还包括:
计算单元5033,用于分别计算所述各出行片区对应第二坐标的坐标均值,并将所述坐标均值作为所述各出行片区内各市民的出行起点和出行终点的第三坐标;
生成单元5034,用于根据所述第三坐标,连接所述各市民的出行起点与出行终点,生成所述目标城市中市民的出行特征信息,其中,所述出行特征信息包含历史客流分布od图。
具体的,所述出行数据存储于区块链中。
本发明实施例中,详细介绍了市民历史出行数据的获取方式,在每一次爬取数据后,判别出行数据数量是否达到爬取阈值,若是,则对爬取区域进行进一步的划分,再从各个城市分区中重新爬取出行数据,以此循环,直到各个城市分区的出行数据数量小于爬取阈值为止,保证爬取到全部目标城市的历史出行数据;详细介绍了出行片区的形成过程,根据扩展出行站点得到出行区域、对相交的出行区域进行融合,得到最终的出行片区,使得得到的出行片区涵盖整个区域用地;详细介绍通过计算出行片区的外围轮廓,判断出行起点与出行终点在哪个外围轮廓的坐标范围之类,已确定所属的出行片区,以用于准确统计市民在目标城市的出行特征。
上面图5和图6从模块化功能实体的角度对本发明实施例中的基于od分析的客流分布预测装置进行详细描述,下面从硬件处理的角度对本发明实施例中基于od分析的客流分布预测设备进行详细描述。
图7是本发明实施例提供的一种基于od分析的客流分布预测设备的结构示意图,该基于od分析的客流分布预测设备700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)710(例如,一个或一个以上处理器)和存储器720,一个或一个以上存储应用程序733或数据732的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器720和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对基于od分析的客流分布预测设备700中的一系列指令操作。更进一步地,处理器710可以设置为与存储介质730通信,在基于od分析的客流分布预测设备700上执行存储介质730中的一系列指令操作。
基于od分析的客流分布预测设备700还可以包括一个或一个以上电源740,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口760,和/或,一个或一个以上操作系统731,例如windowsserve,macosx,unix,linux,freebsd等等。本领域技术人员可以理解,图7示出的基于od分析的客流分布预测设备结构并不构成对基于od分析的客流分布预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种基于od分析的客流分布预测设备,所述基于od分析的客流分布预测设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述基于od分析的客流分布预测方法的步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述基于od分析的客流分布预测方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
1.一种基于od分析的客流分布预测方法,其特征在于,所述基于od分析的客流分布预测方法包括:
获取目标城市内各出行站点的坐标信息,并根据所述坐标信息,对符合预置规则的所述各出行站点进行合并,得到多个出行片区;
获取所述目标城市中市民多条历史的出行数据,并根据所述各出行数据,确定所述各市民的出行起点和出行终点;
计算所述各市民的出行起点和出行终点所属的出行片区,并根据所述各市民的出行起点和出行终点所属的出行片区,生成所述目标城市中市民的出行特征信息;
将所述出行特征信息作为训练样本输入预置预训练模型中,预测所述目标城市的客流分布,直到所述预训练模型收敛,得到客流分布预测模型;
接收当前出行数据,并将当前出行数据信息输入所述客流特征预估模型中,预测所述目标城市当前的客流分布,以供用于部署相关交通策略。
2.根据权利要求1所述的基于od分析的客流分布预测方法,其特征在于,所述根据所述坐标信息,对符合预置规则的所述各出行站点进行合并,得到多个出行片区包括:
根据所述坐标信息,按照预置扩展尺寸对所述各出行站点进行区域扩展,得到多个出行区域;
判断所述各出行区域是否存在相交;
若存在,则对所述相交的各出行区域进行区域融合,得到对应的出行片区,否则将所述未相交的出行区域单独作为出行片区。
3.根据权利要求1所述的基于od分析的客流分布预测方法,其特征在于,所述计算所述各市民的出行起点和出行终点所属的出行片区包括:
每隔预设距离,分别记录所述各出行片区的外围轮廓的第二坐标,并根据所述各第二坐标,确定所述各出行片区的坐标范围;
确认所述各市民的出行起点和出行终点的第一坐标,并依次判断所述第一坐标是否在所述各坐标范围之内;
若在所述各坐标范围之内,则根据所述第一坐标所在的坐标范围,确定对应出行起点或出行终点所属的出行片区。
4.根据权利要求3所述的基于od分析的客流分布预测方法,其特征在于,所述根据所述各市民的出行起点和出行终点所属的出行片区,生成所述目标城市中市民的出行特征信息包括:
分别计算所述各出行片区对应第二坐标的坐标均值,并将所述坐标均值作为所述各出行片区内各市民的出行起点和出行终点的第三坐标;
根据所述第三坐标,连接所述各市民的出行起点与出行终点,生成所述目标城市中市民的出行特征信息,其中,所述出行特征信息包含历史客流分布od图。
5.根据权利要求1-4中任一项所述的基于od分析的客流分布预测方法,其特征在于,所述获取目标城市内各出行站点的坐标信息包括:
爬取所述目标城市内各出行站点的当前坐标信息,并统计当前坐标信息的数量;
判断所述当前坐标信息的数量是否小于预置爬取阈值;
若所述当前坐标信息的数量小于预置爬取阈值,则将当前坐标信息作为所述目标城市内各出行站点的最终坐标信息;
若所述当前坐标信息的数量等于预置爬取阈值,则对所述目标城市划分成多个城市分区,并分别爬取所述各城市分区内各出行站点的当前坐标信息;
分别统计所述各城市分区中当前坐标信息的数量,并依次判断所述各城市分区中当前坐标信息的数量是否小于所述爬取阈值;
若所述城市分区中当前坐标信息的数量小于所述爬取阈值,则将对应城市分区中的当前坐标信息作为最终坐标信息;
若所述城市分区中当前坐标信息的数量等于所述爬取阈值,则将对应城市分区再次划分成多个城市分区,并跳转至分别统计所述各城市分区中当前坐标信息的数量的步骤,直到各城市分区中当前坐标信息的数量小于所述爬取预置,并将各城市分区中的当前坐标信息作为最终坐标信息。
6.根据权利要求1所述的基于od分析的客流分布预测方法,其特征在于,所述出行数据存储于区块链中。
7.一种基于od分析的客流分布预测装置,其特征在于,所述基于od分析的客流分布预测装置包括:
合并模块,用于获取目标城市内各出行站点的坐标信息,并根据所述坐标信息,对符合预置规则的所述各出行站点进行合并,得到多个出行片区;
确定模块,用于获取所述目标城市中市民多条历史的出行数据,并根据所述各出行数据,确定所述各市民的出行起点和出行终点;
生成模块,用于计算所述各市民的出行起点和出行终点所属的出行片区,并根据所述各市民的出行起点和出行终点所属的出行片区,生成所述目标城市中市民的出行特征信息;
训练模块,用于将所述出行特征信息作为训练样本输入预置预训练模型中,预测所述目标城市的客流分布,直到所述预训练模型收敛,得到客流分布预测模型;
预测模块,用于接收当前出行数据,并将当前出行数据信息输入所述客流特征预估模型中,预测所述目标城市当前的客流分布,以供用于部署相关交通策略。
8.根据权利要求7所述的基于od分析的客流分布预测装置,其特征在于,所述生成模块包括:
计算单元,用于分别计算所述各出行片区对应第二坐标的坐标均值,并将所述坐标均值作为所述各出行片区内各市民的出行起点和出行终点的第三坐标;
生成单元,用于根据所述第三坐标,连接所述各市民的出行起点与出行终点,生成所述目标城市中市民的出行特征信息,其中,所述出行特征信息包含历史客流分布od图。
9.一种基于od分析的客流分布预测设备,其特征在于,所述基于od分析的客流分布预测设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于od分析的客流分布预测设备执行如权利要求1-6中任一项所述的基于od分析的客流分布预测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-6中任一项所述基于od分析的客流分布预测方法。
技术总结