基于概率分布的出站客流预测方法及装置与流程

    专利2022-07-08  45


    本申请实施例涉及智慧交通技术领域,尤其涉及基于概率分布的出站客流预测方法及装置。



    背景技术:

    地铁作为一种重要的交通出行方式,随着城市公共交通的快速发展,给人们出行带来了巨大的便利,也给国家和地区的经济带来了很大的发展和促进作用。而随着乘坐地铁的人越来越多,伴随而来的问题也越来越多。怎么样将地铁和乘客进行结合,实现给乘客更合理的出行路线选择,规避交通堵塞,提取部署站点安保措施等问题,已经成为地铁运营首要考虑的问题,而且,随着当前大数据、机器学习、人工智能等技术的快速发展,怎么样将这些技术深入应用到地铁行业助力未来城市安全出行,也成了社会的热点。

    目前,在地铁运营场景中,主要的出站客流量预测方法包括基于时间序列方法预测和基于机器学习和深度学习算法进行预测。这些预测方法受不同进站时间,进站站点以及乘客个体行为习惯的影响,其出站客流预测精准度相对较低。



    技术实现要素:

    本申请实施例提供基于概率分布的出站客流预测方法及装置,能够结合到达时间概率分布和到达站点概率分布进行出站客流预测,提升出站客流预测精度,保障出站客流预测的可靠性。

    在第一方面,本申请实施例提供了一种基于概率分布的出站客流预测方法,包括:

    获取线网实时客流运行数据,基于给定的预测时间段统计线网的站内乘客,并基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息;

    基于所述站间运行时间概率分布信息确定所述站内乘客到达线网各个出站站点的时间阈值,基于所述时间阈值比对所述预测时间段,确定所述站内乘客到达各个所述出站站点的时刻到达概率,所述时间阈值包括最快到达时间和最慢到达时间;

    根据历史客流运行数据统计出线网中各个od对的第一进出站概率分布信息以及所述站内乘客各个od对的第二进出站概率分布信息,基于所述站内乘客的乘客类型使用所述第一进出站概率分布信息、所述第二进出站概率分布信息或所述站内乘客的当天乘车记录确定所述站内乘客到达各个所述出站站点的站点到达概率,所述乘客类型包括新用户和老用户;

    基于给定的所述预测时间段、预测站点和对应的站内乘客数量,使用所述时刻到达概率和所述站点到达概率计算所述预测站点在所述预测时间段内的出站客流量。

    进一步的,基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息,包括:

    基于历史客流运行数据获取线网所有od对,基于各个od对统计各个乘客对应任意两个站点的站间运行时间;

    基于所述站间运行时间统计任意两个站点在各个时段的到达人数,并根据所述到达人数确定任意两个站点的站间运行时间概率分布信息。

    进一步的,根据所述到达人数确定任意两个站点的站间运行时间概率分布信息,包括:

    根据所述到达人数计算对应的各个站间运行时间概率,并从大到小提取设定数量的所述站间运行时间概率作为对应的站间运行时间概率分布信息。

    进一步的,基于所述站间运行时间概率分布信息确定所述站内乘客到达线网各个出站站点的时间阈值,包括:

    提取所述站内乘客的进站时间信息,确定各个站内乘客的进站站点,为所述进站站点匹配线网各个出站站点;

    基于所述进站站点和所述出站站点查询所述站间运行时间概率分布,确定所述站内乘客到达所述出站站点的最快到达时间和最慢到达时间。

    进一步的,基于所述时间阈值比对所述预测时间段,确定所述站内乘客到达各个所述出站站点的时刻到达概率,包括:

    将所述最快到达时间和所述最慢到达时间比对所述预测时间段,若所述最快到达时间和/或所述最慢到达时间处于所述预测时间段中,确定对应的所述站内乘客到达所述出站站点的时间概率;

    统计所述时间概率,确定各个所述站内乘客到达各个所述出站站点的时刻到达概率。

    进一步的,确定对应的所述站内乘客到达所述出站站点的时间概率,包括:

    从对应的所述站间运行时间概率分布信息中循环取出各个所述站间运行时间,基于所述站内乘客的进站时间信息和所述站间运行时间计算得到对应的到站时间;

    将所述到站时间比对所述预测时间段,若所述到站时间处于所述预测时间段中,提取对应的站间运行时间概率作为所述站内乘客到达所述出站站点的一个时间概率。

    进一步的,统计所述时间概率,确定各个所述站内乘客到达各个所述出站站点的时刻到达概率,包括:

    将对应所述站间运行时间概率分布信息中各个所述站间运行时间确定的所述时间概率进行叠加统计,确定一个所述站内乘客到达一个所述出站站点的时刻到达概率,循环各个所述出站站点及各个所述站内乘客,确定各个所述站内乘客到达各个所述出站站点的时刻到达概率。

    进一步的,基于所述站内乘客的乘客类型使用所述第一进出站概率分布信息、所述第二进出站概率分布信息或所述站内乘客的当天乘车记录确定所述站内乘客到达各个所述出站站点的站点到达概率,所述乘客类型包括新用户和老用户,包括:

    若所述站内乘客的乘客类型为新用户,使用所述第一进出站概率分布信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率;

    若所述站内乘客的乘客类型为老用户,使用所述站内乘客的当天乘车记录、所述第二进出站概率分布信息或所述第一进出站概率分布信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率。

    进一步的,若所述站内乘客的乘客类型为新用户,使用所述第一进出站概率分布信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率,包括:

    基于所述第一进出站概率分布信息查询对应的od对的第一概率信息,根据第一概率信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率。

    进一步的,若所述站内乘客的乘客类型为老用户,使用所述站内乘客的当天乘车记录、所述第二进出站概率分布信息或所述第一进出站概率分布信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率,包括:

    若所述站内乘客的进站时间大于或等于指定时间点,根据所述站内乘客的当天乘车记录比对对应的所述出站站点,确定对应的所述站内乘客到达各个所述出站站点的站点到达概率;

    若所述站内乘客的进站时间小于指定时间点,判断对应的所述出站站点是否出现在所述站内乘客的历史出站列表中,若是,基于所述第一进出站概率分布信息查询对应的od对的第二概率信息,根据第二概率信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率,若否,基于所述第一进出站概率分布信息查询对应的od对的第一概率信息,根据第一概率信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率。

    进一步的,其特征在于,所述预测站点在所述预测时间段内的出站客流量计算公式为:

    其中,predictexit_number为所述预测站点在所述预测时间段内的出站客流量,n为所述站内乘客的数量,time_arrive_probi为第i个所述站内乘客到达所述预测站点的所述时刻到达概率,station_arrive_probi为第i个所述站内乘客到达所述预测站点的所述站点到达概率。

    在第二方面,本申请实施例提供了一种基于概率分布的出站客流预测装置,包括:

    统计模块,用于获取线网实时客流运行数据,基于给定的预测时间段统计线网的站内乘客,并基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息;

    第一概率计算模块,用于基于所述站间运行时间概率分布信息确定所述站内乘客到达线网各个出站站点的时间阈值,基于所述时间阈值比对所述预测时间段,确定所述站内乘客到达各个所述出站站点的时刻到达概率,所述时间阈值包括最快到达时间和最慢到达时间;

    第二概率计算模块,用于根据历史客流运行数据统计出线网中各个od对的第一进出站概率分布信息以及所述站内乘客各个od对的第二进出站概率分布信息,基于所述站内乘客的乘客类型使用所述第一进出站概率分布信息、所述第二进出站概率分布信息或所述站内乘客的当天乘车记录确定所述站内乘客到达各个所述出站站点的站点到达概率,所述乘客类型包括新用户和老用户;

    预测模块,用于基于给定的所述预测时间段、预测站点和对应的站内乘客数量,使用所述时刻到达概率和所述站点到达概率计算所述预测站点在所述预测时间段内的出站客流量。

    在第三方面,本申请实施例提供了一种电子设备,包括:

    存储器以及一个或多个处理器;

    所述存储器,用于存储一个或多个程序;

    当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的基于概率分布的出站客流预测方法。

    在第四方面,本申请实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的基于概率分布的出站客流预测方法。

    本申请实施例通过获取线网实时客流运行数据,基于给定的预测时间段统计线网的站内乘客,并基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息。进一步基于站间运行时间概率分布信息确定站内乘客到达各个出站站点的时刻到达概率,并确定站内乘客到达各个出站站点的站点到达概率,基于给定的预测时间段、预测站点和对应的站内乘客数量,使用时刻到达概率和站点到达概率计算预测站点在预测时间段内的出站客流量。采用上述技术手段,可以结合不同进站时间,进站站点以及乘客个体行为习惯对出站客流预测的影响,实现更精准的出站客流预测,保障出站客流预测的可靠性。

    附图说明

    图1是本申请实施例一提供的一种基于概率分布的出站客流预测方法的流程图;

    图2是本申请实施例一提供的基于时刻到达概率和站点到达概率的出站客流预测流程图;

    图3是本申请实施例一中的站间运行时间概率分布信息的确定流程图;

    图4是本申请实施例一中的站间运行时间概率计算流程图;

    图5是本申请实施例一中的时间阈值确定流程图;

    图6是本申请实施例一中的时刻到达概率确定流程图;

    图7是本申请实施例一中的站点到达概率的确定流程图;

    图8是本申请实施例二提供的一种基于概率分布的出站客流预测装置的结构示意图;

    图9是本申请实施例三提供的一种电子设备的结构示意图。

    具体实施方式

    为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

    本申请提供的基于概率分布的出站客流预测方法,旨在根据不同进站时间、进站站点以及个体乘客行为习惯的影响进行出站客流预测,通过确定各个乘客对应各个站点的时刻到达概率和站点到达概率,根据概率分布进行出站客流预测,以此来提升出站客流预测的精度。相对于传统的出站客流预测算方法,其在进行出站客流预测时,一般采用时间序列方法预测或者机器学习和深度学习算法进行预测。在采用传统客流预测模型进行出站客流预测时,模型通常会假设客流规律在统计的时间范围内是会重复出现的,而没有从进站和出站的关系进行考虑。由于地铁所有的出站乘客都是由进站的乘客组成的,从同一个站进站的乘客,其进站口、进站时间不同,出站口和对应的出站时间也不同,因此,乘客的进站行为某种意义上对出站有非常大的影响。此外,现有出站客流预测模型也没有从乘客个体的角度去考虑。出站客流是由多个乘客个体组成的行为,对于不同的乘客,其具体行为习惯是不一样的。而不同的个体行为,也会直接导致每个站点在不同时间段的出站人数不同。显然,对于不同进站时间,进站站点以及乘客个体行为习惯,都会直接影响到出站客流。基于此,提供本申请实施例的基于概率分布的出站客流预测,以解决现有出站客流预测的精准度问题。

    实施例一:

    图1给出了本申请实施例一提供的一种基于概率分布的出站客流预测方法的流程图,本实施例中提供的基于概率分布的出站客流预测方法可以由基于概率分布的出站客流预测设备执行,该基于概率分布的出站客流预测设备可以通过软件和/或硬件的方式实现,该基于概率分布的出站客流预测设备可以是两个或多个物理实体构成,也可以是一个物理实体构成。一般而言,该基于概率分布的出站客流预测设备可以是客流运营后台服务器、电脑、服务器主机等计算设备。

    下述以基于概率分布的出站客流预测设备为执行基于概率分布的出站客流预测方法的主体为例,进行描述。参照图1,该基于概率分布的出站客流预测方法具体包括:

    s110、获取线网实时客流运行数据,基于给定的预测时间段统计线网的站内乘客,并基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息。

    本申请实施例中,考虑到不同进站站点、进站时间和乘客个体行为对出站客流的影响,参照图2,本申请实施例通过统计线网站内乘客,进一步分别根据站间运行时间概率分布信息和乘客分类进行各个站内乘客对应各个站点的时刻到达概率和站点到达概率的计算,进而基于时刻到达概率和站点到达概率进行出站客流预测,以此完成本申请实施例基于概率分布的出站客流预测。

    具体的,在进行时刻到达概率和站点到达概率计算之前,通过获取线网客流运行数据(如乘客进出站刷卡信息),进行站内乘客的统计。其中,基于给定的预测时间段,假设预测时间段为“2019-01-2108:00:00~2019-01-2108:10:00”这一10分钟间隔的时间段,则通过截取这一时间段的开始时间和结束时间,首先根据线网客流运行数据筛选出当天所有发生进站行为的乘客,若某一个乘客的出站时间≥“2019-01-2108:00:00”,则确定其为站内乘客;或者若某一个乘客的进站时间<“2019-01-2108:10:00”,且未发生出站行为,则确定其为站内乘客。通过上面的步骤,即可统计出线网实时在站内的乘客,这些站内乘客在给定的预测时间段尚未出站。

    另一方面通过计算任意两个站点的站间运行时间概率分布信息以用于后续时刻到达概率的计算。参照图3,站间运行时间概率分布信息的确定流程包括:

    s1101、基于历史客流运行数据获取线网所有od对,基于各个od对统计各个乘客对应任意两个站点的站间运行时间;

    s1102、基于所述站间运行时间统计任意两个站点在各个时段的到达人数,并根据所述到达人数确定任意两个站点的站间运行时间概率分布信息。

    其中,由于乘客乘车习惯、地铁列车延时、地铁乘客上下车拥挤度、天气等各种因素的影响。对于不同的乘客,从同样一个车站a进站,到达同一个车站b出站的时间可能不同。针对给定的预测时间段,乘客可能在这个预测时间段内的任何一分钟乃至任何一秒钟到达,但是不同时段其到达的概率是不一样的。因此,通过线网历史客流运行数据进行统计,以确定任意两个站点的站间运行时间概率分布信息。具体的,参照图4,基于线网历史客流运行数据,根据线网所有的站点(包括上行站点和下行站点),获取所有的od对(交通出行量)信息。根据该od对信息,获取线网各个乘客的进出站信息,进出站信息具体包括进站站点、进站时间、出站站点和出站时间等核心信息。进一步的,根据获取到的乘客的进站站点、进站时间、出站站点和出站时间信息,即可统计出各个乘客在任意两个站点之间的乘车时间。根据统计出的每个乘客在任意两个站间的乘车时间,将乘车时间按照大小划分到具体的时段(以分钟为单位),以此即可得到任意两个站间在不同时段的到站人数分布。进一步的,根据所述到达人数计算对应的各个站间运行时间概率,并从大到小提取设定数量的所述站间运行时间概率作为对应的站间运行时间概率分布信息。通过统计出各个时段到达的人数,按照人数多少,从大到小进行排序,即可计算出各个时段对应的概率。并且,考虑到大多数人的行为是符合正态分布的,因此取排名前十的时间概率分布作为站间运行时间概率分布信息,以此即可得到对应任意两个站点的站间运行时间概率分布。例如,a站点到b站点站间运行时间概率分布为{43分钟:0.046;44分钟:0.076;45分钟:0.122;46分钟:0.13;47分钟:0.119;48分钟:0.114;49分钟:0.099;50分钟:0.097;51分钟:0.077;52分钟:0.053;53分钟:0.06},其中,第43分钟(包括小于43分钟)到达的概率为0.046,第44分钟到达的概率为0.076,第45分钟到达的概率为0.122,以此类推,通过提取排序前十的时间概率分布之后,基本可以覆盖线网大多数乘客,对于个例乘客,则可以忽略,以此完成任意两个站点的站间运行时间概率分布信息的确定流程。

    s120、基于所述站间运行时间概率分布信息确定所述站内乘客到达线网各个出站站点的时间阈值,基于所述时间阈值比对所述预测时间段,确定所述站内乘客到达各个所述出站站点的时刻到达概率,所述时间阈值包括最快到达时间和最慢到达时间。

    在确定任意两个站点的站间运行时间概率分布信息之后,为了确定乘客是否可以在预测时间段到达对应的出站站点。此时根据此前统计的在预测时间段内线网所有的站内乘客,确定站内乘客的进站时间信息,以此来计算出乘客达到各个站点的时间概率,即时刻到达概率。

    在此之前,根据上述站间运行时间概率分布信息进行站内乘客到达线网各个出站站点的时间阈值测算。其中,参照图5,时间阈值确定流程包括:

    s1201、提取所述站内乘客的进站时间信息,确定各个站内乘客的进站站点,为所述进站站点匹配线网各个出站站点;

    s1202、基于所述进站站点和所述出站站点查询所述站间运行时间概率分布,确定所述站内乘客到达所述出站站点的最快到达时间和最慢到达时间。

    通过初始化站内乘客对所有站点的时刻到达概率,将站内乘客对所有站点的时刻到达概率初始化为0。进一步循环线网所有的站点,这些站点一般为该站内乘客在线网中所有可能的出站站点,则以线网所有的站点匹配为对应进站站点的各个出站站点。对于固定的某一个出站站点id,根据该站内乘客的进站站点id和出站站点id,通过查询对应的站间运行时间概率分布信息,取出该od对的站间运行时间概率分布信息。从获取到的站间运行时间概率分布信息中,计算出该站内乘客到达该出站站点id的最快到达时间和最晚到达时间,以此完成时间阈值的计算。

    进一步的,基于上述时间阈值,对应进行时刻到达概率的计算。其中,基于时间阈值确定时刻到达概率的流程包括:

    s1203、将所述最快到达时间和所述最慢到达时间比对所述预测时间段,若所述最快到达时间和/或所述最慢到达时间处于所述预测时间段中,确定对应的所述站内乘客到达所述出站站点的时间概率;

    s1204、统计所述时间概率,确定各个所述站内乘客到达各个所述出站站点的时刻到达概率。

    具体的,参照图6,提供时刻到达概率的确定流程。对于给定的预测时间段和给定的站内乘客的进站时间信息,如果发现对应时间阈值的最快到达时间大于预测时间段中的结束时间或者最慢到达时间小于预测时间段中的开始时间,则说明该站内乘客不可能在我们规定的预测时段内到达对应站点进行出站,此时更新在该站点出站的概率值为0。反之,则说明该站内乘客有一定概率到达该站点进行出站。此时从对应的所述站间运行时间概率分布信息中循环取出各个所述站间运行时间,基于所述站内乘客的进站时间信息和所述站间运行时间计算得到对应的到站时间;将所述到站时间比对所述预测时间段,若所述到站时间处于所述预测时间段中,提取对应的站间运行时间概率作为所述站内乘客到达所述出站站点的一个时间概率。在计算站内乘客在该站点出站的时间概率时,将站间运行时间概率分布信息的各个站间运行时间从小到大进行排列,依次循环取出,将对应站内乘客的进站时间加上循环取出的站间运行时间,即为对应的到站时间。将计算得到的对应的到站时间比对预测时间段的结束时间,若该到站时间为预测时间段内的值,则说明对应的到站时间可以在预测时间段内到达该出站站点。进一步将对应所述站间运行时间概率分布信息中各个所述站间运行时间确定的所述时间概率进行叠加统计,确定一个所述站内乘客到达一个所述出站站点的时刻到达概率,循环各个所述出站站点及各个所述站内乘客,确定各个所述站内乘客到达各个所述出站站点的时刻到达概率。通过将可以到达的运行时间对应的时间概率进行累加,就可以得到一个站内乘客对应该出站站点最终的时刻到达概率。在循环完所有的站点之后,就可以得到一个站内乘客对线网所有的站点的时刻到达概率。以此类推,对于所有的站内乘客,都利用上述流程,就可以得到所有的站内乘客对线网所有的出站站点的时刻到达概率。

    s130、根据历史客流运行数据统计出线网中各个od对的第一进出站概率分布信息以及所述站内乘客各个od对的第二进出站概率分布信息,基于所述站内乘客的乘客类型使用所述第一进出站概率分布信息、所述第二进出站概率分布信息或所述站内乘客的当天乘车记录确定所述站内乘客到达各个所述出站站点的站点到达概率,所述乘客类型包括新用户和老用户。

    在进行站点到达概率计算时,通过站内乘客分类进行站点到达概率的确定。基于历史客流运行数据统计出的所有乘客的id列表,将统计到的当前站内乘客的id和id列表进行对比,即可区分出站内乘客为新用户和老用户。可以理解的是,若当前站内乘客的id未出现在id列表上,则确定其为新用户,反之,则为老用户。

    进一步的,基于历史客流运行数据统计出线网中各个od对的第一进出站概率分布信息以及当前站内乘客各个od对的第二进出站概率分布信息,进行站点到达概率的确定。其中,若所述站内乘客的乘客类型为新用户,使用所述第一进出站概率分布信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率;若所述站内乘客的乘客类型为老用户,使用所述站内乘客的当天乘车记录、所述第二进出站概率分布信息或所述第一进出站概率分布信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率。

    具体的,参照图7,基于给定的预测时间段和给定的站内乘客的进站时间信息,首先初始化站内乘客对所有站点的站点到达概率,将站内乘客对所有站点的站点到达概率初始化为0。对应每一个出站站点id,首先根据乘客历史乘车记录,统计出线网各od对的进出站概率分布信息和站内乘客各个od对的进出站概率分布信息,该进出站概率分布信息对应出站站点的概率分布进行统计。进一步的,通过站内乘客类型判断,若该站内乘客为新用户,则基于所述第一进出站概率分布信息查询对应的od对的第一概率信息,根据第一概率信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率。由于新用户没有任何历史乘车信息,则通过获取线网各od对的进出站概率分布信息,并且更新当前这个站内乘客对这个出站站点的出站概率。若该站内乘客为老用户,则说明这个站内乘客存在历史乘车信息。此时根据该站内乘客的进站时间来判断是否大于等于指定时间点(此处取18:00),若所述站内乘客的进站时间大于或等于指定时间点,根据所述站内乘客的当天乘车记录比对对应的所述出站站点,确定对应的所述站内乘客到达各个所述出站站点的站点到达概率;若所述站内乘客的进站时间小于指定时间点,判断对应的所述出站站点是否出现在所述站内乘客的历史出站列表中,若是,基于所述第一进出站概率分布信息查询对应的od对的第二概率信息,根据第二概率信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率,若否,基于所述第一进出站概率分布信息查询对应的od对的第一概率信息,根据第一概率信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率。具体的,若该站内乘客的进站时间大于等于指定时间点,则说明当天该站内乘客可能还有其他乘车记录。考虑到如果该站内乘客当天有多个乘车记录的话,晚上回去的概率是非常大的。则取出该站内乘客当天最早的一条进出站记录,获取其进站站点,该进站站点可能与该站内乘客晚上回程的出站站点对应,将进站站点与当前进行预测的该出站站点id进行对比,若两者相同,则更新该出站站点id的站点到达概率值为1,若不同,则更新该出站站点id的站点到达概率值为0。另外,如果该站内乘客的进站时间小于指定时间点,则根据该站内乘客历史乘车记录判断该出站站点id是否出现在对应站内乘客的历史出站列表中。若存在,则获取该站内乘客与该出站站点id对应的od对,根据该od对的进出站概率分布更新该站内乘客到达该出站站点id的站点到达概率;若不存在,则参照新用户的处理流程,获取线网中与该出站站点id对应的od对,根据线网中该od对的进出站概率分布更新该站内乘客到达该出站站点id的站点到达概率。以此即可确定对应站内乘客到达该出站站点id的站点到达概率。

    进一步的,在循环完所有的站点之后,就可以得到该站内乘客对线网所有的出站站点的站点到达概率。以此类推,对于所有的站内乘客,都利用这套流程,就可以得到所有站内乘客对线网所有站点的站点到达概率。

    s140、基于给定的所述预测时间段、预测站点和对应的站内乘客数量,使用所述时刻到达概率和所述站点到达概率计算所述预测站点在所述预测时间段内的出站客流量。

    最终,基于上述步骤s120、s130确定的各个站内乘客到达各个出站站点的时刻到达概率和站点到达概率,即可进行出站客流量的预测。其中。所述预测站点在所述预测时间段内的出站客流量计算公式为:

    其中,predictexit_number为所述预测站点在所述预测时间段内的出站客流量,n为所述站内乘客的数量,time_arrive_probi为第i个所述站内乘客到达所述预测站点的所述时刻到达概率,station_arrive_probi为第i个所述站内乘客到达所述预测站点的所述站点到达概率。根据已确定的预测时间段、预测站点和对应的站内乘客数量,将上述相关参数输入该出站客流量计算公式,即可得到该预测站点在给定的预测时间段内的出站客流数据,以此完成出站客流预测。

    本申请实施例基于乘客进站和出站的关联关系,利用进站信息来预测出站信息,由于进站乘客终究是要出站的,根据乘客的进站信息预测出站站点,可以提升出站预测的准确性。并且,由于地铁客流是由个体出行行为集计而成,各个个体行为又有极高的规律性(例如固定的上下班事件),将个体行为作为参考可以提高出站客流预测的鲁棒性,通过充分考虑个体行为习惯对出站客流预测的影响,可以进一步提升出站客流预测精度。

    上述,通过获取线网实时客流运行数据,基于给定的预测时间段统计线网的站内乘客,并基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息。进一步基于站间运行时间概率分布信息确定站内乘客到达各个出站站点的时刻到达概率,并确定站内乘客到达各个出站站点的站点到达概率,基于给定的预测时间段、预测站点和对应的站内乘客数量,使用时刻到达概率和站点到达概率计算预测站点在预测时间段内的出站客流量。采用上述技术手段,可以结合不同进站时间,进站站点以及乘客个体行为习惯对出站客流预测的影响,实现更精准的出站客流预测,保障出站客流预测的可靠性。

    实施例二:

    在上述实施例的基础上,图8为本申请实施例二提供的一种基于概率分布的出站客流预测装置的结构示意图。参考图8,本实施例提供的基于概率分布的出站客流预测装置具体包括:统计模块21、第一概率计算模块22、第二概率计算模块23和预测模块24。

    其中,统计模块21,用于获取线网实时客流运行数据,基于给定的预测时间段统计线网的站内乘客,并基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息;

    第一概率计算模块22,用于基于所述站间运行时间概率分布信息确定所述站内乘客到达线网各个出站站点的时间阈值,基于所述时间阈值比对所述预测时间段,确定所述站内乘客到达各个所述出站站点的时刻到达概率,所述时间阈值包括最快到达时间和最慢到达时间;

    第二概率计算模块23,用于根据历史客流运行数据统计出线网中各个od对的第一进出站概率分布信息以及所述站内乘客各个od对的第二进出站概率分布信息,基于所述站内乘客的乘客类型使用所述第一进出站概率分布信息、所述第二进出站概率分布信息或所述站内乘客的当天乘车记录确定所述站内乘客到达各个所述出站站点的站点到达概率,所述乘客类型包括新用户和老用户;

    预测模块24,用于基于给定的所述预测时间段、预测站点和对应的站内乘客数量,使用所述时刻到达概率和所述站点到达概率计算所述预测站点在所述预测时间段内的出站客流量。

    上述,通过获取线网实时客流运行数据,基于给定的预测时间段统计线网的站内乘客,并基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息。进一步基于站间运行时间概率分布信息确定站内乘客到达各个出站站点的时刻到达概率,并确定站内乘客到达各个出站站点的站点到达概率,基于给定的预测时间段、预测站点和对应的站内乘客数量,使用时刻到达概率和站点到达概率计算预测站点在预测时间段内的出站客流量。采用上述技术手段,可以结合不同进站时间,进站站点以及乘客个体行为习惯对出站客流预测的影响,实现更精准的出站客流预测,保障出站客流预测的可靠性。

    本申请实施例二提供的基于概率分布的出站客流预测装置可以用于执行上述实施例一提供的基于概率分布的出站客流预测方法,具备相应的功能和有益效果。

    实施例三:

    本申请实施例三提供了一种电子设备,参照图9,该电子设备包括:处理器31、存储器32、通信模块33、输入装置34及输出装置35。该电子设备中处理器的数量可以是一个或者多个,该电子设备中的存储器的数量可以是一个或者多个。该电子设备的处理器、存储器、通信模块、输入装置及输出装置可以通过总线或者其他方式连接。

    存储器作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请任意实施例所述的基于概率分布的出站客流预测方法对应的程序指令/模块(例如,基于概率分布的出站客流预测装置中的统计模块、第一概率计算模块、第二概率计算模块和预测模块)。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

    通信模块用于进行数据传输。

    处理器通过运行存储在存储器中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的基于概率分布的出站客流预测方法。

    输入装置可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置可包括显示屏等显示设备。

    上述提供的电子设备可用于执行上述实施例一提供的基于概率分布的出站客流预测方法,具备相应的功能和有益效果。

    实施例四:

    本申请实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种基于概率分布的出站客流预测方法,该基于概率分布的出站客流预测方法包括:获取线网实时客流运行数据,基于给定的预测时间段统计线网的站内乘客,并基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息;基于所述站间运行时间概率分布信息确定所述站内乘客到达线网各个出站站点的时间阈值,基于所述时间阈值比对所述预测时间段,确定所述站内乘客到达各个所述出站站点的时刻到达概率,所述时间阈值包括最快到达时间和最慢到达时间;根据历史客流运行数据统计出线网中各个od对的第一进出站概率分布信息以及所述站内乘客各个od对的第二进出站概率分布信息,基于所述站内乘客的乘客类型使用所述第一进出站概率分布信息、所述第二进出站概率分布信息或所述站内乘客的当天乘车记录确定所述站内乘客到达各个所述出站站点的站点到达概率,所述乘客类型包括新用户和老用户;基于给定的所述预测时间段、预测站点和对应的站内乘客数量,使用所述时刻到达概率和所述站点到达概率计算所述预测站点在所述预测时间段内的出站客流量。

    存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如cd-rom、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如dram、ddrram、sram、edoram,兰巴斯(rambus)ram等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的第一计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。

    当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的基于概率分布的出站客流预测方法,还可以执行本申请任意实施例所提供的基于概率分布的出站客流预测方法中的相关操作。

    上述实施例中提供的基于概率分布的出站客流预测装置、存储介质及电子设备可执行本申请任意实施例所提供的基于概率分布的出站客流预测方法,未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的基于概率分布的出站客流预测方法。

    上述仅为本申请的较佳实施例及所运用的技术原理。本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行的各种明显变化、重新调整及替代均不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由权利要求的范围决定。


    技术特征:

    1.一种基于概率分布的出站客流预测方法,其特征在于,包括:

    获取线网实时客流运行数据,基于给定的预测时间段统计线网的站内乘客,并基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息;

    基于所述站间运行时间概率分布信息确定所述站内乘客到达线网各个出站站点的时间阈值,基于所述时间阈值比对所述预测时间段,确定所述站内乘客到达各个所述出站站点的时刻到达概率,所述时间阈值包括最快到达时间和最慢到达时间;

    根据历史客流运行数据统计出线网中各个od对的第一进出站概率分布信息以及所述站内乘客各个od对的第二进出站概率分布信息,基于所述站内乘客的乘客类型使用所述第一进出站概率分布信息、所述第二进出站概率分布信息或所述站内乘客的当天乘车记录确定所述站内乘客到达各个所述出站站点的站点到达概率,所述乘客类型包括新用户和老用户;

    基于给定的所述预测时间段、预测站点和对应的站内乘客数量,使用所述时刻到达概率和所述站点到达概率计算所述预测站点在所述预测时间段内的出站客流量。

    2.根据权利要求1所述的基于概率分布的出站客流预测方法,其特征在于,基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息,包括:

    基于历史客流运行数据获取线网所有od对,基于各个od对统计各个乘客对应任意两个站点的站间运行时间;

    基于所述站间运行时间统计任意两个站点在各个时段的到达人数,并根据所述到达人数确定任意两个站点的站间运行时间概率分布信息。

    3.根据权利要求2所述的基于概率分布的出站客流预测方法,其特征在于,根据所述到达人数确定任意两个站点的站间运行时间概率分布信息,包括:

    根据所述到达人数计算对应的各个站间运行时间概率,并从大到小提取设定数量的所述站间运行时间概率作为对应的站间运行时间概率分布信息。

    4.根据权利要求1所述的基于概率分布的出站客流预测方法,其特征在于,基于所述站间运行时间概率分布信息确定所述站内乘客到达线网各个出站站点的时间阈值,包括:

    提取所述站内乘客的进站时间信息,确定各个站内乘客的进站站点,为所述进站站点匹配线网各个出站站点;

    基于所述进站站点和所述出站站点查询所述站间运行时间概率分布,确定所述站内乘客到达所述出站站点的最快到达时间和最慢到达时间。

    5.根据权利要求4所述的基于概率分布的出站客流预测方法,其特征在于,基于所述时间阈值比对所述预测时间段,确定所述站内乘客到达各个所述出站站点的时刻到达概率,包括:

    将所述最快到达时间和所述最慢到达时间比对所述预测时间段,若所述最快到达时间和/或所述最慢到达时间处于所述预测时间段中,确定对应的所述站内乘客到达所述出站站点的时间概率;

    统计所述时间概率,确定各个所述站内乘客到达各个所述出站站点的时刻到达概率。

    6.根据权利要求5所述的基于概率分布的出站客流预测方法,其特征在于,确定对应的所述站内乘客到达所述出站站点的时间概率,包括:

    从对应的所述站间运行时间概率分布信息中循环取出各个所述站间运行时间,基于所述站内乘客的进站时间信息和所述站间运行时间计算得到对应的到站时间;

    将所述到站时间比对所述预测时间段,若所述到站时间处于所述预测时间段中,提取对应的站间运行时间概率作为所述站内乘客到达所述出站站点的一个时间概率。

    7.根据权利要求6所述的基于概率分布的出站客流预测方法,其特征在于,统计所述时间概率,确定各个所述站内乘客到达各个所述出站站点的时刻到达概率,包括:

    将对应所述站间运行时间概率分布信息中各个所述站间运行时间确定的所述时间概率进行叠加统计,确定一个所述站内乘客到达一个所述出站站点的时刻到达概率,循环各个所述出站站点及各个所述站内乘客,确定各个所述站内乘客到达各个所述出站站点的时刻到达概率。

    8.根据权利要求1所述的基于概率分布的出站客流预测方法,其特征在于,基于所述站内乘客的乘客类型使用所述第一进出站概率分布信息、所述第二进出站概率分布信息或所述站内乘客的当天乘车记录确定所述站内乘客到达各个所述出站站点的站点到达概率,所述乘客类型包括新用户和老用户,包括:

    若所述站内乘客的乘客类型为新用户,使用所述第一进出站概率分布信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率;

    若所述站内乘客的乘客类型为老用户,使用所述站内乘客的当天乘车记录、所述第二进出站概率分布信息或所述第一进出站概率分布信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率。

    9.根据权利要求8所述的基于概率分布的出站客流预测方法,其特征在于,若所述站内乘客的乘客类型为新用户,使用所述第一进出站概率分布信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率,包括:

    基于所述第一进出站概率分布信息查询对应的od对的第一概率信息,根据第一概率信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率。

    10.根据权利要求8所述的基于概率分布的出站客流预测方法,其特征在于,若所述站内乘客的乘客类型为老用户,使用所述站内乘客的当天乘车记录、所述第二进出站概率分布信息或所述第一进出站概率分布信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率,包括:

    若所述站内乘客的进站时间大于或等于指定时间点,根据所述站内乘客的当天乘车记录比对对应的所述出站站点,确定对应的所述站内乘客到达各个所述出站站点的站点到达概率;

    若所述站内乘客的进站时间小于指定时间点,判断对应的所述出站站点是否出现在所述站内乘客的历史出站列表中,若是,基于所述第一进出站概率分布信息查询对应的od对的第二概率信息,根据第二概率信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率,若否,基于所述第一进出站概率分布信息查询对应的od对的第一概率信息,根据第一概率信息确定对应的所述站内乘客到达各个所述出站站点的站点到达概率。

    11.根据权利要求1所述的基于概率分布的出站客流预测方法,其特征在于,所述预测站点在所述预测时间段内的出站客流量计算公式为:

    其中,predictexit_number为所述预测站点在所述预测时间段内的出站客流量,n为所述站内乘客的数量,time_arrive_probi为第i个所述站内乘客到达所述预测站点的所述时刻到达概率,station_arrive_probi为第i个所述站内乘客到达所述预测站点的所述站点到达概率。

    12.一种基于概率分布的出站客流预测装置,其特征在于,包括:

    统计模块,用于获取线网实时客流运行数据,基于给定的预测时间段统计线网的站内乘客,并基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息;

    第一概率计算模块,用于基于所述站间运行时间概率分布信息确定所述站内乘客到达线网各个出站站点的时间阈值,基于所述时间阈值比对所述预测时间段,确定所述站内乘客到达各个所述出站站点的时刻到达概率,所述时间阈值包括最快到达时间和最慢到达时间;

    第二概率计算模块,用于根据历史客流运行数据统计出线网中各个od对的第一进出站概率分布信息以及所述站内乘客各个od对的第二进出站概率分布信息,基于所述站内乘客的乘客类型使用所述第一进出站概率分布信息、所述第二进出站概率分布信息或所述站内乘客的当天乘车记录确定所述站内乘客到达各个所述出站站点的站点到达概率,所述乘客类型包括新用户和老用户;

    预测模块,用于基于给定的所述预测时间段、预测站点和对应的站内乘客数量,使用所述时刻到达概率和所述站点到达概率计算所述预测站点在所述预测时间段内的出站客流量。

    13.一种电子设备,其特征在于,包括:

    存储器以及一个或多个处理器;

    所述存储器,用于存储一个或多个程序;

    当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-11任一所述的基于概率分布的出站客流预测方法。

    14.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-11任一所述的基于概率分布的出站客流预测方法。

    技术总结
    本申请实施例公开了基于概率分布的出站客流预测方法及装置。本申请实施例提供的技术方案,通过获取线网实时客流运行数据,基于给定的预测时间段统计线网的站内乘客,并基于历史客流运行数据统计任意两个站点的站间运行时间概率分布信息。进一步基于站间运行时间概率分布信息确定站内乘客到达各个出站站点的时刻到达概率,并确定站内乘客到达各个出站站点的站点到达概率,基于给定的预测时间段、预测站点和对应的站内乘客数量,使用时刻到达概率和站点到达概率计算预测站点在预测时间段内的出站客流量。采用上述技术手段,可以结合不同进站时间,进站站点以及乘客个体行为习惯对出站客流预测的影响,实现更精准的出站客流预测。

    技术研发人员:曾明;丁保剑;秦伟;李逸帆
    受保护的技术使用者:佳都新太科技股份有限公司;广州新科佳都科技有限公司
    技术研发日:2020.11.30
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-18385.html

    最新回复(0)