一种基于轨迹数据的不确定性医疗可达性计算方法与流程

    专利2022-07-08  125


    本发明属于地理信息技术等技术领域,涉及一种基于浮动车轨迹数据的不确定性医疗可达性测度方法。



    背景技术:

    可达性是交通地理和城市规划中的一个基本概念,已被广泛应用于交通评价、设施选址。而医疗可达性是衡量医疗基础设施建设的重要指标,在政策制定中发挥着重要作用。常用的空间可达性度量模型包括:重力模型,两步移动搜索模型,累计机会模型,时空约束模型和空间阻隔模型。累计机会模型重点研究节点接近机会的难易程度。通过给定的阈值,把在阈值范围内接触到的所有机会的数量定义为特定节点的可达性.机会数量越多,可达性越好。累计机会模型具有较好的可解释性而且计算简便,被广泛应用于可达性研究中。

    随着网络通信技术、车载定位导航及卫星遥感技术的发展和普及,获取海量时空轨迹数据变得越来越容易。利用轨迹数据进行可达性研究正成为可达性研究的新趋势。在我国拥挤的大中型城市中,由于交通拥堵等随机现象的频繁发生,相同od间出行的行程时间存在不确定性。以往研究通常采用固定时间阈值测度某一地点的可达性,忽略了行程时间的不确定对可达性的影响。因此在传统可达性模型中引入可靠性约束能够得到更为精确的可达性结果。



    技术实现要素:

    针对现有技术中存在的缺陷,本发明的目的在于提供一种基于轨迹数据的不确定性医疗可达性计算方法,具体为:通过计算出行完成概率从而在传统可达性模型中引入可靠性约束,将可达性计算由确定性推广至不确定性。所述方法能得到更加符合现实情况的空间可达性。

    本发明的目的由以下技术方案实现:

    一种基于轨迹数据的不确定性医疗可达性计算方法,考虑了行程时间的可靠性,所述方法步骤如下:

    步骤1,数据获取和预处理;

    首先,通过使用互联网地图公司提供的api接口爬取医疗设施poi数据;原始轨迹数据往往为gb级大文件,包含1周甚至几周的数据信息,因此,需要先将文件按照需要以日/小时为单位进行提取;

    然后,剔除因建筑遮蔽、gps信号丢失而产生的异常信息,并对时间字段进行标准化处理。同时,以轨迹为单位,计算相邻轨迹点之间的时间差、轨迹点与起点之间的时间差、轨迹的行驶距离和平均速度,完成轨迹数据的预处理;所述轨迹点与起点之间的时间差为行程时间。

    步骤2,空间处理与网格生成;

    在arcgis中,设置新建数据框的地理坐标系及空间投影,添加研究区域的行政区划图和城市主要道路,利用thiessenpolygon工具箱将研究区域划分为若干边长确定的六边形网格;

    添加步骤1处理完成的轨迹数据,按照位置将六边形网格与轨迹数据进行空间连接。

    添加医疗设施poi并与六边形网格进行空间连接,参考医疗设施的床位数,设置不同类型医疗设施的权重,计算得到每个网格的医疗设施得分,得到公式(1):

    设gj为格子j的医疗设施得分,为格子j内设施h的权重,则有:

    式中,s为格子j内的医疗设施总数;

    步骤3,提取历史行程时间;

    在步骤2处理得到的轨迹数据的基础上,提取每条轨迹上所有的od出行,表示为(i,j),假设轨迹τ由k个轨迹点组成,qτ表示轨迹τ经过的格子编号的集合,m表示轨迹τ经过的格子数,得到公式(2):

    式中,表示轨迹τ上的轨迹点k所在的格子编号,则该轨迹上包含的od对个数为t1,t2,t3,…,tk-1,tk表示轨迹点1,2,3,…,k-1,k的打点时刻;

    假设轨迹τ在格子i中的轨迹点数量为ni,得到公式(3):

    表示格子i的出发时刻,其值为轨迹τ在格子i中的最后一个点的打点时刻;

    因此,格子(i,j)间的行程时间表示为tdj-tdi,且tdj-tdi>0;

    步骤4,构建od矩阵;

    在步骤3的基础上,对相同od的行程时间进行合并,得到该od出行的历史行程时间矩阵:

    odij={tdj-tdi|i=0,1,2…,1101,j=0,1,2,…,1101,i≠j}(4)

    其中,odij为ij之间的历史行程时间集合,0,1,2…,1101为六边形网格编号;

    步骤5,计算出行完成概率;

    假设行程时间服从正态分布,则出行完成概率如式(5)所示:

    式中,cdfij(t)为ij之间行程时间的累积分布函数,σij为ij之间行程时间的样本标准差,μij为ij之间行程时间的样本均值;

    步骤6,计算可靠性约束下的可达性;

    累计机会模型表达如式(6)所示:

    式中,cumi为格子i未考虑可靠性的空间可达性,为格子的机会数,是一个0-1变量,当格子(i,j)间的行程时间tdj-tdi小于等于设定的时间阈值t时,否则

    在(6)中引入可靠性约束,则得到(7):

    式中,pcumi(t,r0)为可靠性要求为r0,时间阈值为t时的可达性,为格子的机会数,取值为0或1,当(i,j)间的行程时间小于等于时间阈值t时,i处居民获得j格子的机会,否则,

    在时间阈值和可靠性约束下,居民能够获得的机会总数即为格子i的可达性。

    在上述方案的基础上,步骤1所述的互联网地图公司包括百度地图、高德地图。

    在上述方案的基础上,步骤2所述的边长为500m。

    在上述方案的基础上,步骤2所述的不同类型医疗设施为:一级医院、二级医院、三级医院;

    本发明的有益效果:

    本发明提供了一种计算医疗可达性的方法,利用轨迹数据并考虑了行程时间不确定的影响,具有以下优点:

    (1)能得到更加符合现实情况的医疗可达性;

    (2)模型简单,易于理解和计算,应用型较强;

    (3)相比于正方形,六边形具有更少的邻近图形、更小的边面积比;同时,具有各向同性的几何性质,能够减少可达性计算中的误差。

    附图说明

    本发明有如下附图:

    图1本发明的计算方法的流程图。

    图2医疗设施分布示意图。

    图3研究区域及网格划分示意图。

    图4医疗得分分布示意图。

    图5可靠性要求为0.1的医疗可达性空间分布示意图。

    图6可靠性要求为0.5的医疗可达性空间分布示意图。

    图7可靠性要求为0.9的医疗可达性空间分布示意图。

    具体实施方式

    以下结合附图1~7对本发明作进一步详细说明,但不限于此。

    本发明提供了一种使用轨迹数据计算医疗可达性的方法,建立起数学模型。

    现有轨迹数据为2015年9月的高德浮动车轨迹数据,数据字段包括采集时间、车辆编号、瞬时速度、经纬度以及道路编号;在处理过程中,提取了2015.9.1-2015.9.7的数据,剔除了经纬度字段异常的轨迹点,同时以轨迹为单位计算了相邻轨迹点之间的时间差、轨迹点与起点之间的时间差(暨行程时间)、轨迹的行驶距离和平均速度,并将数据以小时为单位进行保存。通过高德提供的api接口,爬取了北京市的医疗设施数据2248条,字段包括:名称、地址、经度、纬度、种类。之后,根据医疗资源将医疗设施分为三级医院、二级医院和一级医院三类,各类别医疗设施的分布如图2所示:

    选择北京市五环以内作为研究区域,以500m为边长将研究区域划分为1102个六边形网格(如图3所示)。

    对不同类别的医院信息进行统计分析,结果如下表所示:

    表1医疗设施信息

    根据式(1)可得到每个格子的医疗得分,如图4所示;

    设定时间阈值为30min,计算得到不同可靠性要求下的医疗可达性结果。

    如图5~7所示,其中图5为可靠性要求为0.1的医疗可达性空间分布示意图,图6为可靠性要求为0.5的医疗可达性空间分布示意图,图7为可靠性要求为0.9的医疗可达性空间分布示意图。

    可以看出:在不同的可靠性约束下,医疗可达性的空间分布具有明显差异。随着可靠性要求的提高,医疗可达性呈现出下降的趋势;同时中心城区具有相对较高的医疗可达性。

    以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

    本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。


    技术特征:

    1.一种基于轨迹数据的不确定性医疗可达性计算方法,其特征在于,所述方法步骤如下:

    步骤1,数据获取和预处理;

    首先,通过使用互联网地图公司提供的api接口爬取医疗设施poi数据;

    然后,剔除因建筑遮蔽、gps信号丢失而产生的异常信息,并对时间字段进行标准化处理;同时,以轨迹为单位,计算相邻轨迹点之间的时间差、轨迹点与起点之间的时间差、轨迹的行驶距离和平均速度,完成轨迹数据的预处理工作,所述轨迹点与起点之间的时间差为行程时间;

    步骤2,空间处理与网格生成;

    在arcgis中,设置新建数据框的地理坐标系及空间投影,添加研究区域的行政区划图和城市主要道路,利用thiessenpolygon工具箱将研究区域划分为若干边长确定的六边形网格;

    添加步骤1处理完成的轨迹数据,按照位置将六边形网格与轨迹数据进行空间连接;

    添加医疗设施poi并与六边形网格进行空间连接,参考医疗设施的床位数,设置不同类型医疗设施的权重,计算得到每个网格的医疗设施得分,得到公式(1):

    设gj为格子j的医疗设施得分,为格子j内设施h的权重,则有:

    式中,s为格子j内的医疗设施总数;

    步骤3,提取历史行程时间;

    在步骤2处理得到的轨迹数据的基础上,提取每条轨迹上所有的od出行,表示为(i,j),假设轨迹τ由k个轨迹点组成,qτ表示轨迹τ经过的格子编号的集合,m表示轨迹τ经过的格子数,得到公式(2):

    式中,表示轨迹τ上的轨迹点k所在的格子编号,则该轨迹上包含的od对个数为t1,t2,t3,…,tk-1,tk表示轨迹点1,2,3,…,k-1,k的打点时刻;

    假设轨迹τ在格子i中的轨迹点数量为ni,得到公式(3):

    表示格子i的出发时刻,其值为轨迹τ在格子i中的最后一个点的打点时刻;

    因此,格子(i,j)间的行程时间表示为tdj-tdi,且tdj-tdi>0;

    步骤4,构建od矩阵;

    在步骤3的基础上,对相同od的行程时间进行合并,得到该od出行的历史行程时间矩阵:

    odij={tdj-tdi|i=0,1,2…,1101,j=0.1.2,…,1101,i≠j}(4)

    其中,odij为ij之间的历史行程时间集合,0,1,2…,1101为六边形网格编号;

    步骤5,计算出行完成概率;

    假设行程时间服从正态分布,则出行完成概率如式(5)所示:

    式中,cdfij(t)为ij之间行程时间的累积分布函数σij为ij之间行程时间的样本标准差,μij为ij之间行程时间的样本均值;

    步骤6,计算可靠性约束下的可达性;

    累计机会模型表达如式(6)所示:

    式中,cumi为格子i未考虑可靠性的空间可达性,为格子的机会数,是一个0-1变量,当格子(i,j)间的行程时间tdj-tdi小于等于设定的时间阈值t时,否则

    在(6)中引入可靠性约束,则得到(7):

    式中,pcumi(t,r0)为可靠性要求为r0,时间阈值为t时的可达性,为格子的机会数,取值为0或1,当(i,j)间的行程时间小于等于时间阈值t时,i处居民获得j格子的机会,否则,

    在时间阈值和可靠性约束下,居民能够获得的机会总数为格子i的可达性。

    2.如权利要求1所述的基于轨迹数据的不确定性医疗可达性计算方法,其特征在于,步骤1所述的互联网地图公司包括百度地图、高德地图。

    3.如权利要求1所述的基于轨迹数据的不确定性医疗可达性计算方法,其特征在于,步骤2所述的边长为500m。

    4.如权利要求1所述的基于轨迹数据的不确定性医疗可达性计算方法,其特征在于,步骤2所述的不同类型医疗设施为:一级医院、二级医院、三级医院。

    技术总结
    本发明涉及一种基于轨迹数据的不确定性医疗可达性计算方法,具体包括如下步骤:步骤1,数据获取和预处理;步骤2,空间处理与网格生成;步骤3,提取历史出行时间;步骤4,构建OD矩阵;步骤5,计算出行完成概率;步骤6,计算可靠性约束下的可达性;本发明提供的方法,具有以下优点:(1)得到更加符合现实情况的医疗可达性;(2)模型简单,易于理解和计算,应用型较强;(3)相比于正方形,六边形具有更少的邻近图形、更小的边面积比;同时,具有各向同性的几何性质,能够减少可达性计算中的误差。

    技术研发人员:吕莹;董鲁祺;孙会君;吴建军;支丹月
    受保护的技术使用者:北京交通大学
    技术研发日:2020.10.22
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-21322.html

    最新回复(0)