基于AWA-DRCN的人口空间化方法与流程

    专利2022-07-08  65


    本发明属于互联网与计算机技术领域,涉及一种基于awa-drcn的人口空间化方法。



    背景技术:

    人口空间化类似于早期的气候数据的降尺度处理过程,它是将研究区域某时点的低空间分辨率的统计人口转换为接近真实人口地域分布的高分辨率人口分布的一种降尺度空间化技术。由于人口空间化数据在一定程度上解决了人口普查数据的空间局限问题而被大量应用于疾病灾害管理、城市规划等方面。归纳起来,当前人口空间化建模技术大致分为全局和局部模型构建两大趋势。

    全局模型构建经历了通过计算区域内平均人口来满足低分辨率数据需求,到采用空间插值方法来实现人口统计数据转换到精细空间单元;随着遥感和gis技术的发展,多源异构数据如etm影像、高程、坡度、夜晚灯光数据、土地与河流欧式距离以及土地分类等逐渐应用,其中夜晚灯光数据如dmsp-olp、npp/viirs以及两者的区别被频繁研究;再到分区密度制图开始与树形模型、多元回归模型相结合。随机森林模型因具有较高的灵活性和对变量重要程度的可度量性等优点被广泛用于人口空间化研究。而多元回归模型相比于随机森林则考虑到不同影响因子之间的相关关系问题。鉴于全局模型很难刻画人口空间分布的异质性问题,地理加权回归和超分辨率卷积网络等局部模型被引入人口空间化研究实践中。其中地理加权回归模型因复杂地形影响而降低了模拟精度,zongzefang等人基于单图像超分辨率与降尺度技术的共通性,首次将超分辨率卷积神经网络模型(srcnn)引入上海市全天性的人口空间化研究,获得了更好的结果。thomas等人尝试通过srcnn堆叠海拔通过单图像超分辨率生成高分辨率气候变化预测。可是srcnn模型存在非线性映射步骤过多参数以及滤波器较大导致一定信息损失的问题,尝试通过改进卷积结构还是采用亚像素卷积都能更好地学习局部特征。

    单一模型只能单独提取全局或局部特征,无法摆脱复杂地形的影响,因此,目前亟需一种能够高分辨率人口空间化的方法。



    技术实现要素:

    有鉴于此,本发明的目的在于提供一种基于awa-drcn的人口空间化方法,用于弥补单一模型对全局特征学习不足、局部特征泛化等缺陷,使得空间化结果更接近标签数据、更接近人口分布真实情况。

    为达到上述目的,本发明提供如下技术方案:

    一种基于awa-espcn的人口空间化方法,具体包括以下步骤:

    s1:获取人口数据集和驱动因子数据,并对其进行预处理;

    s2:“去粗”过程:采用面积加权平均栅格化(areaweightedaverage,awa)模型实现全局性特征学习,完成区县级人口普查数据栅格化;

    s3:“取精”过程:构建深度递归卷积神经网络drcn模型,将步骤s2栅格化人口数据及9个驱动因子数据作为特征,处理后的网格人口栅格数据作为标签输入到drcn模型中进行混合学习实现全局与局部特征,获得在空间分布上的人口空间化结果。

    进一步,步骤s1中,所述人口数据集包括人口统计数据和高分辨率栅格人口数据。

    进一步,步骤s1中,所述驱动因子数据包括自然因子、社会因子和距离因子。

    进一步,所述自然因子包括:高程、坡度和土地利用类型,其中土地利用类型分为水体、河流、耕地和林地;所述社会因子包括:夜间灯光和居民点;所述距离因子包括:土地与河流欧式距离。

    进一步,步骤s2中,采用的awa模型的表达式为:

    其中,lrki表示第k个行政单元内第i个栅格的人口数量,pk表示第k个行政单元人口,sk表示第k个行政单元的面积(单位:hm2)。

    进一步,构建drcn模型,具体包括:

    (1)该网络将内插输入图像(达到所需尺寸)作为输入x,并预测目标图像y;本发明的目标是学习一个预测值y=f(x)的模型f,其中y是它对目标图像y的预测估计;设f1、f2、f3分别表示子网函数:嵌入、推理、重构;构建的模型由三个函数组成:f(x)=f3(f2(f1(x));嵌入网f1(x)取输入向量x并计算矩阵输出h0,它是推理网f2的输入;隐藏层值用h-1表示;嵌网公式如下:

    h-1=max(0,w-1*x b-1)

    h0=max(0,w0*h-1 b0)

    f1(x)=h0

    其中,运算符*表示卷积,max(0,)对应于relu;权重和偏置矩阵为w-1、w0和b-1、b0;

    (2)推理网络f2取输入矩阵h0并计算矩阵输出hd。这里,我们对所有操作使用相同的权重和偏差矩阵w和b。设g表示递归层单次递归建模的函数:g(h)=max(0,w*h b);递归关系是

    hd=g(hd-1)=max(0,w*hd-1 b)

    对于d=1,...,d,推理网f2相当于函数g的组成:其中运算符o表示函数组合,gd表示g与d乘积;

    f2(h)=(gogo…o)g(h)=gd(h)

    (3)重构网f3取输入隐藏状态hd,输出目标图像(高分辨率)。粗略地说,重构网是嵌入网的逆运算,公式如下:

    hd 1=max(0,wd 1*hd bd 1)

    y=max(0,wd 2*hd 1 bd 2)

    f3(h)=y

    考虑到影响因素对人口分布的影响,实验将栅格人口与不同的影响因素以通道的形式作为drcn的输入,通道的数量取决于辅助数据的数量。通过嵌入网络、推理网络和重构网络三部分得到模型的一次输出。人口空间化的任务是使得模型输出与实际人口数据尽可能相似,因此,采用了标准反向传播的随机梯度下降方法使模型输出与实际人口分布的均方误差最小化,以此获得高分辨率人口分布结果。

    本发明的有益效果在于:

    (1)在自然环境因子与社会经济因子的共同作用下,本发明采用的awa drcn模型耦合在一定程度上弥补单一模型对全局特征学习不足、局部特征泛化等缺陷。

    (2)本发明采用的awa drcn耦合模型模拟精度最高,且空间残差值区间误差最小。

    (3)本发明采用的面积加权平均栅格化人口很好地学习到全局人口特征(针对人口密度小的区域),驱动因子作为辅助数据虽然能在整体提高训练模型精度以及降低残差大小。

    本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

    附图说明

    为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:

    图1为本发明基于awa-drcn的人口空间化方法流程图;

    图2为研究区域位置示意图;

    图3为驱动因子数据图。

    具体实施方式

    以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。

    请参阅图1~图3,本实施例设计了一种人口空间化方法,具体包括以下步骤:

    s1:获取人口数据集和驱动因子数据,并对其进行预处理。

    本实施例选择重庆市为研究区域可更好地检验空间化模型的区域适应性。本实施例使用的人口数据集包括人口统计数据和高分辨率栅格人口数据。人口统计数据中区、县户籍人口数据来源于http://www.nature.com/sdata,高分辨率栅格人口作为模型标签数据来源于世界人口项目(worldpop)https://www.worldpop.org。

    本实施例所使用驱动因子数据包括自然因子(高程、坡度、土地利用类型)、社会因子(夜间灯光、居民点)和距离因子(土地与河流欧式距离)共9个驱动因子数据,其中自然因子里面的土地利用类型又分为4类(水体、河流、耕地、林地)。

    高程、坡度、土地利用类型数据来源于全球30米分辨率地表覆盖数据(globeland30);夜间灯光数据是将标准未经校准的dmsp灯光源数据(0~63)乘以100后得到的100m分辨率校准值(0~6300),居民点数据是由jeremiahj等学者利用随机森林模型生成的100m分辨率城乡居民点;河流、行政边界等矢量数据来源于自由街景数据,因此可以计算土地与河流欧式距离;原用地类型(耕地、林地、灌木林地、草地、湿地、水体和建设用地7类)合并为四大类,即将湿地、水体作为无人的水域,将森林、灌木林地合并为林地,耕地、草地合并为耕地,建设用地保持不变,同时提取每种用地类型形成图3。

    s2:“去粗”过程:采用面积加权平均栅格化(areaweightedaverage,awa)模型实现全局性特征学习,完成区县级人口普查数据500m分辨率栅格化。本实施例中,将“去粗”的结果记为低分辨率人口(lowresolution人口,lr人口)。

    面积加权平均方法(areaweightedaverage,awa)是指统计单元的总人口数量除以统计单元的总面积(统计单元面积单位:hm2)。通过awa方法,使统计人口在区县级行政单元内均匀分布(这里人口密度的单位是:人/hm2)。计算公式如下

    其中,lrki表示第k个行政单元内第i个栅格的人口数量,pk表示第k个行政单元人口,sk表示第k个行政单元的面积(单位:hm2)。

    构建drcn模型,具体包括:

    (1)该网络将内插输入图像(达到所需尺寸)作为输入x,并预测目标图像y;本发明的目标是学习一个预测值y=f(x)的模型f,其中y是它对目标图像y的预测估计;设f1、f2、f3分别表示子网函数:嵌入、推理、重构;构建的模型由三个函数组成:f(x)=f3(f2(f1(x));嵌入网f1(x)取输入向量x并计算矩阵输出h0,它是推理网f2的输入;隐藏层值用h-1表示;嵌网公式如下:

    h-1=max(0,w-1*x b-1)

    h0=max(0,w0*h-1 b0)

    f1(x)=h0

    其中,运算符*表示卷积,max(0,)对应于relu;权重和偏置矩阵为w-1、w0和b-1、b0;

    (2)推理网络f2取输入矩阵h0并计算矩阵输出hd。这里,我们对所有操作使用相同的权重和偏差矩阵w和b。设g表示递归层单次递归建模的函数:g(h)=max(0,w*h b);递归关系是

    hd=g(hd-1)=max(0,w*hd-1 b)

    对于d=1,...,d,推理网f2相当于函数g的组成:其中运算符o表示函数组合,gd表示g与d乘积;

    f2(h)=(gogo…o)g(h)=gd(h)

    (3)重构网f3取输入隐藏状态hd,输出目标图像(高分辨率)。粗略地说,重构网是嵌入网的逆运算,公式如下:

    hd 1=max(0,wd 1*hd bd 1)

    y=max(0,wd 2*hd 1 bd 2)

    f3(h)=y

    考虑到影响因素对人口分布的影响,实验将栅格人口与不同的影响因素以通道的形式作为drcn的输入,通道的数量取决于辅助数据的数量。通过嵌入网络、推理网络和重构网络三部分得到模型的一次输出。人口空间化的任务是使得模型输出与实际人口数据尽可能相似,因此,采用了标准反向传播的随机梯度下降方法使模型输出与实际人口分布的均方误差最小化,以此获得高分辨率人口分布结果。

    最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。


    技术特征:

    1.一种基于awa-drcn的人口空间化方法,其特征在于,该方法具体包括以下步骤:

    s1:获取人口数据集和驱动因子数据,并对其进行预处理;

    s2:“去粗”过程:采用面积加权平均栅格化(areaweightedaverage,awa)模型实现全局性特征学习,完成区县级人口普查数据栅格化;

    s3:“取精”过程:构建drcn模型,将步骤s2栅格化人口数据及驱动因子数据作为特征,处理后的网格人口栅格数据作为标签输入到drcn模型中进行混合学习实现全局与局部特征,获得在空间分布上的人口空间化结果。

    2.根据权利要求1所述的人口空间化方法,其特征在于,步骤s1中,所述人口数据集包括人口统计数据和高分辨率栅格人口数据。

    3.根据权利要求1所述的人口空间化方法,其特征在于,步骤s1中,所述驱动因子数据包括自然因子、社会因子和距离因子。

    4.根据权利要求3所述的人口空间化方法,其特征在于,所述自然因子包括:高程、坡度和土地利用类型,其中土地利用类型分为水体、河流、耕地和林地;所述社会因子包括:夜间灯光和居民点;所述距离因子包括:土地与河流欧式距离。

    5.根据权利要求1所述的人口空间化方法,其特征在于,步骤s2中,采用的awa模型的表达式为:

    其中,lrki表示第k个行政单元内第i个栅格的人口数量,pk表示第k个行政单元人口,sk表示第k个行政单元的面积。

    6.根据权利要求1所述的人口空间化方法,其特征在于,步骤s3中,构建drcn模型,具体包括:

    (1)网络将内插输入图像作为输入x,并预测目标图像y;目标是学习一个预测值y=f(x)的模型f,其中y是它对目标图像y的预测估计;设f1、f2、f3分别表示子网函数:嵌入、推理、重构;构建的模型由三个函数组成:f(x)=f3(f2(f1(x));嵌入网f1(x)取输入向量x并计算矩阵输出h0,它是推理网f2的输入;隐藏层值用h-1表示;嵌网公式如下:

    h-1=max(0,w-1*x b-1)

    h0=max(0,w0*h-1 b0)

    f1(x)=h0

    其中,运算符*表示卷积,max(0,)对应于relu;权重和偏置矩阵为w-1、w0和b-1、b0;

    (2)推理网络f2取输入矩阵h0并计算矩阵输出hd;对所有操作使用相同的权重和偏差矩阵w和b;设g表示递归层单次递归建模的函数:g(h)=max(0,w*h b);递归关系是

    hd=g(hd-1)=max(0,w*hd-1 b)

    对于d=1,...,d,推理网f2相当于函数g的组成:其中运算符o表示函数组合,gd表示g与d乘积;

    f2(h)=(gogo…o)g(h)=gd(h)

    (3)重构网f3取输入隐藏状态hd,输出目标图像;即重构网是嵌入网的逆运算,公式如下:

    hd 1=max(0,wd 1*hd bd 1)

    y=max(0,wd 2*hd 1 bd 2)

    f3(h)=y

    通过嵌入网络、推理网络和重构网络三部分得到模型的一次输出;采用标准反向传播的随机梯度下降方法使模型输出与实际人口分布的均方误差最小化,以此获得高分辨率人口分布结果。

    技术总结
    本发明涉及一种基于AWA‑DRCN的人口空间化方法,属于互联网与计算机技术领域。该方法包括:S1:获取人口数据集和驱动因子数据,并对其进行预处理;S2:“去粗”过程:采用AWA模型实现全局性特征学习,完成区县级人口普查数据栅格化;S3:“取精”过程:构建高效亚像素卷积神经网络DRCN模型,将步骤S2栅格化人口数据及驱动因子数据作为特征,处理后的网格人口栅格数据作为标签输入到DRCN模型中进行混合学习实现全局与局部特征,获得在空间分布上的人口空间化结果。本发明采用的AWA DRCN模型模拟精度高,且空间残差值区间误差最小。

    技术研发人员:刘明皓;游鹏;文汝杰
    受保护的技术使用者:重庆邮电大学
    技术研发日:2020.12.11
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-18306.html

    最新回复(0)