本发明属于土地利用规划,具体是指一种基于机器学习的城市土地利用规划方法及系统。
背景技术:
1、城市土地利用规划是对城市土地资源进行科学合理布局和利用,提高土地利用效率,促进城市可持续发展。但是采集的城市土地数据存在异常值,增加数据的不准确性和不可靠性,并且现有的异常值检测算法难以准确评估数据的异常程度的问题;现有的城市土地利用规划模型存在过拟合风险,效率和准确性低的问题;现有的城市土地利用规划模型在参数搜索时,初始化位置分布不均匀,位置更新时没有进行任何有效的信息交换,扰乱了算法的收敛速度的问题。
技术实现思路
1、针对上述情况,为克服现有技术的缺陷,本发明提供了一种基于机器学习的城市土地利用规划方法及系统,针对采集的城市土地数据存在异常值,增加数据的不准确性和不可靠性,并且现有的异常值检测算法难以准确评估数据的异常程度的问题,本方案计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据,更准确地衡量数据的分布情况和偏斜程度,从而更好地判断数据的异常程度,保证选择数据集的质量和可靠性;针对现有的城市土地利用规划模型存在过拟合风险,效率和准确性低的问题,本方案引入差值控制量和加权变量设计差值损失函数,增强模型的准确性,使其更好地适应城市土地利用规划任务;针对现有的城市土地利用规划模型在参数搜索时,初始化位置分布不均匀,位置更新时没有进行任何有效的信息交换,扰乱了算法的收敛速度的问题,本方案使用自适应因子改进的帐篷混沌映射函数初始化个体位置,保证个体的位置分布较为均匀,并基于自适应影响力构建个体的自适应邻里组,能够利用邻居间的信息交流来提升搜索效果,基于修正因子进行位置更新,通过修正因子调整个体位置的变化,在一定程度上控制位置的变化幅度,避免过大或过小的变化,提高搜索效率和全局搜索能力,提高城市土地利用规划的效果。
2、本发明采取的技术方案如下:本发明提供的一种基于机器学习的城市土地利用规划方法,该方法包括以下步骤:
3、步骤s1:数据采集,采集城市土地数据和利用类型;
4、步骤s2:城市土地数据异常处理,计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据;
5、步骤s3:构建城市土地利用规划模型,调用svm函数,引入差值控制量和加权变量设计差值损失函数,完成模型构建;
6、步骤s4:模型参数搜索,使用自适应因子改进的帐篷混沌映射函数初始化个体位置,基于自适应影响力构建自适应邻里组,基于修正因子进行位置更新;
7、步骤s5:城市土地利用规划,基于城市土地利用规划模型输出的数据标签对城市土地的利用类型进行合理规划。
8、进一步地,在步骤s1中,所述数据采集是采集城市土地数据和利用类型,城市土地数据包括土地利用现状数据、人口数据、经济数据、生态环境数据、交通数据和地形地貌数据,利用类型包括商业区、工业区、公共区、住宅区和景观区,将利用类型作为数据标签。
9、进一步地,在步骤s2中,所述城市土地数据异常处理具体包括以下步骤:
10、步骤s21:预处理,对采集的数据进行归一化、去除噪声和缺失值处理,基于预处理后的数据构建土地数据处理集a;
11、步骤s22:计算经验累积分布函数,对于第d1个特征的边界值b,计算在土地数据处理集a中小于等于b的比例和大于等于b的比例,得到第一经验累积分布函数和第二经验累积分布函数,所用公式如下:
12、;
13、;
14、式中,1{}是指示函数,当其参数为真时为1,否则为0;是第d1个特征的第一经验累积分布函数,是第d1个特征的第二经验累积分布函数,是土地数据处理集a中第n1个数据的第d1个特征的值,b是边界值,d1是数据的特征索引,n1是土地数据处理集a中的数据数量,d1是数据的特征数量,n1是土地数据处理集a中的数据索引;
15、步骤s23:计算偏度系数,基于第d1个特征的所有数据的平均值得到偏度系数,所用公式如下:
16、;
17、;
18、式中,是第d1个特征的偏度系数,是第d1个特征的数据平均值;
19、步骤s24:计算异常得分,分别基于第一经验累积分布函数、第二经验累积分布函数和偏度系数得到三种异常得分,所用公式如下:
20、;
21、;
22、;
23、式中,是的第一异常得分,是的第二异常得分,是的第三异常得分;
24、步骤s25:计算最终异常得分,预先设定第一异常得分的权重γ1、第二异常得分的权重γ2和第三异常得分的权重γ3,所用公式如下:
25、;
26、式中,是的最终异常得分;
27、步骤s26:删除异常数据,预先设定异常阈值β,当≥β时,则将该数据识别为异常数据并删除;否则,将其保留,从最后保留的数据中随机选取70%的数据构建训练数据集,基于剩余30%的数据构建测试数据集。
28、进一步地,在步骤s3中,所述构建城市土地利用规划模型具体包括以下步骤:
29、步骤s31:模型训练,利用python导入sklearn库调用svm函数,基于训练数据集完成模型训练;
30、步骤s32:设计差值损失函数,将测试数据集输入模型中,基于损失值设计差值损失函数,所用公式如下:
31、;
32、;
33、式中,lossc是第c个样本数据的损失值,hc是第c个样本数据的真实标签,是第c个样本数据的模型输出标签,k是差值控制量,ψ是加权变量,c是样本数据的索引,nxl是测试数据集的样本数据数量,losszh是差值损失函数。
34、进一步地,在步骤s4中,所述模型参数搜索具体包括以下步骤:
35、步骤s41:初始化个体位置,用个体位置是模型参数的代表,在[0,1]范围内随机生成一个位置初始值g0,基于引入自适应因子改进的帐篷混沌映射函数初始化个体位置,所用公式如下:
36、;
37、式中,gi是第i个个体的初始化位置,gi-1是第i-1个个体的初始化位置,i是个体的索引,ng是个体总数量,ε是自适应因子;
38、步骤s42:计算个体的自适应影响力,将城市土地利用规划模型性能作为个体的适应度值,按照适应度值从大到小的顺序进行排序,根据个体在排序中的位置和适应度值,计算每个个体在所有个体中的相对影响力大小,计算个体的自适应影响力所用公式如下:
39、;
40、式中,yxp(t)是第t次迭代时第p个个体的自适应影响力,即第t次迭代时第p个个体在所有个体中的相对影响力大小,p是排序后的个体索引即个体排名,sp(t)是第t次迭代时第p个个体的适应度值,t是迭代索引;
41、步骤s43:构建个体的自适应邻里组,预先设定邻里阈值,根据邻里阈值,判断每对个体之间的自适应邻里关系,若yxp(t)或yxq(t)中有一个大于邻里阈值,则将个体p和个体q之间的自适应邻里关系记为1;否则,将个体p和个体q之间的自适应邻里关系记为0,基于自适应邻里关系为1的个体构建第t次迭代时个体p的自适应邻里组zp(t);其中,yxq(t)是第t次迭代时第q个个体的自适应影响力,q是不等于p的排序后的个体索引;
42、步骤s44:基于修正因子进行位置更新,为每个个体随机生成一个位置更新策略选择值hp,基于修正因子进行位置更新所用公式如下:
43、;
44、;
45、;
46、式中,gp(t)是第t+1次迭代时第p个个体的位置,是第一修正因子,是第二修正因子,j是自适应邻里组zp(t)中的个体索引,np是自适应邻里组zp(t)中的个体数量,ej是第j个个体在自适应邻里组zp(t)中的权重,r是更新随机值,gj(t)是第t次迭代时自适应邻里组zp(t)中第j个个体的位置;
47、步骤s45:参数确定,预先设定适应度阈值σ和最大迭代次数t,更新个体的适应度值,当最高适应度值大于适应度阈值σ时,则基于当前模型参数构建城市土地利用规划模型;否则,若达到最大迭代次数t,则转至步骤s41;否则转至步骤s42。
48、进一步地,在步骤s5中,所述城市土地利用规划是采集需要进行利用规划区域的城市土地数据,预处理后输入至城市土地利用规划模型中进行规划,根据模型输出的数据标签对城市土地的利用类型进行合理规划。
49、本发明提供的一种基于机器学习的城市土地利用规划系统,包括数据采集模块、城市土地数据异常处理模块、构建城市土地利用规划模型模块、模型参数搜索模块和城市土地利用规划模块;
50、所述数据采集模块采集城市土地数据和利用类型,并将数据发送到城市土地数据异常处理模块;
51、所述城市土地数据异常处理模块计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据,并将数据发送至构建城市土地利用规划模型模块;
52、所述构建城市土地利用规划模型模块调用svm函数,引入差值控制量和加权变量设计差值损失函数,完成模型构建,并将数据发送至模型参数搜索模块;
53、所述模型参数搜索模块使用自适应因子改进的帐篷混沌映射函数初始化个体位置,基于自适应影响力构建自适应邻里组,基于修正因子进行位置更新,完成参数搜索,并将数据发送至城市土地利用规划模块;
54、所述城市土地利用规划模块基于城市土地利用规划模型输出的数据标签对城市土地的利用类型进行合理规划。
55、采用上述方案本发明取得的有益效果如下:
56、(1)针对采集的城市土地数据存在异常值,增加数据的不准确性和不可靠性,并且现有的异常值检测算法难以准确评估数据的异常程度的问题,本方案计算数据每个特征的经验累积分布函数和偏度系数,得到数据三个不同的异常得分,采用加权平均法计算数据最终异常得分,并根据异常阈值识别并删除异常数据,更准确地衡量数据的分布情况和偏斜程度,从而更好地判断数据的异常程度,保证选择数据集的质量和可靠性。
57、(2)针对现有的城市土地利用规划模型存在过拟合风险,效率和准确性低的问题,本方案引入差值控制量和加权变量设计差值损失函数,增强模型的准确性,使其更好地适应城市土地利用规划任务,并减少模型对训练数据的过度拟合,提高模型的泛化能力,可以加快模型的收敛速度,使模型更快地达到较好的性能。
58、(3)针对现有的城市土地利用规划模型在参数搜索时,初始化位置分布不均匀,位置更新时没有进行任何有效的信息交换,扰乱了算法的收敛速度的问题,本方案使用自适应因子改进的帐篷混沌映射函数初始化个体位置,保证个体的位置分布较为均匀,增加搜索空间的覆盖率,并基于自适应影响力构建个体的自适应邻里组,能够利用邻居间的信息交流来提升搜索效果,基于修正因子进行位置更新,通过修正因子调整个体位置的变化,在一定程度上控制位置的变化幅度,避免过大或过小的变化,提高搜索效率和全局搜索能力,既保持搜索的多样性,又提升搜索的精细度和效率,优化模型性能,提高城市土地利用规划的效果。
1.一种基于机器学习的城市土地利用规划方法,其特征在于:该方法包括以下步骤:
2.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法,其特征在于:在步骤s2中,所述城市土地数据异常处理具体包括以下步骤:
3.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法,其特征在于:在步骤s4中,所述模型参数搜索具体包括以下步骤:
4.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法,其特征在于:在步骤s3中,所述构建城市土地利用规划模型具体包括以下步骤:
5.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法,其特征在于:在步骤s1中,所述数据采集是采集城市土地数据和利用类型,城市土地数据包括土地利用现状数据、人口数据、经济数据、生态环境数据、交通数据和地形地貌数据,利用类型包括商业区、工业区、公共区、住宅区和景观区,将利用类型作为数据标签。
6.根据权利要求1所述的一种基于机器学习的城市土地利用规划方法,其特征在于:在步骤s5中,所述城市土地利用规划是采集需要进行利用规划区域的城市土地数据,预处理后输入至城市土地利用规划模型中进行规划,根据模型输出的数据标签对城市土地的利用类型进行合理规划。
7.一种基于机器学习的城市土地利用规划系统,用于实现如权利要求1-6中任一项所述的一种基于机器学习的城市土地利用规划方法,其特征在于:包括数据采集模块、城市土地数据异常处理模块、构建城市土地利用规划模型模块、模型参数搜索模块和城市土地利用规划模块。
8.根据权利要求7所述的一种基于机器学习的城市土地利用规划系统,其特征在于: