本发明涉及数据处理技术领域,尤其涉及一种基于梯度提升回归的房价区间预测方法。
背景技术:
在过去的若干年里,房地产行业是我国经济增长的重要动力来源之一,伴随着房地产行业的迅速发展,近几年来购房热度逐渐飙升。住房关系人民的生活之本,而房价是房地产市场健康稳定发展的重要指标,同时也是整个社会所重点关注的热门话题,关乎整个国民经济和人民生活的幸福感。
目前,在房价预测与分析相关的问题的研究方法主要有以下方法:(1)基于传统逻辑回归方法预测,选择相关系数较高的特征,简单进行缺失值和热独码处理,利用最小二乘法,对数据进行拟合,得到预测的房价值;(2)基于集成学习的方法,使用多个模型得到多个预测结果,在其中选取可能性最大的一种,最终得到预测的房价值。
相比预测房价值,预测房价的有效可靠的区间,包含了房价受宏观政策影响大、不确定性大的特点,不仅可以帮助房地产开发商进行投资决策,帮助消费者更加理性的出资,为有住房刚性需求的人们提供更加可靠的价格参照;也可以帮助政府相关部门更好地对房地产市场进行精确的调控,保持房地产市场的平稳有序,控制炒房等现象的发生。现有的房价区间预测方法有分位数回归森林、模糊粒化混合神经网络等,但是这些方法均具有计算代价高,模型结构复杂等缺点。
目前没有发现同本发明类似技术的说明或报道,也尚未收集到国内外类似的资料。
技术实现要素:
本发明针对现有技术中存在的上述不足,提供了一种基于梯度提升回归的房价区间预测方法及系统。
本发明是通过以下技术方案实现的。
根据本发明的一个方面,提供了一种基于梯度提升回归的房价区间预测方法,包括:
s1,获取二手房产交易数据,所述二手房产交易数据包括二手房产交易数据特征,所述特征包括数据型特征和类别型特征;
s2,分析所述交易数据特征,统计并提取合理数据,利用合理数据获得数据特征的分布和/或相关性;
s3,对s1中得到的特征以及s2中所得到的分析结果进行特征处理,得到新数据集;
s4,建立梯度提升回归模型,利用得到的所述新数据集训练模型,得到预测模型;所述预测模型的上分位数损失函数对应输出区间上限,下分位数损失函数对应输出区间下限;
s5,利用得到的预测模型,输入待预测数据进行预测,得到房价区间。
优选地,所述s1中,利用网络爬虫技术获取二手房产交易数据,其中,所述二手房产交易数据包括如下任意一项或多项数据特征:地区、街道、小区、建筑面积、建筑年代、户型、有无电梯、楼层、梯户比例、装修情况、挂牌时间、成交时间、房屋单价以及成交价格,其中,所述建筑面积、建筑年代、楼层、梯户比例、挂牌时间、成交时间、房屋单价以及成交价格属于数据型特征;地区、街道、小区、户型、有无电梯以及装修情况属于类别型特征。
优选地,所述s2中,针对所述s1得到二手房产交易数据,分析二手房产交易数据特征,包括:
s21,统计二手房产交易数据中的重复数据和缺失数据,得到合理数据;
s22,对于合理数据中的单特征分析,通过条形图或直方图进行分析,得到单个特征的分布情况;对于合理数据中的多特征分析,通过散点图、条形图或直方图进行分析,得到各特征之间的相关性。
优选地,所述s3中,针对所述s1中得到的二手房产交易数据特征和所述s2中得到的分析结果,对数据特征进行如下任意一项或任意多项的处理:
-对所述缺失数据补全,包括:
使用各数据型特征的平均值填充其缺失值;
提出各类别型特征缺失值所在的一行,补充其缺失值;
-针对已有特征派生出新的特征:
合并类别型特征中的地区特征,计算该套房屋所在的经纬度,派生出新的特征;
-对已有类别型特征进行独热编码:
-对所有特征进行归一化;
-求得各特征间的相关系数,将相关系数绝对值低于设定值的特征删除。
优选地,所述s4,包括:
s41,设s3中得到的新数据集为:d={(x1,y),(x2,y),...,(xm,y)},xi∈rd;其中,xi代表第i个特征,d代表特征个数,y代表训练数据的预测结果;
s42,建立以决策树为基模型的梯度提升树,将每颗决策树作为预测的基模型,利用损失函数的负梯度在当前模型的值作为梯度提升树算法中残差的近似值,拟合一棵回归树模型,利用新数据集对回归树模型进行训练,提高模型的健壮型,得到预测模型;
其中,每棵决策树的损失函数为分位数回归损失函数,减少异常点对损失函数的影响。
优选地,所述s5,包括:
将待预测数据输入得到的预测模型,得到上分位数值和下分位数值,从而得到预测的房价区间。
根据本发明的另一个方面,提供了一种基于梯度提升回归的房价区间预测系统,包括:
数据获取模块,获取二手房产交易数据,所述二手房产交易数据包括二手房产交易数据特征,所述特征包括数据型特征和类别型特征;
数据分析模块,分析所述交易数据特征,统计并提取缺失数据;
数据处理模块,对数据获取模块中得到的特征以及数据预处理模块中得到的缺失数据进行特征处理,得到新数据集;
房价区间预测模块,建立梯度提升回归模型,利用得到的所述新数据集训练模型,得到预测模型;所述预测模型的上分位数损失函数对应输出区间上限,下分位数损失函数对应输出区间下限;利用得到的预测模型,输入待预测数据进行预测,得到房价区间。
优选地,所述数据获取模块利用网络爬虫技术获取二手房产交易数据,其中,所述二手房产交易数据包括如下任意一项或多项数据特征:地区、街道、小区、建筑面积、建筑年代、户型、有无电梯、楼层、梯户比例、装修情况、挂牌时间、成交时间、房屋单价以及成交价格,其中,所述建筑面积、建筑年代、楼层、梯户比例、挂牌时间、成交时间、房屋单价以及成交价格属于数据型特征;地区、街道、小区、户型、有无电梯以及装修情况属于类别型特征。
优选地,所述数据分析模块统计二手房产交易数据中的重复数据和缺失数据,得到合理数据;对于合理数据中的单特征分析,通过条形图或直方图进行分析,得到单个特征的分布情况;对于合理数据中的多特征分析,通过散点图、条形图或直方图进行分析,得到各特征之间的相关性。
优选地,所述数据处理模块对数据特征进行如下任意一项或任意多项处理:
-对所述缺失数据补全,包括:
使用各数据型特征的平均值填充其缺失值;
提出各类别型特征缺失值所在的一行,补充其缺失值;
-针对已有特征派生出新的特征:
合并类别型特征中的地区特征,计算该套房屋所在的经纬度,派生出新的特征;
-对已有类别型特征进行独热编码:
-对所有特征进行归一化;
-求得各特征间的相关系数,将相关系数绝对值低于0.1的特征删除。
优选地,所述房价区间预测模块,以决策树为基模型的梯度提升回归模型,将每颗决策树作为预测的基模型,利用损失函数的负梯度在当前模型的值作为梯度提升树算法中残差的近似值,拟合一棵回归树模型,即为梯度提升回归模型,利用所述数据处理模块中得到的新数据集对梯度提升回归模型进行训练,提高模型的健壮型,得到预测模型;将待预测数据输入得到的预测模型,得到上分位数值和下分位数值,从而得到预测的房价区间。
根据本发明的第三个方面,提供了一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时可用于执行上述任一项所述的方法。
根据本发明的第四个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可用于执行上述任一项所述的方法。
由于采用了上述技术方案,本发明与现有技术相比,具有如下有益效果:
本发明提供的基于梯度提升回归的房价区间预测方法及系统,克服现有技术仅预测房价值的不足,通过自主爬取上若干房产数据图表分析该数据特征,缺失数据处理,特征编码与派生,梯度提升回归算法建模,生成房价上下分位数值,从而构成房价预测区间,具有较好的鲁棒性,且区间覆盖率高,区间宽度窄的优点。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明实施例的方案流程图。
具体实施方式
下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
需要注意的是,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本发明一实施例针对房价受宏观政策影响大、不确定性大的特点,以克服现有技术仅预测房价值的不足为目的,提出了一种基于梯度提升回归的房价区间预测方法。
如图1所示,本实施例所提供的基于梯度提升回归的房价区间预测方法,包括以下步骤:
步骤s1:获取二手房产交易数据,所述二手房产交易数据包括二手房产交易数据特征,所述特征包括数据型特征和类别型特征;
步骤s2:分析该交易数据特征,统计并提取合理数据,利用合理数据获得数据特征的分布和/或相关性;
步骤s3:对s1中得到的特征以及s2中所得到的分析结果进行特征处理,得到新数据集;
步骤s4:建立梯度提升回归模型;,利用得到的所述新数据集训练模型,得到预测模型;所述预测模型的上分位数损失函数对应输出区间上限,下分位数损失函数对应输出区间下限;
步骤s5:利用得到的预测模型,输入待预测数据进行预测,得到房价区间。
作为一优选实施例,所述步骤s1中,利用网络爬虫技术获取二手房产交易数据,其中,所述二手房产交易数据包括如下任意一项或多项数据特征:地区、街道、小区、建筑面积、建筑年代、户型、有无电梯、楼层、梯户比例、装修情况、挂牌时间、成交时间、房屋单价以及成交价格,其中建筑面积、建筑年代、楼层、梯户比例、挂牌时间、成交时间、房屋单价以及成交价格属于数据型特征,其中地区、街道、小区、户型、有无电梯以及装修情况属于类别型特征。
作为一优选实施例,所述步骤s2中,针对所述步骤s1所得到二手房产交易数据,分析交易数据特征,包括如下步骤:
步骤s21、统计二手房产交易数据中的重复数据和缺失数据,得到合理数据;
步骤s22、对于合理数据中的单特征分析,通过条形图或直方图进行分析,得到单个特征的分布情况;对于合理数据中的多特征分析,通过散点图、条形图或直方图进行分析,得到各特征之间的相关性。
作为一优选实施例,所述步骤s3中,针对步骤s1中所得到的二手房产交易数据特征和步骤s2中所得到的分析结果,对数据特征进行如下任意一项或任意多项的处理:
-对所述缺失数据补全,包括:
使用各数据型特征的平均值填充其缺失值;
提出各类别型特征缺失值所在的一行,补充其缺失值;
-针对已有特征派生出新的特征:
合并类别型特征中的地区特征,计算该套房屋所在的经纬度,派生出新的特征;
-对已有类别型特征进行独热编码:
-对所有特征进行归一化;
-求得各特征间的相关系数,将相关系数绝对值低于设定值(例如0.1)的特征删除。
作为一优选实施例,所述步骤s4具体为:
步骤s41、设步骤s3中得到的新数据集为:d={(x1,y),(x2,y),...,(xm,y)},xi∈rd;其中,xi代表第i个特征,d代表特征个数,y代表训练数据的预测结果;
步骤s42、建立以决策树为基模型的梯度提升树,将每颗决策树作为预测的基模型,利用损失函数的负梯度在当前模型的值作为梯度提升树算法中残差的近似值,拟合一棵回归树模型,即为梯度提升回归模型,利用新数据集对梯度提升回归模型进行训练,提高模型的健壮型,得到预测模型;
其中,每棵决策树的损失函数为分位数回归损失函数,减少异常点对损失函数的影响。
进一步地,梯度提升回归模型算法步骤如下:
定义分位数回归损失函数:
其中,y-f(x)为当前拟合数据的残差,θ为待更新的模型参数。
初始化:
其中,f0表示初始化的子树,l表示分位数回归损失函数。
对于m=1,2,…,m(m为决策树的数量)
对于i=1,2,…,n,计算:
其中,rmi表示负梯度。
对rmi拟合一棵回归树,得到第m棵树的叶节点区域rmj,j=1,2,…,j。
计算每个区域rmj上的输出值:
对j=1,2,…,j计算:
其中,cmj表示每个叶子节点的损失函数的最小值。
更新:
其中,i(.)表示阶跃函数。
得到梯度提升回归模型:
作为一优选实施例,所述步骤s5,包括:
将待预测数据输入得到的预测模型,得到上分位数值和下分位数值,从而得到预测的房价区间。
本发明另一实施例提供了一种基于梯度提升回归的房价区间预测系统,包括:
数据获取模块,所述数据获取模块获取二手房产交易数据,所述二手房产交易数据包括二手房产交易数据特征,所述特征包括数据型特征和类别型特征;
数据分析模块,所述数据分析模块分析所述交易数据特征,统计并提取缺失数据;
数据处理模块,所述数据处理模块对数据获取模块中得到的特征以及数据预处理模块中得到的缺失数据进行特征处理,得到新数据集;
房价区间预测模块,所述房价区间预测模块建立梯度提升回归模型,利用得到的所述新数据集训练模型,得到预测模型;所述预测模型的上分位数损失函数对应输出区间上限,下分位数损失函数对应输出区间下限;利用得到的预测模型,输入待预测数据进行预测,得到房价区间。
作为一优选实施例,所述数据获取模块利用网络爬虫技术获取二手房产交易数据,其中,所述二手房产交易数据包括如下任意一项或多项数据特征:地区、街道、小区、建筑面积、建筑年代、户型、有无电梯、楼层、梯户比例、装修情况、挂牌时间、成交时间、房屋单价以及成交价格,其中,所述建筑面积、建筑年代、楼层、梯户比例、挂牌时间、成交时间、房屋单价以及成交价格属于数据型特征;地区、街道、小区、户型、有无电梯以及装修情况属于类别型特征。
作为一优选实施例,所述数据分析模块统计二手房产交易数据中的重复数据和缺失数据,得到合理数据;对于合理数据中的单特征分析,通过条形图或直方图进行分析,得到单个特征的分布情况;对于合理数据中的多特征分析,通过散点图、条形图或直方图进行分析,得到各特征之间的相关性。
作为一优选实施例,所述数据处理模块对数据特征进行如下任意一项或任意多项处理:
-对所述缺失数据补全,包括:
使用各数据型特征的平均值填充其缺失值;
提出各类别型特征缺失值所在的一行,补充其缺失值;
-针对已有特征派生出新的特征:
合并类别型特征中的地区特征,计算该套房屋所在的经纬度,派生出新的特征;
-对已有类别型特征进行独热编码:
-对所有特征进行归一化;
-求得各特征间的相关系数,将相关系数绝对值低于0.1的特征删除。
作为一优选实施例,所述房价区间预测模块,以决策树为基模型的梯度提升回归模型,将每颗决策树作为预测的基模型,利用损失函数的负梯度在当前模型的值作为梯度提升树算法中残差的近似值,拟合一棵回归树模型,即为梯度提升回归模型,即为利用所述数据处理模块中得到的新数据集对梯度提升回归模型进行训练,提高模型的健壮型,得到预测模型;将待预测数据输入得到的预测模型,得到上分位数值和下分位数值,从而得到预测的房价区间。
本发明第三个实施例提供了一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时可用于执行本发明上述实施例中任一项所述的方法。
可选地,存储器,用于存储程序;存储器,可以包括易失性存储器(英文:volatilememory),例如随机存取存储器(英文:random-accessmemory,缩写:ram),如静态随机存取存储器(英文:staticrandom-accessmemory,缩写:sram),双倍数据率同步动态随机存取存储器(英文:doubledataratesynchronousdynamicrandomaccessmemory,缩写:ddrsdram)等;存储器也可以包括非易失性存储器(英文:non-volatilememory),例如快闪存储器(英文:flashmemory)。存储器用于存储计算机程序(如实现上述方法的应用程序、功能模块等)、计算机指令等,上述的计算机程序、计算机指令等可以分区存储在一个或多个存储器中。并且上述的计算机程序、计算机指令、数据等可以被处理器调用。
上述的计算机程序、计算机指令等可以分区存储在一个或多个存储器中。并且上述的计算机程序、计算机指令、数据等可以被处理器调用。
处理器,用于执行存储器存储的计算机程序,以实现上述实施例涉及的方法中的各个步骤。具体可以参见前面方法实施例中的相关描述。
处理器和存储器可以是独立结构,也可以是集成在一起的集成结构。当处理器和存储器是独立结构时,存储器、处理器可以通过总线耦合连接。
本发明第四个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可用于执行本发明上述实施例中任一项所述的方法。
本发明上述实施例提供的基于梯度提升回归的房价区间预测方法及系统,通过数据获取、数据探索与预处理、特征工程、算法建模、区间预测等步骤,自主爬取房产服务平台上若干房产数据,图表探索与分析该数据特征,缺失、重复数据预处理,特征编码与派生,梯度提升回归算法建模,房价区间预测结果生成。本发明上述实施例所提供的基于梯度提升回归的房价区间预测方法及系统,针对房价受宏观政策影响大、不确定性大的特点,相较于传统的房价准确值预测,可以帮助消费者更加理性的出资,为有住房刚性需求的人们提供更加可靠的价格参照,也为政府宏观调控房价和管理房地产行业提供数据依据和决策辅助,与现有的房价区间预测方法相比,具有计算代价小、区间宽度小和区间可靠性强等优点。
需要说明的是,本发明提供的方法中的步骤,可以利用系统中对应的模块、装置、单元等予以实现,本领域技术人员可以参照系统的技术方案实现方法的步骤流程,即,系统中的实施例可理解为实现方法的优选例,在此不予赘述。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
1.一种基于梯度提升回归的房价区间预测方法,其特征在于,包括:
s1,获取二手房产交易数据,所述二手房产交易数据包括二手房产交易数据特征,所述特征包括数据型特征和类别型特征;
s2,分析所述交易数据特征,统计并提取合理数据,利用合理数据获得数据特征的分布和/或相关性;
s3,对s1中得到的特征以及s2中所得到的分析结果进行特征处理,得到新数据集;
s4,建立梯度提升回归模型,利用得到的所述新数据集训练模型,得到预测模型;所述预测模型的上分位数损失函数对应输出区间上限,下分位数损失函数对应输出区间下限;
s5,利用得到的预测模型,输入待预测数据进行预测,得到房价区间。
2.根据权利要求1所述的基于梯度提升回归的房价区间预测方法,其特征在于,所述s1中,利用网络爬虫技术获取二手房产交易数据,其中,所述二手房产交易数据包括如下任意一项或多项数据特征:地区、街道、小区、建筑面积、建筑年代、户型、有无电梯、楼层、梯户比例、装修情况、挂牌时间、成交时间、房屋单价以及成交价格,其中,所述建筑面积、建筑年代、楼层、梯户比例、挂牌时间、成交时间、房屋单价以及成交价格属于数据型特征;地区、街道、小区、户型、有无电梯以及装修情况属于类别型特征。
3.根据权利要求1所述的基于梯度提升回归的房价区间预测方法,其特征在于,所述s2中,针对所述s1得到二手房产交易数据,分析二手房产交易数据特征,包括:
s21,统计二手房产交易数据中的重复数据和缺失数据,得到合理数据;
s22,对于合理数据中的单特征分析,通过条形图或直方图进行分析,得到单个特征的分布情况;对于合理数据中的多特征分析,通过散点图、条形图或直方图进行分析,得到各特征之间的相关性。
4.根据权利要求1所述的基于梯度提升回归的房价区间预测方法,其特征在于,所述s3中,针对所述s1中得到的二手房产交易数据特征和所述s2中得到的分析结果,对数据特征进行如下任意一项或任意多项的处理:
-对所述缺失数据补全,包括:
使用各数据型特征的平均值填充其缺失值;
提出各类别型特征缺失值所在的一行,补充其缺失值;
-针对已有特征派生出新的特征:
合并类别型特征中的地区特征,计算该套房屋所在的经纬度,派生出新的特征;
-对已有类别型特征进行独热编码:
-对所有特征进行归一化;
-求得各特征间的相关系数,将相关系数绝对值低于设定值的特征删除。
5.根据权利要求1所述的基于梯度提升回归的房价区间预测方法,其特征在于,所述s4,包括:
s41,设s3中得到的新数据集为:d={(x1,y),(x2,y),...,(xm,y)},xi∈rd;其中,xi代表第i个特征,d代表特征个数,y代表训练数据的预测结果;
s42,建立以决策树为基模型的梯度提升树,将每颗决策树作为预测的基模型,利用损失函数的负梯度在当前模型的值作为梯度提升树算法中残差的近似值,拟合一棵回归树模型,即为梯度提升回归模型,利用新数据集对梯度提升回归模型进行训练,提高模型的健壮型,得到预测模型;
其中,每棵决策树的损失函数为分位数回归损失函数,减少异常点对损失函数的影响。
6.根据权利要求1所述的基于梯度提升回归的房价区间预测方法,其特征在于,所述s5,包括:
将待预测数据输入得到的预测模型,得到上分位数值和下分位数值,从而得到预测的房价区间。
7.一种基于梯度提升回归的房价区间预测系统,其特征在于,包括:
数据获取模块,所述数据获取模块获取二手房产交易数据,所述二手房产交易数据包括二手房产交易数据特征,所述特征包括数据型特征和类别型特征;
数据分析模块,所述数据分析模块分析所述交易数据特征,统计并提取缺失数据;
数据处理模块,所述数据处理模块对数据获取模块中得到的特征以及数据预处理模块中得到的缺失数据进行特征处理,得到新数据集;
房价区间预测模块,所述房价区间预测模块建立梯度提升回归模型,利用得到的所述新数据集训练模型,得到预测模型;所述预测模型的上分位数损失函数对应输出区间上限,下分位数损失函数对应输出区间下限;利用得到的预测模型,输入待预测数据进行预测,得到房价区间。
8.根据权利要求7所述的基于梯度提升回归的房价区间预测系统,其特征在于,所述数据获取模块利用网络爬虫技术获取二手房产交易数据,其中,所述二手房产交易数据包括如下任意一项或多项数据特征:地区、街道、小区、建筑面积、建筑年代、户型、有无电梯、楼层、梯户比例、装修情况、挂牌时间、成交时间、房屋单价以及成交价格,其中,所述建筑面积、建筑年代、楼层、梯户比例、挂牌时间、成交时间、房屋单价以及成交价格属于数据型特征;地区、街道、小区、户型、有无电梯以及装修情况属于类别型特征。
9.根据权利要求7所述的一种基于梯度提升回归的房价区间预测系统,其特征在于,所述数据分析模块统计二手房产交易数据中的重复数据和缺失数据,得到合理数据;对于合理数据中的单特征分析,通过条形图或直方图进行分析,得到单个特征的分布情况;对于合理数据中的多特征分析,通过散点图、条形图或直方图进行分析,得到各特征之间的相关性;和/或
所述数据处理模块对数据特征进行如下任意一项或任意多项处理:
-对所述缺失数据补全,包括:
使用各数据型特征的平均值填充其缺失值;
提出各类别型特征缺失值所在的一行,补充其缺失值;
-针对已有特征派生出新的特征:
合并类别型特征中的地区特征,计算该套房屋所在的经纬度,派生出新的特征;
-对已有类别型特征进行独热编码:
-对所有特征进行归一化;
-求得各特征间的相关系数,将相关系数绝对值低于0.1的特征删除。
10.根据权利要求7所述的一种基于梯度提升回归的房价区间预测系统,其特征在于,所述房价区间预测模块,以决策树为基模型的梯度提升回归模型,将每颗决策树作为预测的基模型,利用损失函数的负梯度在当前模型的值作为梯度提升树算法中残差的近似值,拟合一棵回归树模型,即为梯度提升回归模型,利用所述数据处理模块中得到的新数据集对梯度提升回归模型进行训练,提高模型的健壮型,得到预测模型;将待预测数据输入得到的预测模型,得到上分位数值和下分位数值,从而得到预测的房价区间。
11.一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时可用于执行权利要求1-6中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时可用于执行权利要求1-6中任一项所述的方法。
技术总结