本说明书实施例涉及计算机技术领域,具体地,涉及一种构建模型的方法及装置。
背景技术:
通过建立模型来评估样本的风险或评价样本的好坏是很多数据分析人员的日常工作。其中建立模型需要通过建模工具实现,然而现有的建模工具通常过于专业,使得数据分析人员需要花费大量的时间、精力去学习相关的背景知识,同时,不能发挥数据分析人员在业务方面的优势。
因此,迫切需要一种改进的建模方案,可以让数据分析人员能将精力集中在业务分析上,以较低的学习成本让数据分析人员可以根据自己的需求建立、修改模型,以满足自己日常工作的建模需求。
技术实现要素:
本说明书描述了一种构建模型的方法及装置,可以使数据分析人员以极低的学习成本快速上手,同时,在整个建模过程中,数据分析人员不需要了解业务以外的额外知识,可以将全部精力集中在业务分析上,充分发挥其在业务经验上的优势,根据自己的需求建立、修改模型,以满足自己日常工作的建模需求。
根据第一方面,提供一种构建模型的方法,该方法包括:接收用户基于交互界面输入的用于构建第一模型的限定数据,所述第一模型用于对多个样本中的每个样本进行打分,所述接收用于构建第一模型的限定数据,至少包括:接收输入的至少一个预设条件,其中每个预设条件为要求所述第一模型对所述多个样本中的至少一个样本进行打分的分数结果满足的条件;获取从多个样本特征中选取的至少一个样本特征,用于作为所述第一模型的输入特征;构建第一模型。
根据第二方面,提供一种构建模型的装置,该装置包括:接收单元,配置为接收用户基于交互界面输入的用于构建第一模型的限定数据,所述第一模型用于对多个样本中的每个样本进行打分,所述接收单元,至少包括:第一接收模块,配置为接收输入的至少一个预设条件,其中每个预设条件为要求所述第一模型对所述多个样本中的至少一个样本进行打分的分数结果满足的条件;第二接收模块,配置为获取从多个样本特征中选取的至少一个样本特征,用于作为所述第一模型的输入特征。构建单元,配置为构建第一模型。
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
采用本说明书实施例提供的构建模型的方法及装置,可以使数据分析人员以极低的学习成本快速上手,同时,在整个建模过程中,数据分析人员不需要了解业务以外的额外知识,可以将全部精力集中在业务分析上,充分发挥其在业务经验上的优势,根据自己的需求建立、修改模型,以满足自己日常工作的建模需求。
附图说明
为了更清楚地说明本说明书披露的多个实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书披露的多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出根据一个实施例的构建模型的方法流程图;
图2a为本说明书实施例披露的交互界面的示意图之一;
图2b为本说明书实施例披露的交互界面的示意图之二;
图2c为本说明书实施例披露的交互界面的示意图之三;
图3a为本说明书实施例披露的交互界面的示意图之四;
图3b为本说明书实施例披露的交互界面的示意图之五;
图4a为本说明书实施例披露的交互界面的示意图之六;
图4b为本说明书实施例披露的交互界面的示意图之七;
图5a为本说明书实施例披露的交互界面的示意图之八;
图5b为本说明书实施例披露的交互界面的示意图之九;
图6a为本说明书实施例披露的交互界面的示意图之十;
图6b为本说明书实施例披露的交互界面的示意图之十一;
图6c为本说明书实施例披露的交互界面的示意图之十二;
图7为本说明书实施例披露的交互界面的示意图之十三;
图8为本说明书实施例披露的交互界面的示意图之十四;
图9为本说明书实施例披露的交互界面的示意图之十五;
图10为本说明书实施例披露的交互界面的示意图之十六;
图11为本说明书实施例披露的交互界面的示意图之十七;
图12为本说明书实施例披露的交互界面的示意图之十八;
图13为本说明书实施例披露的交互界面的示意图之十九;
图14为本说明书实施例披露的交互界面的示意图之二十;
图15为本说明书实施例披露的交互界面的示意图之二十一;
图16示出根据一个实施例的构建模型的装置结构图。
具体实施方式
下面结合附图,对本说明书披露的多个实施例进行描述。
如前所述,目前供数据分析人员,如股票交易员等使用的建模工具过于专业,导致数据分析人员的学习成本过高,且无法发挥自身在业务方面的优势。基于此,本说明书实施例提供一种构建模型的方法,可以使数据分析人员以极低的学习成本快速上手,同时,在整个建模过程中,数据分析人员不需要了解业务以外的额外知识,可以将全部精力集中在业务分析,如股票分析等上,充分发挥其在业务经验上的优势,根据自己的需求建立、修改模型,以满足自己日常工作的建模需求。下面,结合具体的实施例,描述所述方法的实施步骤。
具体地,图1示出根据一个实施例的构建模型的方法流程图。所述方法的执行主体可以为具有处理能力的设备:系统或者装置或者处理平台,例如,客户端等。如图1所示,该方法流程包括以下步骤:步骤s110,接收用户基于交互界面发出的针对第一样本集的选取指令,所述第一样本集中包括多个样本。步骤s120,展示所述多个样本中每个样本所对应的样本数据,所述样本数据包括所述每个样本对应于多个样本特征中各个样本特征的特征值。步骤s130,接收用户输入的用于构建第一模型的限定数据,所述第一模型用于对所述每个样本进行打分,且步骤s130至少包括:步骤s131,接收输入的至少一个预设条件,其中每个预设条件要求所述第一模型对所述多个样本中的至少一个样本进行打分的分数结果满足的条件;步骤s132,获取从多个样本特征中选取的至少一个样本特征,用于作为所述第一模型的输入特征。步骤s140,构建所述第一模型。
需要说明的是,通过以上步骤s110和步骤s120可以实现对目标样本数据的查看、预览。通过步骤s130可以实现数据分析人员对模型限定数据至少包括预设条件和模型输入特征的设定的输入,数据分析人员只需根据掌握的样本信息,发挥自身业务经验、业务分析能力的优势,即可完成对限定数据的设定。通过步骤s140可以基于限定数据构建第一模型,其中包括模型输入特征和对应的模型参数。此外,步骤s110和步骤s120是可选的,用户可以通过其他途径(如excel表格或纸质文件等)查看样本数据。
以上步骤具体如下:
首先,在步骤s110,接收用户基于交互界面发出的针对第一样本集的选取指令,所述第一样本集中包括多个样本。并且,在步骤s120,展示所述多个样本中每个样本所对应的样本数据,所述样本数据包括所述每个样本对应于多个样本特征中各个样本特征的特征值。
通过步骤s110和步骤s120可以实现对第一样本集的选取以及其所对应的样本数据的预览。
在一个实施例中,第一样本集所涉及的领域可以为多种,例如,股票评估、员工业绩考核、食物营养价值分析等。在一个具体的实施例中,第一样本集属于股票评估领域,其中每个样本对应的多个样本特征或者说多个评估指标,可以包括每股收益、营业收入、净利润、每股现金流量、毛利率等。在另一个具体的实施例中,第一样本集与员工业务考核相关,其中每个样本对应的多个样本特征或者说多个考核指标,可以包括出勤率、工作量等。
在一个实施例中,可以在交互界面(如建模工具的客户端界面)中设计包括多个备选样本集的样本集下拉框,供用户(包括数据分析人员)从中选取第一样本集。具体地,步骤s110可以包括:接收用户基于所述样本集下拉框发出的针对第一样本集的选取指令。在另一个实施例中,可以在交互界面中设计用于输入样本集名称的输入框。
在一个实施例中,步骤s120可以包括:以列表的形式展示第一样本集中多个样本中每个样本所对应的样本数据。
在一个例子中,可以通过图2a中示出的样本集下拉框210,选取表名为stock的样本集,基于由此发出的选取指令,以列表的形式展示相关样本数据,如图2a所示,其中样本名称或者说股票名称为科技1号的股票对应于样本特征每股收益的特征值为0.010929元。如此,可以展示第一样本集的样本数据。
进一步地,一方面,在一个实施例中,在步骤s120之后,还可以包括:响应于针对所述样本数据的收起指令,对所述样本数据进行折叠显示。在一个例子中,如图2b所示,可以通过点击收起列表详情图标220发出收起指令。进一步地,还可以通过点击展开列表详情图标230发出展开指令,以查看样本数据。
另一方面,在一个实施例中,在步骤s120之后,还可以包括:将多个样本的样本数据更新展示为归一化处理后的数据。具体地,其中归一化处理是指对每个样本特征对应的多个特征值进行归一化处理。在一个具体的实施例中,所述交互界面中包括归一化处理图标和对应的选项框。基于此,响应于对所述选项框的确认选择指令,利用对所述各个样本特征对应多个样本的多个特征值进行归一化处理而得到的数据,对所述样本数据进行更新展示。在一个例子中,如图2c所示,基于对选项框240的触发,展示更新后的样本数据,其中对应于各个样本特征的特征值列,均更新为对应的归一化处理后的特征值列,比如说,其中“每股收益(元)”列对应的多个特征值的和值为1。
以上,基于步骤s110和步骤s120可以实现对第一样本集的选取和预览。接着,在步骤s130,接收用户输入的用于构建第一模型的限定数据,所述第一模型用于对所述每个样本进行打分。
具体地,步骤s130至少包括步骤s131和步骤s132。在步骤s131中,接收用户输入的至少一个预设条件。在一个实施例中,输入的预设条件的数量可以为一个或多个,其中预设条件可以由数据分析人员根据掌握的样本信息进行设定,每个预设条件为要求第一模型对多个样本中的至少一个样本进行打分的分数结果满足的条件。在一个具体的实施例中,其中样本信息可以包括上述展示的样本数据,还可以包括与样本相关的其他信息。在一个例子中,样本信息可以包括图2a中示出的股票的指标数据,还可以包括与股票相关的行业数据,或者其中部分股票的历史走向曲线等更加具体、详尽的数据。如此,数据分析人员可以根据样本信息进行业务分析,结合自身经验设定出预设条件。
在一个具体的实施例中,设定的至少一个预设条件中可以包括条件类型为最终得分类的第一预设条件,所述第一预设条件包括多个样本中的至少一个样本,第一运算符和预设分值,所述第一运算符为大于、小于和等于中的一种,所述第一预设条件用于限定利用所述第一模型对所述至少一个样本中的各个样本进行打分得到的分数与所述预设分值之间的相对大小。在一个例子中,第一预设条件中包括的至少一个样本为图2a中示出的教育1号至教育4号共4支股票,第一运算符为大于(>),预定分值为80分。
进一步地,可以在交互界面中设计条件类型下拉框和与最终得分类对应的条件模板,以供用户可以方便、快捷地输入预设条件。在一个例子中,交互界面中的条件类型下拉框中包括多种备选类型,其中包括上述最终得分类。基于此,接收输入的第一预设条件可以包括:首先,接收基于所述条件类型下拉框发出的针对所述最终得分类的选取指令;接着,展示与所述最终得分类对应的第一条件模版,所述第一条件模版中包括样本下拉框、运算符下拉框和运算值输入框,所述样本下拉框中包括所述多个样本,用于引导用户从中选取所述至少一个样本,所述运算符下拉框中包括多个备选运算符,用于引导用户从中选取所述第一运算符,所述运算值输入框用于引导用户输入所述预设分值;然后,接收用户基于所述第一条件模版输入的第一预定条件,归入所述至少一个预设条件。在一个具体的例子中,如图3a所示,首先,接收对条件类型下拉框310中的最终得分类的选取指令;接着,展示对应的第一条件模板320;然后,接收用户基于第一条件模板320输入的第一预定条件,其中,第一预定条件为科技1号和科技2号的最终模型分数大于60分。
进一步地,第一预设条件中还包括用于表示该条件重要程度的权重,所述第一条件模版中还包括权重输入框和/或权重拖动条,用于引导用户输入所述权重。在一个例子中,如图3b所示,用户可以通过权重拖动条330设定第一预设条件的权重。如此,可以接收用户设定的第一预设条件。
在另一个具体的实施例中,设定的至少一个预设条件中可以包括条件类型为相对排名类的第二预设条件,所述第二预设条件包括第一样本子集、第二样本子集和第二运算符,所述第一样本子集和第二样本子集中的样本共同组成所述至少一个样本,所述第二运算符为大于、小于和等于中的一种,所述第二预设条件用于限定利用所述第一模型对所述第一样本子集中的各个样本进行打分得到的分数与对所述第二样本子集中各个样本进行打分得到的分数之间的相对大小。在一个例子中,第一样本子集中的样本包括图2a中示出的娱乐1号和娱乐2号,第二样本子集中的样本包括图2a示出的教育1号,第二运算符为小于(<),由此组成的第二预设条件表示娱乐1号和娱乐2号的得分分数小于教育1号的得分分数。
进一步地,可以在交互界面中设计条件类型下拉框和与相对排名类对应的条件模板。在一个例子中,交互界面中的条件类型下拉框中包括多种备选类型,其中包括上述相对排名类。基于此,接收输入的第二预设条件可以包括:首先,接收基于所述条件类型下拉框发出的针对所述相对排名类的选取指令;接着,展示与所述相对排名类对应的第二条件模版,所述第二条件模版中包括第一样本下拉框、第二样本下拉框和运算符下拉框,所述第一样本下拉框包括所述多个样本,用于引导用户从中选取样本构成所述第一样本子集,所述第二样本下拉框包括所述多个样本,用于引导用户从中选取样本构成所述第二样本子集,所述运算符下拉框中包括多个备选运算符,用于引导用户从中选取所述第二运算符;然后,接收用户基于所述第二条件模版输入的所述第二预定条件,归入所述至少一个预设条件。在一个具体的例子中,如图4a所示,首先,接收对条件类型下拉框410中的相对排名类的选取指令;接着,展示对应的第二条件模板420;然后,接收用户基于第二条件模板420输入的第二预定条件,其中第二预定条件为娱乐1号和娱乐2号的得分分数小于教育1号的得分分数。
进一步地,第二预设条件中还包括用于表示该条件重要程度的权重,所述第二条件模版中还包括权重输入框和/或权重拖动条,用于引导用户输入所述权重。在一个例子中,如图4b所示,用户可以通过权重拖动条430设定第二预设条件的权重。如此,可以接收用户设定的第二预设条件。
此外,在一个例子中,上述至少一个预设条件中的各个预设条件中可以均包括对应的权重,用于指导第一模型的构建。比如说,至少一个预设条件中包括第一预设条件和第二预设条件,在构建第一模型的过程中,若无法同时满足这两个预设条件,则可以优先满足其中权重更大的预设条件。
另一方面,在一个实施例中,预设条件中可以包括系统开发人员预置的默认条件。例如,样本分数的有效范围,如-10^8至10^8。
以上在步骤s131中可以接收用户输入的至少一个预设条件。接着在步骤s132,获取从多个样本特征中选取的至少一个样本特征,用于作为所述第一模型的输入特征。
在一个实施例中,在交互界面中设计与多个样本特征对应的多个特征图标以及与其中各个特征图标对应的筛选框。如此,用户可以通过筛选框进行对样本特征的确认选择和取消选择。具体地,步骤s132可以包括:接收对所述至少一个样本特征对应的至少一个筛选框的确认选择指令。在一个例子中,图5a中示出多个特征图标对应的多个筛选框,可以通过对其中部分筛选框进行点选,以选择对应的部分样本特征,包括每股收益(元)、营业收入(万元)、营业收入_同比(%)等。
此外,在一个实施例中,为了辅助用户进行样本特征的选取,交互界面中还可以设计针对样本特征推荐度的获取图标。基于此,在步骤s131之后和步骤s132之后,还可以包括:接收对所述获取图标的触发指令;展示对所述多个样本特征中各个样本特征的推荐度,用于辅助用户选取所述至少一个样本特征。进一步地,在一个具体的实施例中,其中触发指令可以为点击指令或声控指令等。另一方面,关于其中推荐度的确定,举例说明,假定上述接收的预定条件中包括样本1的得分大于样本2的得分,以及,样本3的得分大于样本4的得分,上述多个样本特征中包括特征a和特征b。此时,如果对于特征a,样本1的特征值大于样本2的特征值,且样本3的特征值大于样本4的特征值,特征a的特征推荐度可以确定为100%。同时,如果对于特征b,样本1的特征值小于样本2的特征值,且样本3的特征值大于样本4的特征值,特征a的特征推荐度可以确定为50%。
在一个例子中,如图5b所示,响应于对获取图标510的触发指令,展示多个样本特征对应的多个特征推荐度,例如,其中样本特征每股收益的推荐度为100%。
以上,通过步骤s131和步骤s132,可以接收限定数据中的至少一个预设条件和作为模型输入特征的至少一个样本特征。
此外,在一个实施例中,第一模型的模型类型为线性模型,相应地,第一模型中包括与至少一个样本特征对应的至少一个模型参数。基于此,接收的限定数据还可以包括针对所述至少一个样本特征的至少一个参数值区间。具体地,在步骤s130中,还可以包括:接收针对所述至少一个样本特征设定的至少一个参数值区间,所述至少一个参数值区间用于限定所述至少一个模型参数的取值范围。
进一步地,在一个具体的实施例中,交互界面中设计有用于对所述多个样本特征的多个参数值区间的上限和下限分别进行统一设定的多个调整图标,其中包括上限统一增加图标、上限统一减少图标、下限统一增加图标和下限统一减少图标。基于此,接收上述设定的至少一个参数值区间可以包括:响应于对所述多个调整图标中任意的第一调整图标的触发指令,统一对所述多个参数值区间进行与所述第一调整图标对应的调整。其中多个参数值区间包括所述至少一个参数值区间,显然可以实现对其中至少一个参数值区间的调整。另外,对图标的每次触发,可以按照预定的间隔值进行调整。在一个例子中,如图6a示出,交互界面中包括下限统一增加图标611、下限统一减少图标612、上限统一增加图标621和上限统一减少图标622,进一步地,响应于对其中下限统一增加图标611的点击指令,多个参数值区间的下限均按照预定的间隔值5从-10变为-5。如此,可以完成对至少一个参数值区间的设定。
在另一个实施例中,接收的限定数据还可以包括针对所述至少一个样本特征中的一部分设定的模型参数。具体地,至少一个样本特征中包括第一样本特征,所述至少一个模型参数中包括与所述第一样本特征对应的第一模型参数,基于此,在步骤s130中还可以包括:接收针对所述第一样本特征设定的所述第一模型参数。
进一步地,在一个具体的实施例中,交互界面中设计有与多个样本特征对应的多个参数值输入框和/或多个参数值拖动条,其中包括与所述第一样本特征对应的第一参数值输入框和/或第一参数值拖动条。基于此,接收上述第一模型参数可以包括:接收基于所述第一参数值输入框和/或第一参数值拖动条设定的第一模型参数。在一个例子中,图6b示出的交互界面中包括多个参数值输入框和多个参数值拖动条,具体包括与样本特征每股收益对应的参数值输入框630和参数值拖动条640。
在一个更具体地实施例中,为了防止上述第一参数值被误编辑,还可以对其进行锁定。具体地,交互界面中还包括与多个参数值输入框对应的多个锁定图标,其中包括与所述第一参数值输入框对应的第一锁定图标,所述第一锁定图标呈解锁状态;在所述接收基于所述第一参数值输入框设定的第一模型参数之后,所述方法还包括:接收对所述第一锁定图标的触发指令;将呈解锁状态的第一锁定图标更新展示为锁定状态,并且,将显示有所述第一模型参数的第一参数值输入框展示为不可编辑状态。在一个例子中,图6c示出的交互界面中包括呈解锁状态的第一锁定图标650,响应于对其的点击指令,更新展示为呈锁定状态。可以理解的是,再次点击即可解锁。如此,可以实现对第一模型参数的锁定。
在又一个实施例中,上述接收的限定数据中还可以包括模型类型,如线性模型或非线性模型。在一个例子中,如图7所示,交互界面中包括与线性模型图标对应的筛选框710和与非线性模型图标对应的筛选框720,通过对筛选框720进行点选,可以触发筛选框710的取消选择和对筛选框720的确认选择,由此将模型类型设定为非线性模型。需要说明的是,模型类型可以不需要用户进行选择,而是后台自动实现对模型类型的筛选。
由上,在步骤s130中可以接收用户输入的用于构建第一模型的限定数据。其中限定数据可以包括至少一个预定条件和用于作为模型输入特征的至少一个样本特征,还可以包括设定的模型类型、针对至少一个样本特征设定的至少一个参数值区间,针对至少一个样本特征中部分样本特征设定的模型参数。
接着,在步骤s140,构建第一模型。
在一个实施例中,可以在接收用户输入限定数据后,自动触发对第一模型的构建。在另一个实施例中,可以响应于对第一模型的构建指令,构建第一模型。在又一个实施例中,可以响应于对第一模型的展示指令,构建第一模型,以用于展示。
需要理解的是,模型中包括输入特征和模型参数。相应地,构建第一模型,包括确定第一模型的输入特征和模型参数。在一个实施例中,可以将前述步骤s132中获取的至少一个样本特征,作为第一模型的输入特征。进一步地,可以利用二次规划法,基于限定的数据,确定模型参数。需要说明的是,其中二次规划(quadraticprogramming)法,是非线性规划中的一类特殊数学规划问题,用于求出最优解,在很多方面都有应用,如约束最小二乘问题的求解、序列二次规划在非线性优化问题中应用等。当二次规划问题只有等式约束时,二次规划可以用线性方程求解。否则的话,常用的二次规划解法有:内点法(interiorpoint)、activeset和共轭梯度法等。
在一个具体的实施例中,假定获取的限定数据包括:设定的模型类型为线性模型;选取的2个样本特征,此处用x1和x2指代;预设条件为样本a的分数大于80,样本b的分数等于60,样本c的分数大于样本d的分数,此处分别用以下式子进行表示:ya>80,yb=60、yc>yd;针对2个样本特征所对应的模型参数分别设定的取值范围为
基于此,为了求解最优的模型参数组合,可以构建以下约束条件:
在公式(1)中,
以上,可以实现基于获取的限定数据,构建第一模型。
需要说明的是,在一个实施例中,在步骤s140之后,还可以包括:接收针对第一模型的展示指令,展示所构建的第一模型,所述第一模型包括所述至少一个样本特征和模型参数。
在一个具体的实施例中,其中展示指令可以为点击指令或声控指令等。
在一个例子中,响应于对图8示出的交互界面中的运行图标810的点击指令,展示第一模型820,第一模型820为线性模型,其中包括至少一个样本特征:每股收益(元)、营业收入(万元)、净利润(万元)、净利润_同比(%)、净资产收益(%)、毛利率(%)、营业收入_同比(%),以及对应的至少一个模型参数:5.72、5.07、4.26、-6.03、、2.72、0.96、-0.27。如此,可以实现对第一模型的展示。
此外,在一个实施例中,如前所述,交互界面中可以包括与多个样本特征对应的多个参数值输入框,其中包括与至少一个样本特征对应的至少一个参数值输入框。基于此,在步骤s140之后,还可以包括:在所述至少一个参数值输入框中展示所述至少一个模型参数。可以理解的是,多个参数值输入框中除所述至少一个参数值输入框以外的其他输入框可以显示数值,也可以显示为0。在一个例子中,图9中示出的交互界面中包括多个参数值输入框,其中对应展示多个模型参数,如在参数值输入框910中展示每股收益(元)对应的模型参数5.72。
进一步地,上述至少一个参数值输入框包括第一参数值输入框,所述至少一个模型参数中包括第一模型参数。由此,接收用户在所述第一参数值输入框中对所述第一模型参数进行的修改;再次响应于针对所述第一模型的展示指令,展示基于所述修改后的第一模型参数重新构建的第一模型。在一个具体的实施例中,如前所述,交互界面中还可以包括与多个参数值输入框对应的多个锁定图标,其中,锁定图标还可以用户锁定对应的参数值输入框中用户设定的模型参数,以使在后续重新构建第一模型时,被锁定的模型参数始终不变。反之,用户在参数值输入框中修改对应的模型参数,但未通过锁定图标对其进行锁定的情况下,后续构建模型时不会直接以其中的设定值作为模型参数,也就是不会将此设定值作为限定数据用于构建第一模型,因此,对应参数值输入框中的模型参数会随着第一模型的重新构建而变化展示。在一个例子中,如图10所示,将第一参数值输入框1010中的第一模型参数由0.96修改为5,然后触发锁定图标1020以对其进行锁定。再次点击运行图标可以得到重新构建的第一模型,如样本特征每股收益(元)的模型参数由5.72变为6.23,而第一模型参数锁定为5。如此,可以实现在参数值输入框中展示模型参数,以便于用户对模型参数进行进一步修改,如修改取值区间,或者结合锁定图标进行参数值设定。
另一方面,如前所述,第一模型用于对多个样本中的每个样本进行打分。在一个实施例中,在步骤s140之后,还可以包括:展示利用第一模型对多个样本进行打分得到的多个原始分数。在一个例子中,图11示出多个样本的分数。进一步地,本说明书实施例提供的交互方案,还可以支持对原始分数整体分布区间的调整。为了便于理解,先举例说明,比如多个原始分数的原始区间为[-2.36,108.5],若用户希望分数可以在[0,100]以内,相应可以基于[0,100]对多个原始分数同一进行调整,使其分布在[0,100],更具体地,可以通过先将多个原始分数统一增加2.36分(偏移值),然后再统一乘以0.902(增益系数),即可将多个原始分数统一调整为[0,100]内的分数。
具体地,在步骤s140之后,还可以包括:展示所述多个原始分数所对应的原始区间。在一个具体的实施例中,同时还可以展示多个原始分数的原始均值和原始方差。进一步地,在展示所述原始区间之后,还可以接收用户基于所述原始区间设定的调整后区间;再利用基于所述调整后区间对所述多个原始分数进行调整后得到的多个调整后分数对所述多个原始分数进行替换展示。在一个具体的实施例中,利用所述多个调整后分数对应的调整后均值和调整后方差分别对所述原始均值和原始方差进行替换展示。
在一个例子中,如图12所示,多个原始分数对应的原始区间为[-3.649,10.064],原始均值和原始方差分别为1.353,1.889。接收用户设定的调整后区间[0,100],之后响应于对应用图标1210的触发指令,利用多个调整后分数、调整后均值和调整后方差对多个原始分数、原始均值和原始方差进行替换展示,并且,展示增益值7.293和偏移值3.649。如此,可以完成对原始分数的调整。
又一方面,还可以通过更加丰富的图表形式,对多个样本对应的多个分数进行展示。其中的多个分数可以为上述多个原始分数,也可以为上述多个调整后分数。具体地,可以在交互界面中以直方图和/或雷达图的形式展示多个分数,在一个实施例中,交互界面中可以包括直方图图标,在步骤s140之后,还可以包括:响应于对所述直方图图标的触发指令,展示基于所述多个分数绘制的直方图;其中,所述直方图中包括至少一个直方条,其中各个直方条相对横坐标的数值区间表示对应的分数区间,且相对纵坐标的数值表示对应的样本个数。在一个例子中,如图13所示,响应于对直方图图标1310的点击指令,展示基于多个分数绘制的直方图,其中直方条1320对应的分数区间和样本个数分别为[25,30]和32。
进一步地,还可以对直方图的横坐标和/或纵坐标代表的数值区间进行调整。在一个具体的实施例中,直方图中包括多个参照网格,其中各个参照网格相对于横坐标的间隔对应第一间隔分数;在所述展示基于所述多个分数绘制的直方图之后,所述方法还包括:接收用户对所述第一间隔分数进行调整得到的第二间隔分数;利用所述第二间隔分数对所述直方图进行更新展示。在一个例子中,如图13所示,交互界面中包括针对步长(相对于横坐标的间隔分数)的步长值输入框1310,其中显示第一间隔分数为5,基于此,可以接收调整后的第二间隔分数10,并且,利用第二间隔分数更新直方图。
在另一个实施例中,可以以雷达图的形式展示多个样本中部分样本的样本分数。具体地,交互界面中包括雷达图图标,在步骤s140之后,还可以包括,所述方法还可以包括:响应于对雷达图图标的触发指令,展示多个样本特征所对应的多个特征图标和多个筛选框,以及基于所述多个样本特征中已被选取的样本特征绘制的雷达图。其中,所述多个特征图标基于多个模型参数(可以理解的是,除上述至少一个模型参数以外的模型参数,均为0)的绝对值的由大到小而顺序排列,所述多个特征图标中包括被选取的第一数量的特征图标,所述第一数量的特征图标所对应的第一数量的筛选框呈选取状态;展示基于所述第一数量的特征图标绘制的雷达图,所述雷达图包括第一数量的放射轴。在一个具体的实施例中,可以限定雷达图至多包括预定数量的放射轴,如5或6等。在一个例子中,如图14所示,响应于对雷达图图标1410的点击指令,展示对应的雷达图,其中包括5个放射轴,分别对应样本特征每股收益(元)、营业收入(万元)、净利润(万元)、净利润_同比(%)、净资产收益率。
进一步地,还需要选择将多个样本中的哪些样本的分数展示在雷达图上。具体地,可以接收用户从多个样本中选取的第二数量的样本;再在所述雷达图中显示所述第二数量的样本所对应的第二数量的封闭曲线。在一个具体的实施例中,为了便于用户选取第二数量的样本,可以先将多个样本基于多个分数的大小而顺序排列。在一个具体的实施例中,所述第一数量的放射轴中包括对应于第一样本特征的第一放射轴,所述第二数量的封闭曲线包括对应于第一样本的第一封闭曲线,所述第一封闭曲线在所述第一放射轴上的取值由所述第一样本特征的权重值与所述第一样本对应于所述第一样本特征的特征值之间的乘积而确定。如图14所示,接收用户选取的第二数量的样本,样本名称分别为科技1号,教育1号和科技2号,其中,股票科技2号在样本特征对应上述5个放射轴的坐标值分别为6.0、2.779、3.213、1.251和1.700。如此,可以实现以雷达图的形式展示样本分数。
再一方面,如前所述,第一模型基于用户输入的限定数据而构建,且限定数据中包括至少一个预设条件。而实际构建的第一模型,通常并非能够完全的满足所有的预设条件。由此,可以在交互界面中向用户展示第一模型针对预设条件中各个条件的满足度或符合度,或者能够反映满足度或符合度的信息。进一步地,某些预设条件中运算符对应的两方运算内容中的任一方,可能不只一个样本,因此,还可以将此种预设条件拆分为不可再分的预设子条件,分别展示第一模型针对各个预设子条件的满足度。
具体地,在一个实施例中,交互界面中还包括预设条件验证图标,在上述步骤s140之后,所述方法还可以包括:响应于对所述预设条件验证图标的触发指令,展示与所述至少一个预设条件对应的至少一个条件差值,其中各个条件差值反映所述第一模型针对所述各个条件差值所对应的预设条件的符合度。为便于理解,先举例说明条件差值的确定,比如说,某预设条件为:样本a的分数大于5,利用第一模型得到的打分结果为:样本a为10分或15分,此时可以认为打分结果满足该预设条件,则条件差值为0。又比如说,某预设条件为样本b的分数大于样本c的分数,利用第一模型得到的打分结果为:样本b为5分,样本c的分数为5.6,此时可以认为打分结果不满足该预设条件,且将条件差值设定为两个分数之间的差值0.6。或者,确定出所有不满足预设条件的情况所对应的分数差值,再进行归一化处理,将归一化处理得到的数值作为条件差值。由此,条件差值为非负,具体地,当条件差值为0时,说明满足度为100%,也就时完全满足该预设条件,同时,条件差值越大,则说明利用第一模型得到的打分结果越不满足该预设条件。在一个例子中,如图15所示,响应于对预设条件验证图标1510的点击指令,展示与多个预设条件对应的多个条件差值。其中多个预设条件按照其重要度进行顺序排列,预设条件(教育3号>娱乐1号)的条件差值为0,表明第一模型的打分结果满足该预设条件。
如此,可以实现在交互界面中向用户展示第一模型针对预设条件中各个条件的满足或符合情况。
综上,采用本说明书实施例披露的构建模型的方法,可以使数据分析人员以极低的学习成本快速上手,同时,在整个建模过程中,数据分析人员不需要了解业务以外的额外知识,可以将全部精力集中在业务分析上,充分发挥其在业务经验上的优势,根据自己的需求建立、修改模型,以满足自己日常工作的建模需求。
根据另一方面的实施例,还提供一种构建模型的装置。具体地,图16示出根据一个实施例的构建模型的装置。如图16所示,所述装置1600包括:第一接收单元1610,配置为接收用户基于交互界面发出的针对第一样本集的选取指令,所述第一样本集中包括多个样本。第一展示单元1620,配置为展示所述多个样本中每个样本所对应的样本数据,所述样本数据包括所述每个样本对应于多个样本特征中各个样本特征的特征值。第二接收单元1630,配置为接收用户输入的用于构建第一模型的限定数据,所述第一模型用于对所述每个样本进行打分,所述第二接收单元,至少包括:第一接收模块1631,配置为接收输入的至少一个预设条件,其中每个预设条件为要求所述第一模型对所述多个样本中的至少一个样本进行打分的分数结果满足的条件;第二接收模块1632,配置为获取从所述多个样本特征中选取的至少一个样本特征,用于作为所述第一模型的输入特征。构建单元1640,配置为构建所述第一模型。
需要说明的是,与前述方法中的描述相对应的,在所述装置1600中,第一接收单元1610和第一展示单元1620是可选的。
在一个实施例中,所述交互界面中包括样本集下拉框,所述样本集下拉框中包括多个备选样本集,所述多个备选样本集中包括所述第一样本集;所述第一接收单元1610具体用于:接收用户基于所述样本集下拉框发出的针对第一样本集的选取指令。
在一个实施例中,所述装置还包括:折叠展示单元,配置为响应于针对所述样本数据的收起指令,对所述样本数据进行折叠显示。
在一个实施例中,所述交互界面中包括归一化处理图标和对应的选项框,所述装置还包括:样本数据更新展示单元,配置为响应于对所述选项框的确认选择指令,利用对所述各个样本特征对应多个样本的多个特征值进行归一化处理而得到的数据,对所述样本数据进行更新展示。
在一个实施例中,所述至少一个预设条件中包括条件类型为最终得分类的第一预设条件,所述第一预设条件包括所述至少一个样本,第一运算符和预设分值,所述第一运算符为大于、小于和等于中的一种,所述第一预设条件用于限定利用所述第一模型对所述至少一个样本中的各个样本进行打分得到的分数与所述预设分值之间的相对大小。
进一步地,在一个具体的实施例中,所述交互界面中包括条件类型下拉框,所述条件类型下拉框中包括多种备选类型,所述多种备选类型中包括所述最终得分类;
所述第一接收模块1631具体配置为:接收基于所述条件类型下拉框发出的针对所述最终得分类的选取指令;展示与所述最终得分类对应的第一条件模版,所述第一条件模版中包括样本下拉框、运算符下拉框和运算值输入框,所述样本下拉框中包括所述多个样本,用于引导用户从中选取所述至少一个样本,所述运算符下拉框中包括多个备选运算符,用于引导用户从中选取所述第一运算符,所述运算值输入框用于引导用户输入所述预设分值;接收用户基于所述第一条件模版输入的第一预定条件,归入所述至少一个预设条件。
在一个更具体的实施例中,第一预设条件还包括用于表示该条件重要程度的权重,所述第一条件模版中还包括权重输入框,用于引导用户输入所述权重。
在一个实施例中,所述至少一个预设条件中包括条件类型为相对排名类的第二预设条件,所述第二预设条件包括第一样本子集、第二样本子集和第二运算符,所述第一样本子集和第二样本子集中的样本共同组成所述至少一个样本,所述第二运算符为大于、小于和等于中的一种,所述第二预设条件用于限定利用所述第一模型对所述第一样本子集中的各个样本进行打分得到的分数与对所述第二样本子集中各个样本进行打分得到的分数之间的相对大小。
进一步地,在一个具体的实施例中,所述交互界面中包括条件类型下拉框,其中包括多种备选类型,所述多种备选类型中包括所述相对排名类;所述第一接收模块1631具体配置为:接收基于所述条件类型下拉框发出的针对所述相对排名类的选取指令;展示与所述相对排名类对应的第二条件模版,所述第二条件模版中包括第一样本下拉框、第二样本下拉框和运算符下拉框,所述第一样本下拉框包括所述多个样本,用于引导用户从中选取样本构成所述第一样本子集,所述第二样本下拉框包括所述多个样本,用于引导用户从中选取样本构成所述第二样本子集,所述运算符下拉框中包括多个备选运算符,用于引导用户从中选取所述第二运算符;接收用户基于所述第二条件模版输入的所述第二预定条件,归入所述至少一个预设条件。
进一步地,在一个具体的实施例中,第二预设条件还包括用于表示该条件重要程度的权重,所述第二条件模版中还包括权重输入框,用于引导用户输入所述权重。
在一个实施例中,所述交互界面中包括与所述多个样本特征对应的多个特征图标以及与其中各个特征图标对应的筛选框,所述第二接收模块1632具体配置为:接收对所述至少一个样本特征对应的至少一个筛选框的确认选择指令。
在一个实施例中,所述交互界面中还包括针对样本特征推荐度的获取图标,所述第二接收单元1630还包括:
第三接收模块,配置为接收对所述获取图标的触发指令;
展示模块,配置为展示对所述多个样本特征中各个样本特征的推荐度,至少用于辅助用户选取所述至少一个样本特征。
在一个实施例中,所述第二接收单元1630还包括:第四接收模块,配置为接收针对所述至少一个样本特征设定的至少一个参数值区间,所述至少一个参数值区间用于限定所述至少一个模型参数的取值范围。
进一步地,在一个具体的实施例中,所述交互界面中包括用于对所述多个样本特征的多个参数值区间的上限和下限分别进行统一设定的多个调整图标,其中包括上限统一增加图标、上限统一减少图标、下限统一增加图标和下限统一减少图标;所述第四接收模块具体配置为:响应于对所述多个调整图标中任意的第一调整图标的触发指令,统一对所述多个参数值区间进行与所述第一调整图标对应的调整。
在一个实施例中,所述至少一个样本特征中包括第一样本特征,所述至少一个模型参数中包括与所述第一样本特征对应的第一模型参数;所述第二接收单元1630还包括:第五接收模块,配置为接收针对所述第一样本特征设定的所述第一模型参数。
进一步地,在一个具体的实施例中,所述交互界面中包括与所述多个样本特征对应的多个参数值输入框,其中包括与所述第一样本特征对应的第一参数值输入框;所述第五接收模块具体配置为:接收基于所述第一参数值输入框设定的第一模型参数。
在一个更具体的实施例中,所述交互界面中还包括与所述多个参数值输入框对应的多个锁定图标,其中包括与所述第一参数值输入框对应的第一锁定图标,所述第一锁定图标呈解锁状态;所述第二接收单元1630还包括:第六接收模块,配置为接收对所述第一锁定图标的触发指令;锁定状态更新展示模块,配置为将呈解锁状态的第一锁定图标更新展示为锁定状态,并且,将显示有所述第一模型参数的第一参数值输入框展示为不可编辑状态。
在一个实施例中,第二接收单元1630还包括:第七接收模块,配置为接收针对所述第一模型设定的模型类型,所述模型类型为线性模型或非线性模型。
在一个实施例中,所述装置1600还包括第三接收单元和第二展示单元,其中,第三接收单元配置为接收针对所述第一模型的展示指令,第二展示单元配置为展示所述第一模型,所述第一模型包括所述至少一个样本特征和模型参数。
在一个实施例中,所述第一模型为线性模型,其中包括与所述至少一个样本特征对应的至少一个模型参数,所述交互界面中包括与所述至少一个样本特征对应的至少一个参数值输入框,所述装置还包括:第三展示单元,配置为在所述至少一个参数值输入框中展示所述至少一个模型参数。
在一个具体的实施例中,所述至少一个参数值输入框包括第一参数值输入框,所述至少一个模型参数中包括第一模型参数;在所述至少一个参数值输入框中展示所述至少一个模型参数之后,所述装置包括:第四接收单元,配置为接收用户在所述第一参数值输入框中对所述第一模型参数进行的修改,用于重新构建所述第一模型。
在一个实施例中,所述装置还包括:第四展示单元,配置为展示利用所述第一模型对所述多个样本进行打分得到的多个原始分数。
在一个具体的实施例中,所述第四展示单元还配置为,展示所述多个原始分数所对应的原始区间。
在一个更具体的实施例中,所述装置还包括:第四接收单元,配置为接收用户基于所述原始区间设定的调整后区间;第五展示单元,配置为利用基于所述调整后区间对所述多个原始分数进行调整后得到的多个调整后分数对所述多个原始分数进行替换展示。
更进一步地,在一个例子中,所述第六展示单元还配置为,展示所述调整后区间相对于原始区间的增益值和偏移值。
在一个例子中,所述第四展示单元还配置为,展示所述多个原始分数对应的原始均值和原始方差;所述第五展示单元还配置为,利用所述多个调整后分数对应的调整后均值和调整后方差分别对所述原始均值和原始方差进行替换展示。
在一个实施例中,所述装置还包括:第六展示单元,配置为展示所述多个样本所对应的多个分数,所述多个分数基于利用所述第一模型对所述多个样本进行打分得到的多个原始分数而确定。
进一步地,在一个具体的实施例中,所述装置还包括:
直方图展示单元,配置为响应于对所述直方图图标的触发指令,展示基于所述多个分数绘制的直方图;其中,所述直方图中包括至少一个直方条,其中各个直方条相对横坐标的数值区间表示对应的分数区间,且相对纵坐标的数值表示对应的样本个数。
在一个更具体的实施例中,所述直方图中包括多个参照网格,其中各个参照网格相对于横坐标的间隔对应第一间隔分数;所述装置还包括:步长接收单元,配置为接收用户对所述第一间隔分数进行调整得到的第二间隔分数;所述直方图展示单元还配置为,利用所述第二间隔分数对所述直方图进行更新展示。
在一个具体的实施例中,所述第六展示单元具体配置为,基于所述多个分数对所述多个样本进行排名展示;
所述交互界面中包括雷达图图标,所述装置还包括雷达图展示单元,配置为:接收对所述雷达图图标的触发指令;展示所述至少一个样本特征所对应的至少一个特征图标和至少一个筛选框,所述至少一个特征图标基于所述至少一个模型参数的大小而顺序排列,所述至少一个特征图标中包括被选取的第一数量的特征图标,所述第一数量的特征图标所对应的第一数量的筛选框呈选取状态;展示基于所述第一数量的特征图标绘制的雷达图,所述雷达图包括第一数量的放射轴;接收用户基于所述排名展示的多个样本选取的第二数量的样本;在所述雷达图中显示所述第二数量的样本所对应的第二数量的封闭曲线;其中,所述第一数量的放射轴中包括对应于第一样本特征的第一放射轴,所述第二数量的封闭曲线包括对应于第一样本的第一封闭曲线,所述第一封闭曲线在所述第一放射轴上的取值由所述第一样本特征的权重值与所述第一样本对应于所述第一样本特征的特征值之间的乘积而确定。
在一个实施例中,所述交互界面中还包括预设条件验证图标,所述装置还包括:条件差值展示单元,配置为响应于对所述预设条件验证图标的触发指令,展示与所述至少一个预设条件对应的至少一个条件差值,其中各个条件差值反映所述第一模型针对所述各个条件差值所对应的预设条件的符合度。
综上,采用本说明书实施例披露的构建模型的装置,可以使数据分析人员以极低的学习成本快速上手,同时,在整个建模过程中,数据分析人员不需要了解业务以外的额外知识,可以将全部精力集中在业务分析上,充分发挥其在业务经验上的优势,根据自己的需求建立、修改模型,以满足自己日常工作的建模需求。
如上,根据再一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图1所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图1所描述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书披露的多个实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本说明书披露的多个实施例的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书披露的多个实施例的具体实施方式而已,并不用于限定本说明书披露的多个实施例的保护范围,凡在本说明书披露的多个实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书披露的多个实施例的保护范围之内。
1.一种构建模型的方法,其中,所述方法包括:
接收用户基于交互界面输入的用于构建第一模型的限定数据,所述第一模型用于对多个样本中的每个样本进行打分,所述接收用于构建第一模型的限定数据,至少包括:
接收输入的至少一个预设条件,其中每个预设条件为要求所述第一模型对所述多个样本中的至少一个样本进行打分的分数结果满足的条件;获取从多个样本特征中选取的至少一个样本特征,用于作为所述第一模型的输入特征;构建所述第一模型。
2.根据权利要求1所述的方法,其中,在所述接收用户输入的用于构建第一模型的限定数据之前,所述方法还包括:
接收用户基于所述交互界面发出的针对第一样本集的选取指令,所述第一样本集中包括多个样本;
展示所述多个样本中每个样本所对应的样本数据,所述样本数据包括所述每个样本对应于所述多个样本特征中各个样本特征的特征值。
3.根据权利要求2所述的方法,其中,所述交互界面中包括样本集下拉框,所述样本集下拉框中包括多个备选样本集,所述多个备选样本集中包括所述第一样本集;
所述接收用户基于交互界面发出的针对第一样本集的选取指令,包括:
接收用户基于所述样本集下拉框发出的针对第一样本集的选取指令。
4.根据权利要求2所述的方法,其中,在所述展示所述多个样本中每个样本所对应的样本数据之后,所述方法还包括:
响应于针对所述样本数据的收起指令,对所述样本数据进行折叠显示。
5.根据权利要求2所述的方法,其中,所述交互界面中包括归一化处理图标和对应的选项框,在所述展示所述多个样本中每个样本所对应的样本数据之后,所述方法还包括:
响应于对所述选项框的确认选择指令,利用对所述各个样本特征对应多个样本的多个特征值进行归一化处理而得到的数据,对所述样本数据进行更新展示。
6.根据权利要求1所述的方法,其中,所述接收输入的至少一个预设条件,包括:
接收用户设定的至少一个预设条件。
7.根据权利要求1所述的方法,其中,所述至少一个预设条件中包括条件类型为最终得分类的第一预设条件,所述第一预设条件包括所述至少一个样本,第一运算符和预设分值,所述第一运算符为大于、小于和等于中的一种,所述第一预设条件用于限定利用所述第一模型对所述至少一个样本中的各个样本进行打分得到的分数与所述预设分值之间的相对大小。
8.根据权利要求7所述的方法,其中,所述交互界面中包括条件类型下拉框,所述条件类型下拉框中包括多种备选类型,所述多种备选类型中包括所述最终得分类;
所述接收输入的至少一个预设条件,包括:
接收基于所述条件类型下拉框发出的针对所述最终得分类的选取指令;
展示与所述最终得分类对应的第一条件模版,所述第一条件模版中包括样本下拉框、运算符下拉框和运算值输入框,所述样本下拉框中包括所述多个样本,用于引导用户从中选取所述至少一个样本,所述运算符下拉框中包括多个备选运算符,用于引导用户从中选取所述第一运算符,所述运算值输入框用于引导用户输入所述预设分值;
接收用户基于所述第一条件模版输入的第一预定条件,归入所述至少一个预设条件。
9.根据权利要求8所述的方法,其中,第一预设条件还包括用于表示该条件重要程度的权重,所述第一条件模版中还包括权重输入框,用于引导用户输入所述权重。
10.根据权利要求1所述的方法,其中,所述至少一个预设条件中包括条件类型为相对排名类的第二预设条件,所述第二预设条件包括第一样本子集、第二样本子集和第二运算符,所述第一样本子集和第二样本子集中的样本共同组成所述至少一个样本,所述第二运算符为大于、小于和等于中的一种,所述第二预设条件用于限定利用所述第一模型对所述第一样本子集中的各个样本进行打分得到的分数与对所述第二样本子集中各个样本进行打分得到的分数之间的相对大小。
11.根据权利要求10所述的方法,其中,所述交互界面中包括条件类型下拉框,所述条件类型下拉框中包括多种备选类型,所述多种备选类型中包括所述相对排名类;
所述接收输入的至少一个预设条件,包括:
接收基于所述条件类型下拉框发出的针对所述相对排名类的选取指令;
展示与所述相对排名类对应的第二条件模版,所述第二条件模版中包括第一样本下拉框、第二样本下拉框和运算符下拉框,所述第一样本下拉框包括所述多个样本,用于引导用户从中选取样本构成所述第一样本子集,所述第二样本下拉框包括所述多个样本,用于引导用户从中选取样本构成所述第二样本子集,所述运算符下拉框中包括多个备选运算符,用于引导用户从中选取所述第二运算符;
接收用户基于所述第二条件模版输入的所述第二预定条件,归入所述至少一个预设条件。
12.根据权利要求11所述的方法,其中,第二预设条件还包括用于表示该条件重要程度的权重,所述第二条件模版中还包括权重输入框,用于引导用户输入所述权重。
13.根据权利要求1所述的方法,其中,所述交互界面中包括与所述多个样本特征对应的多个特征图标以及与其中各个特征图标对应的筛选框,所述获取从多个样本特征中选取的至少一个样本特征,包括:
接收对所述至少一个样本特征对应的至少一个筛选框的确认选择指令。
14.根据权利要求1所述的方法,其中,所述交互界面中还包括针对样本特征推荐度的获取图标,在所述接收输入的至少一个预设条件之后,以及,在所述接收基于所述多个样本特征选取的至少一个样本特征之前,所述方法还包括:
接收对所述获取图标的触发指令;
展示对所述多个样本特征中各个样本特征的推荐度,至少用于辅助用户选取所述至少一个样本特征。
15.根据权利要求1所述的方法,其中,所述接收用户输入的用于构建第一模型的限定数据,还包括:
接收针对所述至少一个样本特征设定的至少一个参数值区间,所述至少一个参数值区间用于限定所述至少一个模型参数的取值范围。
16.根据权利要求15所述的方法,其中,所述交互界面中包括用于对所述多个样本特征的多个参数值区间的上限和下限分别进行统一设定的多个调整图标,其中包括上限统一增加图标、上限统一减少图标、下限统一增加图标和下限统一减少图标;
接收针对所述至少一个样本特征设定的至少一个参数值区间,包括:
响应于对所述多个调整图标中任意的第一调整图标的触发指令,统一对所述多个参数值区间进行与所述第一调整图标对应的调整。
17.根据权利要求1所述的方法,其中,所述至少一个样本特征中包括第一样本特征,所述至少一个模型参数中包括与所述第一样本特征对应的第一模型参数;
所述接收用户输入的用于构建第一模型的限定数据,还包括:
接收针对所述第一样本特征设定的所述第一模型参数。
18.根据权利要求17所述的方法,其中,所述交互界面中包括与所述多个样本特征对应的多个参数值输入框,其中包括与所述第一样本特征对应的第一参数值输入框;
所述接收针对所述第一样本特征设定的所述第一模型参数,包括:
接收基于所述第一参数值输入框设定的第一模型参数。
19.根据权利要求18所述的方法,其中,所述交互界面中还包括与所述多个参数值输入框对应的多个锁定图标,其中包括与所述第一参数值输入框对应的第一锁定图标,所述第一锁定图标呈解锁状态;
在所述接收基于所述第一参数值输入框设定的第一模型参数之后,所述方法还包括:
接收对所述第一锁定图标的触发指令;
将呈解锁状态的第一锁定图标更新展示为锁定状态,并且,将显示有所述第一模型参数的第一参数值输入框展示为不可编辑状态。
20.根据权利要求1所述的方法,其中,所接收用户输入的用于构建第一模型的限定数据,还包括:
接收针对所述第一模型设定的模型类型,所述模型类型为线性模型或非线性模型。
21.根据权利要求1所述的方法,其中,在所述构建所述第一模型之后,所述方法还包括:
接收针对所述第一模型的展示指令,展示所述第一模型,所述第一模型包括所述至少一个样本特征和模型参数。
22.根据权利要求1所述的方法,其中,所述第一模型为线性模型,其中包括与所述至少一个样本特征对应的至少一个模型参数,所述交互界面中包括与所述至少一个样本特征对应的至少一个参数值输入框,在所述构建所述第一模型之后,所述方法还包括:
在所述至少一个参数值输入框中展示所述至少一个模型参数。
23.根据权利要求22所述的方法,其中,所述至少一个参数值输入框包括第一参数值输入框,所述至少一个模型参数中包括第一模型参数;
在所述至少一个参数值输入框中展示所述至少一个模型参数之后,所述方法还包括:
接收用户在所述第一参数值输入框中对所述第一模型参数进行的修改,用于重新构建所述第一模型。
24.根据权利要求1所述的方法,其中,在所述构建所述第一模型之后,所述方法还包括:
展示利用所述第一模型对所述多个样本进行打分得到的多个原始分数。
25.根据权利要求24所述的方法,其中,在所述构建所述第一模型之后,所述方法还包括:
展示所述多个原始分数所对应的原始区间。
26.根据权利要求25所述的方法,其中,在所述展示所述多个原始分数所对应的原始区间之后,所述方法还包括:
接收用户基于所述原始区间设定的调整后区间;
利用基于所述调整后区间对所述多个原始分数进行调整后得到的多个调整后分数对所述多个原始分数进行替换展示。
27.根据权利要求26所述的方法,其中,在所述接收用户基于所述原始区间设定的调整后区间之后,所述方法还包括:
展示所述调整后区间相对于原始区间的增益值和偏移值。
28.根据权利要求26所述的方法,其中,在所述构建所述第一模型之后,以及,在所述接收用户基于所述原始区间设定的调整后区间之前,所述方法还包括:
展示所述多个原始分数对应的原始均值和原始方差;
在所述接收用户基于所述原始区间设定的调整后区间之后,所述方法还包括:
利用所述多个调整后分数对应的调整后均值和调整后方差分别对所述原始均值和原始方差进行替换展示。
29.根据权利要求1所述的方法,其中,在所述构建所述第一模型之后,所述方法还包括:
展示所述多个样本所对应的多个分数,所述多个分数基于利用所述第一模型对所述多个样本进行打分得到的多个原始分数而确定。
30.根据权利要求1所述的方法,其中,所述交互界面中包括直方图图标,在所述构建所述第一模型之后,所述方法还包括:
响应于对所述直方图图标的触发指令,展示基于所述多个分数绘制的直方图;
其中,所述直方图中包括至少一个直方条,其中各个直方条相对横坐标的数值区间表示对应的分数区间,且相对纵坐标的数值表示对应的样本个数。
31.根据权利要求30所述的方法,其中,所述直方图中包括多个参照网格,其中各个参照网格相对于横坐标的间隔对应第一间隔分数;
在所述展示基于所述多个分数绘制的直方图之后,所述方法还包括:
接收用户对所述第一间隔分数进行调整得到的第二间隔分数;
利用所述第二间隔分数对所述直方图进行更新展示。
32.根据权利要求29所述的方法,其中,所述展示所述多个样本所对应的多个分数,包括:
基于所述多个分数对所述多个样本进行排名展示;
所述交互界面中包括雷达图图标,在所述构建所述第一模型之后,所述方法还包括:
接收对所述雷达图图标的触发指令;
展示所述至少一个样本特征所对应的至少一个特征图标和至少一个筛选框,所述至少一个特征图标基于所述至少一个模型参数的大小而顺序排列,所述至少一个特征图标中包括被选取的第一数量的特征图标,所述第一数量的特征图标所对应的第一数量的筛选框呈选取状态;
展示基于所述第一数量的特征图标绘制的雷达图,所述雷达图包括第一数量的放射轴;
接收用户基于所述排名展示的多个样本选取的第二数量的样本;
在所述雷达图中显示所述第二数量的样本所对应的第二数量的封闭曲线;
其中,所述第一数量的放射轴中包括对应于第一样本特征的第一放射轴,所述第二数量的封闭曲线包括对应于第一样本的第一封闭曲线,所述第一封闭曲线在所述第一放射轴上的取值由所述第一样本特征的权重值与所述第一样本对应于所述第一样本特征的特征值之间的乘积而确定。
33.根据权利要求1所述的方法,其中,所述交互界面中还包括预设条件验证图标,在所述构建所述第一模型之后,所述方法还包括:
响应于对所述预设条件验证图标的触发指令,展示与所述至少一个预设条件对应的至少一个条件差值,其中各个条件差值反映所述第一模型针对所述各个条件差值所对应的预设条件的符合度。
34.一种构建模型的装置,其中,所述装置包括:
接收单元,配置为接收用户基于交互界面输入的用于构建第一模型的限定数据,所述第一模型用于对多个样本中的每个样本进行打分,所述接收单元,至少包括:
第一接收模块,配置为接收输入的至少一个预设条件,其中每个预设条件为要求所述第一模型对所述多个样本中的至少一个样本进行打分的分数结果满足的条件;
第二接收模块,配置为获取从多个样本特征中选取的至少一个样本特征,用于作为所述第一模型的输入特征;构建单元,配置为构建所述第一模型。
35.一种计算机可读存储介质,其上存储有计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-33中任一项的所述的方法。
36.一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-33中任一项所述的方法。
技术总结