本发明涉及大数据中多维数据分析的技术领域,具体涉及一种基于多维特征参数的智能动态维度排序方法及系统。
背景技术:
在多维数据模型的建设中,应用数据层在基于事实表进行数据分析需要生成丰富的维度属性。在数据分析师进行实际业务查询时,根据查询的指标和维度组合对逻辑模型进行汇总聚合返回结果,从而实现对业务数据多维分析的有力支撑。
然而,随着具体业务领域的细分,不同业务领域的类目特征出现越累越多的分化情况。
具体来说,单一业务逻辑模型中维度数量过多、分析类目个性化特征的场景越来越多,某些分析维度、特别是数据归属统一维度层级但业务分析视角天差地别的维度组在同一分析模型中出现的频率也越来越高。且业务分析人员能力参差不齐,对不同业务分析场景的把握不足,无法洞察真正具有价值的分析场景。在保证实际多维分析的目标下,如果在维度定义上基于所有的业务场景做细分定义,会导致维度存在过度拉宽、占据过多物理存储空间、维度爆炸的隐患,对维度的管理也会造成很大的挑战。
针对以上场景,目前,常规一般会采用如下方式:
通过采集获取到事实表数据后,基于事实表的每一条数据,利用hive/hbase维度表匹配带出全量维度字段。通过拉宽的全量维度,以满足不同业务方多维分解的数据分析需求,如图1所示。
但是,在单一业务逻辑模型中同一维度层级中不同类目衍生出数量较多、个性化场景较为强烈、分析视角天差地别的场景越来越多。
比如,从技术层面上来讲,针对基于商品衍生出来的品类维度,根据不同品类业务分析场景需要对个性化特征解读。空调品类需要对商品的匹数的度量数据进行分析,酒水品类需要分析度数、香型等。如果在维度定义和管理层面全部分别定义和管理,则会导致维度存在过度重复定义、物理存储空间翻倍、维度爆炸等问题。
从业务层面上来看,由于数据分析人员的能力参差不齐,在同一分析场景下的维度类型过多,会影响到分析人员的判断力,导致数据分析的方向可能会出现偏差,无法洞察业务的变化情况。
技术实现要素:
针对现有技术的缺陷,本发明的目的是,提供一种基于多维特征参数的智能动态维度排序方法及系统,从而解决现有技术中业务多维度定义无法控制的问题,通过智能化的分析和排序,减少物理存储空间与人工管理成本,并能帮助业务数据分析人员更加迅速地洞察到关键问题。
本发明的第一方面,提供了一种基于多维特征参数的智能动态维度排序方法,包括:
根据数据仓库中保存的商品的标准维度数据,创建包含商品的原子维度及其层级关系的商品层级维度表;
根据各商品对应的参数类型,结合所述层级关系表,创建包含商品所有参数类型及对应参数值的商品参数维度表;
对不同层级的商品按照参数类型进行拆解,并对拆解后的每一个参数值通过排序算法进行维度差异化的排序。
进一步地,所述方法还包括:将全部商品参数的排序结果制作成可配置的bi报表或中间表。
进一步地,对所述参数类型的拆解包括:根据不同的业务场景或统计维度,将参数类型分别进行拆解,形成单一的拆解表。
进一步地,所述的排序包括:将所有的拆解表按照层级关系、参数类型、计算结果和排序序号形成完整的排序报表。
进一步地,所述排序算法为方差对比计算法、均值法、中位数法、正态分布法中的一种或几种的组合。
进一步地,所述的方差对比计算法包括:
将所有参数类型下的参数值样本容量进行方差齐性校验,并在校验通过后,进行方差对比计算,根据方差计算结果,按离散度进行降序排列,其中,采用的方差计算公式为:
本发明的第二方面,还提供了一种基于多维特征参数的智能动态维度分析系统,该系统包括:
商品层级维度表创建模块,根据数据仓库中保存的商品的标准维度数据,创建包含商品的原子维度及其层级关系的商品层级维度表;
商品参数维度表创建模块,根据各商品对应的参数类型,结合所述层级关系表,创建包含商品所有参数类型及对应参数值的商品参数维度表;
智能排序模块,对不同层级的商品按照参数类型进行拆解,并对拆解后的每一个参数值通过排序算法进行维度差异化的排序。
进一步地,所述系统还包括:配置模块,根据智能排序模块的排序结果制作成可配置的报表模型。
与现有技术相比,本发明提供的一种基于多维特征参数的智能动态维度排序方法及系统,达到了如下技术效果:
1、本发明将商品按照参数类型进行拆解后,再针对每一个计算出的参数值进行排序,跳过bi报表开发流程,针对新增或变化的维度,能够做到报表结构的及时调整;此外,还可以通过个性化报表模块灵巧的配置方式,随时进行数据分析与验证。
2、由于bi报表的维度为灵活变动维度,不需要过度拉宽事实表,由此可针对不同的业务场景,进行维度差异化的排序控制的方式,还能够有效地控制事实表模型的特征值数量,既满足了分析需求,又在一定程度上解决了分析模型过度拉宽、维度爆炸的隐患。
附图说明
图1是本发明背景技术中的商品访问结果表的形成过程及示例表。
图2是本发明实施例中的基于多维特征参数的智能动态维度排序方法的流程示意图。
图3是本发明实施例中的商品层级维度表的示例图。
图4是本发明实施例中的商品参数维度表的示例图。
图5是本发明实施例中的商品参数拆解表的示例图。
图6是本发明实施例中的商品参数排序表的示例图。
图7是本发明实施例中的报表展示的示例图。
图8是本发明实施例中的基于多维特征参数的智能动态维度排序系统的架构原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例为实施本发明的较佳实施方式,所述描述是以说明本发明的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围应当以权利要求所界定者为准,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图2所示,本发明的一实施例提供了一种基于多维特征参数的智能动态维度排序方法,该方法包括:
步骤s11、根据数据仓库中保存的商品的标准维度数据,创建包含商品的原子维度及其层级关系的商品层级维度表;
配合参照图3所示,具体来说,根据数据仓库中的商品维度表,也即存放标准维度数据的字典表,先定义并创建原子维度,该原子维度也即维度表的主键字段,记载了商品的代码编号及商品名,如11928436409代表美的某型号空调,11398170651代表贵州茅台某规格白酒;然后再根据数据仓库中的商品维度关系表,也即存放标准维度数据及其层级类目关系的关系维度表,定义层级关系,比如00001代表空调品类,00002代表酒水品类,00003代表通讯品类。将全部商品的原子维度及对应的品类层级关系组合形成商品层级维度表。
步骤s12、根据各商品对应的参数类型,结合所述层级关系表,创建包含商品所有参数类型及对应参数值的商品参数维度表;
配合参照图4所示,具体来说,根据数据仓库中的商品参数表,也即存放标准维度数据对应特征参数的关系维度表,并结合前述的层级关系表,创建涵盖商品所有分析参数的参数类型及对应参数值的商品参数维度表。在商品参数维度表中,包含商品名称(原子维度),商品的品类(层级),参数类型及对应的参数值。按照商品层级依次排序,形成全部商品的参数维度表。
步骤s13、对不同层级的商品按照参数类型进行拆解,并对拆解后的每一个参数值通过排序算法进行维度差异化的排序。
在对商品进行数据分析中,丰富的维度数据,代表了多重的分析视角。在面对业务问题拆解的时候,维度便成了洞察数据问题的最好工具。维度分析的关键是差异性分析,随着对维度的拆解,更容易让数据分析人员洞察数据问题,进行查漏补缺。
为此,本发明在步骤s12形成的参数维度表的基础上,根据涉及到的参数类型在不同的应用场景或统计维度的需求,根据所属参数类型进行一一拆解,拆解成每一个具体的参数类型的拆解表。其中,每一个品类的参数类型下又包含多种维度,比如空调品类关注匹数、能耗等,对应地,同一个参数类型下的参数值还可以细分为不同,比如匹数对应的参数特征值有1匹、2匹、4匹等,酒水品类下的参数类型包括度数、香型、容量等,度数之下的参数值亦包括10度、30度、45度、53度等等,通讯品类下的参数类型包括内存、分辨率、操作系统等。每一个参数类型又能包含多个不同的参数值,对这些参数值的进一步拆分则能找出更具体的差异性问题。参照图5所示,将空调品类100万gmv(商品订单的成交额)在不同维度下的拆解结果如图所示,其中,左边为匹数维度下的gmv拆解结果,对所有匹数下的参数值,右边为能耗维度下的gmv拆解结果,从图中能够看出,匹数维度下的gmv拆解分布较为平均,能耗维度下的拆解分布较为离散,分析人员在能耗的维度下更可以评估每一种能耗下空调的市场规模、用户偏好,如能耗维度中,500w和600w的订单金额最大,有利于决策人员可以针对具有不同市场价值的商品制定个性化营销策略。
在对每一个品类下的所有参数类型均可以按照上述维度拆分之后,能够获得某参数类型下的很多对应的参数值样本值。为了从众多的参数类型下获得有业务价值的结果,本发明对不同维度下的参数值样本值根据排序算法进行排序,以获得不同参数类型下的业务价值度排序结果。为了便于直观的显示,将所有的拆解表按照品类(品类中又根据层级关系排列)、参数类型(每一品类中的参数类型具有多种维度)、计算结果(算法计算结果)和排序序号(对应名次)形成完整的排序报表,如图6所示。在排序报表中,能够了解不同维度下的商品业务价值度排名,而且针对同一商品之下的不同维度,具有差异化的表示方式,随着业务变化,通过算法能够对业务进行及时调整。无论是增加品类、增加参数类型或者增加参数特征值,均可以通过本发明的排序算法进行及时调整。
具体来说,所述排序算法可以为方差对比计算法、均值法、中位数法、正态分布法等。
优选地,排序算法采用方差比对,以方差对比计算为例,包括:
将所有参数类型下的参数值样本容量进行方差齐性校验,并在校验通过后,进行方差对比计算分析,根据方差计算结果,按离散度进行降序排列,其中,采用的方差计算公式为:
基于步骤s12获得的商品参数的维度表、步骤s13获得的商品参数的排序表,将参数类型及其商品所处的参数值范围通过报表工具配置在报表中。如果数据分析人员对于步骤s13计算出的参数类型重要程度排名有其它调整,可以利用工具的能力,将参数类型做到优先展示排序结果的可配置模型,如图7所示,只显示部分靠前的展示结果,而靠前的排名则对数据分析更有意义。由于bi报表的维度为灵活变动维度,不需要过度拉宽事实表,故能够有效控制事实表中的特征值或参数值的数量。
此外,也可以将步骤s13中的排序结果做成一张配置中间表,报表工具通过对中间表的读取,将参数类型动态拼接入前端展示界面中,可以只选取所需维度的分析结果,以达到灵活配置及优化资源利用率的效果。
与上述方法实施例相对应的,参照图8所示,本发明的另一实施例还提供了一种基于多维特征参数的智能动态维度分析系统,该系统包括:商品层级维度表创建模块,商品参数维度表创建模块,以及智能排序模块。
商品层级维度表创建模块,根据数据仓库中保存的商品的标准维度数据,创建包含商品的原子维度及层级关系的商品层级维度表;
商品参数维度表创建模块,根据各商品对应的参数类型,结合层级维度表,创建包含商品所有参数类型及对应参数值的商品参数维度表;
智能排序模块,对不同层级的商品按照参数类型进行拆解,并对拆解后的每一个参数值通过排序算法进行维度差异化的排序。
为了对经过智能排序模块处理过的图表供业务人员分析,本发明还设置了配置模块,根据智能排序模块的排序结果,利用报表中的配置工具制作成可展示排序结果的模型图,模型图中可以展示排名靠前的多个参数类型的结果,或者,还可以将排序结果制作成一张可配置的中间表,报表工具通过对中间表的读取,可以选择任一维度的参数数据进行调阅。
单一业务逻辑模型中同一维度层级中不同类目衍生出数量较多、个性化场景较为强烈、分析视角天差地别的场景越来越多,针对此,本发明首先通过商品参数维度表创建模块和商品参数维度表创建模块,将全类商品按照品类、层级、参数类型及参数值进行划分,创建涵盖商品所有分析参数的维度,在面对业务问题拆解的时候,维度成为了洞察数据问题的最好工具,故再对所有的维度按照所需分析的应用场景进行拆解,从拆解后的维度表中能够分析出该维度下的每一细分产品的市场规模、用户偏好等。此外,再根据排序算法,对所有参数类型下的商品根据不同的维度进行排序,并优先设置展示排名靠前的参数类型,如此便能很直观的使得业务人员了解不同维度下的不同排名,方便业务人员作出精准决策。
上述说明示出并描述了本发明的若干优选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
1.一种基于多维特征参数的智能动态维度排序方法,其特征在于,所述方法包括:
根据数据仓库中保存的商品的标准维度数据,创建包含商品的原子维度及层级关系的商品层级维度表;
根据各商品对应的参数类型,结合所述层级维度表,创建包含商品所有参数类型及对应参数值的商品参数维度表;
对不同层级的商品按照参数类型进行拆解,并对拆解后的每一个参数值通过排序算法进行维度差异化的排序。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:将商品参数的排序结果制作成可配置的bi报表或中间表。
3.根据权利要求1或2所述的方法,其特征在于,对所述参数类型的拆解包括:根据不同的业务场景或统计维度,将各商品下不同的参数类型分别进行拆解,形成多个单一的拆解表。
4.根据权利要求3所述的方法,其特征在于,所述的排序包括:将所有的拆解表按照层级关系、参数类型、计算结果和排序序号形成完整的排序报表。
5.根据权利要求3所述的方法,其特征在于,所述排序算法为方差对比计算法、均值法、中位数法、正态分布法中的一种或几种的组合。
6.根据权利要求5所述的方法,其特征在于,所述的方差对比计算法包括:
将所有参数类型下的参数值样本容量进行方差齐性校验,并在校验通过后,进行方差对比计算,根据方差计算结果,按离散度进行降序排列,其中,采用的方差计算公式为:
7.根据权利要求2所述的方法,其特征在于,通过报表工具控制所述排序结果只显示排名靠前的参数类型的相关数据。
8.根据权利要求1所述的方法,其特征在于,所述的商品层级维度表包括:商品的原子维度、品类层级;所述的商品参数维度表包括商品的原子维度、品类层级、参数类型、参数值。
9.一种基于多维特征参数的智能动态维度排序系统,其特征在于,所述系统包括:
商品层级维度表创建模块,根据数据仓库中保存的商品的标准维度数据,创建包含商品的原子维度及层级关系的商品层级维度表;
商品参数维度表创建模块,根据各商品对应的参数类型,结合所述层级维度表,创建包含商品所有参数类型及对应参数值的商品参数维度表;
智能排序模块,对不同层级的商品按照参数类型进行拆解,并对拆解后的每一个参数值通过排序算法进行维度差异化的排序。
10.根据权利要求9所述的系统,其特征在于,所述系统还包括:配置模块,根据智能排序模块的排序结果制作成可配置的报表模型。
技术总结