本发明属于大数据处理技术领域,特别是一种在电子表格中呈现数据指标层级与分类的处理方法。
背景技术:
在大数据治理过程中,数据的来源是多样化的,表格数据文件是其中一种常见类型。
现有的统计类数据大多都以二维表格的方式呈现,表格中的每一个数值所代表的实际意义需要结合表格的标题以及该数值对应的横纵坐标的指标进行理解,如图1中,表格的指标区域可以划分为x坐标区域和y坐标区域,即x坐标区域的指标为“企业数(个)”、“#有r&d活动的企业数”、“#有科技机构的企业数”,y坐标区域的指标为“合计”、“大型”、“中型”、“小型”、“微型”,目前通常数据呈现方式都采用xy(或yx)直接组合方式。例如,数值“348”呈现的指标为“大型企业数(个)”,其实际含义为“按企业规模分大型企业的企业数(个)”,只有结合原表格才能准确理解其含义,如果只从指标“大型企业数(个)”去解读,计算很难准确表达与描述该指标所隐含的分类信息,本例中,按企业规模分类还包含“中型”、“小型”、“微型”,传统的指标呈现形式丢失了准确的指标分类描述信息。
目前,对表格进行处理的技术通常采用横坐标指标加纵坐标指标直接组合方式呈现,如图2,指标“大型企业数(个)”呈现形式,其真正的指标为“企业数”,“大型”为指标“企业数”的分类描述。这样用xy(或yx)直接组合方式形成的新指标大部分都不是标准(或惯例)指标,存在指标名称过长、不规范、不准确、可读性差、晦涩难懂等诸多缺陷,如果指标间存在多层上下级或包含关系时,这种组合方式很难表达清楚或根本无法表达。特别是在多源数据的融合过程中,按这种方式形成的指标,难以形成统一的指标库,也不利于进行数据的大规模组合运算和指标间关系等隐含信息的挖掘,也就难以实现按需展示、灵活组合的需求。
技术实现要素:
本发明需要解决的技术问题是提供一种在电子表格中呈现数据指标层级与分类的处理方法,能够使指标更简洁、指标层级关系显性化,数值的表达也更加清晰、准确。
为解决上述技术问题,本发明所采取的技术方案如下。
一种在电子表格中呈现数据指标层级与分类的处理方法,所述处理方法基于存储有数值项的d库、存储有指标单元信息的i库、存储有指标分类描述单元信息的c库和存储应用场景的r库实现,具体包括以下步骤:
a1.构建指标索引结构s;
a2.结合用户的选择,利用指标索引结构构建器读取i库、c库、d库、r库中的信息,填充指标索引结构s;
a3.依据用户的选择,利用层级分类结果呈现器迭代提取i库、c库、d库、r库中的相应信息;
a4.渲染层级分类结果呈现器提取的信息,呈现给用户。
上述一种在电子表格中呈现数据指标层级与分类的处理方法,步骤a1中所述的指标索引结构s包括指标区、指标分类描述区、关系区和已选指标区;其中指标区为呈现指标及指标层级关系的ia区域,指标分类描述区为呈现指标分类描述及其层级关系的ca区域,关系区为呈现指标单元和指标分类描述单元之间应用场景及相应的源库表等隐含属性的ra区域,已选指标区为呈现用户已经选择的指标和指标分类描述信息的sa区域。
上述一种在电子表格中呈现数据指标层级与分类的处理方法,步骤a2的具体实现方法为:
a21.初始化指标索引结构s;
a22.读取i库中的指标单元信息,填充指标索引结构s的ia区域,形成指标的树形层级结构,供用户选择;
a23.依据用户选择的指标i,在r库中读取指标i对应的关系,填充指标索引结构s的ra区域,形成应用场景r;
a24.依据r库中读取的指标i对应的关系,读取c库中的指标分类描述c,填充指标索引结构s的ca区域,形成指标分类描述的树形层级结构,供用户选择;
a25.依据用户选择的指标i、指标分类描述c和应用场景r,填充指标索引结构s的sa区域。
上述一种在电子表格中呈现数据指标层级与分类的处理方法,步骤a3的具体实现方法为:
a31.初始化数据存储容器矩阵m;
a32.读取指标索引结构s中的sa区域信息;
a33.依据sa区域的用户已选指标信息,在i库中读取指标单元信息,填充矩阵m的x轴指标区;
a34.依据矩阵m的x轴指标区的指标单元信息,在d库中读取相关数据,生成临时数据集合ds1;
a35.依据sa区域的用户已选指标分类描述信息,在c库中读取指标分类描述单元,填充矩阵m的y轴指标分类描述区;
a36.依据矩阵m的y轴指标分类描述区的指标分类描述单元信息,在d库中读取相关数据,生成临时数据集合ds2;
a37.对临时数据集合ds1和临时数据集合ds2求交集,获得矩阵数据集合ds3,将矩阵数据集合ds3填充到矩阵m。
由于采用了以上技术方案,本发明所取得技术进步如下。
本发明呈现的二维电子表格数据能很好的解决指标层级、指标分类描述层级等隐含信息的显性化问题,具有标准化、规范化、层级化等特点,指标表述更简洁,可读性更强,更易于理解,能够实现对二维表格数据的准确表达;并基于此,能够对指标和指标分类描述灵活多样组合展示,使呈现结果更多样化、灵活化、个性化。
附图说明
图1为本发明所述传统统计类数据人工加工的表格呈现形式;
图2为现有技术中统计类数据的组合表达形式;
图3为本发明的流程图;
图4为本发明步骤a1中所述指标索引结构s的示意图;
图5为本发明步骤a2的流程图;
图6为本发明步骤a3的流程图;
图7为实施例中经填充后的指标索引结构s’;
图8为实施例最终展现的电子表格示例图。
具体实施方式
下面将结合附图和具体实施方式对本发明进行进一步详细说明。
一种在电子表格中呈现数据指标层级与分类的处理方法,该处理方法基于调用自带属性的数据实现,通过构建指标索引结构,依据用户的个性化选择,以电子表格形式呈现数值项、以及与数值相对应的指标及层级、指标分类描述及层级、指标与指标分类描述的应用场景和其它隐含属性,实现对二维表格数据的准确表达。
本发明所述的二维表格中的数据包含特征类数据、名词类数据、分类类数据以及统计类数据。数据颗粒化后是包含了自身属性的数值,自身属性包括指标、指标分类描述以及应用场景等;指标由指标名称、计量单位、时间限制、空间限制、应用限制五个要素组成,指标及其层级关系构成指标单元;指标分类描述指的是描述指标的角度,指标分类描述及其层级关系构成指标分类描述单元;应用场景是指指标单元与指标分类描述单元在具体二维表中的对应关系,以及二者对应的源、库、表等信息。
上述这些属性信息分别存储在数值库、指标库、指标分类描述库以及关系库中。其中,数值库为data数据库,简称d库,用于存储数值项,包含横坐标值、纵坐标值和数值等;指标库为index数据库,简称i库,用于存储指标单元信息等;指标分类描述库为classification数据库,简称c库,用于存储指标分类描述单元信息等;关系库为relation数据库,简称r库,用于存储应用场景等。
本发明所述的处理方法,其流程如图3所示,具体包括以下步骤。
a1.构建指标索引结构s。
指标索引结构s的结构如图4所示,包括指标区、指标分类描述区、关系区和已选指标区。其中指标区为indexarea区域,简称ia区,呈现指标单元,即呈现指标及指标层级关系;指标分类描述区为classificationarea区域,简称ca区,呈现指标分类描述单元,即呈现指标分类描述及其层级关系;关系区为relationarea区域,简称ra区,呈现指标单元和指标分类描述单元之间的应用场景,以及相应的源、库、表等隐含属性;已选指标区为selectedarea区域,简称sa区,呈现用户已经选择的指标、指标分类描述等信息。
a2.结合用户的选择,利用指标索引结构构建器读取i库、c库、d库、r库中的信息,填充指标索引结构s。
本步骤的流程如图5所示,具体包括以下内容。
a21.初始化指标索引结构s。
a22.读取i库中的指标单元信息,填充指标索引结构s的ia区域,形成指标的树形层级结构,供用户选择。
a23.依据用户选择的指标i,在r库中读取指标i对应的关系,填充指标索引结构s的ra区域,形成应用场景r。
a24.依据r库中读取的指标i对应的关系,读取c库中的指标分类描述c,填充指标索引结构s的ca区域,形成指标分类描述的树形层级结构,供用户选择。
a25.依据用户选择的指标i、指标分类描述c和应用场景r,填充指标索引结构s的sa区域。
本发明中,无论是指标的树形层级结构,还是指标分类描述的树形层级结构,不仅可以使指标层次清晰,用户选择时,可直观的看到指标在不同分类描述上的分布情况,有利于更快、更精准的找到需要的数据;而且经过填充后的指标索引结构s能够更加准确的表达数据自身含义。本实施例中,经过填充后的指标索引结构s’如图7所示。
a3.依据用户的选择,利用层级分类结果呈现器迭代提取i库、c库、d库、r库中的相应信息。
本步骤的流程如图6所示,具体包括以下内容。
a31.初始化数据存储容器矩阵m。
a32.读取指标索引结构s中的sa区域信息。
a33.依据sa区域的用户已选指标信息,在i库中读取指标单元信息,填充矩阵m的x轴指标区。
a34.依据矩阵m的x轴指标区的指标单元信息,在d库中读取相关数据,生成临时数据集合ds1。
a35.依据sa区域的用户已选指标分类描述信息,在c库中读取指标分类描述单元,填充矩阵m的y轴指标分类描述区。
a36.依据矩阵m的y轴指标分类描述区的指标分类描述单元信息,在d库中读取相关数据,生成临时数据集合ds2。
a37.对临时数据集合ds1和临时数据集合ds2求交集,获得矩阵数据集合ds3,将矩阵数据集合ds3填充到矩阵m。
a4.渲染层级分类结果呈现器提取的信息,呈现给用户。
本实施例呈现给用户的表格示例如图8所示,与图1所示的呈现方式基本相同,实现了对二维表格数据的准确表达。
本发明通过对四个存储库中存储的数据信息进行调用与呈现,可在用户进行数据自由选择展现时,在树形层级结构中,随意的选择一个(一组)或多个(多组)指标,同时选择一个(一组)或多个(多组)指标分类描述,然后根据用户的选择快速呈现结果,呈现的表格中,数据属性关系明确、清晰,做到了个性化选择,个性化呈现。
1.一种在电子表格中呈现数据指标层级与分类的处理方法,其特征在于,所述处理方法基于存储有数值项的d库、存储有指标单元信息的i库、存储有指标分类描述单元信息的c库和存储应用场景的r库实现,具体包括以下步骤:
a1.构建指标索引结构s;
a2.结合用户的选择,利用指标索引结构构建器读取i库、c库、d库、r库中的信息,填充指标索引结构s;
a3.依据用户的选择,利用层级分类结果呈现器迭代提取i库、c库、d库、r库中的相应信息;
a4.渲染层级分类结果呈现器提取的信息,呈现给用户。
2.根据权利要求1所述的一种在电子表格中呈现数据指标层级与分类的处理方法,其特征在于,步骤a1中所述的指标索引结构s包括指标区、指标分类描述区、关系区和已选指标区;其中指标区为呈现指标及指标层级关系的ia区域,指标分类描述区为呈现指标分类描述及其层级关系的ca区域,关系区为呈现指标单元和指标分类描述单元之间应用场景及相应的源库表等隐含属性的ra区域,已选指标区为呈现用户已经选择的指标和指标分类描述信息的sa区域。
3.根据权利要求2所述的一种在电子表格中呈现数据指标层级与分类的处理方法,其特征在于,步骤a2的具体实现方法为:
a21.初始化指标索引结构s;
a22.读取i库中的指标单元信息,填充指标索引结构s的ia区域,形成指标的树形层级结构,供用户选择;
a23.依据用户选择的指标i,在r库中读取指标i对应的关系,填充指标索引结构s的ra区域,形成应用场景r;
a24.依据r库中读取的指标i对应的关系,读取c库中的指标分类描述c,填充指标索引结构s的ca区域,形成指标分类描述的树形层级结构,供用户选择;
a25.依据用户选择的指标i、指标分类描述c和应用场景r,填充指标索引结构s的sa区域。
4.根据权利要求3所述的一种在电子表格中呈现数据指标层级与分类的处理方法,其特征在于,步骤a3的具体实现方法为:
a31.初始化数据存储容器矩阵m;
a32.读取指标索引结构s中的sa区域信息;
a33.依据sa区域的用户已选指标信息,在i库中读取指标单元信息,填充矩阵m的x轴指标区;
a34.依据矩阵m的x轴指标区的指标单元信息,在d库中读取相关数据,生成临时数据集合ds1;
a35.依据sa区域的用户已选指标分类描述信息,在c库中读取指标分类描述单元,填充矩阵m的y轴指标分类描述区;
a36.依据矩阵m的y轴指标分类描述区的指标分类描述单元信息,在d库中读取相关数据,生成临时数据集合ds2;
a37.对临时数据集合ds1和临时数据集合ds2求交集,获得矩阵数据集合ds3,将矩阵数据集合ds3填充到矩阵m。
技术总结