本申请涉及数据处理技术领域,具体而言,涉及一种网页代码转换方法和装置。
背景技术:
目前,excel(电子表格)经常需要将内容转换为网页代码,以此通过网页代码对excel中的内容进行展示。
相关技术中,excel转网页代码可以采用对原有的excel每个单元格填入占位符,占位符包含了合并、样式等等信息,完全依靠占位符对每个占位符解析。
在实施本申请实施例的过程中,发明人发现相关技术至少存在以下问题:
相关技术中,需要对原excel表格进行大量的改造,工作量巨大,耗时耗力,且生成的网页代码不规范,修改困难,无法直接投入生产使用。
技术实现要素:
本申请的主要目的在于提供一种网页代码转换方法和装置,以解决电子表格转换网页代码时需要进行大量改造,使用繁琐的问题。
为了实现上述目的,第一方面,本申请实施例提供了一种网页代码转换方法,包括:
获取待转换的电子表格文件;
确定所述电子表格文件中每个单元区域和每个单元区域的类型,对于每个所述单元区域,基于对应的所述类型提取该单元区域的位置信息和单元值,其中,所述单元区域的类型包括多单元格合并区域和非合并区域;
将每个所述单元区域对应的所述位置信息和所述单元值之间构建映射关系;
将所述每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码,从而得到所述电子表格文件对应的网页代码文件。
可选地,所述将所述每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码包括:
对每个单元区域的所述位置信息、所述单元值和映射关系进行遍历,以根据映射关系将所述每个单元区域的所述位置信息和所述单元值生成包含tr/td的表格信息,从而将所述表格信息作为指定格式的所述网页代码。
可选地,当所述单元区域的类型为多单元格合并区域时,所述基于对应的所述类型提取该单元区域的位置信息和单元值,包括:
将所述多单元格合并区域中左顶角首个单元格对应的单元值作为该单元区域的单元值,以及
生成包含所述多单元格合并区域中每个单元格的位置信息以及所述多单元格合并区域的行列信息。
可选地,当所述单元区域的类型为多单元格合并区域时,该方法还包括:
根据所述单元区域的映射关系将所述的多单元格合并区域的行列信息生成所述单元区域对应的表格行列信息,从而将所述表格行列信息作为指定格式的所述网页代码。
可选地,所述单元值包括样式信息和占位符信息。
可选地,当所述单元值为样式信息,将所述样式信息转换为css代码,从而将所述css代码作为指定格式的所述网页代码。
可选地,当所述单元值为占位符信息时,将所述占位符信息转换为类名。
可选地,在所述将每个所述单元区域对应的所述位置信息和所述单元值之间构建映射关系之后,该方法还包括:
将所述每个单元区域的所述位置信息、所述单元值和映射关系汇总,生成json文件。
第二方面,本申请还提供了一种网页代码转换装置,包括:
获取模块,获取待转换的电子表格文件;
提取模块,用于确定所述电子表格文件中每个单元区域和每个单元区域的类型,对于每个所述单元区域,基于对应的所述类型提取该单元区域的位置信息和单元值,其中,所述单元区域的类型包括多单元格合并区域和非合并区域;
映射模块,用于将每个所述单元区域对应的所述位置信息和所述单元值之间构建映射关系;
转换模块,用于将所述每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码,从而得到所述电子表格文件对应的网页代码文件。
第三方面,本申请还提供了一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行上述任一项所述的网页代码转换方法。
在本申请实施例中,获取待转换的电子表格文件;确定所述电子表格文件中每个单元区域和每个单元区域的类型,对于每个所述单元区域,基于对应的所述类型提取该单元区域的位置信息和单元值,其中,所述单元区域的类型包括多单元格合并区域和非合并区域;将每个所述单元区域对应的所述位置信息和所述单元值之间构建映射关系;将所述每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码,从而得到所述电子表格文件对应的网页代码文件。这样,先确定电子表格文件中每个单元区域和每个单元区域的类型,再根据类型提取单元区域的位置信息和单元值,再构建位置信息和单元值之间的映射关系,最后根据每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码,由于针对了确定出了多单元格合并区域和非合并区域,因此,不需要对原excel表格进行大量的改造,简单方便,实现了简化电子表格转换网页代码操作的目的。进而解决了电子表格转换网页代码时需要进行大量改造,使用繁琐的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的一种网页代码转换方法的流程图;
图2是根据本申请实施例提供的一种网页代码转换方法的操作流程图;
图3是根据本申请实施例提供的另一种网页代码转换方法的流程图;
图4是根据本申请实施例的一种网页代码转换装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本发明实施例提供了一种网页代码转换方法,图1是本申请实施例提供的一种网页代码转换方法,如图1所示,该方法包括如下步骤110至步骤140:
110,获取待转换的电子表格文件。
具体的,先获取待转换的电子表格文件,其中,该待转换的电子表格文件可以是存储在本地存储器或云端服务器中的excel文件,如图2所示,该excel文件可以包括多个复杂合并单元格以及各种样式。
120,确定所述电子表格文件中每个单元区域和每个单元区域的类型,对于每个所述单元区域,基于对应的所述类型提取该单元区域的位置信息和单元值,其中,所述单元区域的类型包括多单元格合并区域和非合并区域。
其中,单元区域的类型包括多单元格合并区域和非合并区域,多单元格合并区域即为多个相邻的单元格合并在一起的合并单元格,该合并单元格中仅包含有同一个单元值,而非合并区域即为一个独立的单元格,该独立的单元格不与其他单元格合并;而位置信息即为excel文件中的行列信息,例如,一个多单元格合并区域的位置信息为列a、b和c,行为3和4,即该多单元格合并区域包括的单元格为a3、a4、b3、b4、c3和c4共两行三列6个单元格。
具体的,根据excel文件针对单元格合并的属性,在电子表格文件识别出全部的多单元格合并区域和非合并区域,并确定出每个单元区域的位置信息和单元值。
130,将每个所述单元区域对应的所述位置信息和所述单元值之间构建映射关系。
具体的,每个单元区域都确定了位置信息和单元值,继而将每个所述单元区域的位置信息和单元值构建映射关系。
140,将所述每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码,从而得到所述电子表格文件对应的网页代码文件。
其中,该指定格式的网页代码可以是html表格网页代码。
具体的,先确定电子表格文件中每个单元区域和每个单元区域的类型,再根据类型提取单元区域的位置信息和单元值,再构建位置信息和单元值之间的映射关系,最后根据每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码,由于针对了确定出了多单元格合并区域和非合并区域,因此,不需要对原excel表格进行大量的改造,简单方便,实现了简化电子表格转换网页代码操作的目的。
可选地,步骤140,所述将所述每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码包括:
对每个单元区域的所述位置信息、所述单元值和映射关系进行遍历,以根据映射关系将所述每个单元区域的所述位置信息和所述单元值生成包含tr/td的表格信息,从而将所述表格信息作为指定格式的所述网页代码。
具体的,如图2所示,将位置信息和单元值的关系映射,逐行转换成网页代码(包含tr/td的表格信息)。
可选地,当所述单元区域的类型为多单元格合并区域时,所述基于对应的所述类型提取该单元区域的位置信息和单元值,包括:
将所述多单元格合并区域中左顶角首个单元格对应的单元值作为该单元区域的单元值,以及
生成包含所述多单元格合并区域中每个单元格的位置信息以及所述多单元格合并区域的行列信息。
具体的,如图2所示,在多单元格合并区域中将合并单元格的左上角首个单元格的单元值作为多单元格合并区域的单元值。在生成多单元格合并区域的行列信息时,可以先对多单元格合并区域进行定位,确定出多单元格合并区域中4个顶角所在位置,进而确定出该多单元格合并区域的行列信息,其中,当多单元格合并区域中4个顶角存在相同的顶角时,将相同的顶角进行合并,进而确定出多单元格合并区域的行列信息。
可选地,当所述单元区域的类型为多单元格合并区域时,该方法还包括:
根据所述单元区域的映射关系将所述的多单元格合并区域的行列信息生成所述单元区域对应的表格行列信息,从而将所述表格行列信息作为指定格式的所述网页代码。
具体的,将位置信息和单元值的关系映射逐行转换成网页代码(包含tr/td的表格信息)的过程中,当遇到多单元格合并区域时,将该多单元格合并区域对应的表格行列信息转换成包含colspan/rowspan的标准html表格行列信息。这样,本申请提供的网页代码转换方法对excel表格文件转换成的页面代码十分标准,可用于二次修改以及嵌入其他网页代码中,网页代码可可利用性极高。
可选地,所述单元值包括样式信息和占位符信息。
可选地,当所述单元值为样式信息,将所述样式信息转换为css代码,从而将所述css代码作为指定格式的所述网页代码。可选地,当所述单元值为占位符信息时,将所述占位符信息转换为类名。
具体的,将位置信息和单元值的关系映射逐行转换成网页代码(包含tr/td的表格信息)的过程中,占位符信息可以转换成对应的类名,样式信息则转换成css代码。这样使得本申请提供的网页代码转换方法功能强大,对复杂合并、复杂样式均能完美转换。
另外,如图2所示,如果想添加类名,则本申请提供的网页代码转换方法在步骤110之后以及步骤120之前,还可以包括对所述待转换的电子表格文件输入带有占位符的类名信息,从而控制生成自定义css类名。
可选地,图3是本申请实施例提供的另一种网页代码转换方法的流程示意图,如图3所示,在所述将每个所述单元区域对应的所述位置信息和所述单元值之间构建映射关系之后,该方法还包括步骤150:
150,将所述每个单元区域的所述位置信息、所述单元值和映射关系汇总,生成json文件。
其中,将能每个单元区域的所述位置信息、所述单元值和映射关系汇总生成标准的json文件,可以提供强大的扩展能力,本json文件其中包含的位置信息可用于网页代码的业务数据填充或者对原excel的数据填充,另外通过此json文件还可以转换成其他格式的文件。
在本申请实施例中,获取待转换的电子表格文件;确定所述电子表格文件中每个单元区域和每个单元区域的类型,对于每个所述单元区域,基于对应的所述类型提取该单元区域的位置信息和单元值,其中,所述单元区域的类型包括多单元格合并区域和非合并区域;将每个所述单元区域对应的所述位置信息和所述单元值之间构建映射关系;将所述每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码,从而得到所述电子表格文件对应的网页代码文件。这样,先确定电子表格文件中每个单元区域和每个单元区域的类型,再根据类型提取单元区域的位置信息和单元值,再构建位置信息和单元值之间的映射关系,最后根据每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码,由于针对了确定出了多单元格合并区域和非合并区域,因此,不需要对原excel表格进行大量的改造,简单方便,实现了简化电子表格转换网页代码操作的目的。进而解决了电子表格转换网页代码时需要进行大量改造,使用繁琐的技术问题。
基于相同的技术构思,本申请还提供了一种网页代码转换装置,图4是本申请实施例提供的一种网页代码转换装置的结构示意图,如图4所示,包括:
获取模块10,获取待转换的电子表格文件;
提取模块20,用于确定所述电子表格文件中每个单元区域和每个单元区域的类型,对于每个所述单元区域,基于对应的所述类型提取该单元区域的位置信息和单元值,其中,所述单元区域的类型包括多单元格合并区域和非合并区域;
映射模块30,用于将每个所述单元区域对应的所述位置信息和所述单元值之间构建映射关系;
转换模块40,用于将所述每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码,从而得到所述电子表格文件对应的网页代码文件。
可选地,转换模块40,用于:
对每个单元区域的所述位置信息、所述单元值和映射关系进行遍历,以根据映射关系将所述每个单元区域的所述位置信息和所述单元值生成包含tr/td的表格信息,从而将所述表格信息作为指定格式的所述网页代码。
可选地,当所述单元区域的类型为多单元格合并区域时,提取模块20,用于:
将所述多单元格合并区域中左顶角首个单元格对应的单元值作为该单元区域的单元值,以及
生成包含所述多单元格合并区域中每个单元格的位置信息以及所述多单元格合并区域的行列信息。
可选地,当所述单元区域的类型为多单元格合并区域时,转换模块40,用于:
根据所述单元区域的映射关系将所述的多单元格合并区域的行列信息生成所述单元区域对应的表格行列信息,从而将所述表格行列信息作为指定格式的所述网页代码。
可选地,所述单元值包括样式信息和占位符信息。
可选地,当所述单元值为样式信息,将所述样式信息转换为css代码,从而将所述css代码作为指定格式的所述网页代码。
可选地,当所述单元值为占位符信息时,将所述占位符信息转换为类名。
可选地,本申请提供了一种网页代码转换装置,还包括:
生成模块,用于将所述每个单元区域的所述位置信息、所述单元值和映射关系汇总,生成json文件。
基于相同的技术构思,本申请还提供了一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行上述任一项所述的网页代码转换方法。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
1.一种网页代码转换方法,其特征在于,所述方法包括:
获取待转换的电子表格文件;
确定所述电子表格文件中每个单元区域和每个单元区域的类型,对于每个所述单元区域,基于对应的所述类型提取该单元区域的位置信息和单元值,其中,所述单元区域的类型包括多单元格合并区域和非合并区域;
将每个所述单元区域对应的所述位置信息和所述单元值之间构建映射关系;
将所述每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码,从而得到所述电子表格文件对应的网页代码文件。
2.根据权利要求1所述的网页代码转换方法,其特征在于,所述将所述每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码包括:
对每个单元区域的所述位置信息、所述单元值和映射关系进行遍历,以根据映射关系将所述每个单元区域的所述位置信息和所述单元值生成包含tr/td的表格信息,从而将所述表格信息作为指定格式的所述网页代码。
3.根据权利要求2所述的网页代码转换方法,其特征在于,当所述单元区域的类型为多单元格合并区域时,所述基于对应的所述类型提取该单元区域的位置信息和单元值,包括:
将所述多单元格合并区域中左顶角首个单元格对应的单元值作为该单元区域的单元值,以及
生成包含所述多单元格合并区域中每个单元格的位置信息以及所述多单元格合并区域的行列信息。
4.根据权利要求3所述的网页代码转换方法,其特征在于,当所述单元区域的类型为多单元格合并区域时,该方法还包括:
根据所述单元区域的映射关系将所述的多单元格合并区域的行列信息生成所述单元区域对应的表格行列信息,从而将所述表格行列信息作为指定格式的所述网页代码。
5.根据权利要求1所述的网页代码转换方法,其特征在于,所述单元值包括样式信息和占位符信息。
6.根据权利要求4所述的网页代码转换方法,其特征在于,当所述单元值为样式信息,将所述样式信息转换为css代码,从而将所述css代码作为指定格式的所述网页代码。
7.根据权利要求4所述的网页代码转换方法,其特征在于,当所述单元值为占位符信息时,将所述占位符信息转换为类名。
8.根据权利要求1所述的网页代码转换方法,其特征在于,在所述将每个所述单元区域对应的所述位置信息和所述单元值之间构建映射关系之后,该方法还包括:
将所述每个单元区域的所述位置信息、所述单元值和映射关系汇总,生成json文件。
9.一种网页代码转换装置,其特征在于,包括:
获取模块,获取待转换的电子表格文件;
提取模块,用于确定所述电子表格文件中每个单元区域和每个单元区域的类型,对于每个所述单元区域,基于对应的所述类型提取该单元区域的位置信息和单元值,其中,所述单元区域的类型包括多单元格合并区域和非合并区域;
映射模块,用于将每个所述单元区域对应的所述位置信息和所述单元值之间构建映射关系;
转换模块,用于将所述每个单元区域的所述位置信息、所述单元值和映射关系转换成指定格式的网页代码,从而得到所述电子表格文件对应的网页代码文件。
10.一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行如权利要求1-8中任一项所述的网页代码转换方法。
技术总结