本发明属于计算机技术领域,特别涉及一种基于图片识别进行资产分类及准确度校验的方法和装置。
背景技术:
互联网上有成千上万个物联网设备,每个设备都有自己的特征及归属类别,有的设备名称中带有类别,有的设备只有产品名称为了方便管理就需要给它定位类别。资产数据是通过规则特征获取的,所以还需要确定获取到的资产是否一致。
现有技术中,资产分类是通过人工的方式进行划分类别及规则特征准确度校验的,这样费时又费力。
技术实现要素:
为了解决上述问题,本发明一方面提供了一种基于图片识别进行资产分类及准确度校验的方法,其包括:基于资产特征对数据资产进行扫描,得到扫描结果集;对所述扫描结果集中的部分扫描结果进行解析,获取各扫描结果的body部分并生成含有所述body部分的第一图片和资产访问页面截图;通过图像识别技术对所述第一图片和所述资产访问页面截图进行识别,得到资产产品信息,所述资产产品信息包括产品名称,并构建web搜索以定位出与所述产品名称对应的产品类型;通过对比所述第一图片和所述资产访问页面截图的得到的相似度来确定所述资产特征的准确度。
在如上所述的方法中,优选地,所述资产产品信息还包括:产品厂商;对应的,所述构建web搜索以定位出与所述资产产品名称对应的产品类型具体包括:通过基于所述产品厂商、所述产品名称和类别的关联算法三元组实现产品类型的分类。
在如上所述的方法中,优选地,通过随机方法从所述扫描结果集中采集出部分扫描结果。
另一方面提供一种基于图片识别进行资产分类及准确度校验的装置,其包括:扫描模块,用于基于资产特征对数据资产进行扫描,得到扫描结果集;解析和图片生成模块,用于对所述扫描结果集中的部分扫描结果进行解析,获取各扫描结果的body部分并生成含有所述body部分的第一图片和资产访问页面截图;类型确定模块,用于通过图像识别技术对所述第一图片和所述资产访问页面截图进行识别,得到资产产品信息,所述资产产品信息包括产品名称,并构建web搜索以定位出与所述产品名称对应的产品类型;校验模块,用于通过对比所述第一图片和所述资产访问页面截图的得到的相似度来确定所述资产特征的准确度。
在如上所述的装置中,优选地,所述资产产品信息还包括:产品厂商;对应的,所述构建web搜索以定位出与所述资产产品名称对应的产品类型具体包括:所述类型确定模块,用于通过基于所述产品厂商、所述产品名称和类别的关联算法三元组实现产品类型的分类。
在如上所述的装置中,优选地,通过随机方法从所述扫描结果集中采集出部分扫描结果。
本发明实施例提供的技术方案带来的有益效果是:
通过图片识别的方式进行自动化分类及准确度校验相对于通过人工的方式进行划分类别及规则特征准确度校验,可以节约时间、解放人力,提高用户的满意度。
附图说明
图1为本发明一实施例提供的一种基于图片识别进行资产分类及准确度校验的方法的流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
参见图1,本发明一实施例提供了一种基于图片识别进行资产分类及准确度校验的方法,其包括以下步骤:
步骤101,基于资产特征对数据资产进行扫描,得到扫描结果集。
数据资产包括的资产数据来源于网络空间测绘平台,数据类型包含body、ip。
步骤102,对扫描结果集中的部分扫描结果进行解析,获取各扫描结果的body部分并生成含有body部分的第一图片和资产访问页面截图。
实际应用中,可以将将获取资产相应结果的body并保存成的图片及资产访问页面截图分别放到不同的文件夹。
步骤103,通过图像识别技术对第一图片和资产访问页面截图进行识别,得到资产产品信息,资产产品信息包括产品名称,并构建web搜索以定位出与产品名称对应的产品类型;
优选地,资产产品信息还包括:产品厂商;对应的,构建web搜索以定位出与资产产品名称对应的产品类型具体包括:通过基于产品厂商、产品名称和类别的关联算法三元组实现产品类型的分类。
也就是说:通过图像识别识别出厂商,型号,构建新的web搜索,通过基于产品厂商、产品名称和类别的关联算法三元组,实现类型分类。实际应用中,可以用产品型号替代产品名称。
步骤104,通过对比第一图片和资产访问页面截图的得到的相似度来确定资产特征的准确度。
该步骤用于校验通过特征提取的产品是否准确,即通过图片识别技术得到结果集之间的相似度,来确定规则特征的准确性。。
优选地,通过随机方法从扫描结果集中采集出部分扫描结果。部分扫描结果的数量可以为50个。
本发明另一实施例提供了一种基于图片识别进行资产分类及准确度校验的装置,其包括:扫描模块、解析和图片生成模块、类型确定模块和校验模块。
其中,扫描模块用于基于资产特征对数据资产进行扫描,得到扫描结果集。解析和图片生成模块用于对扫描结果集中的部分扫描结果进行解析,获取各扫描结果的body部分并生成含有body部分的第一图片和资产访问页面截图。类型确定模块用于通过图像识别技术对第一图片和资产访问页面截图进行识别,得到资产产品信息,资产产品信息包括产品名称,并构建web搜索以定位出与产品名称对应的产品类型。校验模块用于通过对比第一图片和资产访问页面截图的得到的相似度来确定资产特征的准确度。
优选地,资产产品信息还包括:产品厂商;对应的,构建web搜索以定位出与资产产品名称对应的产品类型具体包括:类型确定模块,用于通过基于产品厂商、产品名称和类别的关联算法三元组实现产品类型的分类。
优选地,通过随机方法从扫描结果集中采集出部分扫描结果。
关于扫描模块、解析和图片生成模块、类型确定模块和校验模块的实现方式可参见上述实施例中步骤101~104的相关描述,此处不再一一赘述。
由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。
1.一种基于图片识别进行资产分类及准确度校验的方法,其特征在于,所述方法包括:
基于资产特征对数据资产进行扫描,得到扫描结果集;
对所述扫描结果集中的部分扫描结果进行解析,获取各扫描结果的body部分并生成含有所述body部分的第一图片和资产访问页面截图;
通过图像识别技术对所述第一图片和所述资产访问页面截图进行识别,得到资产产品信息,所述资产产品信息包括产品名称,并构建web搜索以定位出与所述产品名称对应的产品类型;
通过对比所述第一图片和所述资产访问页面截图的得到的相似度来确定所述资产特征的准确度。
2.根据权利要求1所述的方法,其特征在于,所述资产产品信息还包括:产品厂商;
对应的,所述构建web搜索以定位出与所述资产产品名称对应的产品类型具体包括:
通过基于所述产品厂商、所述产品名称和类别的关联算法三元组实现产品类型的分类。
3.根据权利要求1所述的方法,其特征在于,通过随机方法从所述扫描结果集中采集出部分扫描结果。
4.一种基于图片识别进行资产分类及准确度校验的装置,其特征在于,所述装置包括:
扫描模块,用于基于资产特征对数据资产进行扫描,得到扫描结果集;
解析和图片生成模块,用于对所述扫描结果集中的部分扫描结果进行解析,获取各扫描结果的body部分并生成含有所述body部分的第一图片和资产访问页面截图;
类型确定模块,用于通过图像识别技术对所述第一图片和所述资产访问页面截图进行识别,得到资产产品信息,所述资产产品信息包括产品名称,并构建web搜索以定位出与所述产品名称对应的产品类型;
校验模块,用于通过对比所述第一图片和所述资产访问页面截图的得到的相似度来确定所述资产特征的准确度。
5.根据权利要求4所述的装置,其特征在于,所述资产产品信息还包括:产品厂商;
对应的,所述构建web搜索以定位出与所述资产产品名称对应的产品类型具体包括:
所述类型确定模块,用于通过基于所述产品厂商、所述产品名称和类别的关联算法三元组实现产品类型的分类。
6.根据权利要求4所述的装置,其特征在于,通过随机方法从所述扫描结果集中采集出部分扫描结果。
技术总结