基于知识图谱的串标行为分析方法、终端设备及存储介质与流程

    专利2022-07-08  74


    本发明涉及招投标数据分析领域,尤其涉及基于知识图谱的串标行为分析方法、终端设备及存储介质。



    背景技术:

    串标也称为串通投标,通常是指招标投标行业中几个投标人之间相互约定,一致抬高或压低投标报价进行投标,通过限制竞争排挤其他投标人,使某个利益相关者中标,从而谋取利益的手段和行为。串标不仅扰乱了市场秩序,逃避了主管部门的监管,还直接伤害了其他投标人的合法权益。因此需要对串标行为进行鉴别。



    技术实现要素:

    为了解决上述问题,本发明提出了一种基于知识图谱的串标行为分析方法、终端设备及存储介质。

    具体方案如下:

    一种基于知识图谱的串标行为分析方法,包括以下步骤:

    s1:采集招投标公告数据;

    s2:对招投标公告数据进行预处理,识别其中的投标相关信息;

    s3:根据投标相关信息的参标单位,获取对应的参标单位信息;

    s4:根据投标相关信息和参标单位信息的关联关系构建知识图谱;

    s5:根据构建的知识图谱判断是否具有存在串标行为的可能性。

    进一步的,参标单位信息包括企业工商信息、企业法人和控股关系。

    进一步的,知识图谱包括:根据信息的类型设定三个类型的顶点,分别为:招投标公告顶点、企业信息顶点和人员顶点;根据三个类型的顶点设定了五个类型的边,分别为:参标边、中标边、控股边、法人边和高管边,其中:参标边从企业信息顶点指向招投标公告顶点,中标边从企业信息顶点指向招投标公告顶点,控股边从投资企业的企业信息顶点或投资人的人员顶点指向企业信息顶点,法人边从法人的人员顶点指向企业的企业信息顶点,高管边从高管的人员顶点指向企业的企业信息顶点。

    进一步的,知识图谱的构建过程包括以下步骤:

    s401:根据招投标公告数据建立招投标公告顶点;

    s402:根据参标单位和中标单位,建立企业信息顶点,并建立指向招投标公告顶点的对应的参标边以和中标边;

    s403:根据获取的参标单位信息,建立人员顶点,并建立指向企业信息顶点的对应的法人边和高管边;

    s404:如果获取的参标单位信息中包括控股关系,则根据控股关系建立对应的企业信息顶点和人员顶点,并建立指向被投资企业对应的企业信息顶点的控股边;

    s405:重复步骤s401~s404,直到知识图谱构建完毕。

    进一步的,步骤s5中串标行为的判断方法包括:针对每个招投标公告顶点,查出该招投标公告顶点对应的所有的关联顶点,如果其中有多个企业信息顶点具有相同的人员顶点,或有多个企业信息顶点存在关联的控股边,则判定上述多个企业信息顶点对应的企业存在串标行为的可能性。

    进一步的,步骤s5中串标行为的判断方法包括:如果存在关联到多个招投标公告顶点却没有任何一条边为中标边的企业信息顶点,则判定该企业信息顶点对应的企业存在串标行为的可能性;如果与该企业信息顶点关联的招投标公告顶点中具有其他企业信息顶点,则判定上述企业信息顶点对应的企业存在串标行为的可能性。

    进一步的,步骤s5中串标行为的判断方法包括:如果有某个人员顶点具有多个关联到不同企业信息顶点的法人边,且关联到的企业信息顶点关联到相同的招投标公告顶点,则判定上述企业信息顶点对应的企业存在串标行为的可能性。

    进一步的,步骤s5中串标行为的判断方法包括:如果两个或两个以上同时关联到多个人员顶点的企业信息顶点中,如果只有一个企业顶点具有中标边,则判定上述企业信息顶点对应的企业存在串标行为的可能性。

    一种基于知识图谱的串标行为分析终端设备,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例上述的方法的步骤。

    一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述的方法的步骤。

    本发明采用如上技术方案,将文本处理和知识图谱等相关技术用于招投标数据分析,实现了从招投标公告数据中分析疑似串标行为,为招标单位或企业提供了参考。

    附图说明

    图1所示为本发明实施例一的流程图。

    图2所示为该实施例中知识图谱的示意图。

    图3所示为该实施例中知识图谱存在串标行为可能的示意图。

    具体实施方式

    为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。

    现结合附图和具体实施方式对本发明进一步说明。

    实施例一:

    本发明实施例提供了一种基于知识图谱的串标行为分析方法,如图1所示,其为本发明实施例所述的基于知识图谱的串标行为分析方法的流程图,所述方法包括以下步骤:

    s1:采集招投标公告数据。

    该实施例中通过对互联网爬虫采集的招投标公告信息进行格式化处理,作为招投标公告数据。

    s2:对招投标公告数据进行预处理,识别其中的投标相关信息。

    该实施例中投标相关信息包括公告所在网站、标的、采购单位、代理机构、参标单位、中标单位以及涉及的人员信息等,在其他实施例中也可以包括其他信息,在此不做限制。

    s3:根据投标相关信息的参标单位,获取对应的参标单位信息。

    该实施例中通过互联网获取参标单位的一些基本信息,例如企业法人、企业工商信息(如企业高管的人员名称)以及控股关系(如企业的母公司、子公司)。

    s4:根据投标相关信息和参标单位信息的关联关系构建知识图谱。

    该实施例中知识图谱包括:

    (1)根据信息的分类,定义以下三个类型的顶点,顶点的属性可根据应用需要进行设定:

    bid-vertex:招投标公告顶点。

    enterprise-vertex:企业信息顶点。

    person-vertex:人员顶点。

    (2)根据三个类型的顶点设定以下五个类型的边,边的属性可根据应用需要进行设定:

    in-bid-edge:参标边,从enterprise-vertex指向bid-vertex。

    win-bid-edge:中标边,从enterprise-vertex指向bid-vertex。

    invest-edge:控股边,从投资企业enterprise-vertex或投资人person-vertex指向被投资企业enterprise-verttex。

    legalperson-edge:法人边,从法人person-vertex指向企业enterprise-vertex。

    staff-edge:高管边,从高管person-vertex指向企业enterprise-vertex。

    基于上述的知识图谱结构,该实施例中知识图谱的构建过程包括以下步骤:

    s401:根据招投标公告数据建立招投标公告顶点;

    s402:根据参标单位和中标单位,建立企业信息顶点,并建立指向招投标公告顶点的对应的参标边以和中标边;

    s403:根据获取的参标单位信息,建立人员顶点,并建立指向企业信息顶点的对应的法人边和高管边;

    s404:如果获取的参标单位信息中包括控股关系,则根据控股关系建立对应的企业信息顶点和人员顶点,并建立指向被投资企业对应的企业信息顶点的控股边;

    s405:重复步骤s401~s404,直到知识图谱构建完毕,如图2所示。

    s5:根据构建的知识图谱判断是否具有存在串标行为的可能性。

    串标行为分为以下3种形式:

    a)邀请其他陪标单位同时投标,增大自己的中标几率;

    b)几家单位联合,轮流坐庄排挤其他投标单位;

    c)同一个人同时挂靠若干家单位参加投标。

    该实施例中提出下述四种判定方式:

    (1)针对每个招投标公告顶点,查出该招投标公告顶点对应的所有的关联顶点,如果其中有多个企业信息顶点具有相同的人员顶点,或有多个企业信息顶点存在关联的控股边,则判定上述多个企业信息顶点对应的企业存在串标行为的可能性。

    如图3所示,某企业a与某企业b存在投资关系,且他们都关联到了同一个招投标公告顶点,即存在串标行为的可能性。

    具体操作中,可针对所有的招投标公告顶点进行逐个分析,取出一个招投标公告顶点,对每一个与之相关联的企业信息顶点,查出企业信息顶点子树中所有的人员顶点以及控股边,并与其它企业信息顶点子树中的顶点以及边进行碰撞,查找是否有相同的人员顶点或控股边,以此进行分析。

    (2)如果存在关联到多个招投标公告顶点却没有任何一条边为中标边的企业信息顶点,表示该企业多次参与招投标却从不中标,则判定该企业信息顶点对应的企业存在串标行为的可能性;如果与该企业信息顶点关联的招投标公告顶点中具有其他企业信息顶点,则判定上述企业信息顶点对应的企业存在串标行为的可能性。

    查询时使用的gremlin查询语句为:g.v().haslabel(‘enterprise-vertex’).where(oute(‘in-bid-edge’).count().is(gte(4)).and().oute(‘win-bid-edge’).count().is(0));该查询语句为查出所有含有4条以上参标边并且没有中标边的企业信息顶点。

    (3)如果有某个人员顶点具有多个关联到不同企业信息顶点的法人边,且关联到的企业信息顶点关联到相同的招投标公告顶点,则判定上述企业信息顶点对应的企业存在串标行为的可能性。

    查询时使用的gremlin查询语句为:g.v().haslabel(‘person-vertex’).filter(oute(‘legalperson-edge’).countt().is(gte(2))).out().oute();该查询语句为查出所有含有2条以上法人边的人员顶点所关联的企业信息顶点。

    (4)如果两个或两个以上同时关联到多个人员顶点的企业信息顶点中,如果只有一个企业顶点具有中标边,则判定上述企业信息顶点对应的企业存在串标行为的可能性。

    本发明实施例一提供的基于知识图谱的串标行为分析方法将文本处理和知识图谱等相关技术用于招投标数据分析,实现了从招投标公告数据中分析疑似串标行为,为招标单位或企业提供了参考。

    实施例二:

    本发明还提供一种基于知识图谱的串标行为分析终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例一的上述方法实施例中的步骤。

    进一步地,作为一个可执行方案,所述基于知识图谱的串标行为分析终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述基于知识图谱的串标行为分析终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,上述基于知识图谱的串标行为分析终端设备的组成结构仅仅是基于知识图谱的串标行为分析终端设备的示例,并不构成对基于知识图谱的串标行为分析终端设备的限定,可以包括比上述更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述基于知识图谱的串标行为分析终端设备还可以包括输入输出设备、网络接入设备、总线等,本发明实施例对此不做限定。

    进一步地,作为一个可执行方案,所称处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述基于知识图谱的串标行为分析终端设备的控制中心,利用各种接口和线路连接整个基于知识图谱的串标行为分析终端设备的各个部分。

    所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述基于知识图谱的串标行为分析终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据手机的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

    本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述方法的步骤。

    所述基于知识图谱的串标行为分析终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)以及软件分发介质等。

    尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。


    技术特征:

    1.一种基于知识图谱的串标行为分析方法,其特征在于,包括以下步骤:

    s1:采集招投标公告数据;

    s2:对招投标公告数据进行预处理,识别其中的投标相关信息;

    s3:根据投标相关信息的参标单位,获取对应的参标单位信息;

    s4:根据投标相关信息和参标单位信息的关联关系构建知识图谱;

    s5:根据构建的知识图谱判断是否具有存在串标行为的可能性。

    2.根据权利要求1所述的基于知识图谱的串标行为分析方法,其特征在于:参标单位信息包括企业工商信息、企业法人和控股关系。

    3.根据权利要求1所述的基于知识图谱的串标行为分析方法,其特征在于:知识图谱包括:根据信息的类型设定三个类型的顶点,分别为:招投标公告顶点、企业信息顶点和人员顶点;根据三个类型的顶点设定了五个类型的边,分别为:参标边、中标边、控股边、法人边和高管边,其中:参标边从企业信息顶点指向招投标公告顶点,中标边从企业信息顶点指向招投标公告顶点,控股边从投资企业的企业信息顶点或投资人的人员顶点指向企业信息顶点,法人边从法人的人员顶点指向企业的企业信息顶点,高管边从高管的人员顶点指向企业的企业信息顶点。

    4.根据权利要求3所述的基于知识图谱的串标行为分析方法,其特征在于:知识图谱的构建过程包括以下步骤:

    s401:根据招投标公告数据建立招投标公告顶点;

    s402:根据参标单位和中标单位,建立企业信息顶点,并建立指向招投标公告顶点的对应的参标边以和中标边;

    s403:根据获取的参标单位信息,建立人员顶点,并建立指向企业信息顶点的对应的法人边和高管边;

    s404:如果获取的参标单位信息中包括控股关系,则根据控股关系建立对应的企业信息顶点和人员顶点,并建立指向被投资企业对应的企业信息顶点的控股边;

    s405:重复步骤s401~s404,直到知识图谱构建完毕。

    5.根据权利要求1所述的基于知识图谱的串标行为分析方法,其特征在于:步骤s5中串标行为的判断方法包括:针对每个招投标公告顶点,查出该招投标公告顶点对应的所有的关联顶点,如果其中有多个企业信息顶点具有相同的人员顶点,或有多个企业信息顶点存在关联的控股边,则判定上述多个企业信息顶点对应的企业存在串标行为的可能性。

    6.根据权利要求1所述的基于知识图谱的串标行为分析方法,其特征在于:步骤s5中串标行为的判断方法包括:如果存在关联到多个招投标公告顶点却没有任何一条边为中标边的企业信息顶点,则判定该企业信息顶点对应的企业存在串标行为的可能性;如果与该企业信息顶点关联的招投标公告顶点中具有其他企业信息顶点,则判定上述企业信息顶点对应的企业存在串标行为的可能性。

    7.根据权利要求1所述的基于知识图谱的串标行为分析方法,其特征在于:步骤s5中串标行为的判断方法包括:如果有某个人员顶点具有多个关联到不同企业信息顶点的法人边,且关联到的企业信息顶点关联到相同的招投标公告顶点,则判定上述企业信息顶点对应的企业存在串标行为的可能性。

    8.根据权利要求1所述的基于知识图谱的串标行为分析方法,其特征在于:步骤s5中串标行为的判断方法包括:如果两个或两个以上同时关联到多个人员顶点的企业信息顶点中,如果只有一个企业顶点具有中标边,则判定上述企业信息顶点对应的企业存在串标行为的可能性。

    9.一种基于知识图谱的串标行为分析终端设备,其特征在于:包括处理器、存储器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~8中任一所述方法的步骤。

    10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1~8中任一所述方法的步骤。

    技术总结
    本发明涉及基于知识图谱的串标行为分析方法、终端设备及存储介质,该方法中包括:S1:采集招投标公告数据;S2:对招投标公告数据进行预处理,识别其中的投标相关信息;S3:根据投标相关信息的参标单位,获取对应的参标单位信息;S4:根据投标相关信息和参标单位信息的关联关系构建知识图谱;S5:根据构建的知识图谱判断是否具有存在串标行为的可能性。本发明将文本处理和知识图谱等相关技术用于招投标数据分析,实现了从招投标公告数据中分析疑似串标行为,为招标单位或企业提供了参考。

    技术研发人员:江明臻;陈镇国;俞碧洪;蓝少泽
    受保护的技术使用者:厦门市美亚柏科信息股份有限公司
    技术研发日:2020.12.15
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-21571.html

    最新回复(0)