一种基于图神经网络的超图传染病传播过程预测方法

    专利2025-06-12  57


    本发明属于网络信息分析,具体涉及一种基于图神经网络的超图传染病传播过程预测方法。


    背景技术:

    1、通过对covid-19全球大流行的研究和流行病学调查,研究者发现,病毒传播已经不再是单一的个体感染个体过程,而是出现明显的聚集性感染,如以家庭、学校、公司为单位的场所性聚集感染;也就是说病毒传播是具有群体性的。同时,随着全球分工与合作的进一步加深,这种群体性的现象也出现在生活中的很多场景,比如同辈压力和公司间的市场竞争等等;网络科学领域将这种现象称为高阶交互。高阶交互是一种超出传统的单对单,单对多,多对单甚至多对多的交互的高阶形式。因为,我们无法简单判断群体里中哪些个体发生了哪些交互,参考文献[1]证明了高阶交互无法用传统的二者交互关系进行简化,因此,高阶交互也就无法用传统的图结构来刻画;为了更为准确地描述高阶交互关系,网络科学邻域引入了超图这种能够描述更加复杂的个体间关系的网络结构。

    2、因为超图具有复杂的空间关系,所以其是一种更加适合对现实的传染病传播进行建模的数据结构。由于超图上的高阶结构可以加速或者阻碍病毒的传播,需要对高阶上的传染病传播的动力学过程进行重新建模,构建超图上的传染病传播模型,如超图sis模型。尽管目前已有的超图上的传播模型对于理解超图的一些性质具有很好的助力,但也引入了新的计算复杂度;新的复杂度的出现使得模型求解需要更全面更复杂的数据或者引入额外的假设,这些手段往往又限制了超图动力学模型对现实情况的应用而无法取得预期的效果。总之,超图是一种能很好对现实传染病传播建模的工具,但是当前阶段缺乏一种能够很好的利用超图复杂特性从而对传染病传播进行准确预测的手段,所以亟需寻找一种可以完成该项工作的方法。

    3、近些年来,使用机器学习的方法去处理具有复杂形式的数据成为新的研究方向,超图传染病传播就是这样一种具有复杂形式的数据。在所有的机器学习方法中,深度学习方法,特别是基于图的图神经网络(graph neural networks,gnns)方法已经成功应用于现实的传染病传播的预测;通过已经成功运用的图神经网络去预测超图上的动力学传播问题便是一种最直接的想法。此外,当前的一些研究也尝试重新设计适用于超图的图神经网络,称为超图神经网络(hypergraph neural networks,hgnn),但是,超图神经网络最初是为了超图的结构学习设计,如链路预测等;其是否能够应用于超图的动力学研究目前尚未得到确认;另外超图神经网络具有更为复杂的结构,训练该类网络也就更为困难。若是直接使用已经成功运用的图神经网络结构进行超图动力学的预测,一方面能够扩展图神经网络的应用范围,另一方面也不用引入重新设计超图神经网络的额外难度。

    4、通过对超图的特性和超图上的传染病传播这一动力学过程的研究,本发明提供一种将超图投影为低阶带权图的方法,并设计了能够从低阶带权图上重构超图信息的图神经网络算法,实现对超图上传播动力学过程的预测。


    技术实现思路

    1、本发明的目的在于提供预测准确性较高、运算工作量较低的基于图神经网络的超图传染病传播过程预测方法,以实现预测具有超图结构的实际网络上的传染病传播过程。

    2、本发明提供的基于图神经网络的超图传染病传播过程预测方法,主要是构建一种超图动力学图神经网络(hypergraph dynamic graph neural network,hgd-gnn);为了能够在超图上使用hgd-gnn,相比于图神经网络,引入了一些改变;首先,hgd-gnn在图神经网络中引入了时间维度的特性提取模块;其次,由于算法中的低阶有向图的边权特性是通过超图投影而来的,因此,边权特性与节点特性应该具有同等重要的地位,所以本发明引入边权特性伴随着节点特性的同步更新模块;最后,hgd-gnn中引入有效传播率μ作为算法的约束条件:节点特性x是超图中所有的节点在有效传播率μ=λ/δ下经过传播过程产生的,其中λ表示超图中处于易感态的节点vi被包含该节点的超边ej∈εi中处于感染态节点感染的概率,δ表示处于感染态的节点恢复到易感态的概率;因此,hgd-gnn中引入有效传播率μ,作为除了下一时刻超图中的感染节点数目y之外的第二个标签,以约束算法使其能够快速收敛。基于以上的设计,本发明能够基于超图传播过程准确预测下一个时刻超图中处于感染态的节点数目。

    3、本发明设计的hgd-gnn包括四个模块:

    4、超图投影模块:将一个超图按照其邻接矩阵投影成为一个低阶带权图,用邻接矩阵adj和连边特性向量ea表示;

    5、空间信息模块:通过修改的图注意力网络(graph attention networks,gats),称为多层图注意力网络(multi-layer-gat),实现从投影矩阵adj、边权特性ea和节点特性x重构超图中节点之间的空间关系;

    6、时间信息模块:通过使用长短时信息门(long short-term memory,lstm)去捕获节点特性x中的时域信息;

    7、下游任务模块:通过使用多层感知机(multi-layer perceptron,mlp)进行最终感染节点的预测和有效传播率μ的预测。

    8、基于以上四个模块,本发明提供的基于图神经网络的超图传染病传播过程预测方法,具体步骤为:

    9、步骤1:超图到低阶带权图的投影与超图动力学时序采样;

    10、一个包含n个节点和m条超边的超图表示为其中表示节点集,ε={e1,e2,…,em}表示超边集;第j条超边ej是节点集的子集,即用|ej|表示第j条超边包含的节点数目,其中|·|表示获取集合中元素的数目。此外,定义表示包含节点vi的所有超边组成的集合;定义超图的邻接矩阵a来表征不同节点之间总体的空间关联程度,其第i行k列元素为:

    11、

    12、其中,i≠k且对所有的i都满足aii=0,aik是a中的元素。

    13、本步骤的具体流程为:

    14、步骤1-1:将超图投影成为一个由邻接矩阵adj和边权特性向量ea组成的低阶带权图。邻接矩阵adj是n行n列的只包含0和1的矩阵,若是其第i行j列的元素adji,j=0表示节点vi和节点vj之间不存在连边;若adji,j=1,则表示vi与节点vj之间存在一条连边ei,j,该连边的权重为wi,j=aij;按照先行后列的顺序依次获取adj中值为1位置的权重,所有的权重组成边权特性向量ea;

    15、步骤1-2:在超图中统计节点的感染状态随时间的变化,将已经处于感染状态的节点记录为1,处于易感状态的节点记录为0;从t=0时刻开始,每间隔δt时刻进行一次采样,记录节点的感染状态,表示为直到t=tmax,记录采样的次数为t,其中f表示节点的特征,若是只记录了感染状态则为1,表示实数域;将所有的采样组合成为一个张量形式作为算法的输入,对t=tmuax+δt时刻继续采样,此时超图中的感染节点数目y作为训练神经网络的标签。

    16、步骤2:由多层图注意力网络(graph attention networks,gats)从步骤1-1的低阶投影图中重构超图的空间信息;具体流程为:

    17、步骤2-1:计算节点与节点之间的注意力系数αi,j,计算式为:

    18、

    19、其中,xi,xj和xk分别表示节点特性x的第i,j,k个元素,wi,j是边特性ea中对应投影边ei,j的权重大小,leakyrelu(·)表示非线性激活函数leakyrelu,exp(·)表示指数函数,表示在与节点vi相邻的节点,即邻接矩阵adj中第i行元素为1对应的节点,at和θ是为了进行线性变换引入的可训练矩阵,且满足和f1是当前输入的节点特性x或边权特性ea的维度,f2为线性变换之后的输出维度,在训练算法时需要不断调整;

    20、步骤2-2:通过注意力系数,对节点特性和边权特性分别做如下变换:

    21、

    22、ea′=φ(ea||α),                                             (4)

    23、其中,||表示将两个向量组合,α表示所有的注意力系数αi,j组成的向量,φ表示对边权特性进行线性变换的矩阵,满足其中f1为当前的边权特性维度,f2为变换之后的边权特性维度。

    24、步骤3:对经过步骤2之后的节点特性通过长短时记忆门(long short-termmemory,lstm)提取超图动力学传播过程中的时序信息;具体流程为:

    25、步骤3-1:对步骤2输出的节点特征做最大池化变换,提取节点特性中的部分特性作为超图的空间信息,表示为:

    26、x″=maxpool(x′),                               (5)

    27、其中,表示多层图注意力网络的输出的节点特性,f″表示输出的特性维度,表示最大池化之后的输出;

    28、步骤3-2:对步骤3-1之后的输出使用长短时记忆门提取超图传染病传播的时序特征,其表示为:

    29、x″′=lstm(x″),                                                  (6)

    30、使用最后一个时刻的特征作为该部分的输出;其中f″′表示当前节点特征的维度。

    31、步骤4:对下一个时刻的超图感染节点数目做输出预测;具体流程为:

    32、步骤4-1:通过多层感知机(multi-layer perceptron,mlp)对下一时刻的感染节点数目进行预测,其表示为:

    33、xlast=mlp(x″′),                                                (7)

    34、其中,表示最后的输出包含两个值,分别为下一个时刻的超图中的感染节点数目的预测和有效传播率的预测其中有效传播率μ定义为个体的传播概率λ和康复概率δ的比值,即μ=λ/δ;

    35、步骤4-2:通过损失函数对模型进行优化,损失函数的定义为:

    36、

    37、其中,平均绝对值误差,使用了均方对数误差(msle),可以表示为:

    38、

    39、步骤4-3:将训练好的模型应用于对应的测试集。

    40、本发明的技术特点和性能优势主要有:

    41、(1)将超图投影为带权图,使用图神经网络去重构超图的空间关系,这使得已经成功运用于动力学预测的图神经网络得以更进一步运用于超图传染病传播预测。

    42、(2)重新设计了图注意力网络的框架,平衡,节点特性x带时间维度而边权特性ea不带时间特性的差异。hgd-gnn算法中重新设计的图注意力网络,做到对两者信息的有效平衡。

    43、(3)重新设计的图注意力网络能在更新节点特性x的时候同步更新边权特性ea。因为边权特性ea是通过超图投影获取的,其与节点特性x具有同等重要的地位,hgd-gnn算法在更新节点特性的同时也更新了边权特性。

    44、(4)引入了有效传播率μ作为额外约束。超图传染的结果不仅仅与超图结构有关,还与有效传播率μ有关,为此hgd-gnn算法中引入有效传播率μ作为除了超图下一时刻的感染节点数目之外的标签作为训练标签,实现对算法的有效约束,使其能更快的收敛。


    技术特征:

    1.一种基于图神经网络的超图传染病传播过程预测方法,其特征在于,设计一种超图动力学图神经网络(hgd-gnn);为了能够在超图上使用hgd-gnn,相比于图神经网络引入了一些改变,包括,(1)引入时间维度的特性提取模块;(2)由于其中的低阶有向图的边权特性是通过超图投影而来的,边权特性与节点特性具有同等重要的地位,所以引入边权特性伴随着节点特性的同步更新模块;(3)引入有效传播率μ约束算法:节点特性x是超图中所有的节点在有效传播率μ=λ/δ下经过传播过程产生的,其中λ表示超图中处于易感态的节点vi被包含该节点的超边ej∈εi中处于感染态节点感染的概率,δ表示处于感染态的节点恢复到易感态的概率;hgd-gnn中引入有效传播率μ,作为除了下一时刻超图中的感染节点数目y之外的第二个标签,以约束算法使其能够快速收敛;根据以上设计,能够基于超图传播过程准确预测下一个时刻超图中处于感染态的节点数目;

    2.根据权利要求1所述的基于图神经网络的超图传染病传播过程预测方法,具体步骤为:


    技术总结
    本发明属于网络信息分析技术领域,具体为一种基于图神经网络的超图传染病传播过程预测方法。本发明包括:将用以表述超图结构的邻接矩阵投影成为低阶带权图形式,包含描述节点空间关系的低阶邻接矩阵和描述连边特性的连边权重两项;由多层图注意力网络算法从低阶带权图中重构节点在超图中的空间信息,并将其与带有时序信息的节点特征进行融合;通过长短时记忆门算法实现对节点特征中传染病传播的动力学特征提取;由多层感知机算法对下一时刻超图中被病毒感染的节点数目进行预测。本发明实现了由超图的低阶投影和低阶图神经网络算法预测超图中的传染病传播过程。

    技术研发人员:李聪,王武,曲博,李翔
    受保护的技术使用者:复旦大学
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-88116.html

    最新回复(0)