本发明涉及交通管理、智能导航中的车辆轨迹预测领域,尤其涉及一种基于时空结构因果模型的场景融合下轨迹预测方法。
背景技术:
1、近年来,轨迹预测在移动性分析和应用领域引起了广泛关注。随着移动设备和传感器技术的快速发展,轨迹预测旨在基于历史轨迹数据预测未来的移动模式。这项技术在交通管理、智能导航、自动驾驶和物流规划等各个领域都有广泛应用。
2、然而,由于轨迹数据的复杂性和不确定性,轨迹预测面临许多挑战。幸运的是,在车辆轨迹预测方面已经存在很多工作,再加上hd maps为轨迹预测提供的丰富的上下文场景,轨迹预测目前已经取得了很好的进展。
3、轨迹预测方法大致可分为传统轨迹预测方法和数据驱动轨迹预测方法。前者利用概率和统计模型来预测目标在不同运动模式下的概率,或者直接利用运动学模型进行预测。后者利用深度学习技术从大量现有轨迹数据中学习轨迹特征及其交互行为,然后利用学习到的模型进行预测。
4、deo等(convolutional social pooling for vehicle trajectory prediction,2018,1468-1476)提出一种使用卷积社交池作为lstm编码器-解码器模型上社交池层的升级版本,稳健地学习车辆运动的相互依赖性。pecher等(data-driven vehicle trajectoryprediction,2016,13-22)提出了一种增加了马尔可夫模型和神经网络模型的阶数的方法,以增强轨迹预测的准确性。schmid等(encoding hd maps and agent dynamics fromvectorized representation,2020,11525-11533)提出了vectornet,将矢量化地图引入轨迹预测,大量工作开始围绕矢量地图展开。m.wang等(goal area network for motionforecasting,2023)通过设计端点附近小范围内的信息融合来增强未来的交互信息。zikang zhou等(query-centric trajectory prediction,2023,17863-17873)提出了一种以查询为中心的全局时空表示。gilles等(graph-oriented heatmap output for futuremotion estimation,2022,9107-9114)提出一种对历史和本地上下文进行编码后解码并输出热图的方法。gorela等(go relative for viewpoint-invariant motion forecasting,2022)提出了一种成对相对位置编码的方法,这种视点不变的方法使得学习更加高效。sakaridis等(real-time motion prediction via heterogeneous polylinetransformer with relativepose encoding,2023)提出了一种在transformer的强大表示下,让成对位置表示的方法表现出更强的性能的方法。park等(leveraging futurerelationship reasoning for vehicle trajectory prediction,2022)等更关注未来的车辆交互。
5、尽管这些模型通过将历史场景上下文集成到轨迹数据中提高了模型的预测能力,但它们没有提供正式的解释,导致无法发现限制模型性能的根本原因。因此,设计出能够解释场景上下文在轨迹预测中带来性能提升的真正原因,分析限制模型性能的混杂路径干扰的轨迹预测方法成为本领域技术人员亟待解决的技术问题。
技术实现思路
1、本发明的目的在于提供一种基于时空结构因果模型的场景融合下轨迹预测方法。将因果推理引入轨迹预测中,应用基于因果干预的前门准则来消除特征提取过程中的混杂偏差,确保模型能够更加公平地将每个场景上下文情况融入到轨迹数据时空特征中。
2、本发明采用的技术方案是:
3、一种基于时空结构因果模型的场景融合下轨迹预测方法,其包括步骤:
4、s1、定义一个结构因果模型,通过前门准则消除特征提取过程中的混杂路径;
5、s2、构建嵌入动态时空因果关系的时空因果图,并通过一个时空因果图卷积来提取时空因果依赖关系;
6、s3、利用反事实推理表征方法,将轨迹的时空特征推演到未来交通场景中来进行轨迹预测得到预测结果。
7、进一步地,步骤s1具体包括以下步骤:
8、s1-1、定义结构因果模型,得到结构因果图的四条路径如下:
9、xt→st→ht→yt+1
10、xt→tt→ht→yt+1
11、xt←ct→ht→yt+1
12、ht←ct+1→yt+1
13、其中,x表示来自数据集的轨迹数据,c表示场景上下文等外部因素,s表示轨迹空间特征,t表示轨迹时序特征,h表示高度耦合的轨迹时空特征,y表示模型的预测结果,下标t表示当前的时刻;
14、s1-2、定义轨迹预测任务,预测未来车辆的一段轨迹表示为:
15、p(y|xt)=∑hp(y|h)p(h|x) (1);
16、其中,p(h|x)表示编码器提取时空因果特征的过程,p(y|h)表示解码器的轨迹解码过程;
17、s1-3、引入前门准则切断轨迹输入数据x和时空特征h之间存在的虚假的关联,对变量x进行因果干预操作消除特征提取过程中的混杂路径。
18、进一步地,步骤s1-3中对变量x进行因果干预操作后模型提取时空特征的过程表示为:
19、
20、其中,p(x′t)表示对x的干预,p(st,tt|xt)表示从输入的带有噪声的数据中提取时空特征的过程,p(ht|st,tt,x′t)表示从特征中产生随着时间改变的潜在时空状态表示。
21、进一步地,步骤s2的具体包括以下步骤:
22、s2-1、引入特征融合网络将场景上下文特征融入到轨迹特征中,并将轨迹特征序列利用lstm网络进行特征嵌入得到对应的特征嵌入hj∈rn×d,具体的表达式如下:
23、hj=lstm(trajhis)∈rn×d (3);
24、其中,trajhis=jt,jt-1,...,j1表示为自动驾驶车辆的历史轨迹序列,jt(p,h,v,ts)是描述自动驾驶车辆位置和状态的四元组;p={x,y}表示车辆在当前时刻的位置坐标;h表示车辆在当前时刻的朝向;v={vx,vy}表示车辆在当前时刻沿着x方向的瞬时速度vx和y方向的瞬时速度vy大小;ts是描述当前时刻的时间戳;rn×d表示n×d实数域的矩阵,即轨迹序列矩阵;n表示矩阵的行数,对应于轨迹序列的长度;d表示维度,即每个轨迹序列被嵌入到一个d维的向量空间中;
25、s2-2、利用车道图卷积方法将车道线节点信息进行卷积聚合,左右节点卷积操作只进行一次,前续和后继节点卷积操作进行k次,因此提取地图的语义信息h(c)表示:
26、
27、其中,c是车道节点特征,m是车道节点数量,apre是表示pre类型关系的邻接矩阵;是表示i类型矩阵的k次方;w是可训练的参数;k表示膨胀卷积的阶数;pre表示前续、suc表示后继、left表示左邻和right表示右邻,四种边连接关系表示车道线节点的拓扑结构;rm×d表示m×d实数域的矩阵;
28、s2-3、对于每个时刻的车辆i的轨迹特征表示针对道路节点j利用注意力融合的方式将场景上下文特征融入到车辆的轨迹特征中得到融合轨迹特征x′i,具体表达式如下:
29、
30、其中,w0,w1,w2是可训练的参数,δi,j是i和j两个节点之间的欧式距离差,σ是非线性激活函数relu的操作;
31、s2-4、将每一个时刻的特征x′t输入后,与上一个时刻的隐藏特征ht-1拼接起来,然后通过全连接层变换到it:
32、it=fc(x′t||ht-1)∈rn×d (6);
33、其中,x′t表示每一时刻t输入的特征,是一个n*d的矩阵;it表示在每个时刻t下得到的新特征表示,其包含了时间因果关系;fc表示全连接层,用于对输入进行线性变换;
34、s2-5、对每个节点的所有特征做全局平均池化得到对应组节点的重要性指标序列,再经过全连接层和sigmoid函数,得到每个取值都在(0,1)的门控因子α,计算过程如下:
35、
36、其中,是对it中的每个节点特征进行平均池化;d是特征维度d的个数;
37、it[:,c]表示it中的第c列,即t时刻每个节点在第c个特征维度上的取值;
38、s2-6、将门控因子α和特征it进行哈达马元素积,得到t时刻该节点的动态时空因果表征dstt:
39、dstt=it⊙α∈rn×d (8);
40、s2-7、通过自注意力机制将动态因果关系嵌入到动态时空因果图;
41、
42、其中,φ是tanh函数;
43、s2-8、车辆在环境中的交互关系用时空交互图gint(v,e,a)来表示,其中v为车辆和行人的集合,每个智能体视为一个节点;边e表示不同智能体之间是否存在交互行为;基于车辆之间存在的交互关系构建一个双向全连通图,具体表达式如下:
44、
45、s2-9、基于轨迹时空因果特征图adst和轨迹时空交互图aint构建时空因果交互卷积网络,以便融合因果特征和交互特征;
46、进一步地,s2-9中时空因果交互卷积网络的具体执行步骤如下:
47、s2-9-1、在t时刻,输入特征表示为:
48、
49、其中,x′是特征增强网络的输出,ht-1是上一个时刻传递到当前时刻的隐藏特征;
50、s2-9-2、将时空因果交互图卷积被定义为:
51、
52、其中,l表示层数;θ0,θ1,θ2三个权重系数是可学习的参数;
53、具体地,公式12通过时空因果图卷积网络(stcgcn)的计算(对轨迹和场景上下文的信息整合和更新),在模型中的操作与公式(2)中(对轨迹和场景上下文的各种概率分布的乘积)的对应部分是相似的,主要是为了构建整个模型的推断和训练过程。
54、s2-10、训练一个线性网络,线性网络对时空因果交互图卷积网络stcgcn输出提取特征,以将特征恢复到原来的特征维度:
55、
56、进一步地,步骤s2-8中根据当前时刻智能体之间的坐标位置计算智能体之间的欧氏距离,当距离小于一个阈值threshold时,认为两辆车或者智能体之间存在交互关系。
57、进一步地,阈值threshold设定为100。
58、进一步地,将编码器抽象为一个层层嵌套的gru网络结构,即因果时空自编码器,每一个编码器的细胞单元描述完整的因果干预效应效果p(ht|do(xt)),其中特征增强网络描述了p(x′),时空因果图卷积描述过程。
59、进一步地,步骤s2-10中所因果时空自编码器的结构因果单元计算过程如下:
60、rt=σ(θr*g(x′t||ht-1)+br)
61、zt=σ(θz*g(x′t||ht-1)+bz)
62、ht=σ(θr*g(x′t||rt⊙ht-1)+bh)
63、ht=zt⊙ht-1+(1-zt)⊙ht
64、其中,⊙是哈达马积,即按元素相乘;θr,θz,θh,br,bz,bh均为可学习的参数,*g是上面公式定义的gigcn卷积过程;ht是t时刻结构因果单元的时空状态;rt是门控变量,用于控制要更新的信息,称为重置门;zt是另一个门控变量,用于控制新的候选信息要更新到当前隐藏状态的程度,称为更新门;ht是一个候选隐藏状态,根据当前输入和重置门计算得到的。
65、进一步地,所述步骤s3的具体步骤如下:
66、s3-1、利用在事实场景下的轨迹数据xt,计算反事实场景ct+1下的未来轨迹得到:
67、
68、其中,p(h′t|xt,ct+1)表示反事实推理过程,表示基于反事实表征的预测过程。
69、s3-2、将当前轨迹对应的全局场景上下文cg,利用自注意力机制计算每个道路节点上场景上下文的相似度;在反事实推理过程中利用注意力矩阵将编码器的输出变换为解码器的输入;反事实表征推理模块的公式为:
70、q=cgwq∈rm×d;
71、k=cgwk∈rm×d;
72、v=hhiswv;
73、s3-3、计算得到解码器的输入hpred:
74、
75、其中,d是特征维度,wq,wk,wv是三组可训练的参数,是注意力聚合方式。
76、s3-4、解码器基于轨迹特征在场景上下文节点上的表征变换输出预测结果。
77、进一步地,表征变换指的是对轨迹特征的变换操作,将原始的轨迹特征通过一定的方式转换为在场景上下文节点上的新表示。在这里,通过注意力矩阵cg对编码器的输出进行加权,得到了新的表示q、k、v。这种变换的目的是将轨迹特征与场景上下文相结合,以便在解码器中更好地进行预测或生成。
78、本发明采用以上技术方案,具有的有益效果为:提出了基于因果推理的轨迹预测结构因果模型,解释了场景上下文在轨迹预测中带来性能提升的真正原因,分析了限制模型性能的混杂路径干扰。在两个真实世界的数据集上实验验证了提出这种端到端方法在真实交通场景,尤其是多代理之间交互场景下的有效性和鲁棒性。
1.一种基于时空结构因果模型的场景融合下轨迹预测方法,其特征在于:其包括步骤:
2.根据权利要求1所述的一种基于时空结构因果模型的场景融合下轨迹预测方法,其特征在于:步骤s1具体包括以下步骤:
3.根据权利要求2所述的一种基于时空结构因果模型的场景融合下轨迹预测方法,其特征在于:步骤s1-3中对变量x进行因果干预操作后模型提取时空特征的过程表示为:
4.根据权利要求1所述的一种基于时空结构因果模型的场景融合下轨迹预测方法,其特征在于:步骤s2的具体包括以下步骤:
5.根据权利要求4所述的一种基于时空结构因果模型的场景融合下轨迹预测方法,其特征在于:步骤s2-8中根据当前时刻智能体之间的坐标位置计算智能体之间的欧氏距离,当距离小于一个阈值threshold时,认为两辆车或者智能体之间存在交互关系。
6.根据权利要求5所述的一种基于时空结构因果模型的场景融合下轨迹预测方法,其特征在于:阈值threshold设定为100。
7.根据权利要求4所述的一种基于时空结构因果模型的场景融合下轨迹预测方法,其特征在于:将编码器抽象为一个层层嵌套的gru网络结构,即因果时空自编码器,每一个编码器的细胞单元描述完整的因果干预效应效果p(ht|do(xt)),其中特征增强网络描述了p(x′),时空因果图卷积描述过程。
8.根据权利要求4或7所述的一种基于时空结构因果模型的场景融合下轨迹预测方法,其特征在于:步骤s2-10中所因果时空自编码器的结构因果单元计算过程如下:
9.根据权利要求1所述的一种基于时空结构因果模型的场景融合下轨迹预测方法,其特征在于:所述步骤s3的具体步骤如下: