本技术涉及核聚变等离子体诊断领域,尤其涉及一种基于等离子体的反演代理模型训练方法及装置。
背景技术:
1、实现等离子体的稳定运行对于磁约束可控核聚变来说非常关键,而等离子体中的磁流体(简称mhd)会对等离子体的稳定运行造成干扰,导致等离子体放电不稳定或者放电失败。一般的,可对磁流体进行监控,并基于监控得到的磁流体信息给出相应的控制策略,以使得等离子可稳定运行。
2、目前,在等离子体诊断领域,可测量等离子体极向截面的软x波段辐射,再开发层析重建算法,从数量有限并且具有误差的线积分数据中,准确地反演代理出辐射的二维空间分布,以达到观芯部测mhd活动的目的。也就是说,在实现对磁流体的监控时,需要快速解析出等离子体的辐射分布剖面。因此如何基于等离子体产生的软x波段辐射,快速解析出等离子体的辐射分布剖面是一个重要问题。
3、基于此,本技术说明书提供了一种基于等离子体的反演代理模型训练方法。
技术实现思路
1、本说明书提供一种基于等离子体的反演代理模型训练方法、装置、存储介质及电子设备,以至少部分的解决现有技术存在的上述问题。
2、本说明书采用下述技术方案:
3、本说明书提供了一种基于等离子体的反演代理模型训练方法,反演代理模型包括第一特征提取层、第二特征提取层以及结果预测层,所述第二特征提取层包括具备残差连接结构的多头注意力网络以及具备残差连接结构的前向神经网络,所述第一特征提取层以及所述结果预测层均包括全连接层,所述方法包括:
4、获取采样信号序列,所述采样信号序列是预先在若干个采样时刻,对等离子体产生的软x射线进行采样得到的,并且每个采样时刻对应的采样信号序列是在若干个采样位置,对等离子体产生的软x射线进行采样得到的;并获取所述等离子体在每个采样时刻的辐射分布剖面标注;
5、将所述采样信号序列输入所述第一特征提取层,得到第一信号特征;
6、将所述第一信号特征输入所述第二特征提取层,以使所述具备残差连接结构的多头注意力网络对所述第一信号特征进行加权处理,并使所述具备残差连接结构的前向神经网络对每个采样时刻的第一信号特征进行特征提取,得到所述第二特征提取层输出的第二信号特征;
7、将所述第二信号特征输入所述结果预测层,得到所述结果预测层输出的每个采样时刻对应的第二信号特征的辐射分布剖面预测结果;
8、根据所述辐射分布剖面预测结果以及所述辐射分布剖面标注,确定损失;
9、根据所述损失,对所述反演代理模型进行训练。
10、可选地,将所述采样信号序列输入所述第一特征提取层,具体包括:
11、对所述采样信号序列进行预处理,将预处理后的采样信号序列输入所述第一特征提取层;其中,所述预处理包括:去除所述采样信号序列中的异常信号,和/或,补充所述采样信号序列中的缺失信号。
12、可选地,所述反演代理模型还包括第三特征提取层,所述第三特征提取层包括具备残差连接结构的多头注意力网络以及具备残差连接结构的前向神经网络;
13、将所述第二信号特征输出所述结果预测层,在具体包括:
14、将所述第二信号特征输入所述第三特征提取层,得到第三信号特征;
15、将所述第三信号特征输入所述结果预测层。
16、可选地,在若干个采样时刻,对等离子体产生的软x射线进行采样,具体包括:
17、在若干个采样时刻,根据软x射线诊断系统,对所述等离子体产生的软x射线进行采样。
18、可选地,根据所述辐射分布剖面预测结果以及所述辐射分布剖面标注,确定损失,具体包括:
19、针对每个采样时刻,确定该采样时刻对应的辐射分布剖面预测结果与该采样时刻对应的辐射分布剖面标注之间的差值;
20、判断所述差值是否在预设范围内;
21、若是,则根据该采样时刻对应的辐射分布剖面预测结果与该采样时刻对应的辐射分布剖面标注,采用第一公式,确定该采样时刻对应的损失;
22、若否,则根据该采样时刻对应的辐射分布剖面预测结果与该采样时刻对应的辐射分布剖面标注,采用第二公式,确定该采样时刻对应的损失。
23、可选地,根据所述损失,对所述反演代理模型进行训练,具体包括:
24、根据得到的每个采样时刻对应的损失,对所述反演代理模型进行训练。
25、可选地,所述方法还包括:
26、获取待预测信号序列,所述待预测信号序列是在若干个采样时刻,对待预测的等离子体产生的软x射线进行采样得到的,并且每个采样时刻对应的采样信号序列是在若干个采样位置,对待预测的等离子体产生的软x射线进行采样得到的;
27、将所述待预测信号输入训练完成的反演代理模型,得到所述训练完成的反演代理模型输出的所述待预测的等离子体的辐射分布剖面;
28、根据得到的所述待预测的等离子体的辐射分布剖面,监控所述待预测的等离子体中的磁流体状态。
29、本说明书提供了一种基于等离子体的反演代理模型训练装置,反演代理模型包括第一特征提取层、第二特征提取层以及结果预测层,所述第二特征提取层包括具备残差连接结构的多头注意力网络以及具备残差连接结构的前向神经网络,所述第一特征提取层以及所述结果预测层均包括全连接层,所述装置具体包括:
30、数据获取模块,用于获取采样信号序列,所述采样信号序列是预先在若干个采样时刻,对等离子体产生的软x射线进行采样得到的,并且每个采样时刻对应的采样信号序列是在若干个采样位置,对等离子体产生的软x射线进行采样得到的;并获取所述等离子体在每个采样时刻的辐射分布剖面标注;
31、第一特征提取模块,用于将所述采样信号序列输入所述第一特征提取层,得到第一信号特征;
32、第二特征提取模块,用于将所述第一信号特征输入所述第二特征提取层,以使所述具备残差连接结构的多头注意力网络对所述第一信号特征进行加权处理,并使所述具备残差连接结构的前向神经网络对每个采样时刻的第一信号特征进行特征提取,得到所述第二特征提取层输出的第二信号特征;
33、结果预测模块,用于将所述第二信号特征输入所述结果预测层,得到所述结果预测层输出的每个采样时刻对应的第二信号特征的辐射分布剖面预测结果;
34、损失确定模块,用于根据所述辐射分布剖面预测结果以及所述辐射分布剖面标注,确定损失;
35、模型训练模块,用于根据所述损失,对所述反演代理模型进行训练。
36、可选地,所述第一特征提取模块具体用于,对所述采样信号序列进行预处理,将预处理后的采样信号序列输入所述第一特征提取层;其中,所述预处理包括:去除所述采样信号序列中的异常信号,和/或,补充所述采样信号序列中的缺失信号。
37、可选地,所述反演代理模型还包括第三特征提取层,所述第三特征提取层包括具备残差连接结构的多头注意力网络以及具备残差连接结构的前向神经网络;
38、所述结果预测模块具体用于,将所述第二信号特征输入所述第三特征提取层,得到第三信号特征;将所述第三信号特征输入所述结果预测层。
39、可选地,所述数据获取模块具体用于,在若干个采样时刻,根据软x射线诊断系统,对所述等离子体产生的软x射线进行采样。
40、可选地,所述损失确定模块具体用于,针对每个采样时刻,确定该采样时刻对应的辐射分布剖面预测结果与该采样时刻对应的辐射分布剖面标注之间的差值;判断所述差值是否在预设范围内;若是,则根据该采样时刻对应的辐射分布剖面预测结果与该采样时刻对应的辐射分布剖面标注,采用第一公式,确定该采样时刻对应的损失;若否,则根据该采样时刻对应的辐射分布剖面预测结果与该采样时刻对应的辐射分布剖面标注,采用第二公式,确定该采样时刻对应的损失。
41、可选地,所述模型训练模块具体用于,根据得到的每个采样时刻对应的损失,对所述反演代理模型进行训练。
42、可选地,所述装置还包括模型应用模块;
43、所述模型应用模块具体用于,获取待预测信号序列,所述待预测信号序列是在若干个采样时刻,对待预测的等离子体产生的软x射线进行采样得到的,并且每个采样时刻对应的采样信号序列是在若干个采样位置,对待预测的等离子体产生的软x射线进行采样得到的;将所述待预测信号输入训练完成的反演代理模型,得到所述训练完成的反演代理模型输出的所述待预测的等离子体的辐射分布剖面;根据得到的所述待预测的等离子体的辐射分布剖面,监控所述待预测的等离子体中的磁流体状态。
44、本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于等离子体的反演代理模型训练方法。
45、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于等离子体的反演代理模型训练方法。
46、本说明书采用的上述至少一个技术方案能够达到以下有益效果:
47、在本说明书提供的基于等离子体的反演代理模型训练方法中,可先获取采样信号序列,该采样信号序列是预先在若干个采样时刻,对等离子体产生的软x射线进行采样得到的,并且每个采样时刻对应的采样信号序列是在若干个采样位置,对等离子体产生的软x射线进行采样得到的,并可获取该等离子体在每个采样时刻的辐射分布剖面标注。接着,可将采样信号序列输入第一特征提取层,得到第一信号特征,以及将第一信号特征输入第二特征提取层,以使所述具备残差连接结构的多头注意力网络对第一信号特征进行加权处理,并使具备残差连接结构的前向神经网络对每个采样时刻的第一信号特征进行特征提取,得到第二特征提取层输出的第二信号特征。然后,可将第二信号特征输入结果预测层,得到结果预测层输出的每个采样时刻对应的第二信号特征的辐射分布剖面预测结果。最后,可根据辐射分布剖面预测结果以及辐射分布剖面标注,确定损失,并根据损失,对反演代理模型进行训练。
48、从上述方法中可以看出,通过构建反演代理模型的结构,也即采用第一特征提取层、第二特征提取层以及结果预测层构建反演代理模型,并且第二特征提取层包括具备残差连接结构的多头注意力网络以及具备残差连接结构的前向神经网络,以使得对头注意力网络对特征进行加权处理,并使得具备残差连接结构的前向神经网络可提取软x射线信号序列在每个采样时刻的时序信息特征,区别于目前在等离子体诊断领域中所采用的,最小二乘反演代理方法以及贝叶斯反演代理方法等等,在提高预测效率的同时,提高了反演代理模型预测出的等离子体的辐射分布剖面的准确度。
1.一种基于等离子体的反演代理模型训练方法,其特征在于,反演代理模型包括第一特征提取层、第二特征提取层以及结果预测层,所述第二特征提取层包括具备残差连接结构的多头注意力网络以及具备残差连接结构的前向神经网络,所述第一特征提取层以及所述结果预测层均包括全连接层;所述方法包括:
2.如权利要求1所述的方法,其特征在于,将所述采样信号序列输入所述第一特征提取层,具体包括:
3.如权利要求1所述的方法,其特征在于,所述反演代理模型还包括第三特征提取层,所述第三特征提取层包括具备残差连接结构的多头注意力网络以及具备残差连接结构的前向神经网络;
4.如权利要求1所述的方法,其特征在于,在若干个采样时刻,对等离子体产生的软x射线进行采样,具体包括:
5.如权利要求1所述的方法,其特征在于,根据所述辐射分布剖面预测结果以及所述辐射分布剖面标注,确定损失,具体包括:
6.如权利要求5所述的方法,其特征在于,根据所述损失,对所述反演代理模型进行训练,具体包括:
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种基于等离子体的反演代理模型训练装置,其特征在于,反演代理模型包括第一特征提取层、第二特征提取层以及结果预测层,所述第二特征提取层包括具备残差连接结构的多头注意力网络以及具备残差连接结构的前向神经网络,所述第一特征提取层以及所述结果预测层均包括全连接层,所述装置具体包括:
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-7任一所述的方法。
10.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1-7任一所述的方法。