本发明涉及多源数据融合,具体涉及一种基于贝叶斯统计的地球科学多源数据融合方法及系统。
背景技术:
1、地球科学是典型的多源数据学科,因此先验信息的来源也多种多样。以地球物理数据反演为例,除了对观测数据本身的分布类型进行限定以外,还可以引入地质学家的经验、地质层位信息、钻测井数据、不同地球物理参数数据等来进行约束。这些数据不仅来源多样,在数据类型上也有很多差异。例如岩性数据通常为分类数据,钻测井数据通常为连续数据,地质学家的经验更是难于数学化,如何统计融合这些信息,决定了地球科学中的预测问题和不确定性问题的解决效果。
2、现有技术中处理中,通常对数据类信息分别处理,再进行人工解释,这种方法费时费力,通常也无法获得较好的结果。
技术实现思路
1、本发明的目的在于提供一种基于贝叶斯统计的地球科学多源数据融合方法,以解决现有技术中人工解释,费时费力,也无法获得较好的结果的技术问题。
2、为解决上述技术问题,本发明具体提供下述技术方案:
3、一种基于贝叶斯统计的地球科学多源数据融合方法,包括以下步骤:
4、确定地球科学研究的地物化遥工作中的多源数据,所述多源数据的数据类型包括连续数据类型、分类数据类型以及经验数据类型;
5、获取多源数据的先验信息以及多源数据的观测信息;
6、通过贝叶斯统计框架,构建融合所述多源数据且用于定量化决策地球科学研究中预测问题和不确定性问题的概率模型,得到表征多源数据的先验信息以及多源数据的观测信息和定量化决策地球科学研究中预测问题和不确定性问题的决策概率间映射关系的多源数据融合决策模型;
7、通过先验模型,根据多源数据的数据类型,对多源数据的先验信息进行数学化;
8、将数学化的多源数据的先验信息和多源数据的观测信息,输入至多源数据融合决策模型中,得到定量化决策地球科学研究中预测问题和不确定性问题的决策概率。
9、作为本发明的一种优选方案,所述多源数据融合决策模型的构建方法包括:
10、通过先验分布融合多源数据,得到多源数据的先验分布,所述多源数据的先验分布为:p(m)=p1(m)p2(m)…pn(m),式中,p(m)为多源数据的先验分布,p1(m)为多源数据中第1种数据的先验分布,p2(m)为多源数据中第2种数据的先验分布,pn(m)为多源数据中第n种数据的先验分布,m为多源数据的标识符;
11、通过贝叶斯定理公式,根据多源数据的先验分布,得到所述多源数据融合决策模型,所述多源数据融合决策模型为:
12、p(m|d)=const*p(d|m)p(m);
13、式中,p(m|d)为表征地球科学研究中预测问题和不确定性问题的决策概率的后验分布,p(d|m)为表征多源数据与观测信息间线性或非线性关系的似然函数,p(m)为多源数据的先验分布,d为观测信息的标识符,m为多源数据的标识符,const为常系数。
14、作为本发明的一种优选方案,通过多源数据的先验信息的决策权重与多源数据的观测信息的决策权重对所述后验分布进行加权平均得到所述决策概率。
15、作为本发明的一种优选方案,所述多源数据的先验信息的决策权重的确定方法包括:
16、获取多源数据的先验信息以及多源数据的观测信息;
17、计算多源数据的先验信息与多源数据的观测信息的离散度,并利用离散度量化多源数据中各种数据的不稳定性,其中离散度利用相似性函数进行计算,所述不稳定性为:
18、ki=dis(mold,i,mnew,i);
19、式中,ki为多源数据中第i种数据的不稳定性,mold,i为多源数据中第i种数据的先验信息,mnew,i为多源数据中第i种数据的观测信息,dis(mold,i,mnew,i)为mold,i和mnew,i间欧氏距离;
20、将不稳定性进行min-max标准化处理,以线性映射至[0,1]区间范围内,min-max标准化处理后的ki为:ki’=(ki-mink)/(maxk-mink),其中,mink为多源数据中n种数据的不稳定性的最小值,max为多源数据中n种数据的不稳定性的最大值;
21、根据多源数据的不稳定性,构建出根据不稳定性进行自适应调整的所述多源数据的先验信息的决策权重,所述多源数据的先验信息的决策权重为:
22、wi=-(1-ki’)^r*log ki’;
23、式中,wi为多源数据中第i种数据的先验信息的决策权重,ki’为min-max标准化处理后的多源数据中第i种数据的不稳定性,i为计数变量,r>1,r为常次幂。
24、作为本发明的一种优选方案,所述多源数据的观测信息的决策权重的确定方法包括:
25、根据所述多源数据的先验信息的决策权重,得到多源数据的观测信息的决策权重;
26、多源数据的观测信息的决策权重为:
27、mi=1-wi;
28、式中,mi为多源数据中第i种数据的观测信息的决策权重,wi为多源数据中第i种数据的先验信息的决策权重,i为计数变量。
29、作为本发明的一种优选方案,对多源数据的先验信息进行数学化方法包括:
30、当多源数据的先验信息的数据类型为连续数据类型,则根据多源数据的先验信息的分布类型,将多源数据的先验信息近似为高斯分布或柯西分布形式进行数学化;
31、当多源数据的先验信息的数据类型为分类数据类型,则采用马尔科夫随机场对类别进行编号分类,建立类别随机场,通过gibbs分布将多源数据的先验信息数学化;
32、当多源数据的先验信息的数据类型为经验信息类别,则将多源数据的先验信息转化为计数矩阵形式,再利用马尔科夫过程的转移概率矩阵将多源数据的先验信息进行数学化。
33、作为本发明的一种优选方案,本发明提供了一种基于贝叶斯统计的地球科学多源数据融合系统,应用于所述的一种基于贝叶斯统计的地球科学多源数据融合方法,所述地球科学多源数据融合系统包括:
34、数据预处理模块,用于确定地球科学研究的地物化遥工作中的多源数据,所述多源数据的数据类型包括连续数据类型、分类数据类型以及经验数据类型;
35、数据采集模块,用于获取多源数据的先验信息以及多源数据的观测信息;
36、模型建立模块,用于通过贝叶斯统计框架,构建融合所述多源数据且用于定量化决策地球科学研究中预测问题和不确定性问题的概率模型,得到表征多源数据的先验信息以及多源数据的观测信息和定量化决策地球科学研究中预测问题和不确定性问题的决策概率间映射关系的多源数据融合决策模型;
37、数学化处理模块,用于通过先验模型,根据多源数据的数据类型,对多源数据的先验信息进行数学化;
38、决策输出模块,用于将数学化的多源数据的先验信息和多源数据的观测信息,输入至多源数据融合决策模型中,得到定量化决策地球科学研究中预测问题和不确定性问题的决策概率。
39、作为本发明的一种优选方案,所述模型建立模块构建多源数据融合决策模型,包括:
40、通过先验分布融合多源数据,得到多源数据的先验分布,所述多源数据的先验分布为:p(m)=p1(m)p2(m)…pn(m),式中,p(m)为多源数据的先验分布,p1(m)为多源数据中第1种数据的先验分布,p2(m)为多源数据中第2种数据的先验分布,pn(m)为多源数据中第n种数据的先验分布,m为多源数据的标识符;
41、通过贝叶斯定理公式,根据多源数据的先验分布,得到所述多源数据融合决策模型,所述多源数据融合决策模型为:
42、p(m|d)=const*p(d|m)p(m);
43、式中,p(m|d)为表征地球科学研究中预测问题和不确定性问题的决策概率的后验分布,p(d|m)为表征多源数据与观测信息间线性或非线性关系的似然函数,p(m)为多源数据的先验分布,d为观测信息的标识符,m为多源数据的标识符,const为常系数。
44、作为本发明的一种优选方案,所述模型建立模块通过多源数据的先验信息的决策权重与多源数据的观测信息的决策权重对所述后验分布进行加权平均得到所述决策概率。
45、作为本发明的一种优选方案,所述数学化处理模块对多源数据的先验信息进行数学化,包括:
46、当多源数据的先验信息的数据类型为连续数据类型,则根据多源数据的先验信息的分布类型,将多源数据的先验信息近似为高斯分布或柯西分布形式进行数学化;
47、当多源数据的先验信息的数据类型为分类数据类型,则采用马尔科夫随机场对类别进行编号分类,建立类别随机场,通过gibbs分布将多源数据的先验信息数学化;
48、当多源数据的先验信息的数据类型为经验信息类别,则将多源数据的先验信息转化为计数矩阵形式,再利用马尔科夫过程的转移概率矩阵将多源数据的先验信息进行数学化。
49、本发明与现有技术相比较具有如下有益效果:
50、本发明在地球科学多源数据的融合方面,引入贝叶斯统计方法,该方法能够有效地融合多源数据,将一些难于数学化的先验信息转化为各种概率分布,有效提高数据利用效率,提高地球科学研究中预测问题和不确定性问题的决策准确度。
1.一种基于贝叶斯统计的地球科学多源数据融合方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于贝叶斯统计的地球科学多源数据融合方法,其特征在于:所述多源数据融合决策模型的构建方法包括:
3.根据权利要求1所述的一种基于贝叶斯统计的地球科学多源数据融合方法,其特征在于:通过多源数据的先验信息的决策权重与多源数据的观测信息的决策权重对所述后验分布进行加权平均得到所述决策概率。
4.根据权利要求1所述的一种基于贝叶斯统计的地球科学多源数据融合方法,其特征在于:所述多源数据的先验信息的决策权重的确定方法包括:
5.根据权利要求1所述的一种基于贝叶斯统计的地球科学多源数据融合方法,其特征在于:所述多源数据的观测信息的决策权重的确定方法包括:
6.根据权利要求1所述的一种基于贝叶斯统计的地球科学多源数据融合方法,其特征在于:对多源数据的先验信息进行数学化方法包括:
7.一种基于贝叶斯统计的地球科学多源数据融合系统,其特征在于,应用于权利要求1-6任一项所述的一种基于贝叶斯统计的地球科学多源数据融合方法,所述地球科学多源数据融合系统包括:
8.根据权利要求1所述的一种基于贝叶斯统计的地球科学多源数据融合系统,其特征在于:所述模型建立模块构建多源数据融合决策模型,包括:
9.根据权利要求1所述的一种基于贝叶斯统计的地球科学多源数据融合系统,其特征在于:所述模型建立模块通过多源数据的先验信息的决策权重与多源数据的观测信息的决策权重对所述后验分布进行加权平均得到所述决策概率。
10.根据权利要求1所述的一种基于贝叶斯统计的地球科学多源数据融合系统,其特征在于:所述数学化处理模块对多源数据的先验信息进行数学化,包括:
