跳转至

生成对抗网络

AVO Inversion Based on Closed-Loop Multitask Conditional Wasserstein Generative Adversarial Network

基于闭环多任务条件Wasserstein生成对抗网络的avo反演

https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10078923&tag=1

摘要

标记数据不足的情况下,基于神经网络的地震反演结果精度下降,甚至低于基于传统反演方法的反演结果。此外,基于神经网络的地震反演结果普遍存在横向不连续性。针对这些问题,本文提出了一种基于闭环多任务条件Wasserstein生成对抗网络( CMcWGAN )的AVO反演方法,即基于生成对抗网络( GAN )的AVO反演方法。这可以同时准确反演三个弹性参数,同时,利用弹性参数的低频信息作为条件输入,缓解了反演结果的横向不连续问题。相较于传统AVO反演,具有更高的精度和鲁棒性

INTRODUCTION

AVO反演可以有效地预测地下介质的弹性参数,为储层预测和流体识别提供可靠的理论依据

AVO反演方法的发展:

  • Zoeppritz方程及其近似
  • 加权叠加法实现线性AVO反演
  • 贝叶斯网络
  • 基于L1范数的似然函数和全变差( TV )正则化约束
  • 基于马尔科夫随机场( MRF )的正则化
  • L曲线和广义交叉验证( GCV )
  • 方向全变分( DTV )正则化
  • 机器学习
  • 人工神经网络
  • 物理引导神经网络( PGNN )
  • 闭环CNN
  • 生成对抗网络GAN

本文提出了一种基于闭环多任务条件WGAN ( CMcWGAN )的反演方法,它将闭环框架和基于GAN的网络相结合,设计了GAN的结构,实现了3个弹性参数同时反演,可以实现多任务学习。此外,为了提高网络训练的鲁棒性,使用Wasserstein距离代替交叉熵( CE )作为损失函数,使用cGAN通过引入低频信息到网络缓解横向不连续性。我们的方法具有更高的反演精度和更好的抗噪性。

CMcWGAN Framework and Neural Network Structure

CMcWGAN由两个子网络组成:反演网络和正演网络

G为反演网络生成器。DVp、DVs和Dρ分别为纵波速度、横波速度和密度对应的判别器。F为正演网络

G结构如下:

feature block其中特征提取block结构为

U-net结构

N代表入射角,a代表数据长度

将每个下采样和对应的上采样特征的数据进行跳跃拼接,融合数据的浅层特征和深层特征。这是解决传统全卷积神经网络梯度消失问题的有效方法

在ASPP结构中,较小的核尺寸可以捕获数据的高频内容,因此,ASPP的核尺寸均为3×1,通过空洞卷积增大感受野,捕获多个尺度的特征。

在G结构中,inversion block使用了三个1-D U-net,该块的U - Net比特征提取块具有更浅的深度和更简单的结构。参考cGAN的理论,这里的三个unet均为双通道输入,一个为特征提取到的高频信息,另一个为预设低频信息。

discriminator判别器结构

判别器为3个结构相同的网络,本文采用一维马尔科夫判别器代替传统的GAN判别器进行多任务cGAN。马尔科夫判别器的输出是一个矩阵或向量,而不是传统GAN中的0或1输出。这意味着输出的每个元素对应输入数据的一个补丁。这样可以增强反演结果中高频细节的刻画。判别器同样是低频高频双通道输入,最终输出大小为输入的1/16

F正演网络

我们在AVO反演中使用神经网络代替基于物理的方程进行地震正演。由于U - Net在地震正演方面也具有良好的性能,因此我们将U - Net作为AVO正演网络(F),实现弹性参数到地震角道集的映射。F的结构如上Unet。它通过三个通道将三个弹性参数分别输入网络;所以N=3。最终得到角道集

Loss function

三个判别器的损失函数

\begin{aligned} & L_{V p}^d=\frac{1}{m} \sum_i^m\left[-D_{V p}\left(V p^{\text {label }} \mid V p^{\text {low }}\right)\right. \left.+D_{V p}\left(G\left(S \mid V p^{\text {low }}\right) \mid V p^{\text {low }}\right)+\lambda \mathrm{gp}_{V p}\right] \\ & L_{V s}^d=\frac{1}{m} \sum_i^m\left[-D_{V s}\left(V s^{\text {label }} \mid V s^{\text {low }}\right)\right. \left.+D_{V s}\left(G\left(S \mid V s^{\text {low }}\right) \mid V s^{\text {low }}\right)+\lambda \mathrm{gp}_{V s}\right] \\ & L_\rho^d=\frac{1}{m} \sum_i^m\left[-D_\rho\left(\rho^{\text {label }} \mid \rho^{\text {low }}\right)\right. \left.+D_\rho\left(G\left(S \mid \rho^{\mathrm{low}}\right) \mid \rho^{\mathrm{low}}\right)+\lambda \mathrm{gp}_\rho\right] \\ & \mathrm{gp}=E_{\tilde{x}, y}\left[\left(\left\|\nabla_{\tilde{x}} D(\tilde{x}, y)\right\|_2-1\right)^2\right] \\ & \tilde{x}=t x+(1-t) G(y) \\ \end{aligned}

其中,m为标记数据的个数,S为有标注数据的地震角度道集,gp为梯度惩罚,满足1-Lipschitz约束,\lambda为约束系数在gp的表达式中,y是作为生成器输入的原始数据。\nabla_{\tilde{x}}是沿\tilde{x}方向的梯度计算。\tilde{x}随机采样于在x作为标签和对应的生成数据G (y)之间的直线上。

生成器的损失函数

\begin{aligned} & L^g=\frac{1}{m} \sum_i^m\left[-D_{V_p}\left(G\left(S \mid V p^{\text {low }}\right) \mid V p^{\text {low }}\right)\right. -D_{V s}\left(G\left(S \mid V s^{\text {low }}\right) \mid V s^{\text {low }}\right) \\ & \left.-D_\rho\left(G\left(S \mid \rho^{\text {low }}\right) \mid \rho^{\text {low }}\right)\right] \text {. } \\ \end{aligned}

我们使用了循环一致损失函数,G和F的互为输入输出,因此,G和F操作的数据都是闭环的,相比之下,仅由单个网络G或F操作的数据意味着开环。此外,根据AVO反演的需求,对循环一致损失函数进行了改进。此外,我们使用平均绝对误差(MAE)代替均方误差(mse)作为损失函数,以提高训练的鲁棒性。开环损失函数如下

\begin{aligned} & L_{\text {open }}^1=\frac{1}{m} \sum_i^m \| G\left(S \mid V p^{\text {low }}\right)-V p^{\text {label }} \mid +\left|G\left(S \mid V s^{\text {low }}\right)-V s^{\text {labcl }}\right| \\ & \left.+\left|G\left(S \mid \rho^{\text {low }}\right)-\rho^{\text {labcl }}\right|\right] \\ & L_{\mathrm{open}}^2=\frac{1}{m} \sum_i^m\left[\left|F\left(V p^{\text {label }}, V s^{\text {labcl }}, \rho^{\text {label }}\right)-S\right|\right] . \\ & \end{aligned}

闭环损失函数由正演地震数据的损失,反演三参数的损失,未标注数据的正演损失组成

\begin{align} & L_{\text {close }}^1=\frac{1}{m} \sum_i^m\left[\left|F\left(G\left(S \mid V p^{\text {low }}\right), G\left(S \mid V s^{\text {low }}\right), G\left(S \mid \rho^{\text {low }}\right)\right)-S\right|\right] \\ & L_{\text {close }}^2=\frac{1}{m} \sum_i^m\left[\left|G\left(F\left(V p^{\text {label }}, V s^{\text {label }}, \rho^{\text {label }}\right) \mid V p^{\text {low }}\right)-V p^{\text {label }}\right|\right] \\ & L_{\text {close }}^3=\frac{1}{m} \sum_i^m\left[\left|G\left(F\left(V p^{\text {label }}, V s^{\text {label }}, \rho^{\text {label }}\right) \mid V s^{\text {low }}\right)-V s^{\text {label }}\right|\right] \\ & L_{\text {close }}^4=\frac{1}{m} \sum_i^m\left[\left|G\left(F\left(V p^{\text {label }}, V s^{\text {label }}, \rho^{\text {label }}\right) \mid \rho^{\text {low }}\right)-\rho^{\text {label }}\right|\right] \\ & L_{\text {close }}^5=\frac{1}{M} \sum_i^M\left[\mid F\left(G\left(S^* \mid V p^{\text {low* }}\right), G\left(S^* \mid V s^{\text {low* }}\right)\right. \text {, }\right. \\ & \left.\left.G\left(S^* \mid \rho^{\text {low* }}\right)\right)-S^* \mid\right] \\ & \end{align}

故综上,最终的生成器损失函数为

L_{I,L} = L^g+\beta(L^1_{open}+L^2_{open})+\alpha(L^1_{close}+L^2_{close}+L^3_{close}+L^4_{close}+L^5_{close})

其中\alpha,\beta(\beta \gg \alpha)为约束系数,分别控制开环和闭环部分的贡献。

训练流程

  • 首先将带标签数据组作为输入训练判别器
  • 训练G和F

带标签数据由精确Zoeppritz方程得到

在一个训练epoch内,判别器训练两次,G和F训练一次。成为对抗训练

训练超参数设定

  • 约束系数分别为\lambda = 10, \alpha = 50, \beta = 1500
  • epoch = 300, batchsize = 34, 学习率=10exp-4, 衰减率为0.99

评价标准

为了量化反演结果的准确性,我们计算了每个道的皮尔逊相关系数( PCC )以及反演结果与真实模型之间的mse。两者均定义

\begin{aligned} & PCC(x,y)=\frac{Cov(x,y)}{\sqrt{Var(x)\sqrt{Var(y)}}}\\ & mse(x,y) = \frac{1}{M \times N}\sum^M_i\sum^N_j(x_{i,j}-y_{i,j})^2 \end{aligned}

本文方法的反演结果与其他两种方法相比具有更高更紧凑的PCC和更低的mse

我们还采用Frechet起始距离( FID )评分来评估反演结果。它能比inception score( IS )更好地捕捉生成结果与真实结果的相似性.当FID评分越低时,预测结果越接近真实模型。

\mathbf{FID}(x,y)=||\mu_x-\mu_y||^2_2+\mathbf{Tr}\left(\sum_x+\sum_y-2\left(\sum_x\sum_y\right)^{\frac{1}{2}}\right)

其中x和y分别为预测结果和真实模型,\mu为平均值。\sum为特征向量的协方差矩阵。\mathbf{Tr}为矩阵的迹

创新点: - 损失函数使用Wasserstein距离代替交叉熵。 - 利用弹性参数的低频信息作为条件输入缓解横向不连续性。 - 使用平均绝对误差( MAE )代替均方误差( mse )作为损失函数来提高网络训练的鲁棒性

结论

CMcWGAN利用弹性参数的低频信息作为条件输入缓解了横向不连续问题,提高了反演结果的精度。利用合成地震角道集的实验结果表明,CMcWGAN比cGAN具有更好的横向连续性,比传统的贝叶斯AVO反演方法具有更高的反演精度。在标签不足的情况下,CMcWGAN能够实现高精度的AVO反演,并且对含噪角度道集具有鲁棒性。