Análisis de la incertidumbre en problemas inversos geofísicos no lineales de alta dimensión
Resumen Abstract Índice Conclusiones
García, José Luis
2017-A
Descargar PDF
Resumen
——-
En esta Tesis Doctoral se aborda el análisis de incertidumbre de la solución en
problemas geofísicos lineales y no lineales en espacios altamente dimensionales.
En una primera parte teórica se justifica el análisis de incertidumbre desde un
punto de vista determinista mediante técnicas provenientes del álgebra lineal y
de la teoría de optimización. En particular, en el caso de los problemas
inversos lineales se demuestra que el condicionamiento del sistema lineal está
relacionado con la excentricidad de la región de equivalencia. En el caso de los
problemas inversos no lineales se justifica por qué las técnicas de
linealización sólo proporcionan un análisis de incertidumbre en el entorno de la
solución adoptada, pudiendo conducir a soluciones erróneas en el caso de que la
información a priori utilizada sea incorrecta.
Se realiza un análisis teórico exhaustivo del efecto del ruido y de la
regularización de Tikhonov en la topografía de la función objetivo en los casos
de los problemas inversos lineales y no lineales, mostrando analíticamente que
en ambos se ve deformada dicha topografía. El ruido la deforma de un modo
homogéneo en el caso de los problemas lineales y no homogéneo en los problemas
inversos no lineales. En el caso de la regularización de Tikhonov la deformación
es anisotrópica, actuando de forma diferente en cada componente del modelo
solución.
En segundo lugar, se ha desarrollado un método de inversión en 2D y 3D para la
resolución (estimación del mejor modelo y su análisis de incertidumbre) del
problema gravimétrico inverso en cuencas sedimentarias, en su formulación no
lineal para la determinación de la interfase de separación sedimentos-basamento,
basado en el algoritmo Particle Swarm Optimization. Se han obtenido muy buenos
resultados con ejemplos sintéticos y reales, tanto en la estimación del modelo
de mejor ajuste como en el análisis de su incertidumbre, lo que convierte al
algoritmo PSO en una alternativa seria para la resolución de este tipo de
problemas.
Esta Tesis Doctoral fue presentada en la modalidad «por compendio de artículos»,
contemplada en la normativa de la Universidad de Oviedo. En total se han
publicado 5 trabajos en revistas JCR, 4 de los cuales estaban aceptados y
publicados a la fecha de lectura de la tesis, mientras que el quinto (que había
sido enviado, motivo por el cual en la memoria no aparece con el formato de la
revista) fue publicado en el año 2017. Además fueron presentadas dos
comunicaciones a congresos internacionales con revisión por pares, uno de los
cuales está incluido en el Congress Proceedings Citation Index (CPCI).
En el primer artículo (From Bayes to Tarantola: New insights to understand
uncertainty in inverse problems) se hace hincapié en la importancia del análisis
de la incertidumbre en la resolución de los problemas inversos, especialmente en
Geofísica, ya que los datos observados en campo son en la mayoría de los casos
bastante ruidosos. Se resaltan también tres problemas bastante comunes que son
usualmente aceptados por los profesionales e intérpretes:
1. La incertidumbre de la solución de un problema inverso tiene una estructura
aleatoria imposible de conocer.
2. Las técnicas de regularización hacen que las soluciones equivalentes
desaparezcan.
3. Las técnicas de linealización representan de forma adecuada la región de
incertidumbre de la solución adoptada.
Estas tres suposiciones no son correctas y pueden conducir a errores en una
posterior toma de decisiones. En este trabajo se introducen nuevas vías para
comprender el concepto de incertidumbre desde un punto de vista determinista y
se propone una definiciín ‘geométrica’ del concepto de mal condicionamiento. Las
técnicas de optimización local no son capaces de proporcionar un análisis
correcto de la incertidumbre de la solución de un problema inverso no lineal, ya
que en este caso la región de equivalencia es únicamente aproximada por una
hipercuádrica local. Por otro lado, la aproximación bayesiana y algunas técnicas
de optimización global son ineficientes porque ignoran la estructura algebraica
de la región de equivalenca y son ineficientes cuando el problema inverso es
altamente dimensional. La comprensión de la incertidumbre desde un punto de
vista determinista es un paso necesario en el diseño de métodos eficientes de
muestreo del espacio de incertidumbre el problemas de altas dimensiones.
En el segundo artículo (The effect of noise and Tikhonov’s regularization in
inverse problems. Part I: The linear case) se analiza el efecto del ruido y de
la regularización de Tikhonov en los problemas inversos discretos lineales. El
propósito de este trabajo es la comprensión desde un punto de vista analítico
(independientemente de las dimensiones del espacio modelo) de cómo el ruido y la
regularización deforman la función de coste en problemas inversos lineales. Las
principales conclusiones del trabajo son:
1. El ruido en las observaciones modifica la posición de la solución obtenida
por mínimos cuadrados con respecto al modelo real. En el caso de sistemas
compatibles este desplazamiento es el único efecto del ruido.
2. El ruido deforma de manera homogénea la topografía de la función de coste.
Para ruido blanco o positivamente correlado, las regiones de equivalencia
disminuyen en tamaño con respecto a las correspondientes del problema sin
ruido. Con ruido negativamente correlado las regiones de de equivalencia
pueden aumentar de tamaño, hecho que podría ser utilizado para optimizar la
eficiencia de los métodos globales de resolución.
3. La regularización estabiliza la solución del problema inverso gracias a que
limita la extensión de los ejes de la hipercuádrica de equivalencia en las
direcciones correspondientes al espacio nulo del operador directo,
transformando la hipercuádrica de un hipercilindrro elíptico a un
hiperelipsoide.
4. La regularización deforma las regiones de equivalencia de forma no homogénea,
actuando de manera diferente a lo largo de cada componente del modelo. La
regularización no hace que las regiones de equivalencia desaparezcan, esto
es, seguirá habiendo múltiples modelos que ajusten los datos por debajo de un
nivel de tolerancia preestablecido.
Todas las conclusiones enumeradas han sido deducidas de forma analítica y
corroboradas mediante ejemplos sintéticos.
En el tercer artículo (The effect of noise and Tikhonov’s regularization in
inverse problems. Part II: The nonlinear case) se analiza el efecto del ruido y
de la regularización de Tikhonov en los problemas inversos discretos no
lineales. El efecto del ruido en problemas inversos no lineales apenas ha sido
analizado en la literatura científica y, cuando lo ha sido, los análisis no se
diferencias de los hechos para los problemas lineales, lo cual es una
limitación. En este artículo, y al igual que en el correspondiente a los
problemas lineales, se ha empleado un enfoque analítico. Las principales
conclusiones son:
1. Al igual que en el caso lineal el ruido en los datos ‘desplaza’ la solución
obtenida por mínimos cuadrados de tal forma que la solución ‘real’ del
problema nunca podrá ser hallada.
2. El ruido deforma la función de coste de forma no homogénea en el sentido de
que la deformación depende del modelo inicial m0 seleccionado para resolver
el problema.
3. Bajo ciertas condiciones el ruido puede hacer que el tamaño de las regiones
de equivalencia disminuya y al mismo tiempo hacer que el tamaño de las
regiones de ajuste medio aumente. La solución del problema inverso de este
modo se dificulta para los métodos de búsqueda global, aunque a la vez se
facilita la tarea de encontrar las regiones de desajuste medio.
4. Como en el caso lineal, la regularización de Tikhonov deforma las regiones de
equivalencia linealizadas de forma anisotrópica. La diferencia es que en el
caso no lineal esta deformación no es homogénea y depende del modelo inicial
m0 elegido.
5. En el caso de funciones de coste multimodales la regularización no implica
que los mínimos relativos desaparezcan, de modo que la posibilidad de que el
modelo solución quede atrapado en uno de ellos se mantiene, dependiendo del
modelo inicial m0. El único efecto de la regularización es la mejora local
del mal condicionamiento de la matriz jacobiana del operador directo.
6. La linealización sólo aproxima localmente las regiones de equivalencia del
problema no lineal original. Dado un nivel de error, la región de
equivalencia linealizada contiene modelos con incertidumbres mayores que el
nivel de tolerancia dado, mientras que otros modelos por debajo de dicho
nivel quedan fuera de ella.
Todas ellas son cpnclusiones importantes y a tener en cuenta para un correcto
análisis de la incertidumbre.
En el cuarto artículo (Gravity inversion and uncertainty assessment of basement
relief via Particle Swarm Optimization) se aplica el algoritmo de búsqueda
global Particle Swarm Optimization (PSO) a la inversión gravimétrica 2D en
cuencas sedimentarias. La inversión gravimétriva es una herramienta esencial
para el estudio de la corteza terrestre tanto a escalas regionales como locales,
así como en prospección de minerales. Como todo método basado en campos
potenciales, el problema gravimétrico inverso sufre de una no unicidad inherente
en su solución, por lo que es un método muy adecuado para su resolución mediante
de un método global de búsqueda. La aproximación utilizada en este trabajo es la
determinación bidimensional de la interfase sedimentos-basamento usando
observaciones de la gravedad en la superficie del terreno e imponiendo el
contraste de densidad, de modo que el método se correspondería con un método no
lineal desde el punto de vista clásico. Tras una exhaustiva revisión de la
literatura existente se puede concluir que esta es la primera ocasión en que el
algoritmo PSO se aplica a este problema. Los puntos fundamentales de este
trabajo son:
1. En primer lugar hace un breve resumen de los métodos clásicos para afrontar
el problema.
2. A continuación se detalla el método de resolución propuesto mediante el
algoritmo PSO. Se detalla la construccción del espacio de búsqueda así como
la posibilidad de utilizar constreñimientos. En este artículo se usan los
miembros GPSO, CC-PSO, CP-PSO, PP-PSO y RR-PSO de la familia PSO.
3. Se resuelve el problema utilizando modelos sintéticos. Se analiza la
evolución de la función de error y la dispersión del conjunto de modelos PSO
a lo largo de las iteraciones, tareas importantes en la utilización de este
método. Se han verificado las siguientes dos afirmaciones adelantadas en el
artículo ‘The effect of noise and Tikhonov’s regularization in inverse
problems. Part II: The nonlinear case’: (i) el mínimo de la función de coste
para el problema con ruido no coincide con el mínimo del problema sin ruido y
(ii) el ruido hace que el tamaño de las regiones de equivalencia de bajo
desajuste disminuya, para lo cual se ha hecho un análisis en el espacio de
componentes principales a partir de los modelos muestreados con PSO.
4. Se presenta una inversión de datos reales procedentes del desierto de Atacama
(Chile). Los resultados obtenidos son realistas desde el punto de vista
geológico y están en concordancia con resultados previos. La resolución con
PSO añade a los métodos clásicos el análisis de la incertidumbre de la
solución adoptada. Se demuestra de esta manera que el método propuesto es un
método válido para la inversión gravimétrica 2D en cuencas sedimentarias.
En el quinto artículo (3D gravity inversion and uncertainty assessment of
basement relief via Particle Swarm Optimization) se aplica el algoritmo PSO a la
inversión 3D de datos gravimétricos en cuencas sedimentarias. Las principales
diferencias de este trabajo con el anterior es el incremento en las dimensiones
del problema y el tratamiento específico del contraste de densidad en lo tocante
a su variación horizontal y vertical. Como en el caso bidimensional, esta es la
primera ocasión en que el método PSO se aplica a este problema. Los puntos
fundamentales del trabajo son:
1. Se ha añadido al método de inversión la capacidad de ajuste de una tendencia
regional de los datos de gravedad. También pueden utilizarse distribuciones
variables del contraste de densidad tanto horizontal como vertical.
2. Se introduce el uso de una matriz de filtrado que hace las veces de la
regularización de Tikhonov de primer orden en los métodos de optimización
local.
3. Se detalla la construcción del espacio de búsqueda y se discute el uso de
constreñimientos absolutos. Como en el método 2D, se utilizan los miembros
GPSO, CC-PSO, CP-PSO, PP-PSO y RR-PSO de la familia PSO.
4. Se resuelven ejemplos sintéticos con variaciones horizontales y vertivales
del contraste de densidad. Se comparan las soluciones obtenidas y sus
regiones de incertidumbres con los modelos reales, llegando a la conclusión
de que el PSO es un método válido para la inversión ravimétrica 3D en cuencas
sedimentarias. De manera similar al caso 2D se muestra numéricamente el
efecto del ruido en la topografía de la función de coste.
5. Se aborda la inversion de un conjunto real de datos correspindiente a la
cuenca de Argelès-Gazost (Francia). EL modelo obtenido como solución en
consistente desde el punto de vista geológico y concuerda con los resultados
obtenidos por otros métodos. El algoritmo PSO añade la capacidad de analizar
la incertidumbre de la solución de una manera realista.
En la primera comunicación a congreso (Noise, regularization and uncertainty:
new insights for linear and nonlinear inverse problems), como trabajo previo de
los artículos dedicados al análisis del ruido y la regularización en los
problemas inversos lineales y no lineales, se presentan algunos resultados
previos obtenidos del trabajo luego publicado.
La segunda comunicación a congreso (The effect of the noise and the
regularization in inverse problems. Geophysical implications) también forma
parte de los resultados preliminares de los trabajos dedicados a la descripción
del efecto del ruido y la regularización en los problemas inversos.
.
Abstract
——–
This PhD Thesis tackles the uncertainty analysis of the solution of linear and
nonlinear geophysical inverse problems in high-dimensional spaces. In a first
theoretical part, the uncertainty analysis from a deterministic and from the
optimization theory point of view is justified. Particularly, it is demonstrated
that in linear inverse problems, the linear system conditioningrelated to the
equivalence region eccentricity. In the case of nonlinear inverse problems, the
reason why the linearization techniques only provide a local uncertainty
analysis, and can lead to wrong solutions if the a priori information used is
not correct, is demonstrated.
An exhaustive theoretical analysis of the effects of noise and Tikhonov
regularization in the objective function topography for linear an nonlinear
inverse problems is developed, analytically showing that both effects deform the
aforementioned topography. Noise deforms it in a homogeneous way in the case of
linear inverse problems, while the deformation is non-homogeneous for nonlinear
problems. In the case of Tikhonov regularization, the deformation is
anisotropic, affecting each component of the solution model in a different way.
Secondly, a method for 2D and 3D nonlinear gravity inversion in sedimentary
basins (in the nonlinear form for determination of the interface
sediments-basement) has been developed, comprising the best model estimation and
its uncertainty analysis and based on the Particle Swarm Optimization algorithm.
Very good results have been obtained, both with synthetic and real examples,
regarding the best model estimation and its uncertainty analysis, which makes
the PSO algorithm a serious alternative for the solution of this kind of
problems.
Índice de la Tesis Doctoral
—————————
Agradecimientos
Contents
List of Figures
Resumen
Abstract
1 Introduction and state of the art
1.1 Introduction
1.2 The cost function topography of an inverse problem
1.3 The Particle Swarm Optimization (PSO) algorithm
1.4 Introduction to gravity inversion in sedimentary basins
1.4.1 Basin as a trapezoidal figure
1.4.2 Basin as an irregular polygon
1.4.3 Basin as a set of simple geometrical bodies
1.4.4 Methods based on the direct problem solution
1.4.5 Global optimization methods
2 Thesis contributions
2.1 The effect of noise and Tikhonov regularization in inverse problems
2.1.1 The effect of noise in linear inverse problems
2.1.2 The effect of Tikhonov regularization in linear inverse problems
2.1.3 The effect of noise in nonlinear inverse problems
2.1.4 The effect of Tikhonov regularization in nonlinear inverse problems
2.2 Gravity inversion in sedimentary basins using PSO
2.2.1 Domain discretization
2.2.2 Density contrast treatment
2.2.3 Search space, constraints, and inversion
2.2.4 Inverse problem solution and uncertainty assessment
3 Articles published in peer-reviewed journals
3.1 From Bayes to Tarantola: New insights to understand uncertainty in inverse problems
3.2 The effect of noise and Tikhonov’s regularization in inverse problems. Part I: The linear case
3.3 The effect of noise and Tikhonov’s regularization in inverse problems. Part II: The nonlinear case
3.4 Gravity inversion and uncertainty assessment of basement relief via Particle Swarm Optimization
3.5 3D gravity inversion and uncertainty assessment of basement relief via Particle Swarm Optimization
4 Other publications
4.1 Noise, regularization and uncertainty: new insights for linear and nonlinear inverse problems
4.2 The effect of the noise and the regularization in inverse problems. Geophysical implications
5 Conclusiones y líneas futuras
5.1 Conclusiones
5.2 Líneas futuras de investigación
6 Conclusions and future research
6.1 Conclusions
6.2 Future research
A Reuse permissions and impact factor reports
Bibliography
Conclusiones
————
Las principales conclusiones de esta Tesis Doctoral son:
1. Esta Tesis proporciona nuevos conocimientos que permiten la comprensión desde
un punto de vista determinista de la incertidumbre, paso necesario para el
diseño posterior de métodos eficientes de muestreo de las regiones de
equivalencia en problemas inversos no lineales de alta dimensión. Se propone
una definición general del concepto de mal condicionamiento, basada en la
estructura de las regiones de equivalencia. En esencia, la incertidumbre en
los problemas inversos no lineales no necesita ser tratada como un proceso
aleatorio, ya que las regiones de equivalencia tienen una interpretación
algebraica natural. Los métodos de optimización local pueden ser rediseñados
para que realicen muestreo mientras optimizan, para lo cual su carácter
explorativo debe ser optimizado y sostenido.
2. En los problemas inversos lineales el ruido desplaza la solución estimada por
los métodos de mínimos cuadrados (solución que se corresponde con el centro
de la hipercuádrica de equivalencia) y deforma de manera homogénea la
topografía de la función de coste. Se proporciona también una interpretación
geométrica del efecto de la regularización, la cual actúa como limitación al
tamaño de los ejes de la hipercuádrica de equivalencia en las direcciones del
núcleo del operador directo. Geométricamente, la hipercuádrica original, que
es un hipercilindro elíptico, se transforma en un hiperelipsoide cuyo centro
coincide con la solución regularizada del problema. Se ha evaluado
cuantitativamente la deformación de la función de coste en ambos casos,
debido al ruido y debido a la regularización, y se proporcionan las
correspondientes ecuaciones para su cuantificación.
3. El ruido desplaza la solución estimada por los métodos clásicos de
optimización no lineal y deforma la topografía de la función de coste de
manera no homogenea, en el sentido de que dicha deformación depende del
modelo inicial m0 elegido para la resolución del problema. Bajo ciertas
condiciones, el ruido hace que las regiones de equivalencia de buen ajuste
decrezcan en extensión y, al mismo tiempo, que las de ajuste medio aumenten
en tamaño. Esto dificulta la solución del problema inverso para los métodos
de búsqueda global, mientras que la detección de las zonas de ajuste medio se
vuelve más fácil. El papel de la regularización en las regiones de
equivalencia linealizadas es similar al caso de los problemas inversos
lineales, deformándolas de manera no homogénea, actuando de forma diferente
en cada componente del modelo. La diferencia estriba en que en el caso no
lineal dicha deformación depende del modelo inicial m0 . La regularización no
causa la desaparición de los modelos equivalentes, sino que sólo sirve para
mejorar localmente el mal condicionamiento del jacobiano del operador
directo. Además, las regiones de equivalencia de los problemas no lineal
original y linealizado son muy distintas. La linealización aproxima
únicamente de forma local dichas regiones de equivalencia y, para un nivel de
error dado, puede contener modelos con un error mayor que el especificado a
la vez que ignora otros modelos que sí entrarían en tolerancia. Aunque la
regularización sirve para estabilizar la inversión ante la presencia de
ruido, la solución regularizada puede estar lejos de la real, ya que pueden
existir otras soluciones equivalentes en otras cuencas de la función de
coste. Debido a estos hechos, se puede afirmar que siempre es necesario un
análisis lineal completo del problema en geofísica aplicada a fin de evaluar
los posibles riesgostodo proceso de toma de decisiones.
4. Este análisis teórico de los efectos del ruido y la regularización abre
nuevas posibilidades para el diseño de algoritmos más eficientes de
optimización y muestreo.
5. Se ha diseñado una aplicación práctica del algoritmo Particle Swarm
Optimization (PSO) para la resolución del problema gravimétrico inverso 2D y
3D en cuencas sedimentarias, en su modalidad no lineal de determinación de la
interfase de separación sedimentos-basamento. Se detalla el método de diseño
del espacio de búsqueda, así como la posibilidad de uso de constreñimientos y
su comparación con sus equivalentes en los métodos de optimización local. Se
han testeado los miembros GPSO, CC-PSO, CP-PSO, PP-PSO y RR-PSO de la familia
PSO, mostrando que se obtienen resultados realistas en cuanto a la estimación
del mejor modelo y el análisis de su incertidumbre, especialmente con el
miembro PP-PSO. Se ha aplicado el método a dos entornos reales, uno en 2D en
Atacama (Chile) y otro en un entorno 3D en la cuenca de Argelès-Gazost
(Francia), obteniéndose resultados compatibles con los obtenidos por otros
métodos, pero añadiendo además una estimación realista de su incertidumbre.
Líneas futuras de investigación
——————————-
El desarrollo de esta Tesis Doctoral ha abierto varias líneas de trabajo que
serán abordadas en el futuro, las principales de las cuales son:
1. En esta Tesis sólo se han analizado los efectos del ruido y la
regularización, pero otra fuente importante del mal planteamiento de los
problemas inversos es el hecho de que el operador F, debido a los errores de
modelado, es sólo una aproximación de la realidad. Una importante línea
futura de investigación es el estudio detallado del efecto de los errores del
operador F en los problemas inversos lineales y no lineales. Por otro lado,
otra línea de investigación consiste en el análisis del ruido y la
regularización en problemas inversos considerando funciones obletivo basadas
en normas distintas a la L2.
2. Una línea inmediata de trabajo es la creación de un paquete de software para
la solución y el análisis de incertidumbre del problema gravimétrico inverso
en cuencas sedimentarias en 2D y 3D usando el algoritmo Particle Swarm
Optimization. Los artículos 4 y 5 han demostrado en la práctica, mediante
ejemplos sintéticos y reales, que el método es una herramienta potente para
la determinación de la interfase de separación sedimentos-basamento y el
análisis de su incertidumbre. El objetivo consiste en crear un software que
permita la utilización de los modelos 2D y 3D, proporcionando al usuario la
posibilidad de selección de parámetros como la resolución espacial del
modelo, el modelo de variación vertical y horizontal de densidad a utilizar,
funciones avanzadas de representación gráfica de resultados y otras
características relacionadas. Esta línea ha sido sugerida por Sylvain
Bonvalot (Laboratoire GET (Université de Toulouse, CNRS, IRD, CNES) – Bureau
Gravimétrique International, Toulouse, France).
3. Una línea futura importante será la integración en el método gravimétrico
propuesto (especialmente en 3D) de las técnicas de reducción de la dimensión
desarrolladas en Fernández Muñiz (2012). Aunque para problemas de tanmaño
medio (el problema real resuelto en el artículo 5 tiene 300 incógnitas, lo
cual es un número de parámetros bastante común) el tiempo de procesado es
bajo, si la cuenca en estudio comprende un área muy grande las dimensiones
del problema se incrementan de manera rápida (para un área y prismas
cuadrados el número total de incógnitas es N 2 ), lo que podría dar lugar a
un problema inabordable por métodos de búsqueda global si la capacidad de
cómputo es limitada. La aceleración del tiempo de cómputo es uno de los
beneficios de las técnicas de reducción de la dimensión. Por otro lado, se
estudiará cómo las citadas técnicas mejoran el condicionamiento del problema
gravimétrico inverso, así como el modo en que la solución se ve afectada por
el efecto del ruido en los datos. Fernández-Martínez (2015) muestra avances
preliminares en este sentido.
4. Otra futura línea de investigación importante es la aplicación del algoritmo
Particle Swarm Optimization y de las técnicas de reducción de la dimensión a
otros problemas geofísicos. Una técnica interesante es el problema
magnetotelúrico inverso, método mediante el cual se puede determinar la
estructura eléctrica y magnética del subsuelo a partir de mediciones en
superficie de los campos geomagnéticos y geoeléctricos naturales de la
Tierra. Este problema presenta, desde el punto de vista de esta Tesis, tres
características importantes: (i) un alto nivel de ruido en los datos
observados, (ii) alto número de parámetros modelo, y (iii) alto coste
computacional del problema directo. Estas particularidades convierten al
método magnetotelúrico en un reto a la hora de ser abordado mediante el
algoritmo PSO, pero los buenos resultados obtenidos en la inversión
gravimétrica indican que el problema puede ser resuelto con garantías.
5. Finalmente, una línea por explorar es el diseño y análisis de otros
algoritmos de muestreo y optimización, como los de evolución diferencial y su
combinación con técnicas de reducción de la dimensión.