Incorporación de información blanda para la cuantificación de la incertidumbre: aplicación a la hidrogeología


Tesis doctoral – Universidad Politécnica de Valencia – Escuela Técnica Superior de Ingenieros de Caminos, Canales y Puertos – Departamento de Ingeniería Hidráulica y Medio Ambiente
Director: J. Jaime Gómez Hernández
Eduardo F. Cassiraga
Opción A
2000

RESUMEN
 
      Esta tesis trata con un importante aspecto relacionado con la construcción de modelos numéricos para la simulación del flujo y el transporte de masa en acuíferos heterogéneos: la integración de toda la información disponible teniendo en cuenta su grado de confianza y su procedencia para la caracterización del medio físico. Esta integración está orientada a la cuantificación y reducción de la incertidumbre en las predicciones realizadas a partir de modelos numéricos.

      El análisis de riesgos en aquellos ámbitos de la ingeniería en los cuales el medio ambiente hidrogeológico juega un rol importante, requiere modelizar el flujo de agua subterránea y/o el transporte de masa en los acuíferos que lo integran. La solución más común es la utilización de modelos numéricos por medio de los cuales podemos predecir las respuestas del sistema hidrogeológico que estamos estudiando. Estos modelos deben estar condicionados a la información disponible con el fin de que sean lo más representativo posible del medio físico estudiado. De cara a un problema real es normal disponer de información directa acerca de algún parámetro que interesa describir, por ejemplo la porosidad o la permeabilidad. Estas medidas pueden provenir de ensayos in situ o de ensayos de laboratorio sobre testigos. La obtención de este tipo de datos requiere la realización de perforaciones en el terreno que, además de alterar las propiedades del subsuelo, son costosas. Por esta razón las medidas directas de parámetros hidrogeológicos suelen ser escasas y espacialmente dispersas. A este tipo de datos se lo llama información dura, ya que su incertidumbre puede considerarse nula o despreciable. Ademas de la información anterior, es posible contar con un tipo de información de tipo indirecta que no proporciona una medida del parámetro que interesa, sino la de algún otro que esperamos tenga alguna correlación con el primero. Por ejemplo, es posible relacionar medidas geofísicas de velocidad o atenuación sísmica con valores de porosidad y más débilmente con valores de permeabilidad. Dada la incertidumbre que conlleva, el establecimiento de estas relaciones, a este tipo de información se la denomina información blanda.

      Una de las fuentes más importante de información blanda la constituyen los re-conocimientos geofísicos. En esta tesis describimos la naturaleza y los principios de los métodos geofísicos con énfasis en aquellas aplicaciones capaces de recabar información útil para la caracterización hidrogeológica del terreno. Dada la naturaleza indirecta de la información geofísica, estudiamos las relaciones que los atributos geofísicos tienen con las variables hidrogeológicas de más interés como la conductividad hidráulica y la porosidad del terreno. Comprobamos que los reconocimientos geoeléctricos y sísmicos son los más comúnmente utilizados, los primeros por las analogías existentes entre el flujo de corriente y el de agua en el subsuelo, y los segundos por la cantidad y calidad de información que son capaces de recoger mediante sondeos. Todas las relaciones encontradas son de tipo determinístico y ninguna puede ser considerada universal.

      La información geofísica puede ser eficientemente integrada en los modelos numéricos, sin perder de vista su procedencia y la escala a la que fue registrada, a través de los algoritmos geoestadísticos de interpolación y representación estocástica. Estos algoritmos son descritos con cierto detalle en esta tesis. Un especial interés dedicamos a la simulación secuencial, dado que en la mayoría de las técnicas de representación estocástica presentadas, el condicionamiento a la información disponible se hace a través de este algoritmo. Tanto las técnicas de estimación como las de simulación son evaluadas a través de un ejercicio práctico. Las primeras fueron utilizadas para estimar el valor esperado de un campo aleatorio a partir de unos pocos datos acerca de la variable principal y de muchos más datos de otra variable considerada complementaria. Para los métodos de representación estocástica el ejercicio presentado es más complejo. Se emula el proceso de evaluación de la incertidumbre en el análisis de variables de respuesta tras el procesado de los campos generados por modelos numéricos de flujo subterráneo y transporte de masa. Estas variables de respuesta son los tiempos de viaje y las posiciones de llegada de partículas liberadas en un acuífero bajo ciertas condiciones. En ambos casos se observa el impacto que la información secundaria tiene sobre las predicciones realizadas y la importancia de utilizar aquellos métodos capaces de capturar la mayor cantidad de información acerca del patrón de continuidad espacial de las variables en juego.

      De entre los nuevos algoritmos de representación estocástica revisados, la técnica de simulación por campos de probabilidad es uno de los más atractivos. Este algo-ritmo requiere por un lado de la generación de campos de probabilidad y por otro de la construcción en cada celda a simular, de funciones de distribución de probabilidad de los valores del atributo modelizado. Cada valor simulado se obtiene a partir de la probabilidad (generada en el campo de probabilidad) y de la función de distribución correspondientes a su localización. Los campos de probabilidad son construidos por alguna de las técnicas clásicas de representación estocástica, por ejemplo simulación gausiana secuencial, y su estructura de variabilidad espacial es asimilada a la de la transformada uniforme de los datos de la variable a simular. Para esta asunción no hay ninguna justificación teórica. En esta tesis se estudia la posibilidad de utilizar los campos de probabilidad para la simulación de dos o más variables correlacionadas entre sí. Para ello no se establece ninguna hipótesis acerca del modelo de continuidad de los campos de probabilidad. Estos campos son construidos a partir de la (co)simulación de campos de dos variables y de la (co)estimación de las funciones locales de distribución para esas variables y realizando el proceso inverso al de simulación por campos de probabilidad. La estructura de continuidad espacial de los campos de probabilidad así obtenidos es investigada en función de la cantidad y calidad de los datos utilizados para condicionar la generación tanto de los campos de las variables como de las funciones de distribución.. Observamos que, tanto para la simulación de una como de varias variables, la correlación espacial de los campos de probabilidad es función de la cantidad y calidad de los datos. Por eso concluimos que antes de asumir sin más la hipótesis que expresa que la covarianza de los campos de probabilidad es asimilable a la de la transformada uniforme de los datos disponibles, es aconsejable realizar un estudio similar al que presentamos en esta tesis. La función de covarianza de los campos de probabilidad así obtenidos será la más adecuada para el ejercicio de simulación por campos de probabilidad.

      La última cuestión con la que tratamos en esta tesis está relacionada con la escala de la información. La mayoría de las técnicas de simulación estocástica comentadas son capaces de integrar datos a escala local como pueden ser las medidas de permeabilidad o porosidad derivadas de ensayos de laboratorio sobre pequeñas muestras de terreno. También es posible condicionar los modelos numéricos a información geofísica, casi siempre exhaustivamente conocida, como por ejemplo la velocidad sísmica derivada a través de una tomografía entre pozos o la reflectividad del terreno obtenida vía GPR (Ground Penetrating Radar). Hay situaciones prácticas en las que se dispone de otro tipo de datos que más que informar acerca del detalle local del atributo modelizado, restringen sus propiedades medias. Un ejemplo son los datos de transmisividad derivados de un ensayo de bombeo los cuales permiten obtener un valor representativo de la región que rodea al pozo. Otro ejemplo es el caso de la información procedente de la interpretación geológica del terreno, de la que podemos derivar espesores globales de la formación. También en el ámbito geofísico hay muchas técnicas que informan acerca de las propiedades promedio sobre un volumen de soporte grande. Este tipo de información está necesariamente relacionada con la información recabada a pequeña escala y no puede ser despreciada. En esta tesis se presenta un algoritmo que es capaz de generar simultáneamente campos aleatorios de las variables tanto a escala local como global imponiendo una relación lineal entre las variables a las dos escalas y en consecuencia entre sus estructuras de continuidad espacial. El algoritmo es evaluado a través de una serie de ejemplos prácticos mostrando que es capaz de reproducir tanto la relación existente entre los atributos como el modelo multivariado de continuidad espacial de ambas variables.


ABSTRACT
 
No disponible

ÍNDICE
 
Resumen iii<br> 
Agradecimientos vii

1 Introducción general 1
1.1 ¿Por qué la incertidumbre? 1
1.2 Modelos estocásticos y condicionamiento 3
1.3 Tipología de la información 6
1.4 Propósitos y alcances de esta tesis 8
1.4.1 La información geofísica 8
1.4.2 Relaciones entre parámetros geofísicos e hidrogeológicos 9
1.4.3 Técnicas geoestadísticas para combinar información 9
1.4.4 Simulación multivariada por campos de probabilidad 9
1.4.5 Simulación secuencial con restricciones lineales 10
1.4.6 Contribuciones 10
1.5 Organización de esta tesis 12

I Métodos geofísicos 13

2 Introducción 15
2.1 Geofísica e interpretación geofísica 15
2.2 Clasificación de métodos geofísicos 16

3 Descripción de métodos geofísicos 18
3.1 Alcances de esta revisión 18
3.2 Métodos gravimétricos 18
3.3 Métodos magnéticos 22
3.4 Métodos radiométricos 23
3.5 Métodos geotérmicos 25
3.6 Métodos eléctricos 28
3.6.1 Métodos de la resistividad 29
3.6.2 Método de polarización inducida 33
3.6.3 Método del potencial espontáneo 36
3.6.4 Método de las corrientes telúricas 38
3.7 Métodos electromagnéticos 39
3.8 Métodos sísmicos 42
3.8.1 Método de refracción 46
3.8.2 Método de reflexión 46
3.9 Teledetección 47
3.10 Métodos de registro en perforaciones 53
3.10.1 Registro del potencial espontáneo 54
3.10.2 Registros de resistividad 56
3.10.3 Registros radiométricos 63
3.10.4 Registros acústicos 65
3.10.5 Registros de gravedad 67
3.10.6 Registros de temperatura 69
3.10.7 Registros magnéticos 69
3.10.8 Registro sísmico vertical 70
3.10.9 Tomografía 71

II Relación entre parámetros geofísicos e hidrogeológicos 77

4 Introducción 79

5 Relación entre parámetros geoeléctricos e hidrogeológicos 81
5.1 Estructura hidrogeológica y prospección geoeléctrica 81
5.2 Relaciones 84
5.2.1 Relaciones empíricas 84
5.2.2 Relaciones analíticas 100
5.3 Síntesis de las relaciones encontradas 109
5.4 Hacia un modelo hidrogeofísico general 112
5.5 Consideraciones finales 114

6 Relación entre parámetros sísmicos e hidrogeológicos 116
6.1 Principio y definición de parámetros sísmicos 116
6.2 Relaciones 118
6.3 Síntesis de las relaciones encontradas 140
6.4 Consideraciones finales 141

III Métodos geoestadísticos para la integración de información 143

7 Introducción 145
7.1 Interpolación en el espacio 145
7.2 Clasificación de los algoritmos 148

8 Algoritmos de interpolación 150
8.1 Regresión tradicional 150
8.2 Krigeado 151
8.2.1 Krigeado simple 152
8.2.2 Krigeado ordinario 153
8.2.3 Krigeado universal 153
8.3 Krigeado con deriva externa 154
8.4. Cokrigeado 155
8.4.1 Cokrigeado simple 156
8.4.2 Cokrigeado ordinario 157
8.5 Cokrigeado colocalizado 158
8.5.1 Cokrigeado colocalizado bajo un modelo de Markov 159
8.6 Krigeado indicador 160
8.7 Cokrigeado indicador 163
8.7.1 Cokrigeado indicador bajo un modelo de Markov-Bayes 164
8.8 Estimación por campo de probabilidad 166

9 Estimación: ejemplo de aplicación 168
9.1 Descripción del ejercicio 168
9.2 Análisis de los resultados 178
9.2.1 Análisis visual 179
9.2.2 Análisis univariado de los valores estimados 185
9.2.3 Análisis univariado de los residuos 188
9.2.4 Análisis bivariado de los valores de referencia y de los estimados 188
9.3 Valoración final 191

10 Algoritmos de representación estocástica 193
10.1 Introducción 193
10.2 Simulación secuencial 194
10.2.1 Teoría 194
10.2.2 Evaluación del algoritmo 201
10.2.3 Conclusiones 209
10.3 Simulación por recocido simulado (annealing) 209
10.4 Simulación por campos de probabilidad 211
10.5 Algoritmos booleanos 213

11 Simulación: ejemplo de aplicación 214
11.1 Descripción y análisis de la información 214
11.2 Algoritmos evaluados y metodología 223
11.3 Análisis de los resultados 226
11.3.1 Simulación gausiana secuencial 226
11.3.2 Simulación gausiana secuencial por cokrigeado colocalizado bajo un modelo markoviano 226
11.3.3 Simulación indicadora secuencial 236
11.3.4 Simulación secuencial por cokrigeado indicador con un modelo de Markov-Bayes 236
11.3.5 Simulación por campos de probabilidad 237
11.3.6 Simulación por recocido simulado 237
11.4 Conclusiones 237

12 Posibilidades de aplicación de los campos de probabilidad a la simulación multivariada 240
12.1 Introducción 240
12.2 Desarrollo del ejercicio 242
12.2.1 Obtención de los campos de probabilidad 242
12.2.2 Primera parte 243
12.2.3 Segunda parte 247
12.2.4 Tercera parte 258
12.3 Conclusiones 258

13 Simulación secuencial condicionada con restricciones lineales 260
13.1 Introducción 260
13.2 Teoría 261
13.2.1 Ejemplo numérico sencillo 264
13.3 Implementación 265
13.4 Ejemplos 269
13.4.1 Ejemplo 1 269
13.4.2 Ejemplo 2 278
13.5 Conclusiones 291

14 Sumario y líneas futuras de investigación 293
14.1 Sumario 293
14.2 Líneas futuras de investigación 296

A El modelo de Markov 299

Bibliografía 301


CONCLUSIONES
 
      Esta tesis trata con una serie de aspectos relacionados con la construcción de modelos numéricos de acuíferos heterogéneos, con énfasis en la integración de toda la información relevante de la que se dispone en las situaciones prácticas. Los principales resultados a los que hemos llegado son:

      1. Información geofísica y su relación con los principales parámetros hidrogeológicos. La geofísica es una de las ciencias de la Tierra de la cual podemos extraer más y mejor información para caracterizar el medio geológico. La naturaleza de la información geofísica hace que ésta pueda ser considerada como información indirecta o blanda en el marco de una aproximación geoestadística a los problemas de flujo de agua subterránea y transporte de masa. Los principios y la naturaleza de los métodos geofísicos fueron descritos en esta tesis. El objetivo fue mostrar las fuentes geofísicas de las cuales se puede obtener información para mejorar nuestro conocimiento del subsuelo. Las relaciones entre los parámetros geofísicos más relevantes y los atributos de interés hidrogeológico fueron revisadas. Se observó que para el caso de los sondeos geoeléctricos, la metodología para la obtención de relaciones empíricas entre algún parámetro hidrogeológico y la resistividad de una formación es similar en todos los trabajos encontrados. Se trata de ajustar una curva de regresión a un grupo de valores que corresponden a una serie de puntos del acuífero en los que se han medido tanto la resistividad como el parámetro hidráulico en cuestión. Los datos de resistividad provienen de la interpretación de las curvas obtenidas en cada sondeo eléctrico vertical, y los datos hidráulicos de ensayos de bombeo realizados en las cercanías de los puntos sondeados. Las relaciones que se encuentran en la literatura no dejan de ser contradictorias, pudiéndose obtener, para los mismos parámetros, tanto relaciones directa como inversamente proporcionales. Todos los investigadores reconocen la limitación de sus resultados al entorno geológico en el que han sido verificados, aunque el procedimiento seguido para su determinación puede ser considerado general. En cuanto a las relaciones de tipo analítico son deducidas a partir de la hipótesis de que tanto el flujo hidráulico como el eléctrico están relacionados con la tortuosidad y la porosidad del medio. La similitud físico-matemática de las ecuaciones de ambos flujos permite obtener algunas expresiones de interés. Para la estimación de transmisividades es necesario modelizar su relación con la porosidad del medio. En cuanto a los reconocimientos sísmicos se vio que existe un acuerdo entre los investigadores en cuanto a las tendencias generales que muestran las relaciones entre parámetros sísmicos e hidrogeológicos. La velocidad sísmica, tanto la de compresión como la de corte, decrece conforme aumenta la porosidad. Prácticamente todas las relaciones ajustadas son de tipo lineal y es esperable que puedan variar sensiblemente de un entorno geológico a otro. Las primeras relaciones están basadas en la ecuación del tiempo medio. En este tipo de relaciones la velocidad sísmica está ligada sólo a la porosidad. Posteriormente los investigadores consideraron, además de la porosidad, al contenido de minerales arcillosos como variables independientes en las relaciones con la velocidad sísmica. En cuanto a la permeabilidad parece que no afecta sensiblemente a las velocidades sísmicas.

      2. Algoritmos geoestadísticos para la integración de información. La geoestadística dispone de un conjunto de técnicas que permiten relacionar dis-tintos tipos de información teniendo en cuenta su origen y su calidad. Bajo un esquema geoestadístico no es necesario establecer relaciones únicas y determinfsticas entre las variables en juego como las vistas en los primeros capítulos de esta tesis. Toda la información es tratada sistemáticamente con el objetivo de construir, si este fuera el caso, verdaderos modelos de incertidumbre acerca de los atributos modelizados. Las técnicas geoestadísticas de estimación y simulación para combinar información fueron revisadas en esta tesis tanto desde el punto de vista teórico como práctico. Las técnicas de estimación fueron evaluadas a través de un ejercicio en el cual estimamos un campo de una variable considerada principal a partir de unos pocos datos de ésta y una mayor cantidad de información acerca de otra variable considerada secundaria. Se mostró que la consideración de la información secundaria produce notables mejoras en lo que se refiere a la resolución de los campos estimados. El algoritmo de estimación basado en campo de probabilidad funciona muy bien, sin embargo al requerir información secundaria exhaustiva la calidad del campo estimado desmejora notablemente cuando ésta escasea. Desde el punto de vista de la eficiencia computacional podemos decir que si disponemos de información secundaria exhaustiva el algo-ritmo de cokrigeado colocalizado es el más aconsejable. Si bien la elección de un único algoritmo depende del tipo de problema y de la cantidad de información disponible, se concluyó con claridad que el algoritmo de cokrigeado indicador con un modelo de Markov-Bayes es el que produce el mejor campo estimado. En el caso de los algoritmos de simulación, estos se evaluaron procesando los campos con un modelo numérico de flujo y transporte de masa en un acuífero rectangular. Los tiempos de viaje y la posición de llegada fueron analizados estadísticamente para cada uno de los algoritmos aplicados. Se mostró que el algoritmo de cokrigeado indicador con un modelo de Markov-Bayes es de los más robustos. Especial interés se dedicó a la simulación secuencial, por estar en la base de la mayoría de los algoritmos que se describen. Esta técnica es fácil de comprender y es completamente general siendo los campos generados a través de ella condicionales por construcción. Debido a problemas de implementación algunas aproximaciones fueron realizadas para que el algoritmo sea de aplicabilidad práctica. Aún así se demostró que para el caso de un modelo multigausiano, el impacto de tales aproximaciones no afecta ni la reproducción del histograma ni la del modelo de covarianzas de entrada en los conjuntos de campos generados.

      3. Simulación multivariada por campos de probabilidad. Con el objeto de analizar la aplicabilidad de la simulación por campos de probabilidad a la integración de información, se estudió la estructura de los campos de probabilidad que habría que generar para conseguir la simulación de una o dos variables condicionadas a datos de una o de ambas variables. Sin establecer ninguna hipótesis acerca del modelo de continuidad espacial de los campos de probabilidad estos campos fueron construidos a partir de la (co)simulación de campos de dos variables y de la (co)estimación de las funciones locales de distribución para esas variables. Los campos de probabilidad obtenidos fueron evaluados con el fin de estudiar: a) la correlación lineal punto a punto entre los correspondientes a la variable 1 y los correspondientes a la variable 2, b) los variogramas medios de los conjuntos de campos de probabilidad para una y otra variable en función del número de datos condicionantes, c) el comportamiento de los campos de probabilidad de las variables 1 y 2 en función de la correlación impuesta a través de los datos y del modelo de corregionalización a los campos simulados y a las funciones locales de distribución, y d) la sensibilidad de los variogramas de la transformada uniforme de una de las variables con respecto a la cantidad de información disponible. El análisis realizado permitió concluir que los campos de probabilidad son sensibles a la cantidad de información. Tanto para la simulación de una como de varias variables se vio que la correlación espacial de los campos de probabilidad es función de la cantidad de datos, por lo que para la definición del modelo de variabilidad espacial de los campos de probabilidad es necesario tener en cuenta la cantidad de información disponible. Creemos que antes de asumir sin más la hipótesis que expresa que la covarianza del campo de probabilidad es asimilable a la de la transformada uniforme de los datos disponibles, es aconsejable realizar un estudio similar al que presentamos en esta tesis para deducir experimentalmente las funciones de covarianza y covarianza cruzada utilizadas en la generación de los campos de probabilidad.

      4. Simulación secuencial condicionada con restricciones lineales. Entre los tipos de información secundaria de los que podemos disponer en situaciones prácticas reales hay datos que más que informar acerca del detalle local del atributo modelizado, restringen sus propiedades medias. Por ejemplo, los datos de transmisividad derivados de ensayos de bombeo los cuales permiten obtener un valor de la transmisividad representativa de la región que rodea al pozo; o el caso de la información procedente de la interpretación geológica del terreno, de la que podemos derivar espesores tanto globales como de los distintos estratos que lo integran si este fuera el caso. También en el ámbito geofísico hay muchas técnicas que informan acerca de las propiedades del terreno en una columna soporte a una escala mayor a la de interés. (por ejemplo los reconocimientos gravimétricos, magnéticos, radiométricos, geotérmicos, los sondeos eléctricos superficiales, la teledetección, etc). En esta tesis se presentó un algoritmo que es capaz de generar simultáneamente campos aleatorios condicionados tanto a información a escala local como a información de tipo global en el marco de la simulación secuencial. Los valores de las variables y sus estructuras de continuidad espacial están relacionadas linealmente. El algoritmo fue evaluado a través de una serie de ejemplos prácticos mostrando que es capaz de reproducir tanto la relación existente entre los valores de una y otra variable como el modelo multivariado de continuidad espacial de ambas variables.