Sistema de detección y clasificación de señales Sísmico-Volcánicas utilizando modelos ocultos de Markov (HMMs): Aplicación a volcanes activos de Nicaragua e Italia
Resumen Abstract Índice Conclusiones
Ligdamis Anaxis Gutiérrez Espinoza
2014-A
La presente tesis aplica técnicas de reconocimiento y clasificación de señales, mediante modelos matemáticos a una serie de datos sísmicos generados en continuo y que proceden de cuatro volcanes activos. Dos situados en Europa en Italia y dos en Centro América en Nicaragua. El objetivo principal es desarrollar un reconocedor de eventos sísmico-volcánicos que minimice el error de clasificación con un costo computacional aceptable, que permita llevar a cabo un análisis mucho más fiable de las señales sísmicas producidas en los volcanes del que actualmente se realiza de forma manual. Este proceso pasa por un reconocimiento de los tipos de eventos sísmicos que se producen en los volcanes estudiados, a través de un análisis de las características espectrales de la señales y de algoritmos de reconocimiento.
El desarrollo del estudio de los datos corresponde al registro de señales producidas por eventos acontecidos y recopilados en cuatro campañas; dos realizadas en dos volcanes de Italia; el Etna y Strómboli en un período de actividad de una semana durante 1997 y 1999 respectivamente, y otras dos en Nicaragua; con el volcán San Cristóbal y el volcán Telica, en un período de actividad de dos semanas del 16 de febrero al 10 de Marzo del 2006 en ambos volcanes.
Para este fin se utiliza como herramienta para realizar el entrenamiento de los modelos y posterior reconocimiento de eventos, el razonamiento de los modelos ocultos de Markov (Hidden Markov Models: HMMs), a través de un proceso de parametrización de las señales en componentes cepstrales.
Uno de los logros del proyecto, ha sido el construir un prototipo de un sistema automático reconocedor y clasificador de eventos sísmicos en volcanes, que sea capaz en un futuro de funcionar en tiempo real, facilitando y ayudando en la labor de los especialistas y/o el operador humano en el análisis y futuras predicciones que suceden en el desarrollo de la actividad de un volcán. En esta misma línea, también se ha desarrollado una aplicación para ayudar en la conversión de formatos y el análisis de los eventos sísmico-volcánicos previo a la clasificación.
El presente trabajo, ha podido brindar un acercamiento a la definición particular de cada uno de los tipos de eventos que se producen en los volcanes estudiados, así como sus características, debido a que como ocurre en el caso particular de Nicaragua, aún no se maneja una clasificación en dichos volcanes. Por lo tanto, aportar información sobre los tipos de eventos que se producen en la cadena volcánica cuaternaria de Nicaragua es un éxito importante. Logrando de esta forma, al igual que en los de Italia, que se pueda identificar en el menor tiempo, el tipo de evento que ocurre en cada volcán. De esta manera, podrían despejarse dudas y conocer las causas y posibles consecuencias, llevando así a una toma de decisiones sobre un valor de la fiabilidad y no solamente del simple parecer humano. Por lo tanto, el método empleado en este trabajo no solo implicaría la existencia de eventos, también brindaría una medición técnica al reconocimiento visual de los mismos (lo que actualmente se realiza por los expertos en los observatorios), ya que estaría aportando el poder reconocer qué tipo de evento está ocurriendo en un determinado período de fuerte actividad sísmica, previa o posterior a una inminente erupción, lo que repercutirá en desarrollar sistemas de alerta temprana mucho más fiables, que minimicen las consecuencias de riesgo a la población en las acciones de vigilancia y prevención sísmico-volcánica.
Por último un logro particular a destacar, y que acompaña el desarrollo de esta tesis, ha sido la cooperación y el trabajo interdepartamental, ya que para alcanzar la presente tesis en Ciencias de la Tierra, se han unido dos departamentos de ámbitos de conocimientos muy distintos; los departamentos del Instituto Andaluz de Geofísica y Prevención de desastres sísmicos (IAG), con el departamento de Teoría de la Señal, Telemática y Comunicaciones (TSTC). Esto marca un hito en el futuro de la cooperación entre departamentos de la Universidad de Granada.
El objetivo de este trabajo es construir un prototipo de un sistema de detección y clasificación de eventos sísmico-volcánicos. Que sea capaz en un futuro de funcionar en tiempo real y facilitar así la labor de los especialistas, en el análisis y futuras predicciones que suceden en el desarrollo de la actividad de un volcán. En el estudio de los datos sísmicos, el problema de clasificación de las señales generadas por un volcán se resuelve de forma automática, utilizando técnicas similares a las implementadas en los sistemas de reconocimiento automático de voz. Dichos datos, corresponden a señales producidas por eventos acontecidos en cuatro volcanes activos; dos de ellos; los volcanes Etna e Strómboli de Italia, en un período de actividad de una semana. Los otros dos San Cristóbal y Telica ubicados en Nicaragua, Centro América se presentan en un período de actividad de dos semanas. Se ha determinado la selección de estos cuatro volcanes debido a que poseen características geológicas similares, aunque se encuentren en zonas geográficas diferentes. De esta forma, puede observarse si existe similitud en los eventos sísmicos que se producen en ellos. En el caso de Italia, se ha trabajado con eventos sísmicos ya catalogados, ampliamente conocidos y estudiados, que en el caso del Etna es el denominado “Tremor burst” (TB), y otro evento asociado a ruidos, producidos en el volcán por diferentes causas a los que se les denominó Noise Etna (NE). En el caso del Strómboli también se han utilizado eventos muy característicos, ampliamente conocidos, “las explosiones estrombolianas”, denominadas en el presente estudio como “explosiones Strómboli” (Exp), de manera similar que en el Etna, se ha considerado además, un evento relacionado a ruidos producidos en el volcán (asociados a diferentes causas), a los que se les denominó Silencio (Sil).
En el caso de los volcanes de Nicaragua no se dispone de ninguna clasificación, por lo que se está marcando pautas iniciales en eventos que no han sido analizados ni catalogados, llegando a ser pioneros en este campo, y nombrar de forma temporal durante el estudio, después de un exhaustivo análisis, los eventos encontrados de una forma genérica hasta lograr en un futuro un consenso con los sismólogos locales el tipo de evento al que pertenecen de acuerdo a una determinada escuela. De esta forma en Nicaragua se han podido catalogar siete tipos de eventos en los dos volcanes, en el San Cristóbal se analizaron tres tipos de eventos, denominados S1, S2 y S3 con su correspondiente ruido asociado, nombrado “Noise San Cristóbal (NS)”. Para el volcán Telica, fueron cuatro eventos llamados como T1, T2, T3 y T4, así como el ruido asociado o “Noise Telica (NT)”. Este procedimiento de estudio, incluye un detallado análisis espectral de los registros capturados por los sensores sísmicos, para obtener un conjunto de parámetros representativos de la señal y construir una fiable base de datos, sobre la que se aplique los algoritmos, tanto de entrenamiento de los modelos como de reconocimiento. Así, se utiliza como herramienta para realizar el entrenamiento de los modelos y posterior reconocimiento de eventos, el modelado oculto de Markov (Hidden Markov Models, HMMs). Obteniendo así, en las pruebas un porcentaje de aciertos en el reconocimiento de eventos en el Etna y Strómboli en pruebas cerradas superior al 93 % y un porcentaje de precisión de más de 94%. Además, se obtuvo una mejora en la matriz de confusión respecto al reconocimiento de los eventos, reduciendo el porcentaje de error en cada evento analizado. Para el caso de los volcanes de Nicaragua se realizaron pruebas tanto abiertas como cerradas y se obtuvieron resultados en el orden cercano al 95% de efectividad en pruebas cerradas.
Otro de los logros que manifiesta el sistema, ha sido el poder reconocer con éxito eventos que inicialmente no habían sido marcados por el observador. De esta forma, el número de eventos reconocidos se incrementó. Por otra parte, el sistema logra descartar con éxito eventos claramente definidos por el ruido y clasificándolos como tales. Por lo tanto, se afirma que se ha obtenido un sistema de entrenamiento de modelos fiable para el proceso de reconocimiento y clasificación de señales de eventos sísmicos en los volcanes, el cual puede en un futuro ser aplicado en tiempo real. Adicionalmente, en el curso de los experimentos, hemos establecido la premisa de que no es posible generalizar el modelo de entrenamiento. Esto se deduce al mezclar las bases de datos de los cuatro volcanes y no obtener resultados positivos. Por lo que se concluye que el modelo de entrenamiento no es posible emplearlo en la generalidad de los volcanes, sino más bien, debe de tomarse cada estructura volcánica como un caso muy particular y único y realizar así un análisis y construcción de modelos de entrenamiento y clasificación de eventos de forma particular, pudiendo aplicar el método de forma general pero conformar la base de datos del entrenamiento de los modelos diferente en cada volcán.
Este estudio se inició de la experiencia recopilada en el desarrollo de un trabajo de investigación, cuyo eje central fue el estudio de eventos sísmicos en dos volcanes activos de Italia; el Etna y el Strómboli. Los datos que en esa ocasión se obtuvieron pertenecían a un equipo de investigación Ibero-Italiano en Septiembre de 1997. Puesto que no hay dos volcanes iguales aunque estén situados en una misma área geográfica y sean de similares características geológicas, el presente estudio ha recopilado datos de cuatro volcanes de características similares para establecer una comparación entre los eventos que se producen y poder establecer así un reconocimiento y clasificación de eventos de manera fiable.
El trabajo consta de dos grandes partes que a su vez se dividen en seis capítulos. La primera parte describe la presentación del problema y engloba la parte teórica y metodológica a utilizar. Abarca del capítulo uno al capítulo dos.
El capítulo uno tiene como objetivo describir el estado del arte de las señales y la importancia de la aplicación de técnicas de reconocimiento de patrones. De este modo, se presentan las características y la estructura general del procesamiento de señales. Adicionalmente, se describe el problema del reconocimiento de las señales sísmicas en los volcanes, los tipos de eventos producidos, sus relaciones con mecanismos volcánicos, la importancia de su caracterización y la necesidad de reconocer las señales en tiempo real. Por otro lado se describen las características generales de los sistemas de reconocimiento cuyo objetivo final es su aplicación a sistemas de alerta temprana en tiempo real de erupciones volcánicas.
El capítulo dos establece de forma teórica, cómo se realizará el análisis de las señales recopiladas en las distintas campañas de Italia y Nicaragua. Se presentará por lo tanto, el marco teórico matemático que permitirá el estudio de las señales sísmico- volcánicas, la caracterización de las mismas y el diseño y construcción de un sistema de reconocimiento automático de eventos sísmicos producido por los volcanes en estudio. En este capítulo se establecen las bases del análisis espectral de las señales, que va a permitir poder identificar los diferentes tipos de eventos que se utilizarán para la construcción de bases de datos etiquetada; dicho análisis se realiza en el dominio de la frecuencia, haciendo uso de la transformada de Fourier y el espectrograma de las señales. También en este capítulo, se determinará la metodología a aplicar en el sistema de reconocimiento basado en los Modelos Ocultos de Markov. El análisis aquí propuesto, podría en un futuro complementarse con herramientas adicionales, que se detallan en los apéndices (ver apéndices D y E).
La segunda parte comprende la parte práctica, desde el trabajo de campo que involucra las campañas de recopilación de los datos, a la implementación del método y los resultados obtenidos. Aquí también se presenta la aplicación que se ha desarrollado a partir de los estudios implicados en este trabajo. Esta segunda parte engloba desde el capítulo tres hasta el capítulo seis.
El capítulo tres describe las zonas de estudio en los volcanes, las campañas a realizar y los instrumentos empleados. En este capítulo se recoge una descripción detallada en cuanto a historia y sismología del sitio de recopilación de datos de los cuatro volcanes de estudio: dos volcanes situados en Nicaragua y dos en Italia, así como las estaciones e instrumentos que permiten la recopilación de los datos. Esta información sirve de ayuda para el desarrollo del estudio dentro del marco geográfico y particular de la actividad sísmica que presenta cada volcán. En este mismo capítulo se desarrolla la adquisición de datos por parte del investigador. Aquí se recopilan los pasos realizados en la obtención de los registros sísmicos en los cuatro volcanes. En el apéndice F se describe el proceso de transformación de los datos, desde que son tomados en crudo en lenguaje binario en el sitio, hasta que son preparados mediante diversos formatos de conversión para ser capaces de ser procesados por los modelos de entrenamiento.
El capítulo cuatro presenta el análisis de los datos. También plantea una descripción de la obtención de los diferentes tipos de eventos y sus características. Con estos tipos de eventos que han sido definidos mediante la experiencia del observador, se han de desarrollar los análisis en el presente estudio. Aquí, hacemos hincapié en un análisis espectral mucho más detallado, con cada uno de los diferentes tipos de eventos sísmicos encontrados en los registros. Además de presentar las características espectrales de los eventos sísmicos de cada volcán, definiendo los tipos de eventos con los que se ha de trabajar en el proceso de reconocimiento que se verá en el siguiente capítulo. Se abordará la complejidad de los eventos sísmico-volcánicos al describir las estadísticas de duración de cada tipo de evento y se detallará el procedimiento de segmentación y etiquetación manual para la construcción de las bases de datos de entrenamiento, que como se indicará en este capítulo, es uno de los pasos más delicados, ya que una buena base de datos bien segmentada, asegura el éxito en las pruebas de entrenamiento y reconocimiento. Por último, en este capítulo se establecerá una clasificación genérica con los tipos de eventos determinados en los volcanes de estudio de Nicaragua, ya que en la actualidad no corresponden a ninguna clasificación en particular.
El capítulo cinco presenta la realización de la aplicación del método de estudio. Cada tipo de evento de los determinados en el capítulo anterior se ha de generar un conjunto de vectores parametrizados. En el apéndice H se detalla todo lo que involucra este proceso como son: la creación de los diccionarios de eventos y las gramáticas, la creación del modelo base o prototipo, y establecer los parámetros de configuración mediante scripts de entrenamiento y reconocimiento (Ver apéndice H).
El desarrollo de la aplicación de método implica el desarrollo de cuatro tipos de pruebas: las primeras son las denominadas “test cerrado o entrenamiento”, realizadas sobre la base de datos previamente etiquetada. Un resultado exitoso en las pruebas, indicaría un porcentaje de precisión superior al 80%. A partir de los resultados iniciales, se introducirá un proceso de mejoras en las pruebas cerradas, que consistirá en realizar una serie de modificaciones a algunos de los parámetros de configuración iniciales, para observar cuál de ellos incrementa los porcentajes de acierto y precisión, y a la vez determinar si se pueden disminuir los valores de las inserciones, borrados y sustituciones en los eventos. Dicho proceso de mejoras constará de cinco pasos; los primeros cuatro, comprenderán la modificación de cuatro de los parámetros de configuración iniciales, el quinto no versará sobre el fichero de configuración, sino que significará realizar un proceso de depuración en el último resultado de los cuatro pasos previos, para eliminar de la base de datos, aquellos registros que obtengan menores porcentajes de aciertos y que estuvieran perjudicando tanto los porcentajes de resultado como el reconocimiento de los eventos. Los cinco puntos son los siguientes:
a) Cambio en el número de iteraciones
b) Cambio en el número de Gausianas
c) Cambio en el factor de penalización (-p) de la herramienta de reconocimiento Hvite
d) Cambio en el número de estados *
e) Proceso de depurado selectivo de los registros, con menores porcentajes de acierto
En el paso “d”, se determina marcar un hito (*), en donde se repetirán las pruebas con el número de gausianas del paso “b”, y se ha determinado establecer este punto, para tomar un valor de referencia de las mejoras que hasta ahora se han obtenido con las modificaciones. Una vez finalizados estos cinco pasos del proceso de mejoras del test cerrado, el siguiente paso a realizar es el segundo tipo de pruebas, denominadas “test abierto o ciego”, la que esencialmente trata en dividir en dos partes la base de datos. Una primera parte la formarán los modelos entrenados, para pasarlos después a la parte restante y observar los porcentajes de reconocimiento del modelo entrenado sobre la parte restante. El tercer tipo de pruebas a realizar son las denominadas “ciego – ciego”, en donde la base de datos de entrenamiento reconocerá registros adicionales, que no han sido previamente parametrizados y que se encuentran sin segmentar (no etiquetados), donde la mayoría de ellos posee un fuerte contenido de ruido de fondo. Con esta prueba, podrá constatarse si el modelo de entrenamiento puede reconocer eventos en registros que no han sido manipulados por el observador. Los resultados de estos tres grupos de pruebas podrán medir la eficacia del sistema, para poder reconocer las señales sísmico-volcánicas en cada volcán. El cuarto y último grupo de pruebas, consistirán en “mezclar las bases de datos de entrenamiento”, para así poder ver la generalización o no, de los resultados obtenidos. Es decir, si los modelos de entrenamiento de un volcán pueden reconocer eventos en los registros de otro volcán. Para ello se mezclarán las bases de datos y los modelos en dos fases; la primera mezclará las del Etna con las del Strómboli, y las del San Cristóbal con las del Telica, en la segunda fase se realizarán la mezcla de las bases de datos y los modelos de entrenamiento de los cuatro volcanes. Al final del capítulo se atenderá a la discusión de resultados.
El capítulo seis, presenta las conclusiones, metodológicas y experimentales obtenidas durante el desarrollo de este trabajo, así como las futuras investigaciones que pueden resultar de las experiencias y conclusiones a las que se han llegado mediante los resultados del presente trabajo.
Por último, se han incluido varios apéndices que ayudan y complementan toda la información que se maneja en la presente tesis. El apéndice A presenta las publicaciones científicas, y las ponencias que se han derivado fruto del desarrollo de la presente tesis. El apéndice B ayuda a situar a la región Centro Americana y concretamente a Nicaragua en el marco geodinámico, presentando el ámbito sísmico-volcánico. Este apéndice ha sido incluido con el fin de aportar a dicha recopilación, un marco teórico sobre la importancia y la historia de los volcanes que conforman la cadena cuaternaria del Pacífico de Nicaragua. Debido a que la información sobre este tema no es particularmente abundante, se ha creído conveniente incluirlo aquí, para poder brindar una breve información sobre los procesos sísmicos, la historia y la influencia sobre la población actual y futura de Nicaragua. El apéndice C describe la historia eruptiva y actividad sísmico-volcánica de los volcanes de estudio durante el período de recopilación de datos. Los apéndices D y E incluyen las herramientas complementarias en el análisis de la caracterización de las señales sísmico volcánicas que se tratan en el capítulo segundo, así como su aplicación a los diferentes tipos de eventos aquí estudiados. El apéndice H realiza una detallada descripción de los principales programas utilizados en el presente estudio.
En esta misma línea, en el apéndice G se ha agregado una implementación tecnológica tendiente a la ayuda en los análisis de las señales sísmico-volcánicas. A partir de los análisis de los eventos sísmico-volcánicos, se ha logrado desarrollar un software que provee de herramientas para desarrollar un análisis espectral de las señales, así como la conversión, para ser utilizado como herramienta de ayuda en el posterior reconocimiento y clasificación de dichas señales mediante los modelos ocultos de Markov (HMMs). El sistema ha sido desarrollado utilizando Matlab V.9, mediante la programación de interfaces gráficas de usuario (GUI).
Key words: Tremor Burst, Noise Etna, HMMs, parametrización, componentes cepstrales
Agradecimientos1
Prólogo3
Abstract Extendido5
Extended Abstract11
PRIMERA PARTE: INTRODUCCIÓN, ANTECEDENTES Y
PRESENTACIÓN DEL CASO DE ESTUDIO15
CAPÍTULO 1.- Introducción17
1.1.- Impacto de terremotos y volcanes sobre la sociedad19
1.2.- Las señales22
1.2.1 Tipos de señales22
1.2.2 El problema de la clasificación de las señales23
1.2.3 Señales analógicas y digitales23
1.2.4 Procesamiento de señales25
1.3.- Reconocimiento y clasificación de patrones26
1.4.- Ámbitos relacionados con el reconocimiento sísmico28
1.5.- Los volcanes y sus manifestaciones29
1.6.- Señales sísmicas producidas en volcanes32
1.6.1.- Tipos de eventos sísmicos-volcánicos33
1.6.2.- Problemas de reconocimiento de las señales sísmico-volcánicas37
1.7- Familia de eventos sísmico-volcánicos39
CAPÍTULO 2.- Metodología y Herramientas41
2.1 Introducción.43
2.2 La transformada de Fourier y el Espectrograma43
2.2.1 La transformada de Fourier43
2.2.2 El Espectrograma45
2.3 Descripción de la señal en el domino cepstral46
2.4 Los Modelos Ocultos de Markov.
Aplicación a un sistema de un sistema de reconocimiento48
2.4.1 Definición de un HMM48
2.4.2 HMM como generador de secuencias de observaciones49
2.4.3 Los tres problemas básicos y soluciones propuestas50
2.5 Esquema de un sistema de reconocimiento basado en HMM51
2.6 Implementación con HTK52
2.6.1.- Descripción de HTK52
2.6.2.- Interfaz de usuario.53
2.6.3.- Preparación de los datos54
2.6.4.- Entrenamiento56
2.6.5.- Reconocimiento58
2.6.6- Análisis (Evaluación de los resultados)58
SEGUNDA PARTE: CAMPAÑAS, EMPLAZAMIENTOS Y DATOS61
CAPÍTULO 3.- Zonas de estudio, Instrumentos y Campañas63
3.1.- Introducción65
3.2.- Marco Volcánico67
3.2.1.- El volcán Etna67
3.2.2.- El volcán Strómboli69
3.2.3.- El volcán San Cristóbal70
3.2.4.- El volcán Telica72
3.3.- Estaciones sísmicas e instrumentos de medición en los volcanes de estudio73
3.3.1.- Tipos de estaciones sísmicas73
3.3.2.- Estaciones e instrumentos en el Etna75
3.3.3.- Estaciones e instrumentos en el Strómboli80
3.3.4.- Elección de los sitios de estudio en Nicaragua83
3.3.5.- Estaciones e instrumentos en el San Cristóbal85
3.3.6.- Estaciones e instrumentos en el Telica89
3.4.- Transformación y unificación de formatos de los datos.93
CAPÍTULO 4.- Análisis de los Datos95
4.1.- Introducción97
4.2.- Determinación de los tipos de eventos.97
4.2.1.- Tipos de eventos del volcán Etna99
4.2.2.- Tipos de eventos del volcán Strómboli100
4.2.3.- Tipos de eventos del volcán San Cristóbal101
4.2.4.- Tipos de eventos del volcán Telica105
4.3.- Análisis espectral de los eventos109
4.3.1.- Análisis mediante la transformada rápida de Fourier109
4.3.2.- Análisis de los espectrogramas de los eventos114
4.4.- Estadísticas de la duración de los eventos126
4.4.1.- Estadísticas en el volcán Etna126
4.4.2.- Estadísticas en el volcán Strómboli126
4.4.3.- Estadísticas en el volcán San Cristóbal127
4.4.4.- Estadísticas en el volcán Telica127
4.5.- Proceso de etiquetado manual de la base de datos130
CAPÍTULO 5.- Aplicación del método y resultados135
5.1 Introducción137
5.2 Desarrollo de las pruebas en los volcanes138
5.2.1.- Análisis de resultados en el Etna138
5.2.2.- Análisis de resultados en el Strómboli152
5.2.3.- Análisis de resultados en el San Cristóbal164
5.2.4.- Análisis de resultados en el Telica177
5.3.- Pruebas cruzadas con las bases de datos188
5.3.1.- Pruebas cruzadas entre el Etna y el Strómboli188
5.3.2.- Pruebas cruzadas entre el San Cristóbal y el Telica191
5.3.3.- Resultado de las pruebas cruzadas con los cuatro volcanes
(Etna, Strómboli, San Cristóbal, Telica)193
5.4.- Discusión de resultados195
CAPÍTULO 6.- Conclusiones y trabajos a futuro203
6.1. – Conclusiones y logros205
6.1.1.- Conclusiones Metodológicas205
6.1.2.- Conclusiones Experimentales206
6.2. – Trabajos a futuro209
6.3. – Conclusions and Successes211
6.3.1 Methodological conclusions211
6.3.2 Experimental conclusions212
6.4. – Future Works215
Bibliografía217
Listado de Figuras233
Listado de tablas245
APÉNDICES249
Apéndice A: Referencias a trabajos publicados251
Apéndice B: Ámbito sísmico-volcánico de Centro América y Nicaragua255
Apéndice C: Historia eruptiva y actividad sísmico-volcánica durante el período de
recopilación de datos273
Apéndice D: Herramientas complementarias en el análisis de señales293
Apéndice E: Aplicaciones a las señales sísmicas de las herramientas
complementarias de análisis de poder espectral
y componentes Wavelet299
Apéndice F: Procedimiento de conversión de Formatos339
Apéndice G: Implementación Tecnológica351
Apéndice H: Programas369
Apéndice I: Formulario383
Conclusiones y Logros
Con los resultados recabados en el presente trabajo, han podido definirse las siguientes conclusiones metodológicas y experimentales:
6.1.1.- Conclusiones Metodológicas
a) Esta tesis ha demostrado que el proceso de reconocimiento automático de señales sismo-volcánicas, puede realizarse de manera fiable y precisa mediante el uso de las técnicas de reconocimiento basadas en modelos HMM.
b) A partir de la realización de la aplicación del conjunto de datos, hemos demostrado que con el fin de tener un resultado fiable, es crucial un adecuado proceso de segmentación.
c) Ha sido posible generar modelos de entrenamiento con éxito en dos volcanes activos de Italia, utilizando cuatro tipos de eventos incluyendo el ruido de fondo. De la misma forma, se han generado modelos de entrenamiento efectivos, en los volcanes San Cristóbal y Telica de Nicaragua, utilizando 9 tipos diferentes de eventos incluyendo el ruido de fondo.
d) Se determina la utilidad como herramienta para establecer los tipos de eventos sísmico-volcánicos, del análisis espectral basado en la transformada rápida de Fourier y el espectrograma, ya que dan una información útil en primera aproximación.
e) En esta tesis se ha explorado otras herramientas para complementar el análisis de la caracterización de las señales presentes en volcanes, fundamentalmente análisis basados en densidad de espectro de potencia y la transformada Wavelet.
f) Se establece que los parámetros de configuración, utilizados en las diferentes pruebas al mejorar el porcentaje de los modelos difieren en cada volcán, lo que determina que no necesariamente puede establecerse un conjunto único de configuraciones para todos los volcanes, necesitando entrenar cada base de datos, de acuerdo a unas características específicas de las señales sísmico-volcánicas presentes en cada volcán.
g) Se ha podido estimar la valía de la caracterización espectral de las señales sísmico-volcánicas, para poder constituir una base de datos fiable. Esto ha sido particularmente útil en eventos desconocidos, generados por los dos volcanes activos de Nicaragua, y que aún no han sido clasificados ni estudiados a fondo a diferencia de los volcanes de Italia, en los que diversos autores en trabajos previos han catalogado y estudiado profusamente los eventos producidos por ellos.
h) Se ha presentado un extenso análisis, de cómo las componentes espectrales de las señales que constituyen los eventos sísmico-volcánicos en los cuatro volcanes de estudio, presentan características únicas, las cuales se diferencian significativamente en todos los volcanes. Esto establece que aunque los volcanes sean de características geológicas muy similares y estén situados geográficamente muy cercanos, los eventos que producen, difieren.
6.1.2.- Conclusiones Experimentales
i) Las pruebas cerradas concluyeron con modelos de entrenamiento que mostraron una eficiencia superior al 90 % en los cuatro volcanes, en cuanto a las pruebas abiertas estas presentaron porcentajes de efectividad superiores al 88%, lo que indica la eficacia en el reconocimiento por parte del sistema.
j) El sistema ha podido discriminar bien el ruido de fondo presente en los registros de los volcanes para que este no influya en los resultados.
k) Se ha determinado que el sistema difiere un poco del observador, al marcar el inicio y el fin de cada evento en la clasificación. Sin embargo, esto no afecta el resultado final de las pruebas y los reconocimientos.
l) Se ha podido comprobar en el San Cristóbal la presencia de eventos como el tremor armónico, estos eventos acompañan al tremor de fondo normal que presentan los volcanes y que precisan de un análisis de sus características y el papel que desempeñan en el ámbito sísmico. Esto debe de representar un trabajo mucho más detallado para futuras investigaciones.
m) Se ha logrado consolidar el catálogo de los eventos que predominan en la actividad de los dos volcanes Telica y San Cristóbal como aporte al estudio sismológico local de Nicaragua. Este catálogo no existía al realizar el presente estudio, lo que sumado al consenso que se debe de realizar entre los sismólogos a cargo del estudio de los volcanes de Nicaragua, debe de llevar a que se establezca el tipo correcto, al cual pertenecen cada evento de acuerdo a la escuela que se juzgue conveniente seguir.
n) En los entrenamientos y el reconocimiento de los modelos, las matrices de confusión de los eventos no describieron muchas sustituciones entre los eventos. Por otra parte, si se toma en cuenta que la mayoría de los eventos eliminados e insertados por el sistema, corresponden a ruidos tanto en Nicaragua como en Italia, esto indicaría que el porcentaje en precisión en todos los volcanes estaría cercano al 94 %.
o) El sistema reconoce eventos que no han sido etiquetados por el observador, pudiendo reconocer más de un tipo en un registro o catalogar más de dos eventos del mismo tipo dentro de un mismo registro. En este sentido, se acepta como un acierto o éxito los eventos que el sistema ha insertado ya que corresponden a eventos que el observador no había catalogado y que sin embargo el sistema reconoce.
p) Las pruebas de entrenamiento cruzadas permiten reafirmar la teoría, de que para entrenar adecuadamente un volcán se necesita una base de datos particular de él mismo. Por lo tanto, el entrenamiento de los modelos en cada volcán, precisa de una base de datos de entrenamiento propia.
q) Se ha logrado desarrollar una implementación tecnológica a partir de los análisis de los eventos sísmico-volcánicos. Dicho software se podrá integrar con el sistema de adquisición de datos local en Nicaragua, brindando así una importante ayuda a los sismólogos locales en el reconocimiento de los eventos y sus posibles consecuencias de riesgo y prevención sísmico-volcánica.
r) Esta tesis doctoral ha tenido como aportación la publicación de capítulos en dos libros, además de tres publicaciones en revistas de alto impacto y varias ponencias en diferentes congresos científicos a nivel internacional.
s) Los resultados de esta tesis son un avance fundamental para la gestión y vigilancia de volcanes activos. El hecho de poder incorporar como herramienta de rutina un sistema automático y fiable de reconocimiento de señales sismo-volcánicas, permite instaurar protocolos de seguimiento y alerta temprana de erupciones volcánicas, basados en la cuantificación y clasificación en tiempo real de la actividad sísmica. Este sistema complementa al trabajo de cualquier operador lo que permite dedicar el esfuerzo a la evaluación de la actividad y no a su identificación.
t) En la presente tesis se ha observado la no posibilidad de combinar las bases de datos, este hecho refleja la necesidad de que para tener un sistema robusto y fiable, exportable a cualquier tipo de sistema volcánico, sería necesaria la integración del mayor número posible de bases de datos de diferentes volcanes.