Reconocimiento de señales sismo-volcánicas mediante canales específicos basados en modelos ocultos de Markov
Resumen Abstract Índice Conclusiones
Cortés Moreno, Guillermo
2016-A
Descargar PDF
——————————————————————————–
«Reconocimiento de señales sismo-volcánicas (VSR) mediante canales
específicos basados en modelos ocultos de Markov»
RESUMEN
——————————————————————————–
La actividad volcánica en nuestro planeta genera un gran impacto económico y
social. Actualmente la monitorización de volcanes se fundamenta principalmente
en el análisis de la actividad sísmica de los eventos considerados precursores de
erupciones. Un sistema automático que sea capaz de detectar y clasificar eventos
sismo-volcánicos en tiempo real permitiría una gestión más eficaz al evaluar el
riesgo volcánico sobre todo cuando previo a una erupción el incremento de la actividad
es tal que compromete la fiabilidad de la clasificación supervisada llevada a cabo
por los técnicos de los observatorios. Un análisis rápido y detallado detallado en
situaciones de crisis sísmicas es crucial a la hora de tomar decisiones que pueden
ser determinantes como la necesidad de evacuación de la población ante el riesgo
de una inminente erupción.
Los sistemas automáticos de reconocimiento de señales sismo-volcánicas (Volcano-
Seismic Recognition – VSR) en una etapa de aprendizaje construyen modelos
probabilísticos para cada tipo de evento o clases a partir del análisis de datos
previamente clasificados por técnicos expertos. Dichos modelos permiten posteriormente
una clasificación sobre registros continuos de forma automática y no supervisada.
El funcionamiento en tiempo real de estos sistemas ha sido tímidamente explorado por
la comunidad científica lo que se une al problema complejo del modelado dada la
naturaleza y variabilidad de las señales sismo-volcánicas sometidas a solapamiento
entre eventos, efectos de sitio, ruidos, etc. Tomando inspiración en los últimos
avances en las áreas de inteligencia artificial, reconocimiento de patrones y
aprendizaje automático, se abre un mundo de lineas de investigación muy interesantes
que están atrayendo la atención de los geofísicos y los observatorios, no solo por
la posibilidad de monitorizar el grado de actividad sísmica en tiempo real, sino
también por la ventaja de contar con una herramienta robusta y fiable de clasificación
automática no susceptible de sufrir errores inevitablemente asociados a la condición
humana como la falta de un criterio unificado, el cansancio y la variabilidad en
la toma de decisiones debido a factores subjetivos o psicológicos. Por ello, son
cada vez más los observatorios vulcanológicos que incorporan sistemas expertos
automatizados de monitarización y métodos de predicción de erupciones (Carniel et
al., 2006; Ham et al., 2012; Boué et al., 2015), lo que explica el auge que los
sistemas VSR están teniendo en los últimos 10 años (Orozco-Alzate et al., 2012).
La motivación de este trabajo de investigación comienza con una simple pregunta:
¿Cómo se podría mejorar los sistemas VSR?. A la luz del estudio realizado, encontramos
diversos elementos donde flaquean los sistemas actuales de reconocimiento de sismos:
– El etiquetado y fiabilidad de las bases de datos.
– La descripción de los eventos en vectores de características.
– El modelado de las clases.
– La evaluación de los resultados.
Para completar esta lista, también tenemos una serie de requerimientos demandados
por parte de los centros de monitorización de volcanes activos:
– El reconocimiento de los eventos potencialmente peligrosos debe realizarse
en tiempo cuasi-real.
– La portabilidad del sistema VSR, tanto en su integración con el software de
adquisición como la exportación de los modelos de un volcán a otro sin tener
que construir modelos propios para cada volcán.
La capacidad del cerebro humano de describir y analizar una situación a distintos
niveles conceptuales es un reto (o el reto) apasionante en el que se centra gran
parte de los últimos trabajos de inteligencia artificial: el aprendizaje profundo
(deep learning) o cómo enseñar a las máquinas a describir y aprender lo verdaderamente
importante. En esta tesis aplicamos estas premisas a los sistemas VSR: pretendemos
enseñar al sistema qué características son importantes para describir los eventos,
cuál es la mejor forma de modelar un tipo de señales y cómo evaluar correctamente
los resultados de clasificación.
Los Modelos Ocultos de Markov (Hidden Markov Models – HMMs), dada su naturaleza
estructurada y su capacidad para modelar datos doblemente estocásticos en el espacio
secuencial (el tiempo en nuestro caso) y en el espacio de descripción de los datos,
se han convertido en una de las técnicas más utilizadas en el área VSR (Ohrnberger,
2001; Alasonati et al., 2006; Benítez et al., 2007; Ibáñez et al., 2009; Beyreuther
et al., 2012). En esta tesis, proponemos una evolución de los sistemas VSR clásicos
en serie (Serial System Architecture – SSA) basados en HMMs a un sistema estructurado
en paralelo (Parallel System Architecture – PSA) compuesto por distintos canales de
reconocimiento cada uno de ellos especializado en un tipo de evento volcánico o
clases concretas (Cortés et al., 2014). Esto permite el análisis por independiente
de clases de eventos especialmente relevantes, tanto por su peligrosidad (lahares,
colapsos y explosiones) como por su carácter precursor de erupciones (eventos de
largo periodo) así como el estudio de la mejor configuración y el mejor conjunto
de características para describir cada tipo de canal (evento), contribuyendo a
incrementar la eficacia de reconocimiento, la capacidad de análisis y la flexibilidad
y funcionalidad del sistema. El objetivo último es la construcción de un sistema
automático no supervisado de carácter general que sea fácilmente integrable en los
centros de monitorización de volcanes activos.
Dicha universalidad y la demanda de un reconocimiento sobre flujos continuos de
datos en tiempo cuasi-real obliga a crear modelos capaces de describir de forma
general y unívoca los eventos que aún observados en distintos volcanes se asocien
a la misma clase. La selección de características que describen los eventos de un
mismo tipo, juega por tanto un papel clave en el diseño de los sistemas VSR que
aspiran tener un funcionamiento no supervisado, influyendo además en la rapidez
de ejecución, el coste computacional, la eficacia y la fiabilidad de los resultados
de reconocimiento. En este escenario, esta tesis contribuye en una doble vertiente:
1. Se realiza un exhaustivo análisis las principales técnicas de descripción de
datos, con especial énfasis en las características diseñadas para modelar eventos
sismo-volcánicos. A partir de dicho estudio se proponen varias parametrizaciones
de distinta naturaleza, construyendo un vector de características híbridas que
consigue mejores resultados que otros esquemas homogéneos (Álvarez et al., 2009;
Cortés et al., 2014).
2. Con el objetivo de modelar solo la información realmente relevante de los eventos
se examinan distintas técnicas de reducción de dimensionalidad del vector de
características. Proponemos el algoritmo DFS generalizado como una mejora al DFS
(Discriminative Feature Selection) de Álvarez et al. (2012) que obtuvo unos
resultados notables al ser aplicado sobre las señales VSR permitiendo una
interpretación geofísica más directa de los eventos y un modelado más eficaz.
Los resultados del sistema VSR-PSA, configurado como un conjunto de detectores
específicos, obtienen el mejor promedio en la tasa de reconocimiento respecto a la
opción clásica de sistemas VSR-SSA en serie. Asimismo, facilita la evaluación de los
resultados gracias a la especialización de los canales para discriminar eventos bajo
circunstancias ruidosas o en presencia de eventos solapados siendo una valiosa
herramienta para el etiquetado semi-supervisado al ofrecer al técnico experto distintas
opciones de clasificación incluyendo las tasas de fiabilidad de cada una de ellas.
Respecto a la reducción de dimensionalidad, el algoritmo DFS generalizado se evalúa
y certifica como la mejor opción entre varios métodos actuales (Cortés et al., 2016)
en cuanto a la eficacia medida como la relación entre la tasa de reconocimiento y el
coste computacional. La técnica DFS al ser una selección de características manteniendo
el significado geofísico del vector de descripción facilitando la interpretación
y el análisis posterior.
Tanto el sistema propuesto VSR-PSA de canales específicos en paralelo como la
generalización del DFS proporcionan una herramienta fundamental para la consecución
del objetivo marcado: la construcción de un sistema VSR no supervisado e integrable
en los observatorios de volcanes activos, abriendo una interesante linea de investigación
para el futuro del reconocimiento automático y la monitarización en tiempo real
de volcanes activos.
————————————————————————————-
BIBLIOGRAFÍA
(Alasonati et al., 2006) Alasonati, P., Wassermann, J., Ohrnberger, M., 2006. Signal
classification by wavelet based hidden Markov models: application to seismic signals
of volcanic origin. Statistics in Volcanology (1), 161–174
(Álvarez et al., 2009) Álvarez, I., Cortés, G., De la Torre, A., Benítez, C., García,
L., Lesage, P., Arambula, R., González, M., 2009. Improving feature extraction in
the automatic classification of seismic events. Application to Colima and Arenal
volcanoes. In: Geoscience and Remote Sensing Symposium, 2009 IEEE International,
IGARSS 2009. Vol. 4. IEEE, p. 526.
(Álvarez et al., 2012) I. Álvarez, L.García, G. Cortés, M. C. Benítez, A. De la Torre.
“Discriminative feature selection for automatic classification of volcano-seismic
signals recorded at Colima Vocano”. IEEE GRSL, 9(2), 151-155, 2012.
(Benítez et al., 2007) Benítez, C., Ramírez, J., Segura, J.C., Ibáñez, J.M.,
Almendros, J., Cortés, G., “Continuous HMM-based seismic event classification at
Deception Island, Antarctica”. IEEE TGARS, 45(1) , 138–147, 2007.
(Beyreuther et al., 2012) Beyreuther, M., Hammer, C., Wassermann, J., Ohrnberger, M.,
Megies, T., 2012. Constructing a Hidden Markov Model based earthquake detector:
application to induced seismicity. Geophysical Journal International 189 (1), 602–610.
(Boué et al. 2015) A. Boué, P. Lesage, G. Cortés, B. Valette, G. Reyes-Dávila, “Real-time
eruption forecasting using the material Failure Forecast Method with a Bayesian
approach”, JVGR:SE 120(4), 2143-2161, 2015.
(Carniel et al., 2006) Carniel, R., Di Cecca, M., Jaquet, O., 2006. A user-friendly,
dynamic web environment for remote data browsing and analysis of multiparametric
geophysical data within the MULTIMO project. Journal of volcanology and geothermal
research, 153 (1), 80–96.
(Cortés et al., 2014) G. Cortés, L. García, I. Álvarez, C. Benítez, Á. De la Torre,
and J. Ibáñez, “Parallel System Architecture (PSA): An efficient approach for
automatic recognition of volcano-seismic events”, Journal of Volcanology and
Geothermal Research, vol.271, no.0, pp.1-10, 2014.
(Cortés et al., 2016) G. Cortés, C. Benítez, I. Álvarez, L. García, “A comparative
study of dimensionality reduction algorithms applied to volcano-seismic signals”,
IEEE-JSTARS, vol.9, no.1, pp.253-263, 2016.
(Ham et al., 2012) Ham, F. M., Iyengar, I., Hambebo, B. M., Garces, M., Deaton, J.,
Perttu, A., Williams, B., 2012. A Neurocomputing Approach for Monitoring Plinian
Volcanic Eruptions Using Infrasound. Procedia Computer Science 13 (0), 7–17, Proc.
of the International Neural Network Society Winter Conference (INNS-WC2012).
(Ibáñez et al., 2009) J.M. Ibañez, C. Benítez, L.A. Gutiérrez, G. Cortés, A. García,
G. Alguacil, “Classification of seismo-volcanic signals using hidden markov models:
an application to Stromboli and Etna volcanoes”, JVGR 2009.
(Ohrnberger, 2001) M. Ohrnberger, “Continuous automatic classification of seismic
signals of volcanic origin at Mt. Merapi, Java, Indonesia”, Ph.D. dissertation,
Math.- Naturwissen. Facultat der Univ. Potsdam, Germany, 2001.
(Orozco-Alzate et al., 2012) M. Orozco-Alzate, C. Acosta-Muñoz, J. M. Londoño-Bonilla.
“The Automated Identification of Volcanic Earthquakes: Concepts, Applications and
Challenges”. In Earthquake Research and Analysis-Seismology, Seismotectonic and
Earthquake Geology, pages 345–370, 2012.
——————————————————————————–
«Reconocimiento de señales sismo-volcánicas (VSR) mediante canales
específicos basados en modelos ocultos de Markov»
ABSTRACT
——————————————————————————–
The volcano activity has a big impact in the economy and society. Nowadays, the
volcano monitoring is mainly based on the analysis of the so-called eruption precursor
events. An automatic system able to detect and classify volcano-seismic signals
in real-time operation would allow a more efficient evaluation of the volcanic
risk previous the eruption, when the seismic activity increases and, thus, is more
difficult and unreliable to manually classify events in a supervised way by the
technicians. In a crisis, a fast and detailed analysis of the current situation
is crucial regarding the decision-making process involving population safety.
In a learning stage, the automatic recognition systems of volcano-seismic signals
(Volcano-Seismic Recognition – VSR) build statistical models of each type of events
analysing previously classified data via expert technicians. Those models allow in
a recognition stage the automatic detection and classification of events appearing
in a continuous data stream flow in an unsupervised operation. Those systems have
to deal with a complex modelling of the volcano-seismic signals due to their
variability, source generation, propagation and site effects, overlapping artefacts
and noises. In addition, the real-time functionality of this unsupervised automatic
recognition remains an open issue in the scientific community.
Connecting ideas from the areas of artificial intelligence, machine learning and
pattern recognition a whole world of new researching branches is paying the attention
of geophysics and observatories thanks not only just to the chance to monitoring the
seismic activity in real-time, also to the aim of having a reliable tool to
automatically classify robust enough to errors related to human condition as the
lack of a unified criteria, weariness and the variability regarding the decision
making process due to subjective or psychological factors. Thereby, more and more
active volcano observatories are incorporating expert systems to monitor and predict
eruptions (Carniel et al., 2006; Ham et al., 2012; Boué et al., 2015), which explains
the upswing of the VSR area in the last 10 years (Orozco-Alzate et al., 2012).
The motivation of this research work starts with a simple question: how much the
VSR systems could be improved? After a meticulous study, we found several unresolved
issues in the current state of the art VSR machinery:
– The labelling process and the reliability of the corpus DB
– The event description via feature vectors to built robust event models
– The recognition accuracy of the models
– The result evaluation measurement
In order to complete this list, other items have to be taking into account the
requirements of the active volcanoes monitoring centres:
– The recognition of the really dangerous events have to be achieved in a real-time
operation
– The VSR system portability, regarding its integration with the acquisition and
monitoring software and the exportability of the models from one volcano to another,
avoiding the need of built custom models for each volcano.
The ability of the human brain to describe and analyse a situation within different
conceptual layers of knowledge is a thrilling challenge of the current machine learning
(ML), artificial intelligence (IA) and deep learning disciplines: how to teach machines
to learn what is really relevant to built models. In this work, we improve ultimate ML
techniques to discriminate the most important features to extract the best information
of the volcano-seismic signals, to discover which is the best way to model each event
type and to evaluate the classification results. Given the nature of the Hidden Markov
Models (HMMs) and their ability to double modelling stochastic data in both spaces,
the sequential one (the time in our case) and the description space, have become one
of the most used techniques in VSR (Ohrnberger, 2001; Alasonati et al., 2006; Benítez
et al., 2007; Ibáñez et al., 2009; Beyreuther et al., 2012).
In this thesis we propose the evolution of classic SSA-VSR systems (Serial System
Architecture – SSA) based in HMMs into a parallel architecture (Parallel System
Architecture) composed of several recognition channels, each one specialized in
to detect and classify signals of a one proper type of events, the so-called the
proper channel class (Cortés et al., 2014). This allows an independent analysis of
each volcano-seismic class, specially of the most relevant types according to the
population risk (lahars, collapses, explosions) and the precursory nature (long
period events). It also permits to set the best channel configuration and to
independently select the best features to describe the events to detect in each
channel, contributing to improve the recognition efficiency, the analysis capabilities
and flexibility of the whole PSA system.
The ultimate aim is to take the required steps forward to an automatic unsupervised
recognition system easily integrable into active volcano monitoring facilities. This
universality and the demand for detecting events in continuous data streams near
real-time requires to built models able to uniquely describe different signals of
different volcanoes which belong to the same class of events. This, the signal
description process and feature selection plays a key-roll in the design of VSR
systems, varying the model complexity, the processing time, the computational cost
and the reliability and accuracy of the recognition stage. In this scenario, this
work contributes in two essential aspects:
1. An exhaustive analysis of the main description techniques of the ML is performed,
emphasizing those involving volcano-seismic signals. Based on this study, we test
several parametrizations of different nature, finally proposing a vector of hybrid
features which achieves the best results versus other homogeneous schemes (Álvarez
et al., 2009; Cortés et al., 2014).
2. With the purpose to extract just the relevant information to model each event class,
several dimensionality reduction techniques are compared. A generalized version of
the DFS (Discriminative Feature Selection) algorithm of Álvarez et al. (2012) is
selected as the best one, encompassing a straight geophysical interpretation when
is applied to the events besides a more efficient modelling.
The results of the PSA-VSR system, configured as a group of specific detectors,
surpass those of the classic serial SSA-VSR schemes. Even more, thanks to the dedicated
channels facilitates the evaluation of the results discriminating events under noisy
conditions or detecting overlapped signals. The PSA scheme is a useful tool in the
semi-supervised labelling, able to offer to the technician several labelling choices,
including their reliability scores. Regarding dimensionality reduction, the generalized
DFS achieves the higher recognition success / computational cost ratio (Cortés et al.,
2016).
The proposed PSA-VSR system with its parallel specialized recognition channels and
the DFS generalization provide the means to achieve the initial aim: the building of
an unsupervised VSR system, easy to be embedded in the observatories, opening a new
development approach focused in real-time monitoring of the active volcanoes.
————————————————————————————-
REFERENCES
(Alasonati et al., 2006) Alasonati, P., Wassermann, J., Ohrnberger, M., 2006. Signal
classification by wavelet based hidden Markov models: application to seismic signals
of volcanic origin. Statistics in Volcanology (1), 161–174
(Álvarez et al., 2009) Álvarez, I., Cortés, G., De la Torre, A., Benítez, C., García,
L., Lesage, P., Arambula, R., González, M., 2009. Improving feature extraction in
the automatic classification of seismic events. Application to Colima and Arenal
volcanoes. In: Geoscience and Remote Sensing Symposium, 2009 IEEE International,
IGARSS 2009. Vol. 4. IEEE, p. 526.
(Álvarez et al., 2012) I. Álvarez, L.García, G. Cortés, M. C. Benítez, A. De la Torre.
“Discriminative feature selection for automatic classification of volcano-seismic
signals recorded at Colima Vocano”. IEEE GRSL, 9(2), 151-155, 2012.
(Benítez et al., 2007) Benítez, C., Ramírez, J., Segura, J.C., Ibáñez, J.M.,
Almendros, J., Cortés, G., “Continuous HMM-based seismic event classification at
Deception Island, Antarctica”. IEEE TGARS, 45(1) , 138–147, 2007.
(Beyreuther et al., 2012) Beyreuther, M., Hammer, C., Wassermann, J., Ohrnberger, M.,
Megies, T., 2012. Constructing a Hidden Markov Model based earthquake detector:
application to induced seismicity. Geophysical Journal International 189 (1), 602–610.
(Boué et al. 2015) A. Boué, P. Lesage, G. Cortés, B. Valette, G. Reyes-Dávila, “Real-time
eruption forecasting using the material Failure Forecast Method with a Bayesian
approach”, JVGR:SE 120(4), 2143-2161, 2015.
(Carniel et al., 2006) Carniel, R., Di Cecca, M., Jaquet, O., 2006. A user-friendly,
dynamic web environment for remote data browsing and analysis of multiparametric
geophysical data within the MULTIMO project. Journal of volcanology and geothermal
research, 153 (1), 80–96.
(Cortés et al., 2014) G. Cortés, L. García, I. Álvarez, C. Benítez, Á. De la Torre,
and J. Ibáñez, “Parallel System Architecture (PSA): An efficient approach for
automatic recognition of volcano-seismic events”, Journal of Volcanology and
Geothermal Research, vol.271, no.0, pp.1-10, 2014.
(Cortés et al., 2016) G. Cortés, C. Benítez, I. Álvarez, L. García, “A comparative
study of dimensionality reduction algorithms applied to volcano-seismic signals”,
IEEE-JSTARS, vol.9, no.1, pp.253-263, 2016.
(Ham et al., 2012) Ham, F. M., Iyengar, I., Hambebo, B. M., Garces, M., Deaton, J.,
Perttu, A., Williams, B., 2012. A Neurocomputing Approach for Monitoring Plinian
Volcanic Eruptions Using Infrasound. Procedia Computer Science 13 (0), 7–17, Proc.
of the International Neural Network Society Winter Conference (INNS-WC2012).
(Ibáñez et al., 2009) J.M. Ibañez, C. Benítez, L.A. Gutiérrez, G. Cortés, A. García,
G. Alguacil, “Classification of seismo-volcanic signals using hidden markov models:
an application to Stromboli and Etna volcanoes”, JVGR 2009.
(Ohrnberger, 2001) M. Ohrnberger, “Continuous automatic classification of seismic
signals of volcanic origin at Mt. Merapi, Java, Indonesia”, Ph.D. dissertation,
Math.- Naturwissen. Facultat der Univ. Potsdam, Germany, 2001.
(Orozco-Alzate et al., 2012) M. Orozco-Alzate, C. Acosta-Muñoz, J. M. Londoño-Bonilla.
“The Automated Identification of Volcanic Earthquakes: Concepts, Applications and
Challenges”. In Earthquake Research and Analysis-Seismology, Seismotectonic and
Earthquake Geology, pages 345–370, 2012.
————————————————————————————
«Reconocimiento de señales sismo-volcánicas (VSR) mediante canales
específicos basados en modelos ocultos de Markov»
ÍNDICE GENERAL
————————————————————————————
Agradecimientos 1
Prólogo 3
Resumen de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Estructura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5
I.INTRODUCCIÓN AL RECONOCIMIENTO AUTOMÁTICO DE EVENTOS SISMO-VOLCÁNICOS (VSR) 7
1. Señales sismo-volcánicas 9
1.1. Sismología volcánica . . . . . . . . . . . . . . . . . . . . . . . . 10
1.1.1. El proceso eruptivo . . . . . . . . . . . . . . . . . . . . . . 11
1.1.2. Señales sísmicas registradas en los volcanes . . . . . . . . . 12
1.2. Monitorización de volcanes activos . . . . . . . . . . . . . . . . . 24
1.2.1. Registro de sismos . . . . . . . . . . . . . . . . . . . . . . 25
1.2.2. Sismología volcánica como herramienta de monitorización . . . . 27
2. Reconocimiento de señales sismo-volcánicas 29
2.1. Desde el aprendizaje automático hasta el reconocimiento de eventos. . 30
2.1.1. Clasificación supervisada de eventos . . . . . . . . . . . . . 34
2.1.2. Clasificadores estadísticos: inferencia estadística y aproximación
bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.1.3. Entrenamiento de modelos . . . . . . . . . . . . . . . . . . . 42
2.1.4. Clasificación y detección de señales . . . . . . . . . . . . . 48
2.2. Reconocimiento de patrones aplicado a señales sismo-volcánicas (VSR) 52
2.2.1. Problemas relacionados con las propiedades de los eventos sís-
micos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.2.2. Problemas relacionados con la fiabilidad de las bases de datos. 54
2.2.3. Requerimientos de los sistemas VSR. . . . . . . . . . . . . . . 56
2.3. Técnicas actuales de clasificación de sismos . . . . . . . . . . . . 57
2.3.1. Clasificadores basados en instancias . . . . . . . . . . . . . 58
2.3.2. Clasificadores basados en análisis discriminativo . . . . . . . 61
2.3.3. Redes neuronales artificiales (ANNs) . . . . . . . . . . . . . 63
2.3.4. Clasificadores probabilísticos . . . . . . . . . . . . . . . . 66
2.3.5. Combinación de técnicas de clasificación. . . . . . . . . . . . 72
2.3.6. Clasificación no supervisada (clustering) . . . . . . . . . . . 74
2.4. Discusión sobre los sistemas VSR . . . . . . . . . . . . . . . . . . 77
2.4.1. Comparación entre técnicas de clasificación . . . . . . . . . . 77
2.4.2. Conclusiones en torno a los sistemas VSR . . . . . . . . . . . 79
II.SISTEMA VSR DE RECONOCIMIENTO CONTINUO PROPUESTO 81
3. Sistema de clasificación de referencia 83
3.1. Origen y adquisición de datos: volcanes de Decepción y Colima . . . . 84
3.1.1. Volcán de la isla de Decepción . . . . . . . . . . . . . . . . 84
3.1.2. Volcán de Fuego de Colima . . . . . . . . . . . . . . . . . . . 89
3.2. Descripción de datos . . . . . . . . . . . . . . . . . . . . . . . . 95
3.2.1. Preprocesamiento de la señal . . . . . . . . . . . . . . . . . 96
3.2.2. Parametrización: desde sismogramas a secuencias de vectores . . 96
3.3. Clasificadores. . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.3.1. Modelado de características: GMMs . . . . . . . . . . . . . . . 99
3.3.2. Modelado de características y de la evolución temporal: HMMs 102
3.4. Criterios de evaluación . . . . . . . . . . . . . . . . . . . . . . . 109
3.4.1. Criterios de evaluación generales . . . . . . . . . . . . . . . 110
3.4.2. Evaluación promediada por clase . . . . . . . . . . . . . . . . 111
3.4.3. Re-evaluación geofísica de resultados de reconocimiento . . . . 111
3.4.4. Otras medidas de evaluación . . . . . . . . . . . . . . . . . . 112
3.5. Metodología experimental . . . . . . . . . . . . . . . . . . . . . . 113
3.6. Bases de datos maestras . . . . . . . . . . . . . . . . . . . . . . . 114
3.6.1. Base de datos maestra de Decepción: dec.95M . . . . . . . . . . 114
3.6.2. Base de datos maestra de Colima: col.04M . . . . . . . . . . . 118
3.7. Construcción de los sistemas base . . . . . . . . . . . . . . . . . . 120
3.7.1. Descripción de los datos. . . . . . . . . . . . . . . . . . . . 122
3.7.2. Construcción de los modelos . . . . . . . . . . . . . . . . . . 124
3.7.3. Evaluación del sistema: resultados base . . . . . . . . . . . . 126
4. Reducción de dimensionalidad 129
4.1. Introducción a la Reducción de Dimensionalidad. . . . . . . . . . . . 130
4.1.1. Motivación: la maldición de la dimensionalidad . . . . . . . . 130
4.1.2. Planteamiento del problema . . . . . . . . . . . . . . . . . . 131
4.1.3. Clasificación de algoritmos de reducción de dimensionalidad . . 134
4.1.4. Selección de características según el conjunto de análisis . . 134
4.1.5. Selección de Características según el método de evaluación . . 136
4.1.6. Metodología experimental . . . . . . . . . . . . . . . . . . . 137
4.2. Características propuestas . . . . . . . . . . . . . . . . . . . . . 137
4.2.1. Características de naturaleza geofísica . . . . . . . . . . . . 138
4.2.2. Características basadas en transformaciones del sismograma . . 142
4.2.3. Características basadas en estadística de los datos . . . . . . 147
4.2.4. Características basadas en esquemas mixtos . . . . . . . . . . 149
4.2.5. Resultados experimentales: elección del vector geoLFCC.D. . . . 154
4.3. Reducción de dimensionalidad mediante Selección de Características . 156
4.3.1. Selección de Características por Filtros . . . . . . . . . . . 157
4.3.2. Métodos guiados por Modelos de predicción . . . . . . . . . . . 165
4.4. Reducción de dimensionalidad mediante transformación de característica 172
4.4.1. Transformaciones no dependientes de datos . . . . . . . . . . . 172
4.4.2. Transformaciones dependientes de los datos . . . . . . . . . . 173
4.4.3. Comparación de métodos basados en transformaciones del espacio
de características . . . . . . . . . . . . . . . . . . . . . . 182
4.5. Comparación de métodos y conclusiones sobre la reducción de dimen-
sionalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
4.5.1. Resultados experimentales . . . . . . . . . . . . . . . . . . . 185
4.5.2. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . 188
5. Diseño del sistema de reconocimiento en paralelo VSR-PSA 191
5.1. Paralelización: canales de reconocimiento específicos para cada clase 192
5.1.1. Diseño de los canales . . . . . . . . . . . . . . . . . . . . . 196
5.1.2. Diseño del decodificador conjunto . . . . . . . . . . . . . . . 200
5.1.3. Coste computacional de los sistemas VSR-PSA frente a los
clásicos VSR-SSA . . . . . . . . . . . . . . . . . . . . . . . 204
5.2. Funcionalidades del sistema VSR-PSA . . . . . . . . . . . . . . . . . 205
5.2.1. Análisis por independiente de cada canal: detectores de clase . 206
5.2.2. Análisis en conjunto de los canales . . . . . . . . . . . . . . 208
III. APLICACIONES DEL SISTEMA VSR-PSA 213
6. Sistema paralelo VSR-PSA como detector específico 215
6.1. Metodología y objetivos . . . . . . . . . . . . . . . . . . . . . . . 216
6.2. Diseño de la topología de los HMMs . . . . . . . . . . . . . . . . . 217
6.2.1. Topología de los HMMs . . . . . . . . . . . . . . . . . . . . . 217
6.2.2. Selección óptima del no de gausianas . . . . . . . . . . . . . 220
6.3. Selección de características . . . . . . . . . . . . . . . . . . . . 222
6.3.1. Selección DFS de características en los canales PSA . . . . . . 224
6.3.2. Análisis y discusión de la selección de características . . . . 227
6.4. Bandas óptimas para el filtrado espectral . . . . . . . . . . . . . . 230
6.5. Análisis del tamaño óptimo de la ventana de parametrización . . . . . 232
6.6. Discusión de resultados y conclusiones . . . . . . . . . . . . . . . 235
IV. CONCLUSIONES Y LÍNEAS DE INVESTIGACIÓN FUTURAS 243
7. Conclusiones 245
7.1. Sistemas VSR actuales . . . . . . . . . . . . . . . . . . . . . . . . 247
7.2. Descripción de eventos sísmicos y la reducción de dimensionalidad . 249
7.3. Sistemas serie VSR-SSA frente arquitecturas en paralelo VSR-PSA . 250
8. Líneas de investigación futuras 253
8.1. Retos principales y su planteamiento inicial . . . . . . . . . . . . 254
8.1.1. Parametrización mejorada . . . . . . . . . . . . . . . . . . . 254
8.1.2. Pre-segmentación de la señal en continuo . . . . . . . . . . . 254
8.1.3. Reconocimiento con las 3 componentes de la señal . . . . . . . 255
8.2. Lineas secundarias de investigación . . . . . . . . . . . . . . . . . 256
8.2.1. Reconocimiento a nivel de sub-evento . . . . . . . . . . . . . 256
8.2.2. Uso de otros modelos en la arquitectura PSA . . . . . . . . . . 256
8.2.3. Modelado explícito de la gramática y del lenguaje . . . . . . . 257
Bibliografía 259
Índice de Tablas 283
Índice de Figuras 287
Índice de Algoritmos 289
V. APÉNDICE 291
A. Cuestiones prácticas 293
A.1. ¿Cuál es la duración del segmento óptima para cada característica
geo-estadística? . . . . . . . . . . . . . . . . . . . . . . . . 293
A.2. ¿Influye la direccionalidad en la selección secuencial de caracte-
rísticas? 295
A.3. ¿Cuál es la mejor configuración para el algoritmo DFS-rsv de sele-
cción de características? . . . . . . . . . . . . . . . . . . . 298
A.4. ¿Cuál es el tamaño mínimo de una BD para evitar el sobre- entrena-
miento de los modelos? . . . . . . . . . . . . . . . . . . . . 301
A.5. ¿Se deben normalizar los registros sísmicos antes del proceso de
extracción de características? . . . . . . . . . . . . . . . . 304
A.6. ¿Cómo influye la variabilidad de una característica en su capacidad
para diferenciar entre clases de eventos? . . . . . . . . . . . 305
A.7. Evaluación de las probabilidades {p(x, wC )} dada la secuencia x =
{xt } por cada HMM asociado a las clases {wc} . . . . . . . . . 305
B. Tablas de selección de características 309
C. Divulgación científica 315
C.1. Artículos en revistas especializadas . . . . . . . . . . . . . . 315
C.2. Capítulos de libro . . . . . . . . . . . . . . . . . . . . . . . 316
C.3. Ponencias en congresos internacionales . . . . . . . . . . . . . 316
C.4. Comunicaciones en congresos internacionales . . . . . . . . . . 317
C.5. Proyectos de investigación . . . . . . . . . . . . . . . . . . . 318
C.6. Docencia en congresos internacionales . . . . . . . . . . . . . 318
D. Nomenclatura 319