A New Model
3.1 The Operation-Event Graph
3.1.1 Formalizing the Semantics
La clasificación general de los algoritmos de determinación de endmembers se encuentra descrita, de acuerdo con los criterios anteriores, en la Tabla C.1. 2.
Tabla C.1. 2. Clasificación de los algoritmos de determinación de endmembers
Interpretación
de los datos No estadística Estadística
Descripción
aleatoriedad No paramétrica Paramétrica
Máxima verosimilitud
Criterio de
optimización No Error cuadrático Geométrica Error cuadrático Gausiano No
Gausiano Transformación Volumen Mínimo Algoritmo DPFT FPFT Mínimos cuadrados lineal Fuzzy K- means Mínimos cuadrados No lineal Gaussian Class Estimation
En ella se observa que los métodos estadísticos de determinación de endmembers identifican los mismos mediante la optimización de alguna función derivada de algún estadístico concreto construido a partir de las muestras, que, en la gran mayoría de los algoritmos analizados, suele ser la función de verosimilitud. Los algoritmos no paramétricos sin embargo intentan conseguir esta optimización minimizando algún estadístico derivado de las muestras, que, normalmente, suele ser alguna distancia o bien el error cuadrático.
Las características más sobresalientes de las familias de algoritmos más significativos, son las siguientes:
Fuzzy K-means.
Es una variante de uno de los algoritmos más utilizados, el K-means, algoritmo iterativo tipo cluster, que, progresivamente, minimiza una función específica, denominada función
J
q(A,S)
, para llegar, simultáneamente, a lograr estimacionesdeterminísticas óptimas, tanto de los endmembers como de sus proporciones, en cada uno de los N píxeles analizados. La función
J
q(A,S)
, se expresa de acuerdo ala ecuación (ec. C.1. 7).
∑∑
= ==
M i N n in q in qd
J
1 1 2)
(
)
(
)
(A,S
A
(ec. C.1. 7)Donde
A
in es un estimador de la i-ésima proporción para el n-ésimo píxel. El factor ind es el error cuadrático entre el n-ésimo píxel y el i-ésimo centroide, es decir el endmember buscado
s
*i, y tiene como valor la ecuación (ec. C.1. 8).[
i] [
i]
i
n
n
d
)
2(
)
*(
)
*43 En la expresión anterior, la matriz W, es la matriz de “pesos” o ponderaciones de cada una de las proporciones. La minimización de la función anterior tiene, lógicamente, las limitaciones derivadas de las restricciones “físicas” impuestas por las proporciones en cada caso. Estos requerimientos se deben insertar en el estimador para A.
Por otra parte, las formas de las regiones asociadas con cada clase varían con el parámetro q. Valores empleados normalmente para q, en el conjunto de la bibliografía consultada, oscilan en el rango 1,5<q<3,0. La optimización de la función
)
(A,S
qJ
se realiza de forma iterativa hasta que se encuentra el valor mínimo, haciendo corresponder, en ese momento, los diferentes valores des
*con los estimadores de los endmembers y los deA
* con los de las proporciones.Non-linear Least Squares (NLLS).
Este tipo de técnicas modelan el ruido aditivo w en los algoritmos del tipo LMM (Linear Mixing Model) como un ruido de tipo Gausiano. En los modelos del tipo LMM es bien conocido que, si se tienen K bandas espectrales y M endmembers y se denomina al espectro del endmember “i” como
s
i y a la proporción de ese endmember comoa
i, el espectro medido u observado de cada uno de los píxeles que componen la escena o imagen viene dado por la ecuación (ec. C.1. 9).w Sa w s w s s s x= + + + + =∑= + = + = M i i i i M M a a a a 1 2 2 1 1 ... (ec. C.1. 9)
Donde S es la matriz de los endmembers y w es un término de error o ruido aditivo que incluye una serie de factores como el ruido del sensor, la variabilidad de los endmembers, etc.
Las técnicas NLLS parten, con relación a las LMM, del supuesto de la existencia de un conocimiento previo acerca de las funciones de densidad de probabilidad de los endmembers, es decir, se supone conocida la función de densidad de probabilidad “a priori” de cada uno de ellos en el momento de formular la ecuación de los mínimos cuadrados para la descomposición espectral.
Para ello, se realiza una primera estimación inicial de S y de a acerca del tipo y la proporción de cada uno de los endmembers que deberían existir en el terreno cuya imagen se posee. Para este supuesto inicial de S y a, se toman las matrices de covarianzas asociadas al conjunto de datos de partida y también se delimitan unos determinados niveles de confianza a criterio del investigador.
Una vez que se poseen estos valores iniciales de S y a, y mediante sucesivas iteraciones, es posible calcular una función de densidad a posteriori, que puede ser expresada como
p(x/S,a)
.Por las propiedades de las funciones normales, la nueva función de verosimilitud será una forma cuadrática y la matriz producto Sa puede ser tratada, nuevamente, como un proceso clásico de mínimos cuadrados, sólo que, en este caso, en modelos no lineales.
Gaussian Class Estimation (GCE).
Este método de estimación también asume hipótesis de normalidad, pero lo hace sin presuponer ruido aditivo gausiano. En vez de esa hipótesis supone que los diferentes
44
endmembers son “clases gausianas”, de manera que, este tipo de algoritmos lo que hacen, en esencia, es combinar la aproximación de la interpretación geométrica de los modelos lineales de mezcla con los modelos gausianos basados en estimaciones de funciones de máxima verosimilitud.
Minimum-volume Transform (MVT).
Este tipo de algoritmos se basan en aproximaciones geométricas para la determinación de los endmembers, y son, todas ellas, aproximaciones no paramétricas y no estadísticas que se basan en la suposición de que el espectro de los píxeles de una determinada escena reside dentro de un volumen multidimensional , y, por virtud de las propiedades de los algoritmos LMM, cada endmember debe encontrarse, precisamente, en la frontera de este volumen, siendo esta propiedad la utilizada para su identificación.
En consecuencia, el objetivo de estos algoritmos es estimar la posición de los vértices que delimiten una superficie con volumen mínimo en la que se puedan englobar las muestras de cada píxel.
Típicamente, esta determinación suele realizarse en dos pasos o fases. En la primera de ellas se lleva a cabo una reducción de los datos de la imagen inicial. En esta fase se descartan píxeles, pero no bandas, ya que, en este caso, sólo es necesario delimitar el perímetro del volumen ocupado por los datos de la escena para establecer la localización de los endmembers por lo que, los píxeles que caen dentro de ese volumen son descartados.
En la segunda (shrinkwrapping), se emplean una clase de procedimientos conocidos como “minimun-volume transforms” (MVT) basados en la localización de superficies geométricas existentes en espacios n-dimensionales definidas, exactamente, por “n+1” vértices.
En concreto, en la literatura consultada, se han identificado dos transformadas de uso habitual: la denominada DPFT (Dark Point Fixed Transform), variante del MVT que asume conocimientos acerca de la situación de la referencia en el sensor del denominado “dark point”, que es un punto clave para la realización de la transformada, y la llamada (FPFT) (Fixed Point Free Transform) que, por el contrario, supone un desconocimiento total acerca de la situación del “dark point” en el sensor. En este último caso se parte de una superficie de muchas caras que son ajustadas progresivamente mediante iteraciones sucesivas, hasta conseguir superficies de volumen mínimo.
Dentro de los denominados métodos no supervisados para la detección de endmembers a partir de datos hiperespectrales, y al igual que sucedía en el punto anterior se han seleccionado una serie de artículos que, por su interés, merece la pena ser mencionados. Así, por el interés y la novedad de su aportación, en el artículo de Nascimento (Nascimento 2004), el autor presenta un nuevo método no supervisado para la extracción de los endmembers, denominado VCA, a partir de imágenes hiperespectrales. Este método se basa en dos supuestos concretos:
Los endmembers son los vértices de modelos simplex La transformación afín de un simplex es otro simplex
El artículo finaliza aplicando el algoritmo VCA a una serie de datos hiperespectrales recogidos por el sensor AVIRIS sobre el área minera de Cuprite en Nevada (EE.UU.)
45 Dentro también del apartado de selección de endmembers a partir de modelos MESMA (Multiple Endmember Spectral Mixture Analysis), cabe mencionar el trabajo presentado por Dennison (Dennison 2003), en el que presenta un nuevo método de selección de endmembers de una librería espectral basado en la utilización de RMSE (Root Mean Squared Error), de los términos de error incluidos en cada una de las bandas en el modelo de regresión lineal correspondiente.