• No results found

A New Model

3.1 The Operation-Event Graph

3.1.3 Incorporating Structure

En esta sección se trata el problema de la inversión que es, como se mencionaba en los puntos anteriores, la tarea destinada a encontrar la “proporción” de cada uno de los endmembers existentes en el espectro de los píxeles de una determinada imagen. En términos de los modelos LMM descritos con anterioridad, los algoritmos de inversión se ocuparían de encontrar el vector a.

Uno de los problemas más importantes a tener en cuenta a la hora de construir algoritmos de este tipo es resolver adecuadamente la “convivencia” de la óptica matemática y estadística con las restricciones “físicas” impuestas por el problema. Con esta consideración en mente, cualquier estimación de a debería tener en cuenta las siguientes restricciones:

ƒ No negatividad, es decir las proporciones no deberían ser, en ningún caso, “negativas”, para que tengan un sentido real.

ƒ Pureza, lo que significa que los coeficientes que definen las proporciones no deberían exceder de 1, es decir,

a

i

≤1,i=1,2,...M

.

ƒ Aditividad, ya sea “total” o “parcial”. Con respecto a la primera de ellas debería cumplirse la siguiente propiedad, denominada de aditividad “total” (ec. C.1. 10).

=

=

M i i

a

1

1

(ec. C.1. 10)

Lo cual equivale a suponer, de manera implícita, que todos los endmembers están presentes en la matriz columna de S. Con respecto a la segunda se debería cumplir la ecuación (ec. C.1.11).

=

<

M i i

a

1

1

(ec. C.1. 11)

Denominada propiedad de aditividad “parcial”, que equivale a suponer que el conjunto de endmembers presentes en la escena está incompleto.

La clasificación general de los algoritmos de inversión se encuentra descrita en la Tabla C.1. 3. Analizando la clasificación anterior y atendiendo a las propiedades fundamentales de las familias de algoritmos que la componen es posible destacar los siguientes puntos:

1) En primer lugar, los algoritmos de inversión están dominados por aproximaciones basadas normalmente en algún aspecto derivado del método de los mínimos cuadrados. La mayor parte de los algoritmos estadísticos y paramétricos, aunque sea

46

de manera indirecta, caen bajo la aproximación de los mínimos cuadrados, ya sea minimizando el error cuadrático y obteniendo los autovalores y autovectores correspondientes, o bien minimizando distancias (geometría euclídea). En la actualidad y de la literatura publicada, se aprecia un predominio claro de los métodos de inversión soportados en los mínimos cuadrados y, todos ellos, están basados en la noción de “distancia”.

Tabla C.1. 3. Clasificación de los algoritmos de inversión

Interpretación de los datos

No estadística Estadística

Descripción

aleatoriedad No paramétrica Paramétrica

Criterio de

optimización Error cuadrático Máxima verosimilitud Inferencia Bayesiana

Mínimos cuadrados

No lineal Enfoque Gausiano Enfoque entropía Gaussian Class estimation

Algoritmo ULS

NNLS MVUE

Weighted Mahalanobis

Fuzzy

membership Máxima entropía

2) La familia de los algoritmos de inversión no estadísticos, no paramétricos basados en el error cuadrático están basados en la solución de la ecuación de los mínimos cuadrados, en principio, sin restricciones (Unconstrained Least Squares, ULS). Dicha solución para el vector a de las proporciones de los endmembers, denominada,

a

*U , tiene la siguiente forma, donde

a

*U es el estimador de las proporciones de endmembers para este caso (ec. C.1. 12).

a

*U

=(SS)

1

Sx

(ec. C.1. 12) Con la suposición de que se utilizan modelos de mezcla lineal (LMM) y ruido no aditivo, los estimadores de a, son los que minimizan la expresión

xSa

*U2. Esta estimación existe cuando hay más bandas que columnas (suposición muy razonable cuando se manejan imágenes de sensores hiperespectrales) y cuando S tiene un rango que se corresponde con la columna completa (endmembers linealmente independientes). Esta situación es típica cuando no se realiza ninguna “restricción” a priori sobre a.

Si se añade ahora la primera restricción relativa a la aditividad total, es decir, si se obliga a que la suma de todas las proporciones sume la unidad, la solución general de los estimadores en este caso es la proporcionada por la ecuación (ec. C.1.13).

[Z(SS)

Z]

(Za

b))

Z

S)

S

(

a

a

*F

=

*U

1

1

1 *U

(ec. C.1. 13) Donde Z es la matriz fila de 1xM elementos, todos unos, y b=1. Si se analiza detenidamente esta solución y se compara con la anterior, se observa que la diferencia consiste en un término de error que depende de la matriz de los endmembers S y del error incurrido por

a

*Ual satisfacer, más o menos, la condición de aditividad total.

47 3) En cuanto a la segunda posible restricción, la relativa a la no negatividad, no es tan sencillo incorporarla a las ecuaciones del modelo como en el caso anterior. En este caso la minimización de

xSa

2 manteniendo

a

i

≥0

, para

i=1,...M

se

convierte en un problema de programación de la resolución de un sistema de inecuaciones con las restricciones anteriores.

En la práctica, para evitar este tedioso proceso de programación, lo que se emplea son los llamados algoritmos de mínimos cuadrados no negativos (Non-Negative Least- Squares, NNLS), cuya aproximación consiste en, a partir de una primera estimación de a y mediante métodos iterativos, encontrar la solución mínima cuadrática solamente para los coeficientes de a que son negativos. El proceso de iteración se repite hasta que el algoritmo converge e identifica una estimación de a no negativa,

a

*NN.

Si se comparan las estimaciones *U

a

y *NN

a

, se encuentra que, la primera de ellas, es una solución sin restricciones (unconstrained) para a que minimiza la expresión

2

Sa

x

, mientras que la segunda es una solución con restricciones que minimiza una distancia “similar”, pero obtenida con criterio diferente, como es

xS

pos

a

2,

donde

S

pos

=S

para aquellas columnas de

S

pos en las que las entradas asociadas

correspondientes de

a

*NN cumplen que

0

*NN

>

a

y son cero para las entradas en las que

a

*NN

=0

.

4) En los anteriores puntos relativos a los algoritmos de inversión basados en los mínimos cuadrados, el objetivo común era la estimación de las proporciones de los endmembers contenidos en cada uno de los píxeles de la escena captada por el sensor que minimizan el error cuadrático entre el espectro real y el espectro aproximado proporcionado por las estimaciones.

El enfoque de los algoritmos estadísticos y no paramétricos, destinados también a determinar las proporciones de los endmembers, es el que se basa en minimizar la varianza del estimador. Dado que el vector de ruido aditivo, w, en los modelos de mezcla lineal (LMM) es un proceso aleatorio de media cero con covarianza

Γ

w, la

estimación de mínima varianza de la proporción

a

*V es la de la ec. C.1.14.

x

Γ

S

S)

Γ

S

(

a

1 w 1 1 V

=

* (ec. C.1. 14)

Este estimador de a no sólo es el mejor estimador lineal insesgado (Best Linear Unbiased Estimator, BLUE) sino que es también el estimador insesgado de varianza mínima (Minimum Variance Unbiased Estimator, MVUE).

5) Finalmente, la familia de algoritmos de inversión estadísticos y paramétricos puede tener también un enfoque de optimización de funciones de máxima verosimiltud o bien de funciones de densidad de probabilidad “a posteriori” (aproximación bayesiana).

48

Casi todos estos enfoques se basan en las propiedades y comentarios ya señalados en la descripción de los algoritmos para la determinación de endmembers por lo que no se van a repetir aquí. Simplemente apuntar que, el enfoque basado en la distancia de Mahalanobis, reestructura el tradicional algoritmo LMM eliminando la incertidumbre introducida por el ruido gausiano, considerando para ello cada uno de los endmembers como procesos estocásticos con una media y una covarianza dadas por una función de distribución multivariada Normal.

En este caso el método LMM puede ser reescrito como

x=(S+E)a

, donde E es la matriz aleatoria gausiana y, consecuentemente, la covarianza del vector x condicionada por el vector a,

p(x/a)

, es una suma de la covarianza de cada uno de los endmembers, ponderada por a. Debido a la dependencia de la covarianza de a, la estimación óptima de a es considerablemente más difícil de obtener en la práctica ya que son necesarias bastantes iteraciones.

También en este apartado de la inversión se han seleccionado una serie de artículos significativos. En primer lugar parece muy interesante citar la línea de investigación propuesta por Plaza y col. (Plaza 2002, 2004), donde describen una nueva aproximación para lograr la extracción de endmembers a partir de imágenes hiperespectrales. El citado artículo se desvía de la clásica línea o punto de vista espectroscópico de obtención de dichos endmembers, línea que normalmente no tiene en cuenta la correlación espacial existente entre los píxeles, para presentar un nuevo método automático de obtención no supervisada de endmembers, usando, de manera combinada información “espectral” y “espacial”.

El método expuesto se basa en la denominada “morfología matemática”, una técnica clásica en procesado de imágenes, que puede ser aplicada con éxito al dominio espectral mientras se tengan en cuenta una serie de características espaciales. La metodología propuesta es evaluada al final del artículo para una serie de datos hiperespectrales reales correspondientes a la zona de Cuprita en Nevada.

Hay también un artículo de sumo interés perteneciente a Heinz (Heinz 2001), en el que se analizan las dos restricciones típicas del problema de las mezclas: la aditividad de las proporciones y la no negatividad de cada una de ellas. El artículo comenta la facilidad de implementación de la primera de ellas y la enorme dificultad de implementar la segunda ya que la serie de desigualdades a que da lugar sólo puede ser resuelta por métodos numéricos.

Estas soluciones, en la mayoría de las ocasiones, producen resultados que no están acordes con la realidad física de los terrenos analizados, o, en otras palabras, las proporciones obtenidas no reflejan la situación real de la zona analizada. En este último caso, los algoritmos sólo pueden ser utilizados para la detección, discriminación y clasificación de endmembers pero no para determinar su grado de presencia en la zona.

El citado artículo, para obviar esta dificultad, presenta un novedoso método de análisis FCLS/LSMA (Fully Constrained Least Squares/Linear Spectral Mixture Analysis), para determinar la cuantificación de los materiales existentes en la zona. El artículo finaliza con la aplicación del algoritmo a un caso real con datos de los sensores AVIRIS, procedentes de cinco firmas hiperespectrales del Lunar Crater Volcanic Field de Nevada, y de HYDICE, con imágenes de las bandas 1-3, 202-210 y 137-153, con resolución espacial de 1,5 metros y resolución espectral de 10 nm.

49 Desde el punto de vista de la comparación de técnicas, es muy interesante el artículo publicado por Brown y col. (Brown 2001), donde aparece un análisis comparativo de interés entre dos de las técnicas de mayor uso en la determinación de endmembers en problemas de mezcla lineal como son las técnicas LSMM (Linear Spectral Mixture Models) y las SVM (Support Vector Machines).

Partiendo de la base de que el uso de las restricciones de las proporciones en los modelos de mínimos cuadrados en LSMM, es equivalente a los modelos lineales SVM, el autor demuestra cómo los algoritmos LSMM pueden ser deducidos de los SVM, con la ventaja, además, de que los algoritmos LSMM proporcionan interesantes interpretaciones acerca del papel desempeñado por los de los términos de error en la matriz de diseño de los mismos. Por otro lado también se analiza el papel de los algoritmos lineales SVM en cuanto a sus ventajas para configurar, de manera automática, el denominado “pure-pixel selection”, cuando se trabaja con grandes bases de datos o un gran número de imágenes hiperespectrales.

Muy interesante es también el artículo de Bateson y col. (Bateson 2000), en el que la variabilidad de los endmembers es incorporada al análisis espectral mediante la representación de cada uno de ellos por un “conjunto” de espectros, (bundle of spectra)”, “razonablemente” representativos de sus respectivas reflectancias. Aplicado este método a las imágenes hiperespectrales remotas, se producen una serie de máximos y mínimos en las proporciones de los mismos que marcan, precisamente, los intervalos de validez de las mismas así como el error debido a la variabilidad de los endmembers.

Mencionar finalmente el artículo de Ju y col. (Ju 2003), en el que presenta un nuevo modelo MDA (Mixture Discriminant Analysis) para la determinación de proporciones de cubiertas forestales a partir de imágenes del sensor Landsat Thematic Mapper. En concreto, cada una de las clases individuales son modeladas como mezclas de subclases de distribuciones Gausianas, realizando, asimismo, un benchmarking de este modelo con uno basado en la red neuronal ARTMAP y aplicando los resultados a un caso real con imágenes del Plumas National Forest de California, captadas por el Landsat TM el 20 de Junio de 1990, en las bandas 1-5 y la 7.