obtiene una proyección de datos de alta dimensionalidad a una dimensionalidad menor por medio de maximizar algunas medidas de interés llamados índices. La primera publicación donde se utiliza el nombre de PP fue (Friedman and Tukey, 1981) quienes implementaron satisfactoriamente la idea basada en el trabajo ya realizado por (Kruskal, 1969).
110 DETECCIÓN DE PATRONES Y ANOMALÍAS ESPECTRALES DEL TERRENO MEDIANTE ESPECTROMETRÍA DE IMAGEN DE ALTA RESOLUCIÓN
Varios índices han sido aplicados en imágenes hiperespectrales en la literatura (Malpica et al., 2008). En PP se usa la kurtosis como índice, es decir, se busca una proyección con índice de kurtosis máximo.
∑ = − − n 1 i 4 i 3 σ x x n 1 (3.5)
Donde xi representa el valor de la coordenada para la componente de la proyección
para cada píxel i; x y σ son la media y desviación estándar, respectivamente, para el conjunto de valores de xi.
Ya que no hay un procedimiento analítico conocido para hacerlo máximo (como ocurre para la varianza con PCA), diversas experiencias (Malpica et al., 2008, Alonso and Malpica, 2009) han recurrido al algoritmo Simplex de Nelder y Mead(1965) que fue implementado por Press (Press et al., 2007). Esta técnica no puede garantizar el mínimo óptimo, pero proporciona una solución cercana dependiendo del tiempo que se permita al algoritmo para ejecutarse.
Hay un número infinito de proyecciones que pueden ser construidas para convertir datos de un espacio dimensional elevado a datos en un espacio dimensional bajo. Una proyección seleccionada aleatoriamente de un conjunto de datos de una dimensionalidad elevada podría parecer similar a una muestra de una distribución normal multivariante. Sin embargo, “normalidad” no tiene entidad de medida pertinente cuando se están buscando proyecciones donde hay algún tipo de estructura en los datos, ya que datos estructurados representan una información relevante. Cualquier estructura en una proyección de datos de baja dimensionalidad puede representar una sombra de una estructura actual en la dimensionalidad completa. Un método común de obtener proyecciones es el denominado de Búsqueda de Proyección (Projection Pursuit-PP). El propósito de PP (Friedman 1974) es dilucidar la estructura de los datos en un espacio dimensional bajo, como agrupaciones (clusters), formas (shapes) o elementos raros o fuera de rango.
El popular detector RX no es un PP; más bien es un detector de ratios de probabilidad o verosimilitud. Esencialmente, el algoritmo calcula la Distancia de Mahalanobis (MD) a partir de un test de media de píxel del fondo, como ya se ha mencionado. Schweizer y Mora (Schweizer and Mora, 2000) también proponen una técnica de detección de anomalías basada en un algoritmo de máxima verosimilitud pero usado como un modelo de campo aleatorio Gauss-Markov de primer orden para el fondo. Todas estas técnicas asumen para el fondo una distribución Gaussiana espacialmente no correlada. Sin embargo, tal hipótesis es generalmente muy complicado de verificar en escenarios prácticos. La aproximación de partida PP es diferente. La no asunción de normalidad es requerida, ya que los datos son proyectados en un espacio unidimensional y luego analizados.
Es importante notar que un espacio dimensional elevado está en su mayoría vacío. La maldición de la dimensionalidad, conocida como efecto Hughes (Hughes, 1968)
111 DETECCIÓN DE PATRONES Y ANOMALÍAS ESPECTRALES DEL TERRENO MEDIANTE ESPECTROMETRÍA DE IMAGEN DE ALTA RESOLUCIÓN
aparece como una consecuencia de esa vacuidad. Los métodos paramétricos de clasificación de imagen están afectados enormemente por estos dos fenómenos. Los investigadores han propuesto métodos para tratar este asunto usando varias técnicas de reducción dimensional (Jiménez and Landgrebe, 1998; Jiménez et al., 1999). Jiménez y Landgrebe (Jiménez and Landgrebe, 1999) aplican PP para reducir la dimensionalidad de los datos, y luego desarrollan métodos paramétricos en un espacio dimensional reducido, bajo. Esto es posible ya que el rasgo más importante de PP es que es uno de los pocos métodos multivariante disponibles para bordear el desafío de la dimensionalidad. Por otra parte, algunos de los métodos propuestos basados en distancia entre puntos que parcialmente evitan este problema, tales como minimal spanning trees, escalado multidimensional o diversas técnicas de agrupamiento (clustering), son incapaces de ignorar variables irrelevantes caracterizadas por ruido o pobre información.
Friedman y Tukey (Friedman and Tukey, 1974) aplicaron con éxito la idea que se basa en el trabajo desarrollado por Kruskal (Kruskal, 1969), acuñando el término PP. Muchos de los métodos de análisis multivariante clásicos, como el análisis de componentes principales y análisis discriminante parecen ser casos especiales de PP (Huber, 1985). En la técnica popular de PCA, por ejemplo, la reducción de datos corresponde a las combinaciones lineales elegidas para maximizar la varianza de los datos proyectados. Por lo tanto, la medida de interés es en este caso la varianza. En (Goovaerts et al., 2004) se propone una metodología para detectar pequeñas anomalías en las imágenes hiperespectrales utilizando PCA para reducir la dimensionalidad de las imágenes, al mismo tiempo, que emplean geoestadística y filtrado para eliminar fondo regional y aumentar la seguridad local de la señal. Una proyección lineal de un espacio n-dimensional a un espacio k-dimensional está dada por las siguientes ecuaciones
Y = GTX, X ∈ Rn, Y ∈ Rk (3.6)
Donde Y es el dato proyectado y G es una matriz de k×n, Y es un vector k×1, donde k es un número pequeño, por lo general uno o dos. Esta combinación lineal o una proyección unidimensional se determinará de manera que la densidad de probabilidad construida con los valores de Y esté muy estructurada.